数据采集与预处理模块
**目标:** 验证“个性化智能选号推荐”功能在个性化推荐准确率、创新功能的用户使用率、算法有效性和算法创新性等方面的表现。 保证数据安全和用户隐私。
**核心指标:** 个性化推荐准确率 (点击率 >= 30%,相似度 >= 70%),用户使用率 >= 30%,推荐号码的中奖概率高于随机选号。
**外部数据:** 彩票历史数据。
**采集数据:** 用户注册信息、用户购彩习惯、用户行为数据。
**业务数据:** 用户画像数据、推荐号码数据、模型训练数据、用户反馈数据。
用户名 | 年龄 | 性别 | 地区 |
---|---|---|---|
testuser1 | 25 | 男 | 北京 |
testuser2 | 30 | 女 | 上海 |
testuser3 | 40 | 男 | 广州 |
用户ID | 彩票类型 | 号码 | 购买时间 |
---|---|---|---|
testuser1 | 双色球 | 01, 03, 15, 22, 28, 33 | 2024-03-15 10:00:00 |
testuser2 | 大乐透 | 02, 05, 18, 25, 31 + 04, 08 | 2024-03-15 11:00:00 |
testuser3 | 双色球 | 05, 08, 12, 19, 25, 30 | 2024-03-15 12:00:00 |