股市智能化综合服务平台 - 数据清洗流程自动化风险评估

功能点入口

应用场景数据展示

以下展示部分应用场景数据,以供参考:

数据ID 数据来源 原始数据 清洗规则 预期结果 实际结果 NLP/ML处理 增效指标 提质指标 案例类型 案例描述
7 金融新闻 快讯:*ST 贵酒 (600520) 午后直线拉升封涨停!是炒作还是价值回归? 去除HTML标签、去除停用词、实体识别、情感分析 快讯:*ST 贵酒 (600520) 午后直线拉升封涨停!炒作 价值回归? 快讯:*ST 贵酒 (600520) 午后直线拉升封涨停!炒作 价值回归? 实体识别:*ST 贵酒 (公司), 600520 (股票代码)
情感分析: 中性偏正面
清洗时间:0.15秒
自动化率:100%
准确率:99%
情感分析准确率:90%
正例 验证对新闻标题的处理和股票代码识别
8 上市公司公告 XX公司关于全资子公司涉及诉讼的公告 (详细内容见附件) 提取关键信息、关联关系识别 XX公司全资子公司涉及诉讼 XX公司全资子公司涉及诉讼 关联关系识别:XX公司 -> 全资子公司
事件类型识别:诉讼
清洗时间:2秒
自动化率:95%
准确率:98%
关键信息提取完整性:90%
正例 验证对公告中关键信息的提取
9 社交媒体舆情 $600520 贵酒 看来要凉凉了,主力跑路迹象明显 去除特殊符号、情感分析、水军识别 贵酒 看来要凉凉了,主力跑路迹象明显 贵酒 看来要凉凉了,主力跑路迹象明显 情感分析:负面
水军识别:疑似水军 (置信度 70%)
清洗时间:0.08秒
自动化率:98%
准确率:95%
情感分析准确率:85%
水军识别准确率:75%
反例 (水军识别置信度不高) 验证对社交媒体负面情绪和水军识别,但结果不够准确

功能点测试