以下展示部分应用场景数据,以供参考:
数据ID | 数据来源 | 原始数据 | 清洗规则 | 预期结果 | 实际结果 | NLP/ML处理 | 增效指标 | 提质指标 | 案例类型 | 案例描述 |
---|---|---|---|---|---|---|---|---|---|---|
7 | 金融新闻 | 快讯:*ST 贵酒 (600520) 午后直线拉升封涨停!是炒作还是价值回归? | 去除HTML标签、去除停用词、实体识别、情感分析 | 快讯:*ST 贵酒 (600520) 午后直线拉升封涨停!炒作 价值回归? | 快讯:*ST 贵酒 (600520) 午后直线拉升封涨停!炒作 价值回归? | 实体识别:*ST 贵酒 (公司), 600520 (股票代码) 情感分析: 中性偏正面 |
清洗时间:0.15秒 自动化率:100% |
准确率:99% 情感分析准确率:90% |
正例 | 验证对新闻标题的处理和股票代码识别 |
8 | 上市公司公告 | XX公司关于全资子公司涉及诉讼的公告 (详细内容见附件) | 提取关键信息、关联关系识别 | XX公司全资子公司涉及诉讼 | XX公司全资子公司涉及诉讼 | 关联关系识别:XX公司 -> 全资子公司 事件类型识别:诉讼 |
清洗时间:2秒 自动化率:95% |
准确率:98% 关键信息提取完整性:90% |
正例 | 验证对公告中关键信息的提取 |
9 | 社交媒体舆情 | $600520 贵酒 看来要凉凉了,主力跑路迹象明显 | 去除特殊符号、情感分析、水军识别 | 贵酒 看来要凉凉了,主力跑路迹象明显 | 贵酒 看来要凉凉了,主力跑路迹象明显 | 情感分析:负面 水军识别:疑似水军 (置信度 70%) |
清洗时间:0.08秒 自动化率:98% |
准确率:95% 情感分析准确率:85% 水军识别准确率:75% |
反例 (水军识别置信度不高) | 验证对社交媒体负面情绪和水军识别,但结果不够准确 |