展示从不同数据源采集的数据,并进行清洗和预处理。
数据ID | 数据来源 | 原始数据 | 清洗规则 | 预期结果 | 实际结果 | 风险指标 | 传播路径相关信息 |
---|---|---|---|---|---|---|---|
7 | 股吧评论 | 用户A:贵酒要起飞! [reply] 用户B:赞同![forward] 用户C:转发 @用户D [reply] 用户E:呵呵 | 去除特殊字符、用户ID匿名化、提取回复和转发关系 | 用户A:贵酒要起飞! 用户B:赞同! 用户C:转发 用户E:呵呵 | 用户A:贵酒要起飞! 用户B:赞同! 用户C:转发 用户E:呵呵 | 准确率:95% | 初始发布者:用户A, 传播节点:用户B, 用户C, 用户D, 用户E, 传播关系:A->B (回复), C->D (@), 关键传播节点:用户C, 传播速度:5分钟, 影响范围:5个用户 |
8 | 金融新闻 | [2024-01-30] 某财经新闻报道:贵酒业绩超预期,股价大涨。该新闻被多家媒体转载 | 去除HTML标签、提取时间、提取关键词、识别转载关系 | [2024-01-30] 某财经新闻报道:贵酒业绩超预期,股价大涨。该新闻被多家媒体转载 | [2024-01-30] 某财经新闻报道:贵酒业绩超预期,股价大涨。该新闻被多家媒体转载 | 准确率:98% | 初始发布者:某财经新闻, 传播节点:媒体A, 媒体B, 媒体C, 传播关系:财经新闻->媒体A (转载), 财经新闻->媒体B (转载), 财经新闻->媒体C (转载), 关键传播节点:财经新闻, 传播速度:1天, 影响范围:多个媒体 |
9 | 社交媒体 | 用户X:贵酒要崩盘了!小心! #贵酒 [reply] 用户Y:真的吗?求消息来源 [forward] 用户Z:转发并评论:假的!别信! | 去除特殊字符、用户ID匿名化、情感分析、识别话题标签 | 用户X:贵酒要崩盘了!小心! #贵酒 用户Y:真的吗?求消息来源 用户Z:转发并评论:假的!别信! | 用户X:贵酒要崩盘了!小心! #贵酒 用户Y:真的吗?求消息来源 用户Z:转发并评论:假的!别信! | 准确率:90% | 初始发布者:用户X, 传播节点:用户Y, 用户Z, 传播关系:X->Y (回复), Z->X (转发并评论), 关键传播节点:用户X, 用户Z, 传播速度:10分钟, 影响范围:3个用户 |
展示风险检测功能,包括敏感词监测、财务指标异常检测等。
监测到的敏感词: “崩盘”, “内幕交易”
检测到的异常财务指标: 应收账款周转率异常下降 (贵酒)
分析信息在不同平台上的传播路径,识别关键节点和影响范围。
提供数据筛选、过滤等操作。
提供用户反馈和交互功能。