明日情报

查看详情

事件发现与追踪

在大数据时代,与科技相关的各类文献和互联网信息呈爆炸性增长,要从中迅速发现高价值情报、准确把握发展态势,必须大力发展科技情报挖掘技术。基于社交媒体的技术类热点事件发现与追踪技术是科技情报挖掘技术体系中情报推理与研判技术的重要组成。

当前,社交媒体已成为人们沟通交流的重要平台。对科研机构与科研人员的社交媒体数据进行监测,从中发现、抽取、合成相关科技信息,从而发现在研项目、研究突破、发展规划、技术应用等信息,可为前沿科技领域的热点技术跟踪、前沿技术分析等应用提供支持。本技术旨在从Twitter等社交媒体中收集前沿科技相关信息,识别重要科研主体,发现技术热点的传播特征,并根据社交媒体信息不充分、用词不准确、事件演化迅速等特点,研究在相关约束条件下的技术热点发现、预测和跟踪方法。

技术类热点事件发现算法
基于用户生成内容和社会网络传播特征,研发在社交媒体中技术类热点事件发现算法,涉及的热点类型包括基础研究突破、创新技术应用、项目里程碑等。

技术类热点事件预测算法
研发在内容特征、传播特征不充分条件下的技术类热点事件预测算法,通过学习已发生技术热点事件的各方面特征,自动识别可能的技术热点事件。

技术热点跟踪算法
研发在技术词汇、技术发展快速演化的情况下自动跟踪热点事件发展脉络的算法,梳理总结热点事件发展路径。

工具包
集成以上所有任务中提出的算法开发工具包。应用工具包开展基于Twitter的技术类热点事件发现与追踪试验。

事件发现准确率不低于90%,单机处理速度高于100KB/s

事件识别准确率不低于70%,单机处理速度高于100KB/s

技术热点跟踪F1值不低于0.7,单机处理速度高于300KB/s

工具包支持跨平台使用,提供支持Java或Python程序调用的API接口

采取随机采样的方式,人工标注Twitter数据10000条,热点事件不少于100个