织梦CMS - 轻松建站从此开始!

酸菜历史网-2019最好看最有趣的历史文化网!

当前位置: 主页 > 图片新闻 >

新闻软件图片

时间:2021-01-24 06:23来源:未知 作者:admin 点击:
2020年初,新冠疫情大规模爆发,迅速蔓延演变成影响全球各个国家的重大卫生事件。面对疫情,各国政府积极采取应对措施,新闻媒体实时聚焦疫情事件报道,世界各国学者迅速投身新

  2020年初,新冠疫情大规模爆发,迅速蔓延演变成影响全球各个国家的重大卫生事件。面对疫情,各国政府积极采取应对措施,新闻媒体实时聚焦疫情事件报道,世界各国学者迅速投身新冠病毒及防治领域的研究。如何从海量的新闻中梳理出疫情发展的脉络,从众多学术信息中跟踪不同方向研究进展,成为科研人员研究的热点问题。实践证明 AI可以成为抗疫期间有力的信息捕手,筛选出有价值的信息。

  本次AI TIME技术分享知识疫图专题最后一期,我们很荣幸的邀请到了智谱华章高级开发工程师,AMiner团队成员的杜冀中,为大家分享知识疫图新冠疫情新闻学术数据的获取及分析应用背后的技术实践,看看AI是如何充当好这个信息捕手的。

  将众多渠道采集到的大量新闻和学术数据,通过多种分析方法挖掘出这些信息中有关联、有价值的部分,并融入知识疫图的全球新冠疫情智能驾驶舱中。如图一所示,知识疫图系统主要设计了事件列表、事件详情、实体链接、关联事件、事件时间轴几个模块对疫情事件进行展现。展开某一具体实体链接,可以得到如图二包含实体描述、实体关系、实体属性等详情的实体面板。这些面板不仅提取整合了大量的疫情信息,同时采取的展现形式清晰明了。

  在知识疫图中,用户可以轻松获取处理后有价值的疫情信息,那这些实体、关联事件都是如何得到的?讲者将通过数据抓取、实体链接、风险影响力计算、相关事件计算、可视化五项核心工作为大家介绍。

  在数据源方面,知识疫图采取实时抓取方式,整个流程如图三所示,数据采集、去重、分类、实体链接等流程都做了自动化以实现时间线的实时更新。针对学术和新闻两种数据类型,新闻软件图片选择不同的数据源。学术数据主要来源于柳叶刀、Science、Nature 、bioRxiv、medRxiv等,新闻数据主要来自WHO、Worldometers等高质量新闻媒体平台。

  在实体链接方面,主要使用了两大现有的基于知识图谱的实体链接系统。一个是同样由AMiner团队融合现有构建的大规模、结构化的COVID-19 KG 新冠知识图谱,另一个是XLINK—基于XLORE的实体链接系统。接入了构建的疫情知识图谱对所有事件做实体识别,分析出事件之间的关系,并对事件及热门实体关系等数据进行可视化展示

  采用最新的无监督Graph Embedding 方法ProNE,将所有的事件和他们所关联的关键词作为节点,连接成一张无向图(如图四),然后对它使用ProNE计算出每个节点的向量表示。

  人工标注了约800条事件的影响力,占总体事件的10%左右,选择向量空间上占据不同位置的事件以使标注事件在目标空间有更好的分布。

  事件影响力计算基于KNN,使用最近的3个标注事件来计算当前事件的影响力,采用加权平均的方式,权重和向量之间的欧几里德距离呈反比。

  热点实体计算是在事件影响力的基础上做了进一步的扩展,把每天的事件整体作为一个文档,热点实体所在的事件的影响力之和作为他出现的次数,进而用TF-IDF来计算每个实体在当天的影响力(如图五)。

  相关事件的计算也是基于事件的Embedding,知识疫图采用了内机的方式,整体上是一个Hierarchical Clustering的算法,选取一个Threshold,把所有similarity小于这个阈值的事件连接起来,构成一些连通子图,然后将threshold调低,进一步连接这些子图。重复这个过程,构建出如图六的事件的层级结构。

  可视化关注的是将得到的数据和分析成果如何更好地呈现给用户,如图七所示,知识疫图通过事件的地理位置信息将事件按事件标注在Mapbox地图上,时间轴采用堆叠柱状图的形式展示不同类型事件随时间变化的全貌。

  在知识疫图中,事件可视化是可以按照时间轴动态播放的,为保证播放时界面的流畅性和提高整个数据处理过程的性能,讲者主要做了两方面设计(1)通过控制地图和时间轴刷新的频率来解决性能问题,地图和时间轴不会随着React状态变化实时刷新;(2)增加对中间数据和渲染组件的缓存来提高刷新效率。

  系统数据展示的一大亮点是保证了数据的实时刷新,为保证前端可以获取到最新的信息,讲者也做了两方面的设计,一是通过在每个事件上增加时间戳的方式来达到与后台数据的实时同步,二是初始化数据以及每次更新请求中都会附带时间戳信息,用来确定要更新的数据。

  图八是知识疫图事件可视化初始版本和现行版本的对比,从两者的比较中,可以发现知识疫图事件的展现形式做了很大的改变,柱状堆叠图使界面更简介,内容更聚焦。并且随着技术的迭代,事件面板也增加了更加丰富的内容。

  疫情之下,人工智能和大数据能做什么?AMiner团队用知识疫图系统交出了自己的答卷,通过自己的专业知识为疫情做出了贡献。本次AI TIME知识疫图专题,5位嘉宾的精彩分享从不同的角度为大家介绍了知识疫图,让大家不仅认识了解了这个系统的强大,同时也学习到了很多背后的技术实践。

  作为全球新冠疫情风险评估和复工辅助决策系统知识疫图从AI和大数据入手,整合新冠病毒各种数据,提供了多项智能预测和服务,在疫情期间发挥了重要作用。目前新冠疫情依然在全球蔓延,未来知识疫图也将继续关注疫情的发展,开发上线更多的功能,希望大家可以持续关注,同时也请期待AI TIME接下来更多的精彩内容!

(责任编辑:admin)
织梦二维码生成器
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片
广告位API接口通信错误,查看德得广告获取帮助