数字中国·星火文集 | 面向知识图谱的知识推理的应用
面向知识图谱的知识推理的应用
神州控股
陈景林
1.
知识图谱的不完备性需要知识推理来补全
知识图谱是对于事实的结构化表示。从感知到认知的跨越过程中,构建大规模高质量知识图谱是一个重要环节,当人工智能可以通过更结构化的表示理解人类知识,并进行互联,才有可能让机器真正实现推理、联想等认知功能。但知识图谱本身具有不完备性,即知识图谱中的关系缺失或者属性缺失,如人物的教育,工作,住址,关系等信息缺失,这可能是原始数据本身不完备,也可能是抽取算法无法识别等原因导致,又或者是知识图谱自身蕴含大量隐式关系未被挖掘。由于知识推理能够基于已存在的知识“出新”,因此可以高效地帮助知识图谱弥补这些缺点。
知识推理就是利用已知知识推理出未知知识的过程。那么这一过程是如何实现的呢?下面以简单规则推理为例对面向知识图谱的知识推理做一实现,希望能够帮助理解这一抽象概念,厘清逻辑。
2.
知识推理应用实例
某国内国家级行业企业管理组织,其下有省、市和区级管理组织,每个组织下面又对应着一些企业和个人,企业信息包括名称、所属地、企业营业类别等;个人信息包括姓名、身份证号、手机号、管理企业名称等。但由于底层数据治理不完善和模型构建逻辑不清晰等原因,信息库出现信息不完全或信息冗余的现象,使得数据的一致性和完备性得不到保障。针对相关情况,利用知识推理可以发挥重要作用。
1、原始数据缺失的情况。比如,在行业管理用户不同的信息可能存放于不同的业务系统中,系统1存放用户基本信息如性别,年龄,手机号等。而用户的工作信息如职位,公司等与用户手机号关联一起存放在系统2中。要获取全部的用户信息可能需要建立正确的模型融合不同系统数据,弃除冗余的信息。手动方式处理这个过程比较繁琐,引入图谱推理的概念可以实现相对自动化。依据逻辑上的相关关系,可将全部信息串联起来形成完整链条。
2、还有隐形关系未被挖掘的情况。比如,推导出某一公司的同行业公司。在图一中,我们看不到公司节点(粉色)之间的联系,可能仅仅通过查询能够知晓某一公司的类别属于制造业或是餐饮业,但无法在图中看到明显的连接边。然而通过每两个公司节点的所属类别信息的相似性,编写规则,判断其是否同行业,再经过规则推理机对进行规则的解析,实施推理找出相关性。最终呈现的结果如图二所示。
图一 基于知识图谱推理前公司节点之间无边的相联关系
图二 基于知识图谱推理后公司节点成同行业团簇状分布
可以看到,公司节点之间显示了边的关系。每一个团簇为同行业公司。这种显示的关系可能更有利于上层图算法应用的查询和分析。可见,知识推理可以使知识图谱本身未被发掘的隐式关系显现出来。
3.
结语
构建大规模高质量知识图谱是实现从感知到认知的跨越过程中一个重要环节,但知识图谱本身的不完备性影响了知识图谱的应用。通过引入知识推理,能够实现原始信息补全和隐式关系的显现,解决这一难题。目前,神州控股已经进行了初步探索,未来还将在城市知识图谱的构建中推广,自动补全城市图谱产品实体间关系的空缺,更好的服务于城市大数据治理。