数字中国·星火文集 | 城市知识图谱产品及其应用
城市知识图谱产品及其应用
神州控股
程炜琦
1.
智慧城市的发展需要新的工具
随着物联网、云计算、大数据等技术的发展,智慧城市建设从感知智能到认知智能逐步提升。随着5G等技术的应用,城市感知能力又有了进一步的提升,数据采集更快、更多、更全。城市数据也包含了文字、图像、音视频等模态,数据复杂度也日渐提升。目前不少城市已经把数据抽取到城市大数据中心,也实现了局部智慧,但数据结构设计仍以传统方法为主,导致虚拟空间的数据的未能和现实城市运行的数据一一映射。要把这些数据用好,需要把这些数据组织成大型的知识库,并将其作为智慧城市的基础资源。
2.
什么是城市知识图谱
要建立城市知识库,离不开知识图谱。知识图谱本质上是一种语义网络,是新一代知识库技术,通过结构化、语义化的处理将信息转化为知识,并加以应用。知识图谱的抽象表现形式是以语义互相连接的实体,是把人对实体世界的认知通过结构化的方式转化为计算机可理解和计算的语义信息。知识图谱可以被理解成一个网状知识库,这个知识库反应的是一个实体及与其相关的其他实体或事件,不同的实体之间通过不同属性的关系相互连接,从而形成了网。由此,知识图谱可以被看成对物理世界的一种符号表达。
传统的知识图谱工具,多用于偏好推荐、知识问答、用户画像等领域,很难直接迁移到城市这个复杂信息的综合体上。同时,城市运行也遵循城市发展的内在规律,因而建立城市知识图谱的前提是认识和理解城市。
城市是一个密集的空间地域社会经济系统。在城市内部,各城市要素相互制约、相互交织,构成了城市复杂的系统性、整体性运动。从城市的组合和结构看,城市是一个多维、多变量、多层次、多因素的动态的大系统,其组成既包括自然与人工相结合并以人工为主的复杂系统,又包括以人类社会为主体、以地域空间和各种设施为环境的生态系统。其中,城市作为一个生态大系统,其结构既包括社会结构和人工结构,又包括资源结构和环境结构,甚至还包括外部结构。现代城市只有实现这个大系统内部关系的协调和结构优化,才能实现城市系统整体功能的优化。
城市知识图谱就是这样一个基于城市理论、涵盖城市规划、建设、管理、服务等领域的大型知识库,它能够提供一个根据治理协议共享数据的统一框架、基于开放标准,并利用数据之间的关系进行业务和运营的优化,使用同源分类法和词汇表来描述城市中所有部门通用术语的数据,将各种不同来源的数据能够在一个全面的、可查询的语义图上链接在一起,以展示关系中的相关点。
城市知识图谱的建立,是城市数据管理和城市运行分析的基础性工作,通过对城市数据的语义定义和实例化,实现对不同领域、行业、类型的城市数据的标准化、知识化的管理,从而支撑复杂城市分析应用。
3.
神州控股城市知识图谱产品及应用
神州控股将城市抽象理解成为一个包含自然景观环境域、物理基础设施域、人口域、文化社会治理域、数字基础设施域、泛在技术域的多层结构的有机体,城市中每个领域层级通过数字化及智慧化赋能融合,提供高效的市民服务。
城市知识图谱产品,就是神州控股基于以人为中心、分层结构的城市理论,面向城市规划、设计、建设、管理、运行、服务等业务领域,按照知识模型组织和管理海量城市数据,支撑城市知识计算、城市时空分析的一套工具集。用户通过定义城市知识模型,结合知识抽取、知识融合、知识加工等工具,实现基于图的数据存储和管理;同时针对城市业务领域,提供了面向路径规划、城市调度、智能入学等应用的复杂时空分析API、图分析API、优化算法API,帮助用户快速、低成本的构建基于图谱的应用场景;此外,也可以通过产品提供的可视化工具,实现城市数据在地图上的知识展示和知识探索。
它依托城市数据的汇聚、治理,构建不同城市数据之间的知识网络关系,从城市整体运行的角度揭示不同城市要素的内在关系,针对城市动态发展趋势进行反馈调节,从而指导城市运行管理和决策分析。
这里以教育场景下的一个例子来描述城市知识图谱产品的应用。学区划定和适龄儿童入学分配,是行政管理部门重点关注的问题。在区域学校资源有限和适龄学生每年动态分布的情况下,统筹学校资源的公平分配及确保就近入学,对于管理者是个巨大的挑战。如果按照传统的方法来实现精确的学区划定,管理部门即使投入大量的人力及时间,也可能徒劳无获。
利用城市知识图谱产品,通过对城市空间(市、县、小区、学区)、城市物(学校、教学设备、道路)、城市自然人(教师、学生)、城市事件(入学事件)、城市时间(入学时间、归属时段)等知识的定义,可以构建城市教育领域基础知识模型,并对接CIM平台,基于CIM数据的建立城市实体,实现实体数据和知识模型的映射关系,按照图模型将数据储存,建立城市教育知识图谱。
图谱建设完毕后,在可视化方面,可以通过产品可视化工具,实现城市图谱信息基于地图的可视化展示,如图为某年某地社区、学校的对应关系,底图透明度多边形表示各小学学区分布;连线起点表示各个小区,终点为目标小学;起点热力图表示各小区入学学生分布。
在智能分析方面,在可以借助空间分析API,判断各校指定入学半径内的小区;结合城市道路交通网络,利用图分析API(最短路径)进行学生最短入学距离计算,评价单个小区学生入学情况。在全区新生入学设计时,考虑区域内单校和多校入学,利用优化算法API,寻找满足入学规则前提下的最优入学分配方案(总入学距离最短),作为学区分配的参考依据。此外,还可以利用统计分析工具,计算各校平均师资、教师学科分布、设备分布,指导教育资源的优化配置。
4.
结语
神州控股基于多年的政务数据服务和对城市的理解,开发了城市图谱产品,依托CIM平台提供的城市数据,结合城市动态运行、管理、服务数据,能够快速建立各行业知识图谱,并进行复杂空间分析、图分析和可视化展现等功能,揭示城市发展的前世今生,探索城市运行的客观规律,预测城市发展的未来趋势,支持城市规建管服各类应用落地。