「大数据期刊」智慧城市知识图谱模型与本体构建方法( 三 )


●以人为本的设计思路 , 让智慧城市更好地围绕为人服务展开 。 一般的大数据中心把自然人信息、法人信息、地理信息、经济运行信息等都放在一个层面上 , 没有形成以人为核心的数据架构 。
●数据不与具体业务挂钩 , 而是在对城市大数据进行属性分类、关系分析之后提取更高层面的知识库 , 利于真正的数据共享 。
【「大数据期刊」智慧城市知识图谱模型与本体构建方法】●结合图数据库技术及语义网描述体系、标准和工具 , 便于计算机系统对大规模知识系统进行存储与检索计算 , 便于人工智能模型之间的有机结合 , 特别是在语义搜索、智能客服、问答系统等方面的应用 。
3智慧城市知识图谱的本体构建方法智慧城市知识图谱模型需要相应的本体支撑 。 本体源自西方哲学 , 描述世界上的客观存在 。 比较流行的本体概念是美国斯坦福大学知名学者Gruber提出的 , 即本体是关于某个实体概念体系的明确规范的说明 。 知识图谱对知识数据的描述和定义被称为知识体系(schema)或者本体 。 本体是重要的知识库 , 知识图谱的本体OKG包括对象的类型T(E)、属性的类型T(F)以及关系的类型T(R) , 具体可表示为:
「大数据期刊」智慧城市知识图谱模型与本体构建方法
文章图片
对象根类型BT(E)的分类是构建领域知识图谱的基础工作 , 而现有流行的公共知识库并没有按照领域数据的特点分类 , 唯一的根类型就是实体 , 这给领域知识表达带来了缺陷 , 无法完整表达文本、视频图片等知识和它们的关联 。 领域知识图谱本体的对象根类型BT(E)除了实体类型Tentity , 还应增加事件类型Tevent、文本类型Ttext和多媒体类型Tmultimedia , 基于上述4种实体类型 , 对象根类型BT(E)={Tentity,Tevent,Ttext,Tmultimedia}再通过扩展到具体分类表达领域的知识 。
智慧城市的知识图谱不仅是关于城市自然人的描述 , 还有对企业法人、各种组织、经济运行、地理信息等方面的描述 , 同时城市发生的各类事件也需要记录和关联 , 可以用实体、事件、文本和多媒体4种本体的对象根类型BT(E)满足这样的要求 。
设计一套完整的智慧城市知识图谱本体OKG是一项巨大的工程 , 需要将城市所有相关的本体根的属性、相互之间的关系理清楚 , 并设计相应的模型完成实体识别、实体扩展、实体消歧、关系抽取等工作 。 一座城市的所有根类型的本体(包括人、企业、社会组织、道路、楼房等实体 , 也包括城市里发生的事件、相关的文本和多媒体)数量众多 , 仅根类型的数量即可达到上万个 , 为了便于叙述 , 本文只针对城市自然人的本体设计展开 , 知识图谱的本体设计也以城市自然人展开 。
若自然人在城市中与N个领域(如教育、医疗、交通等)相关联 , 则可以由N个领域知识图谱叠加 , 构成一个完整的多领域知识图谱 。 城市自然人的本体有3种设计思路:单层单领域OKG(ss)、单层多领域OKG(sm)和多层多领域OKG(mm) 。
单层单领域OKG(ss)思路(智慧城市知识图谱单层单领域本体示意如图6所示)是把整个智慧城市知识图谱当成一个简单的垂直领域知识图谱进行设计 。 这种设计方式虽然涵盖了城市管理中各行业领域的本体 , 能比较方便地对城市宏观数据进行分析和管理 , 但是却无法简单快捷地从整体转入局部 , 例如在这个大的智慧城市知识图谱OKG(主本体)中快速清晰地获取教育或医疗行业的知识图谱Sub(OKG)(子本体) 。 另外 , 在建设这种单层单领域知识图谱初期 , 需要对城市各行业领域的本体有全面的了解 , 才能规划出比较齐备的智慧城市综合知识图谱 , 但这种建设方式无疑难度很大 。
「大数据期刊」智慧城市知识图谱模型与本体构建方法
文章图片
图6智慧城市知识图谱单层单领域本体示意