终于有人把知识图谱讲明白了

导读:知识图谱的概念诞生于2012年 , 由Google公司首先提出 。 知识图谱的提出是为了准确地阐述人、事、物之间的关系 , 最早应用于搜索引擎 。 知识图谱是为了描述文本语义 , 在自然界建立实体关系的知识数据库 。 一般情况下 , 我们可以使用关系图来表示知识图谱 。
作者:刘宇赵宏宇刘书斌孙明珠
来源:华章科技

终于有人把知识图谱讲明白了
文章图片
01什么是知识图谱
我们可以从不同的视角去审视知识图谱的概念 。
在Web视角下 , 知识图谱如同简单文本之间的超链接一样 , 通过建立数据之间的语义链接 , 支持语义搜索 。 在自然语言处理视角下 , 知识图谱就是从文本中抽取语义和结构化的数据 。 在知识表示视角下 , 知识图谱是采用计算机符号表示和处理知识的方法 。 在人工智能视角下 , 知识图谱是利用知识库来辅助理解人类语言的工具 。 在数据库视角下 , 知识图谱是利用图的方式去存储知识的方法 。目前 , 学术界还没有给知识图谱一个统一的定义 。 在谷歌发布的文档中有明确的描述 , 知识图谱是一种用图模型来描述知识和建模世界万物之间关联关系的技术方法 。
知识图谱还是比较通用的语义知识的形式化描述框架 , 它用节点表示语义符号 , 用边表示语义之间的关系 , 如图3-1所示 。 在知识图谱中 , 人、事、物通常被称作实体或本体 。

终于有人把知识图谱讲明白了
文章图片
▲图3-1知识图谱示例
知识图谱的组成三要素包括:实体、关系和属性 。
实体:又叫作本体(Ontology) , 指客观存在并可相互区别的事物 , 可以是具体的人、事、物 , 也可以是抽象的概念或联系 。 实体是知识图谱中最基本的元素 。 关系:在知识图谱中 , 边表示知识图谱中的关系 , 用来表示不同实体间的某种联系 。 如图3-1所示 , 图灵和人工智能之间的关系 , 知识图谱和谷歌之间的关系 , 谷歌和深度学习之间的关系 。 属性:知识图谱中的实体和关系都可以有各自的属性 , 如图3-2所示 。
终于有人把知识图谱讲明白了
文章图片
▲图3-2知识图谱中的属性
知识图谱的构建涉及知识建模、关系抽取、图存储、关系推理、实体融合等多方面技术 。 知识图谱的应用则体现在语义搜索、智能问答、语言理解、决策分析等多个领域 。
02知识图谱的价值
知识图谱最早应用于搜索引擎 , 一方面通过推理实现概念检索 , 另一方面以图形化方式向用户展示经过分类整理的结构化知识 , 从而使人们从人工过滤网页寻找答案的模式中解脱出来 , 可应用到智能问答、自然语言理解、推荐等方面 。
知识图谱的发展得益于Web技术的发展 , 受KR、NLP、Web以及AI等方面的影响 。 知识图谱的价值归根结底是为了让AI变得更智慧 。
1.助力搜索
搜索的目的是在万物互联的网络中 , 能够使人们方便、快速地找到某一事物 。 目前 , 我们的搜索习惯和搜索行为仍然是以关键词为搜索目的 , 知识图谱的出现可以彻底改变这种搜索行为模式 。
在知识图谱还没有应用到搜索引擎上时 , 搜索的流程是:从海量的URL中找出与查询匹配度最高的URL , 按照查询结果把排序分值最高的一些结果返回给用户 。 在整个过程中 , 搜索引擎可能并不需要知道用户输入的是什么 , 因为系统不具备推理能力 , 在精准搜索方面也略显不足 。
而基于知识图谱的搜索 , 除了能够直接回答用户的问题外 , 还具有一定的语义推理能力 , 大大提高了搜索的精确度 。 图3-3所示是知识图谱助力搜索示意图 。

终于有人把知识图谱讲明白了
文章图片
▲图3-3知识图谱助力搜索
2.助力推荐
推荐技术和搜索技术非常相似 , 但是稍有区别 。 搜索技术采用信息拉取的方式 , 而推荐技术采用信息推送的方式 , 所以在推荐技术中有一些问题 , 比如冷启动和数据稀疏问题 。
以电商推荐为例介绍知识图谱在推荐上的应用 。 假设我买了手机 , 手机的强下位关系是手机壳 , 这样系统就可以给我推荐手机壳 , 同时也可以推荐相似或互补的实体 。 图3-4为知识图谱助力推荐示意图 。

终于有人把知识图谱讲明白了
文章图片
▲图3-4知识图谱助力推荐
3.助力问答
问答与对话系统一直是NLP在人工智能实现领域的关键标志之一 。 知识图谱相当于是给问答与对话系统挂载了一个背景知识库 。