终于有人把知识图谱讲明白了( 二 )
对于问答与对话系统或者聊天机器人来说 , 其除了需要实体知识图谱和兴趣知识图谱等开放领域的稀疏大图外 , 还需要针对机器人和用户个性化的稠密小图 。 同时 , 知识图谱是需要动态更新的 。 图3-5是知识图谱助力问答示意图 。
文章图片
▲图3-5知识图谱助力问答
03知识图谱的架构
知识图谱的架构涉及知识表示、知识获取、知识处理和知识利用等多个方面 。
一般情况下 , 知识图谱构建流程如下:首先确定知识表示模型 , 然后根据不同的数据来源选择不同的知识获取手段并导入相关的知识 , 接着利用知识推理、知识融合、知识挖掘等技术构建相应的知识图谱 , 最后根据不同应用场景设计知识图谱的表现方式 , 比如:语义搜索、智能推荐、智能问答等 。
从逻辑上 , 我们可以将知识图谱划分为两个层次:数据层和模式层 。 数据层可以是以事实为单位存储的数据库 , 可以选用的图数据库有RDF4j、Virtuoso、Neo4j等三元组 。
<实体 , 关系 , 实体>或者<实体 , 属性 , 属性值>可以作为基本的表达方式 , 存储在图数据库中 。 模式层建立在数据层之上 , 是知识图谱的核心 。 通常 , 通过本体库来管理数据层 , 本体库的概念相当于对象中“类”的概念 。 借助本体库 , 我们可以管理公理、规则和约束条件 , 规范实体、关系、属性这些具体对象间的关系 。
知识图谱有自顶向下和自底向上两种构建方式 。 自顶向下构建是指借助百科类数据源 , 提取本体和模式信息 , 并加入知识库中 。 自底向上构建是指借助一定的技术手段 , 从公开的数据中提取资源 , 选择其中置信度较高的信息 , 经人工审核后 , 加入知识库中 。
在知识图谱发展初期 , 多数企业和机构采用自顶向下的方式构建知识图谱 , 目前大多企业采用自底向上的方式构建知识图谱 。
知识图谱的架构如图3-6所示 。
文章图片
▲图3-6知识图谱的架构
知识源:包括结构化数据、非结构化数据和半结构化数据 。 信息抽取:就是从各种类型的数据源中提取实体、属性以及实体间的相互关系 , 在此基础上形成本体的知识表述 。 知识图谱的构建过程中存在大量的非结构化或者是半结构化数据 , 这些数据在知识图谱的构建过程中需要通过自然语言处理的方法进行信息抽取 。 从这些数据中 , 我们可以提取出实体、关系和属性 。 知识融合:主要工作是把结构化的数据以及信息抽取提炼到的实体信息 , 甚至第三方知识库进行实体对齐和实体消歧 。 这一阶段的输出应该是从各个数据源融合的各种本体信息 。 知识加工:知识加工阶段如图3-6所示 , 其中知识推理中重要的工作就是知识图谱的补全 。 常用的知识图谱的补全方法包括:基于本体推理的补全方法、相关的推理机制实现以及基于图结构和关系路径特征的补全方法 。关于作者:刘宇 , 清华大学硕士 , 现就职于一家跨境电商公司 , 任技术总监 , 主要负责该公司搜索推荐业务以及广告的相关技术开发 。 目前工作的重点是落地算法在搜索系统、推荐系统、对话系统等具体业务场景下的应用 。 对机器学习、深度学习、大数据应用与开发等颇有研究 。 合著有《聊天机器人:入门、进阶与实战》一书 。
赵宏宇 , 本科毕业于东北大学;研究生毕业于RIT , 主修AI方向 。 现就职于猎聘网 , 主要负责猎聘网推荐排序相关的工作 。
刘书斌 , 本科毕业于东北大学 , 现就职于美团 , 资深系统开发工程师 。 曾在唯品会任职 , 主要负责搜索工程的架构设计与实现等相关工作 , 在Elasticsearch方面有丰富的工程实践经验 。
孙明珠 , 硕士毕业于南京航空航天大学 , 现就职于猎聘网 , 担任高级算法工程师 , 负责查询理解、解析、扩展等NLP相关的工作 。
本文摘编自《智能搜索和推荐系统:原理、算法与应用》 , 经出版方授权发布 。
文章图片
延伸阅读《智能搜索和推荐系统》
【终于有人把知识图谱讲明白了】推荐语:零基础掌握搜索和推荐系统的原理、架构、算法 。
- 日媒说出大实话:莫迪政府终于清醒了,离开中国,印度根本没活路
- 拜登表态力挺台湾?苏贞昌高兴早了,美国随时可能把台湾一脚踢开
- 早就想把谢治宇换了!换袁芳、乔迁、王崇?
- 《骊歌行》定档!换了第七个剧名,李一桐、许凯终于要来了?
- 下周上市新车抢先看 秦PLUS DM-i终于来了!
- 这些明星硬把配角演成了主角,最厉害的是他,把男五号演成男主角!
- 《创4》赞多颐指气使,站凳子上发号施令,甭把糟粕文化带到内娱
- 《演员请就位》终于有人为郭敬明“撑腰”了!
- K甲官方叫板张大仙?再次把XYG放到最后,网友:欺人太甚
- 搞笑|搞笑GIF趣图:媳妇,煲汤把锅都毁了,以后还是长点心吧!