北京人才地图—多领域人才指数领先,成全国最顶尖人才聚集高点( 二 )


而且 , 智慧人才系统提供基于大规模知识图谱的人才语义检索 , 智能理解用户查询的语义信息 , 自动从学科领域、人才姓名、研究兴趣、就职单位等多个维度对系统提供的专家智库进行快速而准确地检索 , 准确定位用户寻找的专家人才 , 并提供多维度人才语义属性的快速过滤和智能排序 。
北京人才地图—多领域人才指数领先,成全国最顶尖人才聚集高点文章插图
图6:多精度人才语义画像
除了智能的语义检索外 , 产品还为用户提供了专家/智库的收藏 , 以及对开通智库的浏览 , 从不同功能入口帮助用户快速找到目标专家 。
智慧人才系统的亮点包括:

  • 以大数据技术为核心 , 构建超大规模多研究领域知识图谱 , 基于场景提供学者的智能匹配服务;
  • 提取基于各地区、研究领域的人才指标 , 对人才结构、发展目标等多维度进行分析和预测 , 提供对人才数据的可视化展示 , 实现对学者的「按图索骥」;
  • 产品采用 SaaS (软件即服务)模式下的微服务架构 , 可对于业务需求的变更进行快速响应和快速部署 , 实现对业务扩展的及时支持 。
正如前文展示 , 智慧人才地图能够给出北京市人工智能、大数据、云计算、物联网等等热点领域的多方面信息 。 所呈现的数据点面结合 , 既包括北京该领域的人才动态、城市人才分布、北京人才机构排名 , 也有该领域的全国人才分布、全国发展情况以及北京与全国其他省会城市的影响力对比 。
北京人才地图—多领域人才指数领先,成全国最顶尖人才聚集高点文章插图
图7:智慧人才地图“人才健康指数”和“人才分布地图”功能介绍
北京人才地图—多领域人才指数领先,成全国最顶尖人才聚集高点文章插图
图8:智慧人才地图“本地人才核心领域/行业”和“人才动态”功能介绍
北京人才地图—多领域人才指数领先,成全国最顶尖人才聚集高点文章插图
图9:智慧人才地图“人才态势分析”功能介绍
此外 , 科技情报大数据挖掘与服务系统平台 AMiner 还结合人工智能学术知识图谱 , 深度挖掘了目前北京各个领域学者的职业生涯信息 。
感兴趣的读者可以访问 AMiner 平台进行查看 。
智慧人才系统算法解析那么 , 这么详细、可视化的人才地图 , 是怎么做出来的呢?
智谱AI人才地图的研发团队表示 , 该智慧人才系统依托清华大学高质量大规模知识图谱、深度隐含关联挖掘算法和认知图谱等核心技术 , 服务地方科技产业发展 , 展示符合地方发展方向的本地、全国和全球人才分布态势、人才流动趋势 , 可以为地方人才引进工作中的寻、评、引、用提供基于大数据的智能化支持 , 构建全球人才 Global Positioning System , 实现人才工作的按图索骥 。
在算法使用上 , 智慧人才地图主要使用了人才指数算法和两种城市人才分析方法 。
人才指数算法:该算法模型是一种机器学习+专家经验的集成模型 , 内层根据学术人才评价指标特点分别采用使用 LR , SVM , 深度神经网络等机器学习算法 。 利用 AMiner 人工标注的不同领域、多层次学术机构的大量高质量学者数据库作为模型训练数据 。 在此基础上 , 外层封装专家知识的经验模型 , 组合而成城市人才评分模型 。
为使该算法达到最优计算效果 , 该模型的训练采用了启发式规则+模型自主学习的联合算法 , 优化目标值也是从大量经过提纯的学者数据中 , 经过统计分析得到的 。
这样得到的算法模型 , 结合了大数据分析和专家先验知识 , 从而达到合理精准评分 。
而计算城市人才指数得分的过程 , 就是将人才该城市的人才指标特征(顶尖学者发文数之和 , 学者数 , h之和 , 引用数之和等) , 输入到模型中 , 会得到所属的层级分类和具体得分 , 这个得分可以理解为和高等级的学术团体之间的差距 。
城市人才分析方法:针对需求领域类型的不同分别采用以下 2 种方法:1.针对较为专业的领域方向 , 且和其他领域交叉较多 , 采用学者标注算法进行人才分析;使用2类算法对学者进行领域分析标注:
a. AMiner 学科知识图谱:对学者的发表论文中的实体 , 关系等信息进行抽取(其中实体抽取方法使用 BERT+CRF 和规则 , 关系抽取采用多种方式结合:包括规则和远程监督) , 再利用已构建的学科知识图谱推理对学者进行领域标注 。
b. 领域标注系统:这是一个以深度学习为核心算法的多标签标注系统 , 算法网络结构简单说明:先用 bert 对学者多篇代表性论文进行 Emmbedding , 再使用多个的局部 Attention 层和全局 Attention 层进行特征的融合和提取 , 最后基于这些语义特征向量进行标签预测 , 即对学者进行领域的标注 。