容联智能化中台,聚焦产业智能化改造( 四 )


容联智能化中台,聚焦产业智能化改造

----容联智能化中台 , 聚焦产业智能化改造//----

  容联的 NLP 技术一览 。

  而在包括自然语言处理和知识图谱等语义理解的技术上 , 团队看到了这些技术对于拓展后续的产品线的作用 。 比如说 , 完成了语义理解的研究后 , 团队可以带着相关的经验继续投入到知识图谱 , 进而拓展至知识整理和知识分类 。 这些技术都可以应用在客服、企业知识库、智慧营销等场景下 。 因此他们在这一领域投入更多 。

  但是 , 学术性的研究则通过和高校的合作进行 。 2018 年 , 容联和华中科技大学成立了联合实验室 , 共同研究个性化推荐、情感计算、认知计算方面的学术成果 。 这样的产学研合作降低了企业独自研发的投入成本 , 同时能够吸收先进的学术成果 。

  行业积累解决数据匮乏问题

  数据是阻碍 AI 应用落地的一大障碍 。 缺乏数据往往会导致 AI 的性能达不到要求 。

  对于这一问题 , 容联一般采用三种方法解决 。 首先 , 从公开渠道获取开源数据集 , 例如在文本数据方面 , 可以使用维基百科数据集 。 其次就是使用标注公司提供的数据 。 最后 , 由于多年的行业积累 , 很多头部客户已有类似规则库、知识库方面的数据 , 也可以灵活使用 。

  在数据方面 , 容联认为 , 有着多年行业积累 , 对于数据的理解也会更深刻 。 例如 , 在智能制造领域 , 有一种 AI 应用便是针对生产线上的工人进行监控 。 很多通用的计算机视觉算法会先在公开的通用数据集(往往有上万甚至更多图像)上进行训练 , 然后再进一步进行模型微调 。 实际上 , 有从业经验的团队会知道 , 这是一个封闭的场景 , 实际上可能只需要 5000 多的场景内图像 , 加上工程化技术便可以达到很高的准确率 , 使用开放数据集反而效果不佳 。

  千人千面 , 测评 AI 能力看应用

  那么 , 在评估 AI 能力的时候应该采用什么样的标准?容联透露说 , 在不同的 AI 应用上 , 测评的方法也有所差别 , 主要需要看不同场景的应用 。 例如 , 在语音客服中 , 就有一个公式 , 需要结合计算「单路通话的通过率」和「语音识别准确率」两个指标 , 综合计算后再评测结果 。

  在问答机器人上则会采用剧本测试的方法 。 比如 , 在信用卡发卡客服应用上 , 测试团队会根据该场景中可能出现的用户交互问题等整理出一个剧本 。 这一剧本需要覆盖 80% 以上的情景 。 之后再请测试人员根据剧本进行测试 。 在测试中 , 很少出现测试人员会脱离剧本「调戏」AI 的情况 。

  此外 , AI 应用必须重视工程能力 , 用于在算法性能不足的情况下弥补 。 在工具和开发框架的使用上 , 容联在研究中采用 PyTorch , 在实际生产中采用 TensorFlow 等 。

  理性看待「AI 红利」

  虽然 AI 热度不减 , 但是容联在进行 AI 产品的开发方面显得非常务实 。 在团队看来 , AI 应用应当符合商业逻辑 。