按关键词阅读:
编辑导读:如今基本每一个品牌的手机都装载了自己的对话系统,可以帮助用户订机票、记事项,甚至能够讲笑话。本文作者围绕对话系统进行了分析,希望对你有帮助。
文章插图
本文将介绍对话系统的基本情况及局限,由此衍生出从事该领域的PM应该如何进行产品设计,以及笔者对未来的一些设想,希望能给大家一点启示。
本文将从以下几个方面展开:
- 对话系统的分类及简介
- 对话系统的局限
- 未来的设想
- AI PM的设计之道
一、对话系统的分类及简介首先,提及到对话系统,大家第一感觉是什么?我相信在当今智能终端时代,大家都会立马联想到siri,小度和小爱同学等。
这类对话系统具备了任务型和闲聊型的产品功能,既能同人对话,又能提供一部分服务,让用户感觉到智能科技感,虽然偶尔会有些智障,但很多人都相信只要给它们足够多的时间,有足够的数据和训练,未来肯定能像人一样智能,而这真的有可能吗?
我把手头碰到的对话系统按领域进行整理分类:
文章插图
从上面可以看出对话系统现在已经渗透到各行各业,但其实它们实现的技术方案流程参考如下:
文章插图
由于不像智能手机的触控交互(GUI)可视化,对话系统(VUI)看似像黑盒处理一般,只给一个输入,就可以输出一大段结果。
但其实整个过程其实就是将语音信号处理成文本,然后将文本整理成结构化数据,即我们常见的表格格式,接着就是按照产品经理设计的逻辑和词槽进行对话管理,最后按照设计好的接口和话术进行结果的反馈;
举个例子:
- “订机票”
- “从上海出发”
- “下周二出发去纽约的”
- “商务舱的”
- 等等
而这类语音交互本质就是类似用手触控订票功能按钮,一步一步的把你的出发地、目的地和时间等信息补充到应用上,然后给你呈现对应的结果;
看完是不是觉得并不是很智能,其实语音交互的优势在于可以一次性补充多个不同维度的信息,
如:“找下明天去纽约的商务舱机票”
如果产品经理设计得好,都设计了对应的词槽进行解析,那么我们一步就可以直接检索出我们想要的结果,而用触控得几步;
但其实这种表述并不遵循人性和口语化,一般也很少人能准确无误的表达这么一句话出来,看起来这个优势又可有可无。
对话系统的本质在于听人话(识别)+讲人话(对话管理),其中离不开填槽\填表的操作,每个科技公司都是按照这种技术方案进行设计。
而决定每个对话系统的优势与劣势,本质是看产品设计、工程设计和如何解决体验和规模化的问题等方面;
二、对话系统的局限先说结论,对话系统的局限有以下几点:
- 局限1:缺乏实质的推理归纳能力;
- 局限2:无常识认知和世界认知模型能力;
- 局限3:对话范围收敛,无法支持发散及引导对话节奏;
- 通用人工智能:即由人造出来的真正智能,即超级智能;
- 基于统计的机器学习,即通过现有技术,实现基础的人机交互;
局限1:缺乏实质的推理归纳能力举个例子:“找飞机票,不要深圳航空的”
这个例子我相信绝大多数对话系统都会直接检索出深圳航空的飞机票出来;
因为我们机器人处理或者说代码处理时,都有一个步骤叫做命名实体提取,而这里面的“不要”一般我们不会做解析,机器会直接将深圳航空作为实体,填入航空公司的词槽中;
而这上面这个例子,在我们普通表达里面,其实是比较常见的一种形式,我们对航空公司的售票员阐述诉求时,其实她们一般就可以理解我们的意思;
因为人的大脑具备基本的推理归纳能力,懂得“不要”这个词指的是“排除深圳航空以外的其他航司”,而机器人只具备提取实体的功能,不存在归纳推理的能力;
稿源:(人人都是产品经理)
【傻大方】网址:/c/1202b231H021.html
标题:对话|对话系统与AI PM的发展之道