对话式AI新方法:对话即数据流
本文最初发布于 Microsoft Research 博客 , 由 InfoQ 中文站翻译并分享 。
“说起来容易做起来难 。 ”这句话反映了对话式人工智能的前景 。 问“我和 Megan 什么时候都有空”只需几秒钟 。 但手动查看日历花的时间要长很多 。 事实上 , 我们借助科技完成的每一件事 , 都让人感觉是走过了一条通往短期目标的漫长道路 。 在微软Semantic Machines 公司 , 我们正在努力填补这一空白——构建对话式人工智能体验 , 你只要专注于说出你想要的东西 , 剩下的交由系统就行了 。 和这样的AI 对话 , 应该像和朋友说话一样:自然地、符合语境地、协作地 。
一个真正强大的对话式AI 需要做的不仅仅是深刻理解语言 , 它还要具备情境性、灵活性和健壮性 , 人工智能还必须深刻理解动作——大多数目标都涉及多个步骤和多个信息源 。 表达目标、动作和对话状态是对话式AI 系统的核心挑战之一 。 我们在《计算语言学协会会刊》(TACL)上新发表了一篇论文 , 题为“面向任务的对话即数据流合成”( Task-Oriented Dialogue as Dataflow Synthesis ) , 描述了一种新的表示和建模框架 , 它将对话解释为数据流图 , 使跨多个领域的复杂任务的对话成为可能 。 我们还发布了一个包含超过 40000 个对话的数据集(标注了数据流图)和公共排行榜 , 可以帮助人工智能社区在多轮任务导向对话中解决具有挑战性和现实意义的问题 。
从我们的新数据集中可以看出用户请求令人难以置信的多样性:
- 目标多样性 。 用户可能想要“与 Megan 预约会议” 。 他们也可能想”与 Megan 预约一个周二的会议” , 甚或是“与 Megan 预约在劳动节后第一个她有空的早上开一个会” 。
- 语言多样性 。 问题可能会是“明天天气怎么样?”同样的问题也可能会以“明天外面怎么样?”或“远足时我需要带一件夹克吗?”这样的形式出现 。
- 语境多样性 。 “How about three?”这句话的意思完全取决于刚刚说了什么 。 句子“Megan 两点没空 , 你有其他建议吗?”是提议更改会议时间 。 句子“天气预报说中午多云”是对于天气有疑问 。 句子“Rivoli 有一张两人桌”是要求增加晚餐预订的座位 。
我们提供了第三种方法 , 使用深度学习来生成和消费强大的“数据流”表示 , 它超越了填槽式方法 , 提供了灵活的动作和可控的语义 。 数据流旨在支持人类在日常生活中自然、灵活、开放的对话 。 我们的方法基于以下五个关键理念 。
1. 用户请求即程序现有的对话方式非常适合解释固定的、预先定义好的任务请求 , 比如“开灯”或“”设置一个名为 pasta 的定时器 , 时长 5 分钟” 。 在这些方法中 , 对话系统设计者定义了一组固定的意图 , 每个意图都有一组固定的参数 。 系统用用户所表达的意图和该意图的参数来标记每个用户请求:
文章插图
但是 , 对于更复杂的请求 , 比如“我和 Megan 一起喝咖啡的时候气温会是多少?”回答这个问题需要对话代理做一系列不同的事情:找出 Megan 是谁 , 在日历应用程序中使用 Megan 查找事件 , 找出开始时间 , 然后使用时间查询天气服务 。 我们不需要系统构建者创建专门的weather_during_event_with_person意图 , 而是将自然语言请求转换为一个程序 , 将所有这些调用联系在一起 。 我们将该程序表示为一个数据流图 , 它明确定义了对话代理计划中的步骤(节点)之间的数据依赖关系(边):
- 对话今年爆火的外骨骼机器人创始人,从民房起步连续创业的追梦者
- 挺进云端AI训练&推理双赛道!独家对话燧原科技COO张亚林:揭秘超高效率背后的“内功”
- 对话Graphcore中国高管:新IPU性能大幅超NV A100,中短期内冲市场第二
- 对话惠普范子军:立足用户需求 助力年轻人实现自我价值
- 中马青年以“数据新时代,携手创未来”为主题举行云端对话
- 对话五位英伟达技术专家:解析GTC China大会不容错过的技术干货
- 南财对话丨专访闵万里:人工智能,离无所不能还有多远?
- 罗振宇对话罗永浩:如果锤子倒闭了你会加入谁
- 对话|蜂巢能源即将量产无钴电池,杨红新:靠降维打击超越对手
- 对话戴尔科技集团刘志洪 聊一聊非结构化数据存储的那些事儿