按关键词阅读: 5G 宁波移动 威海移动 东方日升 海柔 进博会 5g+ 软银 AI 机器人 dbs
口语。口语化的交流,同时也需要避免说显而易见的内容,对话需要多样性,使体验更加自然。
环境贴切。使用简单易懂和约定俗成的表达,尽可能的贴近用户所在的环境。
地方语言。语言的本身要有地域的特色,语音的表达要有广泛的群众基础,其中方言识别也是语音交互中重要的技能。
六、语音交互框架1. 语音交互流程一次完整的语音交互流程,包括:唤醒—ASR—NLP—Skill—TTS语音应答/界面结果展示(如下图所示)。
文章插图
2. 语音交互框架1)根据苹果公司的全品类设备的特点,在语音框架需保持一致,兼顾mac、paid、手机大小屏和横竖屏。Siri交互包括:Siri的状态、ASR内容/话术、语言TTS反馈。
文章插图
3. 远场与近场远场应用比如Siri。直接说:“Siri”唤醒语音助手,唤醒后可以远程进行语音交互。
近场应用比如智能电视。使用遥控器,按住语音键,对着遥控器进行语音近距离语音交互。
设计用例:
User:“Siri,定个闹钟”。
语音助手:“你要定什么时候呢?”
User:“明天早上8点”。
4. 正常/异常状态正常状态:
语音交互的过程中,通过TTS和Siri状态(包括:等待与加载),来满足及时反馈。
异常状态:
语音交互过程中,判断外网终端->提示:待命+网络异常,请检查网络。
注:无界面时,直接TTS反馈:【网络异常,请检查网络】(要求TTS写在本地)。
5. 对话澄清指语音主动与用户的对话,达到意图的确认。
说明 :
① 澄清应用于用户意图不清晰,必须进行再次对话才能进行意图确定,否则导致机器执行的任务错误。
② 假如在远程的交互中,澄清的过程中,需要语音一直处于待命状态(也就是无需再次唤起即可对话)。
③ 在澄清的过程中,需要关键词引导,以便于用户表达明确的意图。
④ 为了让用户能自然的回复和应答,同时也防止自然口语化,语音的澄清话术需要采取封闭式关键词引导。
⑤ 关键词的引导,根据人的记忆及听力的规则,每次小于等于3个,且近俩个每句话术文字在7±2之间。
设计用例:
User:“帮我定下明天闹钟?”(意图不明)
语音助手:“你要定几点闹钟?”(几点钟为关键词)
【 对话|语音交互规范】Uesr:“明天早上8:00”(意图明确)
6. 多伦对话多轮对话指语音助手与用户进行一轮(一问一答)以上的对话。
说明:
① 应用于意图虽然清楚、可执行,但任务执行结果不清晰。如:结果的集合过大,用户没有找到具体的内容。
② 多轮的引导,应能帮助用户完成任务,同时防止用户自然语言的发散。
③ 多轮对话的轮次意味着用户与智能设备的多次交流。在搜索工具语言中,语音交互较快的达到目标是关键,轮次越多代表执行的效果不理想,通常以小于3轮较为合适。但是在闲聊类型功能中,轮次越多,代表用户聊天的意愿越强。
设计用例:
User:“能帮我找一下好看的电视剧吗?”(意图清晰,任务集合过大)
语音助手:“你要看中国的?还是国外的?”(关键词引导)
User:“中国的”(意图明确)。
7. 话术话术指用户与智能设备对话的形式。
说明:
① 话术来源:a 语音产品中需要互动交流产生场景话术;b基于人与人对话的原则撰写而成的话术。
文章插图
设计用例:
文章插图
8. 话术(TTS)设计语音话术指在语音交互过程中语音助手通过语言与用户进行互动,包括文字话术和语音话术。
说明:
① 显示的文字话术与语音助手的形象关联,并配合出现。
② 显示话术与当前语音逻辑相呼应。
③ 语音话术:用户发出请求后,需要给予语音应答。比如:“定今天下午3点闹钟”,反馈;“好的,已经定好下午3点闹钟”。
④ 声音及文字:引导过程中,根据业务的需要进行声音与文字的引导。
声音引导:引导澄清用户的意图。
文字引导:语音域中的引导话术。
声音+文字引导:比如问题及内容的搜索结果。
⑤ 运营类话术:针对高频词的结果及当前热门的内容,定制化的话术,目的是增加产品的情感,更加贴切用户的反馈。实现的方式:由运营后台配置。
稿源:(人人都是产品经理)
【傻大方】网址:http://www.shadafang.com/c/11109541262021.html
标题:对话|语音交互规范( 二 )