系统|小鹏是如何让我们用语音控制一台P7所有功能的?
小鹏在前不久正式OTA推送了Xmart OS 2.1.0版本,也是小鹏P7首个大版本OTA,除了开放了XPilot自动驾驶的部分功能和对Xmart OS中近100个功能进行优化升级之外,最重要的一点是它的全场景语音。从日常使用的角度来说,这个号称是全球第一个实现全语音交互的更新,甚至比XPilot 3.0中的NGP高速自主导航驾驶还要值得期待。
文章插图
我们先来看看这次的全场景语音都有哪些特别的亮点。
一次唤醒,连续对话
首先加入的连续对话功能,说完“你好,小P”之后,我们可以在20秒内持续对它发出指令、跟它聊天逗闷子,而不用再一词一句地频繁唤醒。当系统探测不到有效指令信息20秒之后,小P就会推出这次对话。通过对用户行为的调研,小鹏发现大部分指令的集中发生一般都在1分钟之内,绝大部分则都在十几秒内完成,这也是为什么小鹏设定了20秒的聆听时间。
文章插图
我们在屏幕的左上方可以看到,在这段时间内,系统一直在聆听并识别。而且识别的准确率已经相当高,除了对我们聊天内容中偶尔的专有名词有个别字错误,中英文混杂也可以识别,而且对于有效指令没有任何错误识别。这里车云菌心里产生了两点疑问:把我们的闲聊天都听进去岂不是一直在误触发?其他乘客说了冲突的命令系统到底要听谁的
第一,小鹏使用了语义拒识技术,简单来说就是通过语义识别判断车内是乘客间的闲聊还是对车机发出的指令,只有当系统采集到了有效命令判断我们在跟它做交互,它才会进行相应的回应和执行。而且从我们实际的体验来看,小P对于我们意图的判断已经非常准确,整个过程没有一次“误入”我们于工程师的对话,而我们中间随时对它说的指令,它都非常迅速地响应操作,已经非常成熟,直观感受就是“很人性”。
文章插图
另外,这次的语音系统支持了语义打断,不过同样跟目前市面上的不太一样。有了语义拒识的基础,系统只有捕捉都有效指令才会被打断执行下一个操作,比如我们问完天气之后跟副驾感叹最近北京怎么一下子要到零下了,就不会打断正在播报的天气。
第二,小鹏配备了双音区语义识别,谁唤醒听谁的。也就是说如果这一轮唤醒后的对话由主驾发起,那么其他人再怎么说它都不会理会,这样就避免了一些车控功能被车上的儿童误触发操作造成一些安全隐患。
文章插图
这种一次唤醒连续对话的形式其实更加人性化。目前在免唤醒上,多数车企仍然采用的是固定免唤醒词的方案,但形式的单一死板导致实际触发使用体验感较为一般,而且命令词非常有限,也无法做到与乘客间对话的区分。而小鹏在技术上的进步和优化就很好地解决了这个问题。
可见即可说
这一点可以说是全场景语音最直观的体现了,一句话概括就是凡是在屏幕界面上有的都可以用语音控制。通常我们通过语音导航、听歌、蓝牙、WiFi等,系统基本上可以帮我们完成主要的指令或显示出功能页面,但一些更细节的调整,像切换下一个选项卡、下划翻页、点击某一个按钮,往往还是需要我们去点击屏幕。而有了可见即可说,你会感觉系统可以听懂你要点哪,就像一个声控鼠标一样。
文章插图
比如直接说“氛围灯绿色/蓝色”,系统就能自动调整;打开小鹏实验室页面上,只需要直接说“高”,就能直接设置将屏幕上显示的哨兵模式灵敏度设置设为高。你可以直接说出屏幕上的关键字,系统会替你选择,而且如果内容过长也不怕。比如你要关闭应用使用限制,系统需要我们勾选已阅读选项,我们只需要说“已阅读”而不用说完整句话;当你在开车想选择音乐时,只是瞄了一眼屏幕可以直说“加州”就可以播放加州旅馆,甚至只说“big”就能播放目前屏幕中歌名带有“big”的歌曲。
https://v.qq.com/x/page/p3200w24jvm.html
我们通过视频已经更直观地感受到现在小P的强大能力,这已经可以说脱离了传统指令式交互的范畴,将语音交互上升到了一个新的高度。尤其是在这一点上,让你真正感觉好像它真的像人一样可以听懂我们说话,突出了普通语音模式的一个“傻”。
广泛理解,但精准控制
- 对手|一加9Pro全面曝光,或是小米11最大对手
- 行业|现在行业内客服托管费用是怎么算的
- 王兴称美团优选目前重点是建设核心能力;苏宁旗下云网万店融资60亿元;阿里小米拟增资居然之家|8点1氪 | 美团
- 手机基带|为了5G降低4G网速?中国移动回应来了:罪魁祸首不是运营商
- 技术|做“视频”绿厂是专业的,这项技术获人民日报评论点赞
- 互联网|苏宁跳出“零售商”重组互联网平台业务 融资60亿只是第一步
- 体验|闭上眼睛点外卖是什么感觉?时隔一年再次体验,进步令人欣慰
- 再次|华为Mate40Pro干瞪眼?P50再次曝光,这次是真香!
- 当初|这是我的第一部华为手机,当初花6799元买的,现在“一文不值”?
- 无国界|嘴上说着支持华为,却为苹果贡献了2000亿!还真是科技无国界啊?