智能音箱|智能音箱走下坡路,该反思什么?( 二 )



语音交互与长句识别率一直提不上来 , 也与缺乏海量的数据训练相关 。
对于互联网大厂来说 , 智能音箱是一个独立的产品 , 无法用上移动互联网的海量数据 , 它更需要能响应问答的知识图谱数据来进行训练 。
如果一开始智能音箱的识别率低、用户黏性低、用户交互频率低 , 自然也缺乏海量的数据来迭代它的智能化 。
在语音交互体验的智能化层面 , 亚马逊也没有带来根本的语音体验变革 , 比如它无法对人或者对特定个人的声音与需求进行识别 , 无法拥有媲美智能手机的支付体验等 。
在不少消费者看来 , Alexa的实用性不足 。
根据彭博商业周刊的报道 , 多年来 , 大多数Alexa用户只使用语音设备来播放音乐 , 或在做饭时设置定时器 , 或打开灯 。
亚马逊员工在2019年的一份规划文件中指出 , Alexa新用户在激活设备后的三小时内会发现 , 他们使用的功能仅为全部功能的一半 。
在今天 , 智能语音助手是手机产品的标配 , 也几乎是车载智能系统的标配 。
但是从体验上来看 , 智能音箱语音交互也仅仅停留在基本的常规语音命令识别层面 , 当前的智能音箱不能主动服务 , 只能被动操作 , 智能程度不高 , 体验并不性感 , 也看不到太多创新与变革的潜质 。
诸多种种 , 导致智能音箱的产品与用户的预期体验以及它的变革意义相去甚远 , 当前的智能音箱更多沦为了一个可有可无的语音+屏幕的小玩具 。
带屏智能音箱成为主流 , 玩家们该反思什么?
在今天 , 从海外市场的亚马逊Echo Show、谷歌Nest Hub , 到国内的小米等 , 各厂商都在将带屏智能音箱定位为一款家庭娱乐体验的产品 。 带屏智能音箱也被认为是智能音箱下一阶段 。

但我们也要看到 , 屏幕的使用其实与用户对智能音箱的刚需无关 。
而包括亚马逊在内的大厂们都在死磕带屏智能音箱 , 其实其战略在于两方面 。
其一 , 为了弥补相对低效率的语音反馈 , 屏幕让智能音箱承担起了影音娱乐、视频沟通、家庭监控等多种功能 , 寄希望通过屏幕触控体验这种在PC、手机、平板已经验证过的普适化的产品打法来掩盖语音交互上的短板 。
而屏幕的引入 , 又与各大巨头的内容生态盈利的方向非常吻合——无论是京东阿里、小米百度等玩家 , 他们的内容生态建设基本上与“看”相关 , 而与“语音交互”相关的少 。
如果是主打语音交互 , 那么各大巨头原本在移动互联网上的内容生态就无法很好的打通 。 而有了屏幕 , 内容生态上的布局就可以顺势迁移到智能音箱产品上 。
比如小米小爱音箱在内容方面集成了头条视频、爱奇艺、优酷、B站等视频图文内容;
小度也有爱奇艺、好看视频、优酷、B站、芒果TV、咪咕等在内的视频内容生态 。
天猫精灵也全面接入了阿里文娱、健康、教育、购物等内容和服务能力 。
在今天 , 智能音箱普遍已经涵盖了通讯、音乐、家庭互动游戏、儿童早教等内容生态 , 这些内容层面上的引入 , 也与大厂们的内容付费会员等营收模式息息相关 。
但这也使得智能音箱越来越像一个平板电脑 , 毕竟在屏幕上玩游戏、看视频、刷图文、只需要手机或iPad即可 , 而不是一个语音设备 。
这同时也让智能音箱在语音交互的进化要变慢了 , 屏幕也让产品的定位变得混乱——智能音箱看起来和平板电脑快没啥区别了 。
《哈佛商业评论》曾有篇文章认为:随着时间推移 , 智能音箱背后的科技价值 , 将越来越少地关乎设备本身 , 而更多在于 , 如何让消费者方面地直接对任何设备讲话 。
智能音箱在过去一直被认为是AI技术的承载体 , 但在今天 , 从无屏到有屏智能音箱的进化之后 , 厂商们叠加了视频、娱乐、学习、通话等功能 , 使得屏幕音箱的产品边界不断拓展 。
但这种做法无疑忽略了智能音箱的核心战场在语音交互战场 , 因为通过语音来完成自己想要完成的事情 , 这比用手指触碰屏幕符合人类懒惰而又自然的天性 。
亚马逊在Echo推出之后 , 过去曾让人们看到了它的智能语音系统Alexa平台的巨大潜力 。
因为它是一个不同于视觉触屏模式的新玩法 , Alexa打造的是听觉内容生态 , 它其实是一个类似于安卓版的语音交互操作系统 。
因此 , 打造一个高度智能化的语音系统生态其实应该是亚马逊的一条独特的差异化道路 。
但随着带屏智能音箱成为主流 , 让触屏操控与视觉观看体验喧宾夺主 , 剥夺了语音交互的时长与向更加深度的智能化方向进化 。