Siri|Siri跌倒,苹果吃饱( 二 )


实际上,模块化并不是唯一的选择,在奇点中,趋向无穷的点被定义为极点。与之相似,语音助手也可以成长为庞大的“极”。
发布于2014年的Amazon Alexa就是很好的例子。
在发布时间上未能抢得先机,不代表产品本身技不如人。迟到的三年,反而让Alexa得以充分进化算法。与智能音箱Echo一同问世,也表明了对产品的设想绝不仅仅是辅助性的功能模块,而是一个具备巨大增长空间的业务版块,围绕着Alexa,又会衍生出诸多触手,覆盖更广的应用场景。在产品功能上,与苹果生态的封闭性截然相反,开放的环境让Alexa拥有上万功能,包括但不限于外卖订餐、每日一问、关注球队赛况更新等。
独立的产品形态提供了“沉浸式”语音交互体验,但这并不是成功的关键。Alexa能够达到Siri难以企及的高度,更主要的原因是技术在场景中的下沉。智能音箱的形态,对应着家庭日常生活的应用场景;反过来,家庭场景就要求产品具备特定的属性,比如对不同年龄的匹配性、娱乐性、陪伴性等等,上升至功能,又对应着强语言理解能力、丰富的指令选项、自然语义联想。通过场景完善产品,再由产品锁定更加精确的市场,进一步打磨技术,这样就形成了闭环,智能语音交互才得以顺利落地。
Siri与Alexa的区别,也映射了目前涉足AI产业的企业表现的模式。如苹果一样,只把AI当作已有产品系列的附加功能,就会局限在产品本身的应用场景,结果“文不对题”,闭环无法形成;只有把场景和AI当成两个独立端点,拿产品当作衔接的纽带,才能得到螺旋上升的良性循环。
03、原点“我们究竟需要怎样的语音交互?”
或许这才是“Siri跌倒”的真正原点,也是“Siri们”共同的问题。至于答案,可以从两个视野来寻找:现在,未来。
从现在的视野看,语音交互并不是大多数人的刚需。既有的工作、生活方式中,个人的问题自己解决,团体的问题沟通解决,只要信息是畅通的,不存在使用人工智能充当媒介的必要。
然而,以“信息畅通”作为前提,已经划出了存在痛点的受众:信息不畅通的特殊人群。
小孩、老人、残障人士,都是信息受阻的一方,在处理问题时存在障碍。克服这种障碍,人们通常会想到一个职业:保姆。而智能语音交互,恰恰是保姆的最佳替代。充分利用AI的信息处理能力,搭配特定机械结构,为存在重度需求的用户提供生活辅助;或者仅仅以音箱的形式出现,陪伴需求较轻的受众,提供陪伴、解答、硬件远控等服务。在与特殊人群相关的应用场景中,智能语音交互的出现无异于一场变革。
将视野转向未来,也许会看到一片迷茫,但参考过去发生过的种种巨变,也可以猜想到智能交互带来的震荡。从信息流通的角度出发,智能语音交互代表了更快的传播速度。这和由牍到纸、由马到车、由2G到5G是一样的道理。
电影《Her》描绘了一个语音交互高度成熟的时代。片中人物的办公完全脱离了纸笔,也脱离了我们目前使用的键鼠,只需要人坐在电脑屏幕前,口述自己的想法就可以了。不同于简单的语音转文字,智能语音助手会通过使用者的语气、神情、语言内容等,判断一个语句是内容的一部分还是一条指令。当你说“帮我删掉上一句”,上一句文本就会清除;当你说“存个草稿”,文本就会进入草稿箱。
如果有一天,智能语音交互技术真的发展到了如此高度,那么可想而知,工作的效率将会提高不止百倍;甚至连工作场景这一概念都会消失不见,只要我们正通过耳机或是更先进的设备与语音助手保持联系,哪怕是躺在床上,我们也能轻松地处理文件、撰写策划。
Siri的创始人,诺曼.威纳尔斯基曾认为,改变人类未来的三大要素是虚拟助理、人工智能机器人助理、增强现实,它们分别对应着信息世界、物理世界和二者之间的接口。很显然,智能语音交互同时具备这三个要素。在看不到的地方,语音助手进行信息处理;在看得见的地方,它呈现处理的结果并收集反馈;而它本身,正是那个接口。
Siri|Siri跌倒,苹果吃饱】眼下的Siri虽已落后,但在大势所趋下,也绝不会成为弃子。最近几年,苹果大肆收购AI公司,也表现出了重心转移的信号。不难想象,接下来的几个十年里,智能语音交互将成为几家互联网科技巨头鏖战之地,这种竞争带来的正反馈,让语音交互开始三点成面。