[]Alexa 更新语音风格,长句式朗读听感更加自然,试听一下吧


[]Alexa 更新语音风格,长句式朗读听感更加自然,试听一下吧
文章图片
文章图片
深度学习方法用作 TTS 而带来的语音助手表达力的提升
- shenzhenware -
据研究机构 Omdia 的最新报告 , 在 2020 年第一季度 , 北美智能音箱(含带屏)市场较去年同比增长了 6% 。其中亚马逊及其支持 Alexa 的设备出货量占整个统计数据的 56%(约 610 万台) , 远超 Google 旗下智能音箱和苹果 HomePod 的出货量 。
分析师认为 , 虽然目前全球范围内都在受新冠疫情的影响 , 但智能音箱的用户市场仍有强大的消费动力 , 尤其是带屏类音箱 , 同比增幅在 220% 左右 。而其中 , 亚马逊的带屏音箱设备占 70% 的份额 。

[]Alexa 更新语音风格,长句式朗读听感更加自然,试听一下吧
文章图片
文章图片
而在强劲的市场形势下 , 为了进一步优化语音交互的体验 , 今天 , 亚马逊宣布了在语音交互上的新成就 , 语音助手 Alexa 有了新的语音风格 , 加强了对长句式朗读的听感 。
据亚马逊官方介绍 , 这种长句式的朗读的实现 , 是通过对文本的深度学习(Deep Learning) , 在文本转语音(TTS)的模型上 , 对 Alexa 的表达进行训练 , 让它的发音跟自然 。Alexa 去年曾更新了新闻和音乐内容的朗读技能 , 并且能够表达「失望」和「兴奋」的情绪 。
我们试听一下:
从两个音频内容的听感来看 , 可以明显感觉到优化后的语音更加流畅 , 停顿自如 , 也有一定的情感体现 。
亚马逊计划将新的语音风格应用在其 TTS 服务平台 Amazon Polly 中 , 并开放给开发者用于新的语音技能的开发 。用户也可以在 Alexa 的设备上选择不同的话语风格进行播报新闻、收听流媒体内容等 。
值得一提的是 , Google 前段时间 , 也是强调了语音助手的长句阅读能力 。目前 Google Assistant 的长篇文本阅读可以支持文章阅读 , 但将来有可能会扩展到包括电子邮件在内的其他内容 。

[]Alexa 更新语音风格,长句式朗读听感更加自然,试听一下吧
文章图片
文章图片
这两家语音巨头的表现 , 让我们看到深度学习方法用作 TTS 而带来的语音助手表达力的提升 。尽管让 AI 完全像电影「Her」中萨曼莎讲话还有一定的挑战 , 但针对场景化的训练 , 还是可以获得更加自然的声音的 。■
【[]Alexa 更新语音风格,长句式朗读听感更加自然,试听一下吧】主笔:陈宇凡、陈壹零 / 深圳湾