从服务视障人士到大众“有声”阅读,AI如何赋能内容创作?

中国经济周刊-经济网讯 (采访人员 孙冰) “这真的是机器人读的吗?”这是很多人听到由微软智能语音合成平台制作的有声小说《红楼梦》时的第一反应 。 因为在有声书中 , 林黛玉的声音略带微愠 , 贾宝玉言语委屈 , 而旁白则字正腔圆 , 这些声音不仅非常逼真堪比真人 , 而且还通过多种音色和多种语言风格 , 表现出不同的角色和不同的语境 。
有声读物并不是新鲜事物 , 很早就有各种读屏软件可以实现从文字到声音的转换 , 但最大问题就是从断句到语气 , 一听便知是“电脑音” , 非常生硬 , 体验并不好 。 而随着人工智能技术的进步 , 科学家和工程师们正在努力让AI的声音充满感情和表现力 。 尤其是对于视障人士来说 , 声音是他们感受世界的最重要方式 , 有温度的声音对于他们不仅是感知世界 , 更是陪伴 。
从服务视障人士到大众“有声”阅读,AI如何赋能内容创作?文章插图
为“心目图书馆”捐赠AI有声内容
近日 , 在“2020国际残疾人日”之际 , 微软与周迅AI语音红丹丹公益项目发起人——鹿音苑文化传播公司以及来自微软及各界的150余名志愿者 , 将共同创作的首批人工智能有声内容 , 包括鲁迅、老舍、萧红、朱自清等作家的一系列经典作品、红丹丹文化期刊 , 正式捐赠给北京市红丹丹视障文化服务中心的“心目图书馆” 。
据悉 , 这些作品都是基于微软Azure云认知服务语音合成平台Speech Studio及其丰富的AI(人工智能)语音创作的 , 其中包括著名艺人周迅授权的定制声音、红丹丹视障人士播音员董丽娜授权的定制声音 , 以及多个微软智能语音合成平台声音(如晓晓、云野等) 。
“微软晓晓”到“AI周迅” , 让声音有温度
对于视障人士来说 , 日常的“阅读”主要是通过触摸盲文书、听读屏软件或真人朗读的有声书等方式 。 但遗憾的是 , 这几种方式都存在一定的局限性 。
比如 , 盲文书的数量非常有限 , 而且制作成本高、阅读时间长;读屏软件声音不够自然 , 机械音很难产生共情和共鸣 , 长时间聆听也容易疲劳;真人录音虽然效果很好 , 但制作周期长、成本高 , 即使是志愿者可以免费献声和免费制作 , 但录制制作完成一本有声书 , 最快也要花上两三个月的时间 。
早在十几年前 , 微软就开始与中国最大的视力障碍人群公益组织——北京市红丹丹视障文化服务中心进行合作 , 为其提供技术和产品支持 , 共同探索用技术服务视障人群 。 尤其是在2014年 , 微软AI语音团队和红丹丹一起 , 为视障人士在微软Azure上搭建了云端有声读书馆——“心目图书馆” 。
微软的科学家和工程师们利用微软的AI智能语音技术平台 , 将文字合成有声电子读物产品 , 利用技术可以大批量地、自动化地的将电子书转变为有声书 , 不仅大大减少人工录制的人力和时间成本 , 也成倍丰富了视障人士有声阅读内容的来源 。
“声音是视障人士获取知识、陶冶情操、丰富精神世界的重要方式 。 微软人工智能语音技术声音动听、语音自然 , 帮助我们降低了有声内容创作成本 , 心目图书馆的馆藏越来越丰富 。 应用微软文字转语音技术后 , 红丹丹能够合成一本有声书的效率大大提高 , 而且能够7*24小时不间断生成 。 ”红丹丹创始人郑晓洁表示 。
随着微软AI语音技术不断更新迭代 , 2019年 , 微软利用微软神经网络语音合成技术打造了自然的人工智能声音如“晓晓” 。 而此次 , 微软又与一直热心公益事业的著名演员周迅合作 , 通过定制她的AI声音 , 更加高效率地服务于视障人群 。
“微软语音技术合成的AI声音非常自然、人性化、富有情感 , 最终呈现出来的周迅AI语音特别有说服力 。 我们非常荣幸能通过捐赠用周迅定制声音生成的有声读物 , 帮助视障朋友学习和成长 。 除了贡献公益事业 , 也很欣喜从中获得了促进娱乐业数字化转型 , 优化生产流程方式的更多思考 。 ”周迅AI语音红丹丹公益项目发起人、鹿音苑音乐文化传播公司联合创始人曾宇表示 。
据悉 , 通过“心目图书馆” , 视障人士可以随时随地通过移动设备收听和下载有声读物 , 目前 , 该图书馆已经覆盖全国105所视障人士学校 。
逼真一分需百倍付出 , 声音背后的微软“黑科技”
【从服务视障人士到大众“有声”阅读,AI如何赋能内容创作?】技术的进步不应该加深“数字鸿沟” , 反而应该成为帮助弱势群体和特定人群的强大助力 。 人工智能技术的创新对于社会和产业发展都带来深远积极的影响 , 未来也将逐渐融入人们的日常生活 , 让每个人都能享受到技术带来的便利 。