从服务视障人士到大众“有声”阅读,AI如何赋能内容创作?( 二 )
早在2017年 , 微软就宣布5年内为“AI for Good”项目投资1.25亿美元 , 通过人工智能技术解决当今社会最重大的挑战 , 其中就包括了人工智能无障碍计划(AI for Accessibility) 。 2018年 , 微软宣布在五年内投入2500万美元到该计划当中 , 用于研发能够增强人类能力的人工智能技术 , 让全球残障人士更好地走进职场、融入现代生活、增进人际交往 。
以微软的智能语音技术为例 , 经过持续不断迭代升级 , 目前基于Azure的深度神经网络语音模型几乎能够达到真人录音水平 , 并能够提供多角色、多情感、多风格 , 适用于丰富场景的平台原生或定制声音 。
微软全球资深副总裁、微软亚太研发集团主席兼微软亚洲研究院院长洪小文博士表示:数字经济是21世纪发展主题之一 。 未来十年 , 全球经济增长将得益于数字技术的普及和在每一个行业的深入应用 。 我们要在科技进步的同时 , 确保人人不掉队 , 让每个人都能够参与到经济和社会的发展当中 , 并从中受益 。
“微软的使命是予力世界每个人和每个组织成就不凡 。 我们通过持续创新打造更具包容性的技术和工具 , 不断降低技术门槛 , 让技术创新成果普惠大众 , 推动技术无障碍建设 , 帮助世界各地的公益组织通过创新技术实现公益事业的跨越发展 。 微软世界各地的员工都参与其中 。 ”洪小文说 。
而在这背后是来自微软的科学家和工程师付出的巨大努力 。 想要逼真一分 , 背后需要百倍付出 。 微软云计算与人工智能事业部首席产品总监丁秉公“揭秘”了 , 为什么人工智能合成的声音可以做到如此逼真?是怎样的黑科技在背后作为支撑?
丁秉公表示 , 利用AI技术进行语音识别和语音合成 , 简单来说 , 需要完成一个“ABC公式” , 即A是算法 , 算法是人工智能的核心;B是大数据 , 有了足够大的数据 , 算法这个“厨师”才能做出好菜 , 否则巧妇难为无米之炊;C是算力 ,AI需要一个强大平台的支撑 , 以微软Azure云平台为例 , 它为人工智能提供一个安全、可靠、可信的计算平台 , 让算法能够在上面非常好的运行 。
万物有声:不止公益 , AI赋能有声内容生产
视障人群通过聆听来“阅读” , 但对于普通人来说 , “有声化”阅读也越来越受到欢迎 。 随着“耳朵经济”的兴起 , 有声内容正在成为国人文化消费的重要场景 。
以图书出版领域为例 , 近年来 , 纸声同步、纸声联动已经逐渐成为行业趋势 , 而AI技术大大提升了图书出版行业创作“有声内容”的生产力 。 因此 , 除了在公益领域 , 微软的AI语音识别和语音合成的技术和产品也在赋能机构媒体转型升级 , 协助更多内容创作者产出个性化音频内容 , 让声音成为品牌 。
中信出版集团社会责任部主任孔彦表示 , 很多出版机构现在不止有读者 , 也有听众 , 都会推出有声书平台 , 不仅仅是服务视障人士 , 大众也非常喜欢 。 而AI技术可能帮助出版机构实现 , 文字向声音的转化更快捷 , 成本也大幅降低 。
湛卢文化副总裁、湛卢阅读APP负责人陈漪也表示,AI技术不仅能够帮助湛卢在有声内容制作上提升效率、降低成本 , 也可以帮助打造属于自己的声音品牌 , 为整体品牌赋能 。
实际上 , AI演播员、AI新闻主持人、AI电台主播、AI歌手……微软智能语音合成和语音识别解决方案 , 已经在落地多个业务场景 , 不止公益 , 而是具有经济和社会双重效益 。
“技术必须以人为本、以人为中心 。 通过人工智能技术创新 , 微软希望能扩展每个人的能力 , 解放他们的思维和创意 , 使他们可以投入更具策略性和创新性的探索 , 从而帮助个人和组织实现更多、更重要的目标 。 通过微软Azure认知服务来赋能不同领域的工作者 , 可以让即使不具备机器学习专业技术背景的人也能轻松使用AI , 并由此产生出创新的连锁反应 。 ”微软全球技术院士、微软Azure AI首席技术官黄学东表示 。
- iOS|恒创科技:Linux日本云服务器安全设置的基本步骤
- m1|亚马逊 AWS 云服务添加苹果 M1 Mac mini 实例
- 量子计算|从微商到直播,一个顶流江湖的兴衰
- 出行服务|百度Apollo自动驾驶出行服务平台“萝卜快跑”将落地重庆永川
- 字节旗下火山引擎发布全系云产品,计划3年服务10万用户|最前线 | 字节
- 互联互通|从3999跳水至2399,小米11加速退场,你还选择骁龙870吗?
- 数字化|“AI即服务”,字节跳动的新“引擎”
- 目标|目标用户从哪来?
- 叮咚|从商品采购到商品开发,叮咚买菜打造生态型供应链体系
- 马云|媒体采访马云:如此富有为何从不“花天酒地”?马云回答引人深思