「环球Tech」微软语音技术不断突破 加速各行业发展


【***科技综合报道】人工智能如今已经家喻户晓 , 从日常生活到行业赋能 , 都可见其存在 。 在这之中 , 伴随着智能音箱等单品的爆发、语音交互的普及 , AI语音技术也走进大众视野 。 历经近30年的探索 , 微软AI语音性能已达到全球领先水平 , AI语音技术服务遍及140个国家和地区 。
从2017年在Switchboard语音识别基准测试中以低至5.1%词错率创造当时对话语音识别错误率最低纪录以来 , 微软AI语音技术不断解锁新成就:成为首个在中译英新闻报道的翻译质量和准确率上媲美人工翻译的翻译系统;带来媲美人类专业发音人水平的基于深度神经网络的语音合成技术;2019年 , 在斯坦福对话式问答任务中 , 微软机器阅读理解系统刷新记录 , 成为排行榜上唯一一个超过人类分数的模型 。
谈及此 , 微软(亚洲)互联网工程院资深产品总监丁秉公说道:“对于微软来说 , 我们要让更多的研究成果走出实验室 , 不仅要输入到微软的各个产品中 , 而且还要通过提供先进的工具和平台服务 , 让合作伙伴和开发者获得可打造自己的人工智能产品和解决方案的能力 , 这也是微软语音研发的一个定位 。 ”
「环球Tech」微软语音技术不断突破 加速各行业发展
本文插图
疫情当下 , 为助力企业高效恢复生产 , 微软围绕Azure、Office 365、Dynamics365 智能云服务和Surface硬件 , 推出了多项免费及优惠措施 。 本次微软还在疫情期间面向有需要的企业、政府机构和开发者推出免费语音服务 , 包括语音识别、语音合成、语音评估服务 。
【「环球Tech」微软语音技术不断突破 加速各行业发展】微软AzureAI语音服务平台的功能已经渗透到各个领域和应用场景 。 据悉 ,AI语音在疫情期间可以有着广泛应用 , 譬如可以应用于通过防疫智能外呼 , 进行社区情况排查和通知 , 回访协助政府排查疫情;利用智能语音导航与智能客服 , 解答用户的问题 , 协助用户办理业务 , 同时启动智能客服表单服务 , 帮助企业和政府收集和记录信息;实现智能医疗 , 助力医院智慧化建设 , 通过图片分析/人脸识别 , 声音合成 , 语音识别/声纹识别 , 语言理解/信息搜索等功能 , 实现患者与医务人员、医疗机构、医疗设备之间的互动 。 可与多种医疗数据整合 , 构建智慧医疗体系;以及在疫期利用AI语音合成系统将文字内容转成有声书 , 提高学习娱乐体验 。
对此 , 丁秉公也表示:“我们在由世纪互联运营的微软Azure云上推出了面向中国用户的语音服务 , 助力复工复产复学 , 让企业可以更好地把握未来数字化转型机遇 , 让公共部门更有效率 , 让个人成为技术创新的受益者 。 ”
几十年来 , 微软一直从事着与人工智能相关的技术研发 , 微软全球人工智能首席技术官 , 原微软首席语音科学家黄学东此前更是在采访中指出 , 语音和语言技术是AI皇冠上的明珠 。 在万物互联的5G时代下 , 随着低延时、低功耗、高带宽的到来 , 语音交互也将会成为一个主流 。
“伴随语音技术更加成熟 , 应用场景越来越丰富 , 语音交互通过定制也将可以达到更加卓越的效果 。 这里包括两个层面 , 就语音识别来说 , 一个语音识别系统的识别精度会受到领域相关的词汇影响很大 。 通过定制 , 就可以针对某一个领域的专业词汇 , 让它的识别精度在原有通用模型的技术上变得很高 , 还可以针对每一个人的这个口音进行定制 。 另外一个方面来说 , 微软语音合成的定制可以为企业定制从男女 , 到不同年龄的丰富音色 , 甚至对于同一个音色我们可以定制各种的风格 。 ” 在谈到不断优化的语音交互体验时丁秉公说道 , “因为5G时代的网络会比现在更加快更加好 , 联上网一定会有很好的网络服务 , 所以基于这两点 , 我相信整个语音的应用会有一个爆发式增长 。 ”