科技小辛辛|在网易有道做语音算法工程师是一种怎样的体验?( 二 )


至于最后的结果 , 其实可以说是「两全其美」 。
科技小辛辛|在网易有道做语音算法工程师是一种怎样的体验?
文章图片
虽然准备还是有些仓促 , 没能拿下冠军 , 但对初出茅庐的网易有道语音团队而言 , 面对强劲的业内对手 , 首次「出击」能拿到顶会挑战赛的二等奖 , 还是证明了现有技术方案可行、新的设想值得进一步推动 。
另一方面 , 团队组长孙艳庆也坦承 , 参与比赛对整个语音团队来说 , 学习到了行业中新的想法和技术 , 打开了后续开发的新思路 。
「秘诀」:技术以落地为导向
其实比起单纯去打比赛、发论文 , 如果和一线的开发者们多聊聊 , 就能明显地感觉到 , 网易有道的这支语音团队是非常务实的——以技术落地为导向 , 以用户反馈为指标 。
孙艳庆谈到 , 在内部 , 技术方案的推动一般有两种途径 。
一种是来自业务端的需求 。 技术团队要做的 , 是去评估现有的技术是否能够解决问题 , 并真正落地到产品中 , 给用户带来优质的体验 。
另一种则来自于工程师们对新技术、新用户需求的敏感度 。 如果判断一种新技术会被大规模地应用 , 技术团队也会提前进行相应的布局 。
而评价成果的指标则更为直接:用户体验 。
这种脚踏实地的作风 , 也给时来、Harry这样的职场新人留下了深刻的印象 。
我们大部分的技术 , 最终都会聚焦到非常具体的产品上面 。 不会去做在将来一段时间看来 , 意义不是很大的一些事情 。
技术如果只是停留在学术层面上 , 就没办法真正流行、发展起来 。 落地对于技术而言是一个非常非常核心的点 。
解决用户切实的问题 , 解决产品中的痛点 , 或许正是在这样的导向之下 , 虽然团队仅成立了不到两年的时间 , 但在产品层面 , 网易有道在语音方面的许多技术点已经跻身行业前列 。
比如语音识别(ASR) 。 以网易有道词典为例 , 对话翻译、发音指导 , 各种功能的实现都离不开精准的语音识别 。 而经过测试 , 有道语音识别技术在一些场景上识别准确率超过98% , 并且 , 不止支持中文、英文 , 还支持日、韩、法、德等多种语言 。
科技小辛辛|在网易有道做语音算法工程师是一种怎样的体验?
文章图片
在语音合成(TTS)方面 , 有道语音合成引擎音色逼近真人 , 同样支持中、英、日、韩、葡等多种语言 。 在过硬的技术基础之上 , 今年9月 , 有道词典还用TTS技术实现了王源明星语音的上线 , 效果受到了用户的广泛好评 。
并且 , 为了更好地服务于产品 , 这支规模并不算大的团队 , 覆盖的技术点却很全面:从录音、拾音环节开始 , 到中间的语义理解 , 再到语音识别合成 , 都有涉及 。 可以说 , 在技术上已经形成了比较完整的链条 。
把「脚踏实地」写进价值观的团队
事实上 , 能以一支小而精的团队支撑起复杂业务背后的核心算法 , 团队内部的氛围是技术实力之外的另一个重要影响因素 。
如果你问有道语音团队的工程师们这支团队的特点是什么 , 就能获得这样几个关键词:年轻、活泼、脚踏实地 。
因为年轻、活泼 , 即使是新人融入起来也完全没有压力 , 不管是技术的交流还是平时的相处 , 都可以畅所欲言 。
另一方面 , 虽然团队成员们普遍年纪不大 , 却个个「身怀绝技」 。 作为组长 , 孙艳庆认为 , 一个脚踏实地的团队 , 应该给每个人充分的才华施展空间 , 而在这个空间之下 , 大家潜心钻研技术 , 在专注于自己侧重点的情况下 , 去突破个人的局限 。
科技小辛辛|在网易有道做语音算法工程师是一种怎样的体验?
文章图片
脚踏实地的价值观延续在整个有道AI团队 。 不仅是在语音方面 , 有道的AI能力还覆盖神经网络翻译(NMT)、图像识别(OCR)和自适应教育等等 。