搜狗夺食科大讯飞语音识别


搜狗夺食科大讯飞语音识别
配图来自Canva随着AI技术的跨越式发展 , 智能产品逐渐渗透在日常生活的各个领域 。 不过 , 智能产品的开发 , 还是需要建立在AI技术进步的基础上 。 而AI技术的进步 , 则能够方便智能产品推进商业化 。在语音识别领域 , 代表语音技术圈领先水平的INTERSPEECH为促进语音识别技术的进步 , 举办了2020届语音识别挑战赛 。 在今年举办的INTERSPEECH 2020 DNS挑战赛中 , 搜狗以4.01的MOS评分夺得冠军 。AI降噪技术取得的喜人成绩 , 让搜狗在语音识别技术的商业化推进中有了更足的底气 。 在推出S1录音笔产品中 , 搜狗就将AI降噪技术应用其中 , 并获得了不错的用户评价 。不过 , 同样身居AI录音笔市场的科大讯飞也在不断发力 , 和搜狗展开竞争 。 与此同时 , 搜狗在AI商业化方面 , 也受到来自产品以及商业模式两方面的挑战 。 而在这场竞争中 , 搜狗和科大讯飞谁能够胜出 , 还有待市场考量 。DNS夺冠 , 醉翁之意不在酒作为语音领域尖端组织之一 , INTERSPEECH一直代表着国际语音技术领先水平 , 并在全球范围内拥有极大影响力 。 而DNS挑战作为INTERSPEECH2020的竞赛主题之一 , 其比赛结果就代表了企业在业界的语音识别技术最高水平 。据悉 , 今年举办的DNS挑战主要以MOS评分作为语音技术评价标准 , 考核内容为微软官方提供的500h数据集语音识别 。 最终 , 搜狗以4.00的MOS评分超过亚马逊 , 夺得RT(实时降噪)技术赛道桂冠;而在NRT(非实时降噪)赛道 , 搜狗也已3.90的MOS评分位居第二 , 成绩喜人 。RT、NRT技术赛道的亮眼成绩 , 也让致力于AI技术研发的搜狗略感欣慰 。 作为语音赛道早期的入局者 , 搜狗一直围绕语音技术展开产品创新和技术探索 , 并凭借着多年积累的优势在业界居于领先地位 , 而这次DNS挑战夺冠 , 也正是其在语音识别领域多年积累下强劲实力的体现 。除了获得业界AI技术认可之外 , 语音识别赛道取得的亮眼成就 , 对搜狗AI技术的商业化推进也有重大意义 。 搜狗在AI领域多年深耕 , 研发投入超过数亿美元 , 曾让其面临了巨大的财务压力 。 而这次AI降噪技术夺冠 , 必然对其推进AI商业化进程、降低自身财务压力大有裨益 。目前智能语音市场 , 对AI降噪技术的应用还比较有限 , 仅应用在语音通话等简单场景 。 在市场技术应用场景有限的情况下 , 搜狗率先变革创新 , 将AI降噪技术应用在AI录音笔上 。趁热打铁 , 力推AI录音笔虽然AI降噪技术夺得冠军 , 但这并不是搜狗的最终目的 。 而搜狗在AI领域持续投入技术研发 , 最终还是要将技术成果商业化 。语音识别技术的商业化落地 , 对持续亏损的搜狗来说刻不容缓 。 搜狗近日发布的财报显示 , 2020年第二季度共亏损0.085亿美元 , 搜狗解释主要是搜索引擎、AI技术持续研发的投入所致 。 研发的持续投入 , 自然让搜狗承压 , 而抓住有限的变现渠道、摆脱亏损境况就成了搜狗必须要做的事 。事实上 , 搜狗早就在加紧AI技术的商业化落地 。 今年举办的“同舟共记”发布会上 , 搜狗发布了最新的S1、E1两款具有AI降噪功能的录音笔 , 并使用了pureVoice人工智能降噪算法、clairVoice8麦阵列算法 。 通过其领先的AI降噪技术 , 搜狗的S1、E1录音笔可以做到过滤4万余种真实噪音 , 还能在嘈杂的环境高度并准确还原人声 。凭借着强大的AI降噪技术实力 , 搜狗的S1、C1、C1Pro产品受到用户追捧 , 首发8小时就已售出5000台 。 而在罗永浩直播中 , 搜狗的S1录音笔也有不错的表现 。 在吹风机的强力干扰下 , S1录音笔也能将现场录音清晰还原 , 其强大的语音还原能力受到了老罗和直播间网友的好评 。S1录音笔取得的亮眼成绩 , 多少对搜狗承受的财务压力有所缓解 。 不过 , 搜狗的录音笔虽然有AI降噪技术的优势 , 但同时也面临着变现模式单一、产品同质化的问题 。商业化之殇搜狗在AI产品商业化推进中 , 首先遇到的是变现模式单一的难题 。AI技术高额的研发投入 , 始终让搜狗处于亏损的状态 , 而AI降噪技术的应用也仅限于录音笔产品 。 这样的情况下 , 搜狗为了扭亏为盈 , 在语音转录应用上开启了会员收费模式 。 例如 , 用户在知乎平台爆出搜狗的S1录音笔 , 购买后赠送一年会员(198元/年) , 但在会员时间结束后 , 转写文字功能需要收费才能使用 。和市场上主打转写功能终身免费的产品相比 , 搜狗的会员收费模式自然备受用户诟病 。 而在众多产品主打免费转录的情况下 , 用户自然不愿意为搜狗的收费会员买单 。此外 , 录音笔市场产品同质化的问题也比较严重 。 例如搜狗的S1产品 , 和科大讯的SR501录音笔相比并没有明显差异 。 例如 , 在外观结构设计上 , SR501、S1录音笔都使用了2+6麦克风阵列 , 能在多场景模式下清晰收音;语音识别方面 , SR501、S1都支持10种以上语言识别功能 , 且在中文方言转写方面势均力敌 。从这两款录音笔功能对比中也不难发现 , SR501、S1录音笔的识别能力、外观设计都非常相近 。 这样的情况下 , 搜狗AI降噪技术领先的光环就不再明显 , 这也意味着搜狗录音笔将面临更大的竞争压力 。战场升级 , 胜负未知搜狗AI降噪技术商业化取得突破后 , 科大讯飞也入局AI录音笔市场 。 虽然入局较晚 , 但科大讯飞凭借着其在语音识别方面的优势地位 , 仍在不断加码布局 , 和搜狗展开正面交锋 。在语音识别技术方面 , 作为后起之秀的科大讯飞 , 其AI语音识别技术积累也非常深厚 , 虽然搜狗有领先的AI降噪技术 , 但仍很难拉开差距;在平台服务方面 , 科大讯飞特有的“平台+生态”优势 , 是搜狗无法企及的 。相比之下 , 搜狗也难以在和科大讯飞的竞争中取得较大优势 , 而且科大讯飞仍继续在技术研发方面加大投入 , 缩小其与搜狗的AI技术差距 。 由此可见 , 在未来的AI录音笔市场 , 科大讯飞将会是搜狗强劲的对手 。不过 , 在这场AI录音笔的市场争夺战中 , 搜狗也并非没有优势 。 腾讯收购搜狗后 , 搜狗由于亏损造成的现金流吃紧问题将会得到缓解 , AI领域的技术研发也能得到腾讯全力的支持 。 在现金流紧缩问题缓解之后 , 搜狗的AI语音技术必然能够得到进一步提升 , 其商业化推进也能更进一步 。但是 , 腾讯的助力能否让搜狗以技术优势领先科大讯飞 , 还是个未知数 。 不过可以预见的是 , 在接下来AI录音笔市场 , 科大讯飞和搜狗的竞争只会更加激烈 。文/刘旷公众号 , ID:liukuang110分页标题