「脑极体」YouTube玩转的自动字幕,为什么被国内视频网站“主动错过”?,原创

【「脑极体」YouTube玩转的自动字幕,为什么被国内视频网站“主动错过”?,原创】_本文原题:YouTube玩转的自动字幕 , 为什么被国内视频网站“主动错过”?
成为中国YouTube , 这估计是每一家国内视频网站都曾经设想过的目标 。
现在 , 无论是从全球市场规模、还是从营收规模上来说 , YouTube都已经是一个庞然大物 。 而在国内 , 至今已难以找到一家能够与YouTube实力相当 , 甚至说模式相似的视频网站了 。
差异是如何产生的 , 已经成为一个可以写成商业专著的选题了 。 而这一次我们则关心一个更为细节的产品技术问题 , 那就是在YouTube上早已实现的自动字幕功能 , 为何没有在国内的主流的视频网站上出现?
「脑极体」YouTube玩转的自动字幕,为什么被国内视频网站“主动错过”?,原创
文章图片
据报道 , 在2017年初 , 以UGC起家的YouTube已经为10亿条视频提供了自动添加字幕的服务 , 使用者每天的播放次数超过1500万次 , 而且目前已支持全球10种语言的自动字幕加载 , 以及支持包括简体中文在内的上百种语言的机器翻译 。
那么这一自动字幕的功能为何没有被我们国内的视频网站“Copy”?
也许你第一反应会想到技术原因 。 也是也不全是 。 毕竟近几年 , 我国在自动语言识别上面的技术早已成熟 , 在视频网站上应用也许早已不成问题 。
“是不为也 , 非不能也 。 ”如果孟老夫子在世 , 可能还会说出这句话来 。 但原因究竟是啥 , 恐怕还是要继续追问下去 , 而最终我们其实还是想对这些国内视频网站的新老玩家们提问下:
这么“香”的技术 , 到底要不要学习一下呢?
自动字幕:从Goodness到Business
YouTube的自动字幕功能是在2009年由谷歌的工程师们开发的 , 那时离谷歌收购YouTube已经过去三年了 。
这一功能的初衷是 , 通过将视频声音转化成文字字幕 , 为全世界有听力障碍的用户提供便利 。 而开发这一功能的软件工程师肯·海伦斯坦也正是一位聋哑人士 。
众所周知 , YouTube是从用户UGC视频内容起家的 , 目前仍然是全球最大的UGC视频网站 。 当前月用户访问数可以达到18亿 , 用户每分钟上传视频时长达到400小时 , 并且时长还在增长 。
这同时意味着 , 有大量上传的UGC视频中是没有主动添加字幕的 。 这对于正常听力的用户来说 , 并没有什么影响 , 而对于有听力障碍的人来说 , 则相当于缺少了极其重要的音频信息 。
而自动字幕的加入 , 则在一定程度上帮助了听障用户获取更多的信息渠道 。
目前 , 谷歌和YouTube团队正在利用机器学习为自动字幕增加音效信息 , 从而更大程度地丰富音频内容的表达 。 通过添加如铃声、狗叫声、敲门声等音效字幕 , 也正是出于改善聋哑或听障人士的观看体验而进行的技术改进 。
这样一项出于社会责任感和用户公平体验的技术 , 也带来了额外的市场推广价值 。
「脑极体」YouTube玩转的自动字幕,为什么被国内视频网站“主动错过”?,原创
文章图片
随着自动字幕可以识别的语种的增加 , 以及自动翻译功能的加入 , 这一项技术成为一项全球用户都可以受益的功能 。 比如 , 大量优质的英语原声知识分享视频可以通过自动添加英语字幕 , 再转为其他语种 , 供非英语区的用户观看学习 。 这显然对YouTube的全球化推广产生了积极的推动作用 。
在每天上千万次的自动字幕的使用中 , 语音识别难免会出现一定错误 , 但随着YouTube社区用户对这些自动字幕信息进行评论和编辑后 , 这些信息又会再进入机器学习的流程 , 从而帮助自动字幕系统更好地提高准确率 。 同时 , 自动字幕及机器翻译准确度的提升 , 又推动内容推荐的精准度的提升 , 进一步增加用户粘性和使用时长 。
一项帮助提升用户体验的AI技术 , 又在用户的海量数据的帮助下变得更加强大 , 很好地印证了“科技向善”可以带来更多意想不到的好处 。