『栈外』我们还要多久才能拥有?,钢铁侠的AI助理贾维斯

本文看点
?在要在现实生活中拥有钢铁侠的AI助理贾维斯 , 自然语言处理(NLP)就是出发点 。 作为人工智能的子领域 , NLP能够缩减人与机器之间的交流差距 。
?机器翻译作为NLP的第一步 , 经历了从基于规则、基于语法、基于短语至基于神经网络的变革 , 迎来了商业规模翻译领域的质变飞跃 。
?NLP不仅应用于机器翻译 , 还应用于垃圾邮件的辨别、智能虚拟助手、聊天机器人和情绪分析 。 而NLP的未来在于实现机器的深度学习 , 到那时 , 拥有贾维斯不再是梦 。
『栈外』我们还要多久才能拥有?,钢铁侠的AI助理贾维斯
文章图片
原文来自Hackernoon , 作者IdaJessieSagina
“贾维斯 , 你在吗?”
“随时待命 , 先生 。 ”
托尼·斯塔克随后给出了一系列命令 , 穿上了他超酷的钢铁侠套装 。
贾维斯甚至警告斯塔克先生 , 要先完成TB量级计算才可以尝试实际飞行 , 但托尼却自以为是地回答道:“贾维斯 , 有时侯 , 你必须在走路前学会跑步” 。
这看起来像是与私人助理的普通对话 , 对吧?
但贾维斯并不是人类 , 而是一个能够流畅对话 , 并且全天候提供服务的智能AI助手 。
如果你想要在现实生活中重建贾维斯 , 自然语言处理(下称NLP)将是你要考虑的第一个技术 。
NLP属于AI的子领域 , 它使机器理解语音或文本形式的人类语言 , 进而减小了人与机器之间的交流差距 。
如今市面上已经有了好几个虚拟助手 , 例如Siri和Cortana , 我们是否已经做好了推出贾维斯的准备?让我们回顾一下NLP在过去几十年中的使用 , 以及它未来的发展方向 。
『栈外』我们还要多久才能拥有?,钢铁侠的AI助理贾维斯
文章图片
NLP的起源
艾伦·图灵于1950年发表的论文《计算机械与智能》中提出了一个革命性的问题:“机器可以思考吗?”20世纪40年代就在机器翻译中瞥见了NLP , 如今流行的“图灵测试”(也被称为模仿游戏)为机器理解复杂的语言学创造了可能 。
为了满足图灵的标准 , 机器必须先理解人类的自然语言 , 才能构建出类似人类的智能回应 。
随后 , 有许多人试图通过图灵测试 。 ELIZA、SHRDLU和PARRY都NLP领域的先驱 。 在NLP研究短暂停滞之后 , 由美国政府创建的自动语言处理咨询委员会(ALPAC)停止了对NLP研究的资助 , NLP在20世纪80年代才迎来了“统计革命”的新领域 。
NLP自20世纪80年代以来的发展非常有趣 , 当时统计方法的应用增长显著 。
『栈外』我们还要多久才能拥有?,钢铁侠的AI助理贾维斯
文章图片
机器翻译时代
机器翻译可以说是教授机器人类自然语言的起源 。 Google翻译如今的简单易用可以追溯到20世纪30年代 , 当时机器翻译开始申请专利 。
1954年见证了机器翻译的曙光 , 科学家进行的Georgetown-IBM实验将60多个俄语句子自动翻译成了英语 。 在80年代末期 , 统计型机器翻译(SMT)抢走了规则型翻译的风头 。
当时IBM的CandideProject项目人员研究了加拿大议会辩论报告中的法语和英语文本语料库 , 放弃了语言学规则 , 选择计算概率 。
同时 , 日本研究团队也开启了基于语料库的翻译或基于示例的机器翻译(EBMT)的研究 , 该团队曾使用示例或语料库翻译新单词 。
直到1994年 , Systran的机器翻译可以在几个CompuServe聊天论坛中获取 。 1997年 , AltaVista发布的BabelFish(最古老的在线翻译之一 , 后来由Yahoo接管)可以在网页浏览器上进行36组语言的翻译 。
2001年 , 研究人员开始提倡基于语法的机器翻译(翻译语法单位而非单词) 。 2003年至2005年 , 研究建立了基于短语的机器翻译 , 这也在2006年推动了Google翻译 。 Bing和Yandex于2009年和2011年推出了自己的翻译器 。
Google为机器翻译悄悄研究了十年循环神经网络 , 之后Google翻译运用了经庞大的数据集训练的神经网络 , 迎来了商业规模翻译领域的质变飞跃 。