下一代人工智能的发展方向 (上)

今日分享
By Rob Toews
下一代人工智能的发展方向 (上)文章插图
尽管人工智能的诞生已经超过半个世纪 , 但近十年来人工智能领域发展非常迅速 。 自2012年ImageNet竞赛开始深度学习的现代时代以来 , 只有8年的时间 。 自那时以来 , 人工智能领域的进步令人震惊 , 现在人工智能已经深入我们日常工作生活的方方面面 。
有专家表示 , 这个惊人的步伐只会越来越快 。 从现在开始的五年后 , 人工智能领域将与今天大不相同 。 当前被认为是最先进的方法将已经过时;今天刚刚出现或处于边缘的方法将成为主流 。
下一代人工智能将是什么样子?哪种新颖的AI方法将释放当前在技术和业务方面难以想象的可能性?本文重点介绍了AI中的三个新兴领域 , 这些领域将在未来的几年中重新定义人工智能领域和社会 。
1、无监督学习
当今AI世界中最主要的范例是有监督的学习 。 在监督学习中 , AI模型从数据集中学习人类根据预定义类别进行策划和标记的过程 。 (术语“监督学习”源于人类“监督者”预先准备数据的事实 。 )
在过去的十年中 , 尽管从无人驾驶汽车到语音助手 , 有监督的学习已经推动了AI的显着进步 , 但它仍然存在严重的局限性 。
下一代人工智能的发展方向 (上)文章插图
手动标记成千上万个数据点的过程可能非常昂贵且繁琐 。 在机器学习模型提取数据之前 , 人们必须手动标记数据这一事实已成为AI的主要瓶颈 。
在更深层次上 , 有监督的学习代表了一种狭窄的、受限制的学习形式 。 受监督的算法不仅无法探索和吸收给定数据集中的所有潜在信息、关系和含义 , 而且仅针对研究人员提前确定的概念和类别 。
相反 , 无监督学习是一种AI方法 , 其中算法无需人工提供标签或指导即可从数据中学习 。
许多AI领导者将无监督学习视为人工智能的下一个前沿领域 。 用AI传奇人物Yann LeCun的话说:“下一场AI革命将不会受到监督 。 ”加州大学伯克利分校的教授Jitenda Malik更加生动地说:“标签是机器学习研究人员的鸦片 。 ”
无监督学习如何工作?简而言之 , 系统会根据世界的其他部分来了解世界的某些部分 。 通过观察实体的行为 , 实体之间的模式以及实体之间的关系(例如 , 上下文中的单词或视频中的人物) , 系统引导了对其环境的整体理解 。 一些研究人员用“从其他事物中预测所有事物”来概括这一点 。
无监督学习更紧密地反映了人类学习世界的方式:通过开放式探索和推理 , 不需要监督学习的“训练轮” 。 它的基本优点之一是 , 世界上总是会有比已标记数据多得多的未标记数据(前者更容易获得) 。
用LeCun的话来说 , 他喜欢密切相关的术语“自我监督学习”:“在自我监督学习中 , 输入的一部分用作监视信号 , 以预测输入的其余部分 。 可以通过自我监督学习而不是[其他AI范式]来学习有关世界结构的知识 , 因为数据是无限的 , 每个示例提供的反馈量很大 。 ”
无监督学习已经在自然语言处理中产生了变革性的影响 。 NLP得益于一种新的无监督的学习架构 , 即Transformer , 最近取得了令人难以置信的进步 , 该架构始于Google大约三年前 。 (有关Transformer的更多信息 , 请参见下面的#3 。 )
将无监督学习应用于AI的其他领域的努力仍处于早期阶段 , 但是正在取得快速进展 。 举个例子 , 一家名为Helm.ai的初创公司正在寻求利用无监督学习来超越自动驾驶汽车行业的领导者 。
许多研究人员将无监督学习视为开发人类级AI的关键 。 LeCun认为 , 掌握无监督学习是“未来几年ML和AI面临的最大挑战 。 ”
下一代人工智能的发展方向 (上)文章插图
2、联合学习
数字时代的主要挑战之一是数据隐私 。 由于数据是现代人工智能的命脉 , 因此数据隐私问题在AI的发展轨迹中扮演着重要的角色(并且常常是限制性的) 。
保持隐私的人工智能(使AI模型能够从数据集中学习而不损害其隐私的方法)正变得日益重要 。 保持隐私的AI的最有前途的方法也许是联合学习 。
联合学习的概念最早由Google的研究人员于2017年初提出 。 在过去的一年中 , 对联合学习的兴趣激增:到2020年的前六个月 , 发表了超过1,000篇有关联合学习的研究论文 , 而在2018年只有180篇 。
【下一代人工智能的发展方向 (上)】