你知道神经符号人工智能吗?( 二 )


你知道神经符号人工智能吗?文章插图
举个例子 , 一个神经网络的任务是区分猫和狗的图像 。 图像——或者更精确地说 , 图像中每个像素的值——被输入到第一层节点 , 而最后一层节点输出标签为“猫”或“狗” 。 网络必须使用预先标记的猫和狗的图像进行训练 。 在训练过程中 , 网络会调整节点之间的连接强度 , 这样在对图像进行分类时 , 网络的错误就会越来越少 。 一旦经过训练 , 深网就可以用来对新图像进行分类了 。
事实证明 , 深度神经网络在图像和语音识别以及语言之间的翻译等任务上非常强大 。 布朗大学的托马斯·塞尔在2019年视觉科学年度回顾中探讨了深度神经网络在视觉智能方面的优势和劣势 。 “这方面的进展是惊人的 。 ”塞尔说 , “与此同时 , 由于人们非常感兴趣 , 对深度神经网络的限制越来越明显 。 ”
你知道神经符号人工智能吗?文章插图
获取训练数据代价高昂 , 有时甚至是不可能的 , 而且在这方面深度神经网络是很脆弱的:比如 , 如果在图像上添加干扰噪音 , 就会破坏整个网络 , 导致它可能将熊猫归类为长臂猿 。 在没有大量训练数据的情况下 , 深度神经网络很难进行推理和回答抽象问题 , 比如立方体和圆柱体相似吗 。
而且深度神经网络的高深莫测也是出了名的:因为没有任何符号 , 只有数百万甚至数十亿的连接强度 , 人类几乎不可能知道计算机是如何得到答案的 。 这使得人们很难发现它犯错误的原因 , 比如为什么会将熊猫归类为长臂猿 。
神经符号人工智能的挑战可以看到深度神经网络的一些弱点正好是符号人工智能的强项 , 反之亦然 。 因此将二者结合似乎给出了一种强大的解决方法 。 粗略地说 , 混合使用深度神经网络来代替人类构建符号知识库 , 而符号人工智能则可以利用深度神经网络的力量 , 从原始数据中了解世界 , 然后使用符号进行推理 。
2016年 , 研究神经符号人工智能的研究人员遇到了一个挑战 。 斯坦福大学的李飞飞及其同事接受了一项任务 , 要求实现人工智能系统“推理和回答有关视觉数据的问题” 。 为此 , 他们发明了合成语言和基本视觉推理(CLEVR 数据集) 。 它包含了10万张由计算机生成的简单3D形状的图像 , 包括球体、立方体、圆柱体等等 。
你知道神经符号人工智能吗?文章插图
对任何人工智能来说 , 挑战在于分析这些图像并回答需要推理的问题 。 有些问题很简单 , 比如“方块比红色的东西少吗?” , 但有些问题就复杂得多 , 比如“在青色方块后面的小橡胶筒前面有一个大的棕色方块 , 在它的左边有大的青色金属立方体吗?” 。
使用复杂的深度神经网络有可能解决这个问题 。 然而 , 考克斯和他的同事 , 以及谷歌的DeepMind和麻省理工学院的研究人员 , 提出了一个截然不同的解决方案 , 这个方案显示了神经符号人工智能的力量 。
你知道神经符号人工智能吗?文章插图
研究人员首先将这个问题分解成更小的块 , 就像符号人工智能一样 。 本质上 , 他们必须先看一幅图像 , 描述三维形状及其属性 , 然后生成一个知识库 。 然后 , 他们必须将一个英语问题转换成一个符号程序 , 该程序可以在知识库上运行并生成答案 。 在符号人工智能中 , 人类程序员将执行这两个步骤 。 现在研究人员决定让神经网络来代替人类程序员 。
该团队通过使用一系列大量卷积神经网络解决了第一个问题 。 卷积神经网络是一种为图像识别优化的深度神经网络 。 在这种情况下 , 每个网络都被训练来检查图像并识别物体及其属性 , 如颜色、形状和类型(金属或橡胶) 。
你知道神经符号人工智能吗?文章插图
循环神经网络
对于第二个问题 , 研究人员使用了一种被称为循环神经网络的东西 。 这是另一种深层神经网络 , 被设计用来揭示顺序输入的模式 。 例如 , 语音就是一种顺序信息 , 像苹果的Siri这样的语音识别程序使用的就是循环神经网络 。 在这种情况下 , 网络接受一个问题并将其转换为符号程序形式的查询 。 循环网络的输出也被用来决定哪个卷积网络的任务是查看图像和以什么顺序执行 。 整个过程类似于根据需要生成知识库 , 然后让推理引擎在知识库上运行查询来推理和回答问题 。