儿童|人工智能与4岁儿童的对比( 三 )


自上而下的贝叶斯模型
自上而下的方法在早期人工智能研究中发挥了重要作用,在 21 世纪最初的 10 年,它以概率或贝叶斯生成模型的形式,再次发挥出重要作用。早期使用这种方法时面临两个问题。首先,大多数的证据模式原则上可以用许多不同的假设来解释:我的杂志电子邮件可能是真的,只是看起来不太像。其次,生成模型使用的概念最初来自哪里?柏拉图和乔姆斯基说你生来就有这些概念。但是又如何解释我们是怎样学习最新的科学概念呢?如何解释连小孩子都知道恐龙和火箭船?
贝叶斯模型将生成模型和假设检验与概率论相结合,解决了这两个问题。贝叶斯模型可以让你在给定数据的情况下,计算出一个特定假设为真的可能性有多大。通过对已有的模型进行微小而系统的调整,并根据数据对其进行测试,我们可以从旧的模型中创建新的概念和模型。虽然有这些优势,但同时也出现了其他问题。贝叶斯技术可以帮助你从两个假设中选择出可能性更大的一个,但可能假设的数量非常巨大,没有一个系统能够有效地考虑到所有的假设。而且在最开始,你如何决定哪些假设值得测试?
纽约大学的布伦登·莱克(Brenden Lake)和同事们用这种自上而下的方法来解决另一个问题,这个问题对人类来说不算个问题,但对计算机来说却非常困难,那就是识别不熟悉的手写字符。看看日文卷轴上的一个字符。即使你以前从未见过,你也很可能能够看出它与另一本日本卷轴上的一个字符是相似还是不同。你可能还会画出来,甚至根据你看到的日本字来设计一个假的日本字—— 一个看起来与韩文或俄文字符截然不同的假日本字。
用自下而上的方法识别手写字符,就是给计算机输入每一个字符的上千个例子,让它找出明显的特征。但与此相反,莱克等人却给程序提供了一个关于如何书写字符的通用模型:一个笔画是向右还是向左;完成一个笔画后,开始另一个笔画;以此类推。当程序看到一个特定的字符,它就可以推断出这个字最有可能的笔画顺序,正如我根据垃圾邮件制造过程推断出我的电子邮件很可疑一样。然后,它可以判断出一个新字符是按照那个顺序还是按照另一个顺序写的,它自己还能创造出一组相似的笔画。与输入完全相同数据的深度学习程序相比,这个程序要好得多,它更细致地反映出人类的表现。
这两种机器学习方法优缺点互补。在自下而上的方法中,开始时程序不需要太多的知识,但是需要大量的数据,而且它归纳总结的方法有限。在自上向下的方法中,程序可以从几个示例中学习,进行更广泛、更多样化的归纳,但是开始时你需要在其中构建更多的内容。许多研究者目前正试图将这两种方法结合起来,使用深度学习来实现贝叶斯推理。
人工智能最近的成功在一定程度上是因为扩展了这些旧思想。但除了这个事实,还有更多原因:因为有了互联网,我们有了更多的数据;因为有了摩尔定律,我们有了更多的计算能力来应用于这些数据。此外,还有一个被忽略的事实是,我们所拥有的数据已经被人类分类、处理。发布到网络上的“猫”的图片是典型的猫图片,是人类已经认定为“好”的图片。谷歌翻译之所以能成功,是因为它利用了数以百万计的人工翻译,将它们推广到新的文本片段,而不是真正理解句子本身。
而人类小孩真正值得注意的却是,他们能把每种方法的最佳特性组合在一起,然后获得比这些方法都好的方法。我们也不知道他们是怎么做到的。在过去的 15 年里,发展主义者一直在探索儿童从数据中学习结构的方法。4岁的孩子可以通过只举一两个数据例子来学习,就像自上而下的系统一样,还能归纳出完全不同的概念。但是他们也可以从数据本身学习新概念和模型,就像自下而上的系统一样。
例如,在我们的实验室里,我们给孩子们一个“blicket 探测器”,这是一个新机器,他们从未见过,他们需要弄清楚这是什么。它是一个盒子,当你把特定的物体而不是其他物体放在上面时,它会发光并播放音乐。我们只给孩子们举了一两个机器工作原理的例子,告诉他们,两个红色的方块可以使机器运转,而绿黄的组合则不行。即使是 18 个月大的孩子也会立刻明白这个一般原理,即两个物体必须相同才能使机器运转,他们把这一原理推广到新的例子中:例如,他们选择两个形状相同的物体使机器工作。在其他的实验中,我们已经发现,孩子们甚至可以意识到,有一些隐藏的无形属性使机器运转,或者机器按照一些抽象的逻辑原理进行工作。