神经现实|大脑神经网络:不完美的“民主社会”( 五 )


视觉系统:选择性和不变性
我们已经知道单个神经元是如何运作的 ——如果我们愿意忽视大量复杂的生物细节 , 那么每个神经元所做的计算 , 不过是一种简单的民主投票 。 一个由许许多多这种过分简化的神经元构成的网络 , 却已经可以执行非常复杂的任务 ——比如视觉识别 。
我们之前提到 , 低阈值的兴奋性McCulloch-Pitts神经元相当于逻辑电路中的“与门” , 高阈值的兴奋性McCulloch-Pitts神经元相当于逻辑电路中的“或门” 。 高阈值的神经元像是木讷的好脾气 , 不易被激活;而低阈值的神经元像是人群中极易被煽动的坏脾气 , 容易被激活 。 高阈值的神经元对于输入刺激更加挑剔 , 只对特定输入响应 , 行为相对简单;而低阈值的神经元的响应门槛很低 , 对许多相似的输入都会响应 , 行为相对复杂 。 换句话说 , 高阈值神经元试图实现对输入的选择性(selectivity) , 而低阈值神经元试图捕捉输入中的不变性(invariance) 。
选择性和不变性 , 正是视觉系统的两大特点 。 我们能够从视野中识别出一块“芝士蛋糕” , 依赖于神经系统的选择性将蛋糕的视觉特征和其他物体加以区分;同时 , 类似于赫拉克利特的河流 , 受视角、亮度、颜色、位置、背景的影响 , 我们不能两次看到同样的“芝士蛋糕” , 我们需要神经系统抓住“芝士蛋糕”视觉特征的一些不变性 , 来排除与这一识别过程无关的变量 。
神经科学家对视觉皮层的研究 , 将McCulloch-Pitts神经元的这些计算特性与视觉过程联系起来 , 并启发了广泛用于计算机视觉的卷积神经网络(convolutional neural networks) 。 1959年 , 诺贝尔生理学奖得主大卫·休伯尔(David Hunter Hubel)与托斯坦·威泽尔(Torsten Nils Wiesel)发现大脑初级视觉皮层(V1)中的一类称为“简单细胞”的神经元 , 能对视野中具有特定空间朝向的刺激选择性地做出反应 。 一个“简单细胞”会响应接近特定方向的光条 , 而不响应具有其他方向的光条 。

神经现实|大脑神经网络:不完美的“民主社会”
本文插图
Hubel和Wiesel在麻醉后的猫眼前放一块屏幕 , 并往屏幕上投射不同朝向的光条 。 他们将有玻璃包裹的钨丝微电极插入猫的初级视皮层 , 记录神经元的电活动 。 他们发现当只有当光条转向特定角度时 , “简单细胞”的放电最为强烈 。

图片来源于参考文献[2] , 有修改
休伯尔和威泽尔还在实验中发现 , 除了“简单细胞”外 , V1 还包含另一类称作“复杂细胞”的神经元 。 它们像“简单细胞”一样 , 具有方向选择性(orientation selectivity) , 但它们的反应对刺激光条在感受野(receptive field)内的位置不敏感 。 这种对位置不敏感的特点很好地建立了“复杂细胞”对于特定光条的位置不变性(location invariance) 。 而“简单细胞”对刺激光条在其感受野的兴奋性子区域内的具体位置相当敏感 。
为了解释V1中的神经元呈现出的方向选择性和位置不变性 , 休伯尔和威泽尔在1962年的一篇论文中提出了一个神经网络模型 。 在他们的模型中 , “简单细胞”是具有高阈值的McCulloch-Pitts神经元 , 从外侧膝状核(lateral geniculate nucleus , LGN)中一些感受野沿直线排列的神经元接收输入 。 如果一束光条恰好有相同的朝向和位置 , 所有这些LGN神经元就会被激活 , 从而激活与这些神经元相连的视觉初级皮层中的高阈值的“简单细胞” 。 但如果光条的朝向发生变化 , 则只有这些LGN神经元中的部分被激活 , 兴奋性的输入总和未达到阈值 , “简单细胞”不会被激活 。 这就实现了“简单细胞”对方向的选择性 。
实现“复杂细胞”的位置不变性需要神经网络的层级结构 。 在Hubel-Wiesel模型中 , “复杂细胞” 是具有低阈值的McCulloch-Pitts神经元 , 它们从一些具有相同方向选择性“简单细胞”接受输入 。 如果光条的朝向恰好是那些“简单细胞”的偏好刺激 , 那么至少有对应于一个位置的“简单细胞”会被激活 , 从而激活低阈值的“复杂细胞” 。 这解释了为何刺激在感受野中的位置不会影响“复杂细胞”的活动 。