#影客网络科技#如何利用物理思想帮助机器“升维学习”?( 二 )


例如 , 以码或者米为单位测量一个足球场的长度 , 得到的数字是不同的 , 但其中规律是不变的 。 同样 , 两位摄影师从两个不同的位置拍摄物体 , 会产生不同的图像 , 但是这些图像可以彼此关联 。 等规可确保物理学家的现实模型保持一致 , 无论观察角度或测量单位如何 。 等规卷积神经网络对数据做出了相同的假设 。
纽约大学的物理学家凯尔·克兰默(KyleCranmer)将机器学习用来研究粒子物理学 。 他说:“(物理学的)想法是 , 没有哪个方向是特殊的 。 他们希望把这一原则用在神经网络上 , 而且他们真的做到了 。 ”
摆脱“平地”
伦敦帝国理工学院的计算机科学家迈克尔·布朗斯坦(MichaelBronstein)在2015年创造了“几何深度学习”一词 , 用以描述为“摆脱平地”而进行的初创工作 , 并设计了可以学习非平面数据模式的神经网络 。 这个词和研究工作很快流行起来 。
布朗斯坦和他的合作者知道 , 超越欧几里德平面将要求他们重新构想一种基本的计算程序 , 该程序首先应使神经网络在二维图像识别方面有效 。 此过程称为“卷积” , 它使神经网络中的一层对输入数据的每一块执行数学运算 , 然后将结果传递到网络中的下一层 。
“大致上 , 你可以将卷积视为可以滑动的窗口 , ”布朗斯坦解释说 。 卷积神经网络将许多这些“窗口”作用到数据上 , 就像过滤器一样 , 每一个都旨在检测数据中的某种模式 。 如果是猫的照片 , 经过训练的卷积神经网络可能会使用检测原始输入像素中低级特征(例如边缘)的过滤器 。 这些特征将传递到网络中的其他层 , 执行另外的卷积操作 , 并提取更高阶的特征(例如眼睛 , 尾巴或三角形的耳朵) 。
接受过识别猫训练的卷积神经网络最终将使用这些分层卷积的结果为整个图像分配标签(例如“猫”或“非猫”) 。
1.特征检测装置在图片上滑过 , 每个过滤器与图片中每个块之间的匹配度被记录下来 , 产生一组特征映射 。 2.经过操作之后 , 特征映射又可以利用卷积求解更高维的特征 。 3.最后 , 神经网络学会辨别 , 正确分类图片 。
但是这种方法仅适用于平面 。 韦林说:“当要分析的表面变弯时 , 你就遇上麻烦了 。 ”
在曲面(在几何学上称为流形)上进行卷积 , 就像在地球上拿着一小块半透明的方格纸 , 试图准确地追踪格陵兰岛的海岸线 。 你不能在不使纸张起皱的情况下将正方形按在格陵兰岛上 , 这意味着当你再次将其放平时 , 你的图形会变形 。
同时 , 将纸与地球表面相切放置 , 然后穿过这张透明纸片描绘格陵兰岛的边缘 , 这种方法(称为Mercator投影)也会产生变形 。
另外 , 你也可以索性将方格纸放在平坦的世界地图上描边 , 但是这相当于在复制这些变形——就像地图的整个上边缘其实只代表一个点(北极) 。
如果流形并不像球体那样是一个规则的球体 , 而是一个更复杂更不规则的东西 , 比如瓶子 , 或者折叠的蛋白质 , 那么在它上进行卷积就变得更加困难 。
布朗斯坦和他的合作者在2015年找到了解决非欧氏流形上的卷积问题的一种解决方案 , 方法是将滑动窗口重新想象成类似圆形蜘蛛网的形状 , 而不是一张方格纸 。 这样就可以将其压向地球(或任何弯曲的表面) , 而不会使其弯曲 , 拉伸或撕裂 。
以这种方式改变滑动滤波器的属性 , 能够使卷积神经网络更好地“懂得”某些几何关系 。 例如 , 网络可以自动识别出弯曲成两个不同姿势的三维形状(例如 , 一个站立的人和一个抬起一条腿的人)是同一物体 , 而不是两个完全不同的对象 。 这一变化也使神经网络的学习效率大大提高 。 布朗斯坦说 , 常规的卷积神经网络“需要花数周时间 , 使用数百万个形状示例进行训练;我们使用了大约100种形状的不同姿势 , 并进行了大约半小时的训练 。 ”