知否▲还能观察四维时空,人工智能不只能看平面世界( 四 )


科恩、韦勒和韦林在2019年将规范等变编码到他们的卷积神经网络当中 。 他们实现这一点的方式是:对神经网络通过卷积在数据中“看到”的东西设置数学约束;只有规范等变模式通过神经网络层传递 。 “基本上你可以赋予它任何的表面——从欧几里得平面到任意弯曲的物体 , 包括像克莱因瓶或四维时空这样的奇特流形——不管在什么表面上 , 都能很好地进行深度学习 。 ”韦林说道 。
工作原理
规范等变卷积神经网络的理论是如此的泛化 , 以至于它自动地整合了以前的几何深度学习方法的内在假设 , 如球面上的旋转等变 。 就连布朗斯坦早期的方法——让神经网络识别弯曲成不同姿势的单一3D形状——也适用于它 。 “规范等变是一个非常广泛的框架 。 它包含了我们在2015年所做的特殊设置 。 ”布朗斯坦说 。
从理论上讲 , 规范等变卷积神经网络可适用于任何维度的曲面 , 但科恩和他的合著者已经在全球气候数据上进行了测试 。 这些数据必然有一个基本的三维球面结构 。 他们用他们的规范等变框架构建了一个卷积神经网络 , 该卷积神经网络被训练来从气候模拟数据中发现极端的天气模式 , 如热带气旋 。 2017年 , 政府和学术研究人员使用标准的卷积网络来从数据中发现热带气旋 , 准确率高达74%;去年 , 规范等变卷积神经网络以97.9%的准确率发现这种气旋 。 (它的准确率也超过了2018年专为球体设计的一种不太通用的几何深度学习方法——该系统的准确率达94% 。 )
劳伦斯伯克利国家实验室使用深度学习技术的气候科学家马约尔·穆迪根达(MayurMudigonda)表示 , 他将继续关注规范等变卷积神经网络 。 “人类视觉智能的这一方面”——不管模式是什么定向 , 都能准确识别出来——“是我们想要给气候社区带来的东西 。 ”高通公司最近聘请了科恩和韦林 , 收购了其旨在整合他们围绕等变神经网络的早期研究的初创公司 。 高通现在正计划将规范等变卷积神经网络的理论应用于开发更先进的计算机视觉应用 , 比如使得无人机能够实时进行360度全景“观察” 。 (这种鱼眼式视觉可以很自然地映射到一个球面上 , 就像全球气候数据一样 。 )
与此同时 , 规范等变卷积神经网络在像克兰默这样的物理学家当中越来越受欢迎 , 他们计划将其用于亚原子粒子相互作用模拟数据的研究 。 克兰默说:“我们正在分析与强核力有关的数据 , 试图了解质子内部的情况 。 数据是四维的 , 所以对于有这种规范等变的神经网络 , 我们有一个再适合不过的用例 。 ”
现在研究规范等变神经网络的前物理学家里西·孔多尔(RisiKondor)表示 , 规范等变卷积神经网络的潜在科学应用可能比它们在人工智能中的应用更加重要 。
他说 , “如果你是在识别YouTube上的猫 , 却发现自己不太擅长识别上下颠倒的猫 , 这不是很好 , 但也许你还能接受 。 ”但对物理学家来说 , 确保神经网络不会因特定的方向而误认力场或粒子轨迹是至关重要的 。 “这不仅仅是一个便利性的问题 , ”孔多尔指出 , “重要的是要尊重基本的对称性 。 ”
然而 , 虽然物理学家的数学有助于启发规范等变卷积神经网络 , 物理学家可能会发现它们的大量用途 , 但科恩指出 , 这些神经网络本身不会发现任何新的物理现象 。 他说 , “我们现在能够设计可以处理非常奇特的数据类型的网络 , 但你必须得先知道这些数据的结构” 。 换句话说 , 物理学家之所以能够使用规范等变卷积神经网络 , 是因为爱因斯坦已经证明了时空可以表示为四维弯曲流形 。 科恩的神经网络无法自己“看到”这个结构 。 他说 , “学习对称性是我们不会做的一件事情 , ”尽管他希望将来能够做到 。
科恩不禁为自己曾经凭直觉感知到的跨学科联系感到高兴 , 现在他已经用数学的严谨性证明了这一点 。 “我一直有这样一种感觉 , 即机器学习和物理学正在做非常相似的事情 。 ”他说 , “这是我发现的一件非常了不起的事情:我们只是从这个工程问题着手 , 随着我们开始改进我们的系统 , 我们逐渐发现了二者之间越来越多的联系 。 ”