美国普渡大学利用人工智能技术实现“读心术”

美国普渡大学利用人工智能技术实现“读心术”

美国普渡大学研究人员成功首次利用人工智能技术解析人脑在观看视频时的功能性磁共振成像(fMRI),完成“读心术”技术验证。

这项研究将有助于促进人工智能技术的研究应用,并促进对大脑功能的理解。研究的关键是利用了一种被称为卷积神经网络的人工智能算法,这种算法已经被用于计算机和智能手机的人脸与图像识别。

普渡大学韦尔登学院生物医学工程和电气和计算机工程系助理教授柳钟明表示,近年来,卷积神经网络算法对计算机视觉领域产生了巨大影响,我们开发的这项技术就是采用神经网络来理解人所看到的内容。

卷积神经网络是一种“深度学习”算法,已被用来研究大脑如何处理静态图像等视觉刺激。然而,这项研究首次完成人脑处理自然场景的电影过程的解析,实现复杂动态环境下大脑视觉解码研究的重大跨越。

研究人员获取三名女性受试者观看972个视频剪辑、每人总计11.5小时的fMRI数据,视频包括表现人或动物的行为和自然场景。首先,数据被用来训练卷积神经网络模型,以预测受试者在观看视频时大脑视觉皮层的活动。然后用卷积神经网络模型来解码fMRI数据,并重建视频中的场景,甚至包括模型从未学习到的事物。

该模型能够准确地将fMRI数据转化为具体图像,视频图像解析过程是并行的,即计算机可以根据人脑观看视频获得的fMRI数据实时解析出实际的视频图像。研究人员表示,这项研究的独特之处是受试者观看视频的脑成像解码接近实时。研究中每两秒钟扫描大脑一次,神经网络模型将根据实时的脑成像进行解码。

研究人员能够找到当受试者看到特定信息时发生响应的大脑皮层位置,描绘大脑不同区域负责的特定功能是神经科学里程碑式的目标,这项研究已接近实现这一目标。如一个汽车行驶在大楼前的场景被大脑分割成不同的信息片段,大脑中的一个位置可能代表汽车,另一个位置则代表建筑。

这项技术可将大脑视觉皮层所有位置获取的信息可视化,并反映在屏幕中。在实现过程中,可以看到大脑如何将视觉场景分解为多个片段,并将片段重组为可理解的完整的视觉场景。

研究人员还能够利用受试者的数据训练神经网络,使其可预测和解码另一受试者的大脑活动,这一过程称为跨主体编码与解码。这一成果表明,该模型研究大脑功能具有普适性和巨大应用潜力,甚至适用于具有视觉缺陷的人。

人工智能技术的发展一直受到脑运行机制的启发,现在人工智能技术可以反过来促进和帮助理解脑。这项研究推动了机器智能与神经科学交叉融合,预示我们正进入人工智能与脑科学融合发展的新时代。(中国船舶工业综合技术经济研究院 志伟)

详情:请关注微信公众账号“国防网”。