【新智元】准确率97％，一个“毛骨悚然”的里程碑：华裔科学家AI解码脑电波新智元报道来源：sciencealert编辑：张

文章图片
新智元报道
来源：sciencealert
编辑：张佳
世界才刚刚开始适应像谷歌和亚马逊这样的公司制造的虚拟助理所产生的力量，如果用一个词形容这些虚拟助理识别我们语音的精准度，那就是“不可思议” 。
而现在，一个更加让人“毛骨悚然”的里程碑就在眼前：人工智能系统可以将我们的大脑活动转化为完整的文本，根本不需要我们说一个字。

文章图片
这不是科幻小说。近几十年来，脑机接口的发展突飞猛进，从动物到人类参与者，已经在尝试这种事情。
日前，美国加州大学旧金山分校的科研团队使用人工智能解码系统，把人的脑电波转译成英文句子，准确率高达97% 。

文章图片
论文地址：
这项研究3月30日发表在《自然·神经科学》杂志上，题为“Machinetranslationofcorticalactivitytotextwithanencoder–decoderframework”（利用encoder-decoder框架，将大脑皮质活动翻译为文本）。

文章图片
EdwardChang
这项研究由华裔科学家、加州大学旧金山分校神经外科教授EdwardChang博士领导。 EdwardChang博士的研究重点是言语、运动和人类情感的大脑机制，同时他也是加州大学旧金山分校和加州大学伯克利分校的合作单位——神经工程与假肢中心的联合负责人。
人脑电波转译成句，准确率高达97%
为了提高准确性，研究团队使用了一种新的方法来解码皮层脑电图：皮层活动中产生的电脉冲记录，通过植入大脑的电极接收。
在这项研究中，四名癫痫患者戴上了这种植入物以监测癫痫发作，研究团队进行了一项辅助实验：让参与者朗读并重复一些固定的句子，同时电极记录他们的大脑活动。
然后，将这些数据输入到神经网络中，该神经网络会根据实验的音频记录，分析与特定语音信号相对应的大脑活动模式，比如元音、辅音或嘴巴动作。

文章图片
图1：解码过程
此后，另一个神经网络解码了这些表征（从重复的30–50个口语句子收集而来），并且使用它来尝试预测正在说的话，完全基于语句的大脑皮层特征。

文章图片
图2：解码句子的单词错误率
这个系统产生了一个单词错误率(WER) ，在最好的情况下，其中一个参与者将大脑信号转换成文本的错误率只有3% 。这可能是AI能够获得的最接近于读取人类思想的结果，至少在严格意义上的实验条件下是这样的。

文章图片
图3：经过迁移学习训练的encoder–decoder模型的解码MOCHA-1句子的单词错误率
【【新智元】准确率97％，一个“毛骨悚然”的里程碑：华裔科学家AI解码脑电波】在他们的论文中，研究团队详细列举了大量参与者所说的参考句，以及神经网络产生的预测，有时是错误的，但并非总是如此。但是，当错误显而易见时，它们似乎与人耳听到的语音结果有很大不同（这可能是引入AI的数据集有限所产生的副作用）。

文章图片
表1：错误解码的句子示例（左边是参考句，右边是预测句）