「杂志导读」「一起读科普杂志」让脑电波“开口说话”
霍金在坐上轮椅后 , 一开始还能通过手指敲打键盘来输出文字 , 后来手指无法运动了 , 曾想过利用眼球耕作和脑电波识别技术来帮助输出信息 。 但最后由于病情和技术的问题 , 没能完成 , 转而使用红外探测眼镜 , 这已是当下最先进的语言合成技术了 。 霍金直到最后都没能直接将自己的脑电波直接转换为语言 , 不过这一技術在不久的将来即将到来 。 我们从另一个角度 , 继续探索“脑机接口” 。
文章图片
脑电波“打字”的铺成要让脑电波开口说话 , 需要让脑电波与字母之间建立联系 。 因此“打字”是一个绕不开的话题 。 2018年世界机器人大会上 , 清华大学研发的“动态窗稳态视觉诱发电位脑机接口系统”向参赛者们提供了这样一个竞赛平台:将注意力集中到电脑屏幕上的虚拟键盘中的字母上 , 脑电波就会被捕捉 , 对应的字母就会显示在屏幕上 。
这种视觉打字系统是一种视觉诱发电位的打字系统 , 虚拟键盘中每一个目标字符在运行过程中都会有特定的频率去闪烁 , 目标频率都不相同 , 当我们注视目标的时候 , 大脑的枕区视觉皮层附近 , 会产生对应闪烁频率的脑电波信号 。 刺激不同 , 响应不同 。 所以可以通过采集人的脑电信号 , 找到相对应的目标 , 从而实现打字 。 该项目的主导人表示 , 这一系统平均正确率能达到91% 。 这种输入效率 , 大概等于正常人每分钟手写28个英文字母的水平 , 最快的人每分钟能打出60个字符 。
事实上 , 这一系统的原理跟霍金的红外眼镜有相似之处 , 红外眼镜是根据霍金的一小块肌肉来捕捉信号的 , 二者都是通过人堆字母的强烈反应而实现语言的输出 。 当然 , 霍金的红外眼镜设备成熟得更多 , 打字效率也就更快 。
【「杂志导读」「一起读科普杂志」让脑电波“开口说话”】
文章图片
“动态窗稳态视觉诱发电位脑机接口系统”想要步入下一阶段 , 需要解决的还是“敏感度”的问题——脑电波是非常敏感而且活跃的 。 一方面人如果注意力无法高度集中 , 系统就将很难对字母进行定位;另一方面人的大脑在看到字母的时候往往会不由自主地产生联想 , 比如看到“c”会想到“copy”或者“car”等词 , 这也会对系统识别产生干扰 。 另外 , 相比于英语 , 汉语还要经历更多的转换 , 需要耗费更多的时间 。
万事俱备 , 模式已成目前业内的脑电波语言转化主要分为四大步骤:样本收集、信号转化、虚拟声道、输出 。
第一个步骤样本收集易于理解 , 它需要几率不同语言文字在大脑区域内的活动信号 , 建立一个数据库 , 以供后续的映射使用 。 这一数据库的建立的“健全度”直接影响了脑电波转换语言的准确度 。 这其中还得考虑同一单词的不同读音、语调等 。 想要建立一个“通用”的数据库 , 难度十分巨大 。
第二步骤通过循环神经网络(RNN)的不断学习 , 研究者将大脑神经信号转换成了发音器官动作的信号 , 这些信号与发音器官的动作直接相关 , 比如嘴唇、下巴、舌头、喉咙等 。
不过 , 神经网络的学习问题一直都是让业界头痛的问题 , 它所涉及的内容十分复杂 。 目前普遍的现场是虽然语音输出的速度很快 , 但也只有一半的句子会被识别出来 。
第三步 , 虚拟声道 。 虚拟不同声音所产生的声道运动 , 就像汉语中双唇音、唇齿音、舌尖中音等所需要调动的不同发音部位一样 , 正常来说 , 如果模拟的发音运动模式和人正常说话时一样 , 那么所发的音也一定是一样的 。 这一步弄好了 , 接下来就可以输出了 。
文章选自《大众科学》2019.05
- #家族企业杂志#2020年一季度大类资产收益表现短评
- 中外管理杂志@直播电商的趋势是什么?,从罗永浩进场到薇娅卖火箭
- 『汽车杂志TB』不会唱情歌的低音皇不是JL AUDIO C7
- 【红星新闻】犯罪嫌疑人被刑拘,四川攀枝花突发一起山火系人为造成
- 『抓好』一起为大地添绿(统筹抓好改革发展稳定各项工作)
- 「大咖说生活」你会怎么做?女子淡定回答被录取,面试官:看到男女同事抱在一起
- 【咘咘娱乐谈】和戴安娜一起逛街, 戴妃瞬间暗淡失色,卡米拉年轻时美翻了!
- 「国际连连看」求援防护物资:请保护前线的我们,美国十几名医护人员一起录视频
- [中国民用航空杂志]民航局推出一系列措施提升我国国际航空货运能力
- 『宜春政法』【靖安交警】快速破获一起醉驾交通事故案件