蝌蚪五线谱:实验室活了!竟然能听见蛋白质的声音


人工智能已经被拿来将蛋白质结构转换成乐谱了 。
音乐灵感的来源很多 , 从大黄蜂到星星 , 从火到水 。 但研究人员从一个不同寻常的来源获得了他们的音乐灵感:生命的组成部分——蛋白质 。
由基因编码而成、存在于人体各处的蛋白质 , 是科学研究的重点对象 。 但它们的“声音”始终是个谜 。 近日 , 一项研究不仅为我们提供了期待已久的“蛋白质音乐” , 还在谱曲的过程中 , 培养了人工智能设计新型蛋白质的能力——而这通常是一个耗时、且难以预测结果的过程 。
该研究的成果发表于《APL生物工程》杂志 。 它的灵感来源于这样一种认识 , 即组成蛋白质的20种氨基酸中 , 每一种都有它们独特的振动频率 , 并可以据此将其转换成不同频率的音符 , 即音高 。 而蛋白质音乐的基础 , 就是研究人员将不同的蛋白质特性转化为音乐的概念 , 建立出一首完整的乐谱 。 例如 , 蛋白质的链长和折叠可以对应转化为音符长度、音量、旋律、和弦以及节奏 。
现在 , 你可以上SoundCloud搜到一些蛋白质音乐来听 。 其中有个片段代表了捕食性海螺毒液中的一种蛋白质 , 而另一个更长的片段则是近日绘制的COVID-19棘突蛋白 。
但这些音乐杰作只是该研究的一部分 。 除了转化成乐谱 , 研究人员还训练深度学习神经网络进行蛋白质合成的训练 , 使它们设计出全新结构的蛋白质 。
该神经网络被教导如何从种子蛋白(左)创建出一个即兴乐谱(中) 。 而将乐谱重新翻译成氨基酸序列时 , 便出现了全新的蛋白质结构(右) 。
蝌蚪五线谱:实验室活了!竟然能听见蛋白质的声音
本文插图
图自Markus J. Buehler
Markus J. Buehler表示:“这些网络学习了折叠蛋白在多个时间尺度上的语言 。 一旦计算机得到一个序列的一段线头 , 就可以根据这段线头推断和设计出全新的蛋白质 。 ”
【蝌蚪五线谱:实验室活了!竟然能听见蛋白质的声音】除了将即兴乐谱中的音高和其它音乐信息转换回氨基酸序列会产生前所未有的蛋白质 , 研究人员还发现 , 在蛋白质的设计过程中 , 还可以通过调节温度来控制音乐变化的产生率——温度越高 , 算法产生的变化就越多 。