我们和计算生物学从业者深度聊了聊|对撞派 · 圆桌实录

量子位智库 发自 凹非寺
量子位 | 公众号 QbitAI
名噪一时的AlphaFold 2背后,是蓄势待发的计算生物学。
但,计算生物学究竟是什么?目前进展如何,又蕴藏了怎样的未来机遇?
AI制药、疾病研究、AI for Science、21世纪最伟大的科学发明…
这些都不足以概括这一领域。
过去的两周,量子位对撞派推出了「计算生物学」专题,先后邀请到了专注蛋白质组学的西湖欧米、专注分子模拟的深势科技,和AI领域的头部研究院微软亚洲研究院,从不同角度和我们直播探讨了计算生物学。
在这一系列对谈中,我们谈到了计算生物学的定义、现状、应用潜力、底层含义、技术瓶颈、发展细节等等…..
这个领域比我们想象的更加复杂,潜力也更加可观。
精华版文字内容在此,快来听听业内人士怎么说~(文末还有彩蛋)
第一场:对话西湖欧米西湖欧米是专注于AI赋能的微观世界数据公司。致力于以蛋白质组大数据技术创新为驱动力,联合多模态大数据,助力精准医学和药物研发。
对谈嘉宾:
郭天南(右):西湖欧米创始人,西湖大学生命科学院特聘研究员
陈 义(左):西湖欧米首席AI科学家,中国科学院软件研究所博士
我们和计算生物学从业者深度聊了聊|对撞派 · 圆桌实录
文章插图
Q1:Alphafold的最大意义是什么?
A1:我们可以用两条线,把世界分为四个维度——宏观和不借助设备看不到的微观;生命和非生命。
在Alphafold2之前, AI 实际上一直都没有真正进入微观的生命的世界。而这个部分其实对我们的生命健康有重大意义,比如病毒的侵入扩增、抗体免疫,都属于其中的蛋白质世界。
此外,AlphaFold2是给AI从业者打开的一个新的窗口。因为科研可以分为发现问题、定义问题,还有探索解决方案这么多环节。AlphaFold2证明了AI 在探索解决方案的环节未来可以是人类的一个好帮手。
Q2:蛋白质的重要性是怎样的?基于蛋白质的改变,有哪些领域和应用会发生改变呢?
A2:根据生物学的中心法则,DNA 转录成 RNA ,RNA必须要翻译成蛋白质才会起作用。
对于蛋白质组学,一方面是疾病治疗。
以电影《我不是药神》里,在白血病细胞中靶向融合蛋白BCR-ABL,进而控制细胞增殖的神药为例,如果不从蛋白质角度出发,无论是问切、血细胞计数、CT、心电图等,这些检测都不可能达到这样一个效果。现在的很多生物制药、靶向治疗、免疫治疗等等都是基于蛋白质完成的,对于精准医疗也有意义。
另外一个层面是疾病诊断。
比如甲状腺结节到底是良性还是恶性?有一部分人是处于无法判断结节良恶性的灰色地带的。无论你做什么检测,CT、B超,甚至基因检测都无法准确地判断。而通过蛋白质,加上一些 AI 的模型后,判断能够达到 90% 左右的准确度。
现在几乎所有的领域都会有基因测序,但一个人从出生到死亡,或是在不同的器官里,它的基因组都是差不多是一样的,所以每个人做一次基因测序就够了。
但是我们今天跟明天,生病后跟治疗后它的蛋白质组是不一样的。由于时间维度和空间维度都不同,蛋白质组能更充分地反映疾病的变化。
如果我们能够对蛋白质在各个时间各个空间进行消费级的测量,拥有大量细胞水平的微观世界的数据,我们对生命的理解、对健康的管控会处于一个完全不一样的境界。
Q3:您觉得AlphaFold2现在在蛋白质的结构和功能预测上是否已经比较完善了?他距离蛋白质这个领域中的终极真理还遥远吗?
A3:从我的理解来看,我觉得现在的AlphaFold2肯定还有改进的空间。AlphaFold2带来的象征意义,也许比它的实际意义会更大。AI 的科学家们当知道有这样的数据和问题时,就会涌进来,然后快速迭代,然后不断地发现新的解决方案。
现在蛋白质结构上面还有很多问题,因为在真实的场景下面,蛋白质是会在不同环境里相互作用的。我们在做药物、理解生物学、诊断疾病的时候,肯定不能只单独地看某一个蛋白质内部的解剖。我觉得我们还是要在真实场景中采集蛋白质,观察它在真实的细胞里面、体液里面是一个什么样的状态。从而进行结构和功能的分析,这样会更有价值。
Q4:对于更为动态,变化也更为丰富的这个蛋白质组织领域,我们在利用 AI 去对它做一些预测和分析的时候,从 AI 的角度来看,会觉得它有额外的难度吗?会在建模上造成一些其他的困难吗?
A4:在蛋白这种领域,虽然它动态,但是我觉得这不是问题。在宏观世界,我们产生的数据给我们非常大的便利,我们可以预测春运,我们可以知道新冠的流行的状态。