阿尔法|击败李世石的AI公司,又研发出生物版“阿尔法狗”:破解50年生物学难题( 二 )


哥伦比亚大学计算生物学家 Mohammed AlQuraishi 在《自然》杂志上的撰文指出,“可以说这将对蛋白质结构预测领域造成极大影响。我怀疑许多人会离开这个领域,因为核心问题已经解决。这是一流的科学突破,是我一生中最重要的科学成果之一。”
但卢普斯认为,这将允许新一代的分子生物学家提出更高级的问题。
毫无疑问,AlphaFold 也是 DeepMind 迄今为止取得的最重要进展之一,也是人工智能领域最重要的成就之一。但对于DeepMind的研究人员而言,还有很多后续问题有待解决,包括弄清楚多种蛋白质如何形成复合物以及它们如何与DNA相互作用。江珀表示,DeepMind下一步计划将应对这些挑战。
问题的开始:打破人类智商“天花板” 解决“根节点问题”
作为全球领先的人工智能研究中心之一,DeepMind研发的AI系统已经让世人惊叹。此前,该公司最为人所知的成就当属击败了围棋世界冠军李世石的AlphaGo。
阿尔法|击败李世石的AI公司,又研发出生物版“阿尔法狗”:破解50年生物学难题
文章插图
2016年3月15日,李世石(左)与哈萨比斯握手 图据《财富》杂志
阿尔法|击败李世石的AI公司,又研发出生物版“阿尔法狗”:破解50年生物学难题】然而这并不是DeepMind的目标,利用人工智能解决一些最紧迫的科学难题,才是其联合创始人兼CEO杰米斯·哈萨比斯成立这家企业的初衷。
而DeepMind之所以要瞄准了蛋白质折叠问题,一切要从一个游戏开始说起。
哈萨比斯曾是一名国际象棋神童,13岁时就成为象棋大师,曾一度在同龄人中排名世界第二。他对国际象棋的热爱让他痴迷于两件事:游戏设计和自己内心的思维机制。
在进入剑桥大学学习计算机科学后,他于1998年创立了自己的电脑游戏公司Elixir Studios。在制作出两款获奖游戏后,他卖掉了知识产权并关闭了公司。随后,哈萨比斯又在伦敦大学学院获得了认知神经科学博士学位。
2009年,哈萨比斯在美国麻省理工学院做博士后研究时,听说了一款名为Foldit的网络游戏。Foldit由华盛顿大学的研究人员设计的,是一个关于蛋白质折叠的“公民科学”项目。这款游戏引起了哈萨比斯浓厚的兴趣。
2010年,哈萨比斯创立了人工智能公司DeepMind,目标是“解决智力问题,然后用它来解决其他一切问题”。此时的哈萨比斯已经对蛋白质折叠有了初步的认识,使其成为了“其他一切问题”之一。
阿尔法|击败李世石的AI公司,又研发出生物版“阿尔法狗”:破解50年生物学难题
文章插图
由人工智能预测的蛋白质结构(蓝色)和实验确定的蛋白质结构(绿色)几乎完全匹配 图据《科学》杂志
2016年3月15日,AlphaGo击败世界顶级棋手李世石当天,DeepMind一战成名。同样在当天,哈萨比斯在首尔街头对AlphaGo团队负责人大卫·西尔弗表示:“告诉你吧,我们可以解决蛋白质折叠问题。”
DeepMind人工智能科学应用的部门负责人普什米特·科利表示,DeepMind的目标是试图解决“根节点问题”,也就是说,解开通向众多不同科学途径的根本问题,而蛋白质折叠问题正是这些根节点之一。
Alphafold是如何突破这一难题的?短短4年:从诞生到成功
时间回到1994年,当许多科学家第一次开始使用复杂的计算机算法来尝试预测蛋白质折叠问题时,马里兰大学的生物学家莫尔特决定创建一个竞赛,以提供一个公正的方式来评估出最好的算法。他将这个比赛命名为“蛋白质结构预测的关键评估(CASP)”,每两年举行一次。此后,CASP被誉为蛋白质结构预测领域的奥林匹克竞赛。
2016年,在AlphaGo击败李世石后不久,DeepMind向争夺这块CASP金牌发起了进攻。
为了解决这个问题,DeepMind成立了一个由六名AI研究人员和工程师组成的尖兵队伍,随后蛋白质折叠问题专家约翰·江珀也加入了。经过一番摸索,通过一种名为“监督式深度学习”的简单训练方法,并使用来自蛋白质数据库(一个大型生物分子的3D结构数据在线数据库)的17万份公开数据作为训练数据,AlphaFold很快有了雏形。
阿尔法|击败李世石的AI公司,又研发出生物版“阿尔法狗”:破解50年生物学难题
文章插图
杰米斯·哈萨比斯 图据《财富》杂志
所谓“监督式深度学习”,就是大多数商业应用中使用的人工智能:从一组已建立的数据输入和相应输出,神经网络学习如何匹配给定的输入和给定的输出。
此前,一些生物学家也尝试使用“监督式深度学习”来预测蛋白质如何折叠,但正确率只有50%。随后,有科学家根据蛋白质的进化史将其分门别类并发现,在各类别中,DNA序列中可能存在着“协同进化”的氨基酸对,在蛋白质的折叠结构中相互接触。