继围棋之后,谷歌人工智能又有新突破!可加速新药研发

困扰科学家近50年之久的蛋白质折叠问题有了新的解决方法 。 当地时间11月30日 , 谷歌旗下DeepMind公司宣布 , 其开发的AI程序AlphaFold可以准确地预测蛋白质三维空间结构——而高效地破解和疾病有关的蛋白质结构 , 有助于研究人员发现新型药物 。
AlphaFold在蛋白质结构预测竞赛中斩获第一
在今年的蛋白质结构预测竞赛(下称“CASP”)中 , AlphaFold程序击败其余近百支参赛团队获得第一 , 并达到了与实验室测试基本相当的准确性水平 。
CASP竞赛每两年举办一次 , 被业界视为“蛋白质奥林匹克” 。 主办方会面向全球发布未知的蛋白质序列 , 每个参赛团队运用自己设计的算法来预测其结构 。 随后 , 主办方会将预测结果和实验室结果进行比较 , 并根据两者的接近性给出0-100的得分 。
根据CASP主席、马里兰大学教授约翰·莫尔特(John Moult )的说法 , 分数达到90 分左右 , 就意味着这个算法具有和实验室方法一样的破解能力 。
今年的CASP比赛已经是第14届 。 Deepmind称AlphaFold拿下了92.4的平均分 , 即便是在难度最大的挑战中 , AlphaFold的得分中位数也达到了87分 。
据莫兰特介绍道 , 在中等难度的蛋白质结构预测中 , 其他团队的最高得分为75分 , 而AlphaFold能够获得90分 。
继围棋之后,谷歌人工智能又有新突破!可加速新药研发文章插图
蛋白质靶标的两个示例 , 绿色为实验室结果 , 蓝色为计算机预测 。 图自Deepmind 。
早在2018年 , AlphaFold首次参加CASP , 就在98个参赛团队中名列榜首 , 准确地从43种蛋白质中预测出了25种蛋白质结构 , 而第二名的获奖团队仅准确预测出3种 。
继围棋之后,谷歌人工智能又有新突破!可加速新药研发文章插图
最新版本的AlphaFold算法不仅表现优于竞争对手 , 较18年参赛的旧版本相比也有长足进步 。 图自《自然》官网 。
蛋白质折叠问题已困扰科学家近50年
蛋白质为什么重要?DeepMind官网介绍 , 蛋白质几乎可以支持生命所有的功能 , 而蛋白质的作用很大程度上取决其3D结构 。
人类当前面临的许多挑战 , 例如开发新的疾病治疗方法或寻找可分解工业废物的酶 , 都与蛋白质及其作用密切相关 。 确定蛋白质的形状和功能一直是一个重要的研究领域 , 而在此前的研究中 , 每种蛋白质结构的确定可能要花费数年的艰巨工作 , 并且要使用数百万美元的专用设备 。
弄清楚蛋白质会折叠成什么样 , 被称为“蛋白质折叠问题” 。 “在过去将近50年的时间里 , 我们一直在试图解答这个问题 。 “约翰·莫尔特说 。
据《自然》报道 , 研究人员此前普遍通过X射线、低温电子显微镜等实验技术来确定蛋白质的结构 。 在80年代至90年代 , 研究人员曾使用计算机来预测蛋白质结构 , 但结果并不令人满意 。
而AlphaFold可能会为科学家们提供解答这一问题的新思路 。 德国图宾根马克斯·普朗克生物学研究所演化生物学家安德烈·卢帕斯(Andrei Lupas)已经带领团队花费了十年时间 , 试图破解一种细菌的蛋白质结构 。 而AlphaFold在“半小时”内就给出了它的预测 。
【继围棋之后,谷歌人工智能又有新突破!可加速新药研发】“它(AlphaFold)将改变研究、改变医学、改变一切 , ” 卢帕斯说 。
DeepMind在官网宣称 , 像AlphaFold这样能够准确预测蛋白质结构的系统 , 可以加速许多有重大社会意义的研究 , 例如 , 因为不了解蛋白质的结构 , 研究人员无法进一步了解嗜睡病、利什曼病等热带医学疾病 , 而这些疾病每年造成了成千上万人的死亡 。此外 , DeepMind称 , 这类系统对于许多基础性的研究也有促进作用:以往开发一种新型药物 , 可能需要花费超过25亿美元和十年以上的时间 , 而这类AI系统通过破解和疾病有关的蛋白质结构 , 有助于研究人员发现新型、有效的药物 。