[人工智能]AI技术在新冠肺炎药物发现中的应用


[人工智能]AI技术在新冠肺炎药物发现中的应用
本文插图
【编者按】事实上 , 从本次疫情可以看到中国在算法和硬件方面已经达到世界先进水平 , 全球健康药物研发中心GHDDI正与阿里云合作开发人工智能药物研发和大数据平台:针对SARS/MERS等冠状病毒的历史药物研发进行数据挖掘与集成 , 开放相关临床前和临床数据资源 , 计算靶点和药物分子性质 , 并跟进新型冠状病毒最新科研动态 。
本文发于火石数智, 作者为数智编辑部;经亿欧大健康编辑 , 供行业人士参考 。
背景 2020年2月26日 , 《麻省理工学院技术评论》发布的2020年“全球十大突破性技术”中 , 人工智能筛选分子入选 。 那么什么是筛选分子呢?
伴随着新型冠状病毒肺炎(COVID-19)的爆发 , 相信大家对这个概念并不陌生 。 最早提到这个概念的消息如下:
2020年1月25日 , 中国科学院上海药物研究所和上海科技大学联合研究团队综合利用虚拟筛选和酶学测试相结合的策略 , 发现了一批可能对新型肺炎有治疗作用的老药和中药 。 其中包括后来人人都耳熟能详的洛匹那韦和瑞德西韦 。
分子筛选是药物开发流程(图1)中的一个步骤:是指从大量化合物中选择对某一特定靶点有活性化合物的过程 。 由图1可见 , 新药研发过程复杂漫长 , 面对突然爆发的新型冠状病毒肺炎 , 全新药物设计很不现实 。 因此利用人工智能技术从已有药物中发现对新型冠状病毒(SARS-CoV-2)有抑制作用的药物显得非常迫切 。
人工智能与新药之路 人工智能(Artificial Intelligent, AI)用于药物发现是基于计算机辅助药物设计(Computer-aided Drug Design,CADD) , 然后结合化学信息、生物信息中的大量数据建立优质的机器学习模型 , 在靶点筛选、分子结构/化学空间分析、配体-受体相互作用模拟、药物三维定量构效关系(3D-QSAR)分析等过程中指导先导化合物的发现和优化 。
另外 , 在药物临床阶段及批准上市后也有人工智能的使用 。 比如诺华利用人工智能从多个内部数据源抓取临床数据 , 用于预测和监控临床试验的患者招募、花费和质量 。 诺华宣称该技术的应用 , 使得患者招募时间缩短了10-15% 。图2是人工智能医药公司Insilico Medicine在药物研发各环节中人工智能技术的应用:包括在靶点发现阶段的deep feature selection,NLP;新小分子先导化合物生成中的 deep learning;以及对小分子临床结果的预测等 。
【[人工智能]AI技术在新冠肺炎药物发现中的应用】
新型冠状病毒肺炎药物中的人工智能 新药研发过程复杂漫长 , 面对突然爆发的疫情 , 人工智能技术的应用变得非常重要 。 自疫情爆发以来 , 已公开了大量关于利用人工智能和大数据发现有效药物的研究报导 。 这些研究主要集中在靶点发现、疾病网络构建和药物筛选 。
2020年1月29日 , 燧坤智能应急小组利用人工智能文本挖掘技术 , 完成了对13139个已有药物分子 , 2000余万篇文献和1960万摘要的挖掘 , 输出了数十个已报道对SARS、MERS等冠状病毒有抑制效果的药物化合物 。
2月3日 , 华中科技大学同济医学院等医院和研究所与华为云联合科研团队宣布 , 筛选出五种可能对2019新型冠状病毒(2019-nCoV)有效的抗病毒药物 。 分别是Beclabuvir , 沙奎那韦(Saquinavir) , 比特拉韦(Bictegravir) , 洛匹那韦(Lopinavir) , 多替拉韦(Dolutegravir) 。 联合科研团队针对SARS-CoV-2的多个靶标蛋白对8506种上市或者正在进行临床试验的药物中进行超大规模计算机辅助药物筛选工作 , 并在一周内取得了第一阶段成果 。
某合资医药公司首先通过序列相似性对比找到同源性较大的病毒序列 , 以此为关键词在公共平台中寻找已发表文献或相关靶点数据 , 利用数据挖掘进行实体识别和关系抽取;同时通过传统的数据库检索 , 查找相关靶点;然后将两部分的结果做加权 , 最后输出高置信靶点结果86个 。 然后构建病毒特异性网络 , 挖掘高置信度信号通路24条及病毒作用的核心模块:T细胞受体途径、内吞作用、趋化因子途径、C型凝集受体途径、JAK-STAT途径 。 最后 , 对超过8000种已知药物与病毒网络结合起来进行药物筛选、过滤 , 共得到78个对SARS-CoV-2有抑制作用的药物 , 包括氯喹、阿巴卡韦、穿心莲内酯等 。