#脑极体#当AI开始寻找抗生素:人类终于摘取“高悬的果实”?( 二 )


由于传统的抗生素药物培育的低效 , 从大型合成化学文库的筛选抗生素分子结构成为一种新思路 。 但这些文库可能包含几十万到几百万个化学分子 , 但分子式的化学多样性有限 , 且无法反映抗生素分子可能的化学性质 。 一来是人工筛选的工作量极大成本过高 , 再则是面临难以验证化合物多样性的限制 。
从分子库中筛选对某种细菌能够产生抑制性的分子 , 再去验证这些分子与已经应用的抗生素的差异 。 其中包括了海量的计算与重复实验 , 让这一办法对于人类研究者确实太不友好了 。
但这次 , AI作为一种新的研究手段引入对这些合成化学分子的筛查 , 让发现抗生素引来重大转机 。 研究人员提出了将结构分析和筛选相结合的思路 , 利用机器学习算法从分子性质中预测具有潜在抗菌性能的化合物 。 这一次大获成功 。
首先 , 研究者以抑制某种大肠杆菌为目标进行筛选 , 选取了2335种FDA已经批准的药物分子或自然化合物分子 , 再以80%生长抑制率为标准 , 将它们分为有抑菌性和没有抑菌性两类 , 作为神经网络的训练数据集 。
同时 , 他们采用了一种“有向消息传递深度神经网络”(DMP-DNN)的算法 , 将化合物的原子和成键等信息以连续向量的方式多次重复传递 , 从而获取更高级的表征结果 。 这一神经网络是通过自学习向量来表征分子 , 而不需要人为标注特定的分子结构 。
有向信息传递网络能直接从分子的图结构预测分子的属性 , 经过固定次数的信息传递步骤 , 最终形成的分子的单个向量就可以进行对细菌的抑制率的预测 。 这种窥斑见豹的方式 , 大大的缩短了筛选路径 , 也降低了对于算力、时间等等成本的消耗 。
【#脑极体#当AI开始寻找抗生素:人类终于摘取“高悬的果实”?】
#脑极体#当AI开始寻找抗生素:人类终于摘取“高悬的果实”?
本文插图
(除了铜绿假单胞菌(底部蓝色)外 , Halicin在几种耐药菌测试中 , 显示了良好的广谱抗菌活性)
随后 , 将训练过的深度学习模型应用到博德研究所的包含约1亿分子量的DRH化合物库中进行筛选 , 该模型从6111个正处于研究阶段的药物分子里 , 选出了99种最有可能存在抑菌性的化合物 。
最后 , 经过实验结果证实 , 其中的51种能明显抑制该类大肠杆菌生长 。 从中选出了这种被命名为Halicin的化合物 , 因其低体内毒性和结构新颖性 , 成为最有潜力的新型抗生素 。
此后研究者将在再次训练过的深度学习模型应用在了规模更大的ZINC15药物小分子数据库上 , 对约一亿化合物的预测和筛选 , 又发现了新的潜在的抗生素结构 。 而这一筛选过程 , 也仅仅只用了三天 。
可见在深度学习的帮助下 , 6111个药物分子被筛选成99个 , 对这99个药物分子再进行试验 , 效率自然快得多 。
这一开创性研究标志着抗生素发现乃至更普遍的新药挖掘方法发生了范式转变 。 那AI的加入到底会带来哪些更多的价值呢?
抗生素新药研发的战场 , AI正全军出击
一般来说 , 传统的药物的研发主要经历这四个阶段:
1、靶点的选择和确认;2、先导化合物的发现和优化;3、临床前研究;4、临床试验 。 之后才可以正式被批准上市 。 一款新药从研发到上市面临3个“10”的考验:10年时间、10亿美金、10%成功率 , 而且这一趋势更为严重 。 对于抗生素的研发 , 也面临着同样的长时间高投入、低产出低利润的问题 。
在AI特别是深度学习算法的帮助下 , 药物研发正在迎来新的转机 。 从目前AI已经在投入应用的新药研制 , 以及这一次AI在新的抗生素化合物分子的发现上 , 都表现出非常明显的效果 。 可以说 , 未来AI在新药物挖掘、化合物筛选、靶点发现和药物有效性预测等方面都将起到极大的辅助作用 , 一定程度上提高研发效率、节约资金以及降低临床试验的失败风险 。