清华姚班、MIT计算机博士:入局AI制药风口,为什么要趁早?丨附19个现场问答( 六 )


经过湿实验检测 , 全部都是有很好的活性且有专利空间 。 其中五个分子中有两个分子来自于全新生成的De Novo模块 , 拥有全新骨架结构 , 因此具有足量专利空间;
另外三个来自于衍生物跃迁模块 , 根据现有阳性药进行改造 , 使得各种性质表现更好 , 也具有专利空间 。
在商业化合物库中 , 我们从百万级别商业化合物中筛选出100个小分子 , 在后续湿实验验证中筛出了57个具有活性分子 , 即IC50小于10微摩尔 。
作为对比 , 我们看看传统计算化学或传统筛选方式是什么样 。
传统筛选方式概率或Hit Rate大概是2%-5% 。 这意味如果筛选出100个分子 , 大概只有两到三个或四五个有活性 , 而我们则能够筛选出57个有活性分子 。
所以 , 相比于传统方法 , 我们能够把这一效率提高数倍甚至十数倍 。 并且在57个分子中 , 有34个是具有较高活性的分子 , IC50小于一微摩尔 , 这些都可以用作下一步的检测 。
总的来看 , 这一筛查过程被我们提速相当之多 , 因为传统方法找到个位数纳摩尔甚至皮摩尔级别分子需要一年甚至几年 , 而我们只需要短短几个月时间:甚至这次只用了两个月 。
四、 技术创新 , 如何让研发从量变到质变
接下来我给大家讲解一下简单的技术问题 。
例如 , 我们是如何判断一个小分子能否与一个蛋白质结合的?
清华姚班、MIT计算机博士:入局AI制药风口,为什么要趁早?丨附19个现场问答
本文插图
这是发表过论文的 , 当时我们使用蛋白质三维结构作为信息输入 , 这能够令我们在做小分子和蛋白质对接模型 , 考虑到小分子和蛋白质相互作用 , 尤其是三维结构上匹配程度 , 这个额外信息让我们指标有一个质的飞跃 。
大家可以看两个图代表我们和主流算法的区别 , 绿色是bar , 相对于其他主流算法要高出一截 , 所以小分子与蛋白质对接应用上 , 我们做得非常好 。
清华姚班、MIT计算机博士:入局AI制药风口,为什么要趁早?丨附19个现场问答
本文插图
另外就是大家关心的神经网络黑箱问题 。
谈到人工智能 , 大家往往会认为人工智能不可解释 , 即AI制药是不是也是黑箱问题 , 因为我们做预测的时候 , 向神经网络里丢一个分子 , 神经网络就会告诉分子式毒性好不好 。
这样预测结果出来 , 我们也不清楚究竟是什么因素导致做出这样的结果 , 为了解决可解释性问题 , 我们引入了信息瓶颈和剪枝技术 , 进一步把信息可视化 。
也就是把分子丢进去之后 , 系统会告诉我 , 如果毒性表现不好 , 是哪一个模块或哪一个基团导致 , 这个结果和图像我们也会拿给药化学家看 , 看看分子是不是遵循思路 , 整体描述是不是契合科学原理 。