我们和计算生物学从业者深度聊了聊|对撞派 · 圆桌实录( 三 )
Q3:深势科技也推出了一个中国版的 AlphaFold2 就是我们的 Uni-Fold, 那当时咱们是出于怎么样的动机或者说观察来决定完成这一项工作的呢?
A3:其实我们面临的一个系统性的机会,以及我们希望做到的事情,本质上是用计算替代实验。
在医药、材料、化工等这些领域,面临的问题本质上抽象出来是一样的,大家关注的都是在微观层面怎么样设计出一个有用的分子。
我们抽象的在微观层面上想做的微尺度工业平台,本质上就是三个物理问题:结构、能量和动力学。而结构就像是一个起点或者milestone,对于算法矩阵和商业落地都是至关重要的。
Uni-Fold还有很大潜力可以挖掘,我们也不会止步于此。比如说对蛋白聚合体的结构预测,蛋白和分子结合的结构预测,当然很多比较大的蛋白现在还没有做得很准,我们也可以提升它的精度。
我们还有一系列的比如说强化分子动力学的算法,来和Uni-Fold形成完整的对蛋白结构进行预测、乃至对动态结构进行预测的算法体系,以及这些计算的方法怎样和实验联动,去提升实验的效率,或者是做一些实验上很难做的事情。
所以说我们是要在整个结构生物学领域深刻地去布局前沿的算法,然后最终达到替代不必要的实验,并且让必要进行的实验也能高效稳定地进行,这是我们想达到的最终目的。
Q4:在计算生物学里面,我们会把我们能解决的问题会做一个怎样的分类,或者说我们大概有一个怎样去攻克的一个规划和理解吗。
A4:科学问题普遍上都遵循两种范式。
第一种范式,可被完善地定义成一个物理或者化学问题,意味着可以找到相应的物理模型去很完备地描述它,这种我们就称之为叫规则驱动,或者叫物理驱动的问题。那这种问题最好的办法就是我们精准的求解物理模型。
另一种问题就是很难定义为一个物理问题。也就是所谓数据驱动的。
这两种范式上发展出来算法也很不一样。
Q5:我们认为哪些场景是计算生物学能够最快落地,或者发挥最大潜能的?
A5:我觉得可能的突破口还是会从两个地方出现。
一个是理解生命体运作的机制。我们无论是做药物还是做疗法、做任何的东西,第一个前提就是我们要知道我们到底是怎么样运行的,疾病的产生与治愈是怎样的一个微观的过程。那第二,在充分理解生物体运作机制的前提下,我们就会确定一些药物的靶标和疾病之间的关系。那再往下其实就是药物的设计。之后,就是这些相应疗法在人体内作用的预测等相关的这件事情。
这部分的突破,我认为会比较快地出现在两个方向上:1. 能更明确地能定义为物理问题和化学问题的方向,比如蛋白质尺度的结构和药物计。2. 实验技术进步能够带来大量高质量标准化数据,且问题相对不是那么高维。也就是数据的积累会对算法产生非常大帮助的领域。
第二个方面就是逆向问题。我们在理解了生物体的运作机制之后,去反向生成。比如说像合成生物学,我们通过编程的方式去创造生命,那这是解反问题。
可能还有一个维度其实是计算生物学的解决方案和专家的关系。将原来专家的经验知识转化成了一个模型或者可执行的一个工具,更好地赋能下游的科学家和工作人员。
Q6: 那如果我们用百分比来衡量的话,今天比如说以Alphafold2 为一个代表,我们会觉得它大概到了一个怎么样的进度?
A6:我觉得遵循着一个指数发展的规律。当前的一系列技术的积累,其实是刚刚捅破了这层窗户纸,也可能是黎明前的黑暗到往上走的关键时期。所以说当下的这个点或许是还比较少的,甚至可能不一定到1%。
如果借鉴AI的图片识别和语音识别发展历程,我想它还是一个快速增长的时期。它的导数可能非常的大。
比如说以AlphaFold2的话,它分为两种层面,一种是已知的未知,比如说对人类的蛋白组的预测可能接近60%,都预测的相对比较靠谱。那剩下 40% 预测的不靠谱的部分,至少也能给出一个大致的置信区间。这意味着算法是初步可用了。
更大的其实是未知的未知。科学家们普遍都认为我们对可见宇宙或者已知宇宙的认知肯定是不超过 5% ,更何况还有很大的未知的宇宙。我觉得在蛋白质结构预测这个领域也是同样的。我们可见的包括这些预测不准的 40%, 主要是一些大蛋白、膜蛋白、蛋白复合物等等。就可见部分而言,我觉得可能只完成了 10% 到 20。我们其实并不知道分母有多大。
这是计算生物学领域大航海时代的开始,这个真正的竞争或者真正的突破才刚刚开始。整个的技术发展肯定是非线性的,出现了一个突破可能一下就提升了一大截,大家也可以密切地关注这个领域的进展,这里面也可能获得很多非线性的回报机会。
- 华为|华为出品,必是精品,三月份华为将发布Mate 40e pro和P50E等产品
- 5G|5G最大的应用场景,也许就是云计算+全国产化的,轻便终端
- 巨头|互联网巨头造车狂想曲:投资、技术支持和亲自下场
- 营收|首都在线:东数西算+持续放量+云计算+大数据,还能入场吗?
- 保修|苹果售后数据和保修只能二选一,背后是行业集体摆烂
- 芯片|OPPO子品牌爆发,骁龙888手机降至1799元,还有65W闪充和素皮机身
- iPhoneSE3|同是三千价位K50和iPhone SE3怎么选
- 显示屏|「选购技巧」办公显示屏别看尺寸和分辨率这三点更重要
- 编程|厉害了!乐山10岁男孩获计算机编程大奖,即将启程赴阿里云
- 云计算|快速了解Redmi K50发布会,参数与价格盘点,超越iPhone13