每解析一个蛋白质结构,就会有一种疾病“消失”?生物计算有多强

如果有一位科学家跟你说 , 他是做蛋白质结构研究的 , 我想绝大多数人脑海中会浮现出这样的景象:他穿着白大褂 , 聚精会神地坐在显微镜前观察 。 这似乎已经成了生物化学家的标准形象 。 然而有一天你去他办公室 , 却发现根本看不到显微镜和试管 , 只看到他穿着宽大舒服的便装 , 在电脑上噼里啪啦地敲代码 , 这个景象必然会让很多人大吃一惊 。

每解析一个蛋白质结构,就会有一种疾病“消失”?生物计算有多强
文章图片
实际上 , 准确地说 , 这位科学家是一位生物计算学家(或计算生物学家) 。 他的研究对象的确是像蛋白质或者DNA这样微小的生物活性物质 , 但他和传统的生物化学家不同的是 , 他的研究工具不是试管和显微镜 , 而是——计算机 。

每解析一个蛋白质结构,就会有一种疾病“消失”?生物计算有多强
文章图片
很多人在初次看到类似“某某公司进军生物计算”这样的新闻标题时 , 往往会产生强烈的不明觉厉的感觉 。 甚至有人以为是该公司要用生物活性物质来制造计算机 , 就像科幻电影中出现的那种插满电极的一摊软乎乎的脑组织 。

每解析一个蛋白质结构,就会有一种疾病“消失”?生物计算有多强
文章图片
这真是一个天大的误会 。 这些新闻其实说的是:某公司要设计一种AI算法 , 它能够根据有限的蛋白质信息 , 准确地绘制出蛋白质的三维结构 。 打个形象的比喻 , 这家公司相当于要帮助警察设计一个程序 , 它能根据受害人的描述 , 准确地绘制出凶手的外貌 。
绘制出某个蛋白质的三维结构对于新药研发 , 例如新冠病毒的疫苗研发有着极其重大的意义 。 但是 , 这个问题也极为困难 , 它是当今人类科学面临的几个至关重要的挑战之一 。 想要知道它难在哪里 , 又为什么意义重大 , 往下看 。
蛋白质折叠问题蛋白质从微观上来说 , 就是一团有机大分子 。 它是构成生命的基本零件 , 每一种蛋白质都有一个特定的三维结构 , 但这种三维结构有一个特殊之处:它一定是由一根长长的链条折叠而成的 。 要理解蛋白质的三维结构到底是怎样的 , 你只需要去玩一种叫“百变魔尺”的儿童玩具 , 就能马上理解 。 百变魔尺是一节一节的 , 每一节都可以做各个角度的翻转 。 因此 , 你可以把一根长长的魔尺折叠成各种各样的形状 , 魔尺的节数越多 , 能够折叠出的形状数量就会呈指数级的增长 。

每解析一个蛋白质结构,就会有一种疾病“消失”?生物计算有多强
文章图片
组成蛋白质的基本单元是氨基酸 , 它就像魔尺的一个“节” 。 蛋白质刚刚生成时 , 就像一根长长的几十到几百节的魔尺 。 然后 , 它会在几微秒到几毫秒的时间内 , 迅速地折叠成一个特定的形状 。 因此 , 在电子显微镜中 , 每一个蛋白质就像是一团乱麻 。

每解析一个蛋白质结构,就会有一种疾病“消失”?生物计算有多强
文章图片
因此 , 决定一个蛋白质性状和功能的 , 就是构成蛋白质的氨基酸序列和蛋白质最终折叠成的形状 。 比如 , 我们的免疫系统在面对病毒和细菌入侵时 , 就会产生一种“Y”字形的抗体蛋白 。 它们的形状就像是一个抓娃娃机的夹子 , 能够精确瞄准并夹住这些入侵者 。

每解析一个蛋白质结构,就会有一种疾病“消失”?生物计算有多强
文章图片
正在瞄准和识别病毒的抗体
我们的韧带、骨骼和皮肤之间有大量的胶原蛋白 。 它们的形状就像是由三根粗绳拧成的麻花 , 为我们的皮肤提供张力 , 使其显得有弹性 。

每解析一个蛋白质结构,就会有一种疾病“消失”?生物计算有多强
文章图片
麻花状的胶原蛋白
再比如 , 2020年获得诺奖的基因定点编辑技术CRISPR , 也正是利用了一个长得像螃蟹钳子的CAS9蛋白 。 它会“紧紧地夹住”基因组中某段特定的DNA , 从而进行剪切 。

每解析一个蛋白质结构,就会有一种疾病“消失”?生物计算有多强
文章图片
因此 , 科学家们对蛋白质最感兴趣的是2个信息:一个是蛋白质的氨基酸序列 , 你可以想象成魔尺的那些“节”;另一个则是蛋白质的结构 , 也就是魔尺折叠后的形状 。
序列信息相对容易获得 , 但结构信息却极难获得 。 偏偏结构信息又更重要 , 因为知道了一个未知蛋白质的结构 , 就可以更准确地理解它在细胞中的作用 。 如果这个蛋白质与某种疾病相联系 , 那么科学家们就能根据它的结构形状 , 开发出相应的药物 。
1972年 , 诺贝尔化学奖获得者克里斯蒂安·安芬森提出了一个假说:其实我们只需要知道一个信息就足够了 。 因为他在实验中发现 , 一个蛋白质只要序列不发生改变 , 并且一直处于同一个化学环境中 , 那么它每次都能折叠成一样的三维结构 。 所以 , 蛋白质在三维空间中该如何折叠 , 这些信息其实已经包含在了它的氨基酸序列中 。 换句话说 , 如果我们知道了一个蛋白质的氨基酸序列 , 理论上我们就应该能推测出它的三维结构 。