承启生物 再刷世界记录!承启生物单机5分钟解码全基因组

_本文原题:再刷世界记录!承启生物单机5分钟解码全基因组
近日 , 承启生物利用自主研发的云平台Chi-Cloud及高精度算法FANSe3 , 实现了单机5分钟分析完成一个全基因组数据集!这使得基因检测结果向“立等可取”、“又快又准”迈进了一大步 , 大力推进了精准医学的普及落地 。
5分钟 , 不仅仅是速度单机5分钟解码全基因组究竟意味着什么?
【承启生物 再刷世界记录!承启生物单机5分钟解码全基因组】在临床上 , 医生往往是和死神赛跑 , 时间就是生命 。 从“天”到“分钟”的速度飞跃 , 或许就是“生死之别” 。 对患者来说 , 尤其是重症患者 , 都会希望能够指导治疗方案的基因检测分析结果 , 能出得越快越好 。 而除了出结果的速度 , 基因检测高昂的价格也是阻碍精准医学应用的关键因素之一 , 在测序实验成本不断降低的情况下 , 分析成本逐渐成为了精准医学检验流程中的主要成本板块 。
庞大数据分析 , 壁垒重重当测序仪运行速度越来越快 , 测定全基因组只需要1天的时候 , 人们发现分析成为了新的瓶颈 。 从原始数据到分析出基因突变 , 用服务器通常要几十个小时才能计算完成 。 即便使用大规模的超算集群、辅以FPGA等专用硬件加速的方案 , 多数也需数小时 , 并且要付出成本高昂、不易扩展和改进的代价 。
当然 , 亚马逊、阿里云等云服务厂商也曾经试验过同时采用超多高性能节点进行极限挑战 , 将单任务处理时间压缩到了15-30分钟 , 但在目前的云服务定价体系下 , 这样处理能力的系统连续运行一年所需要的费用可达数百万元甚至更高——这也正是诸如天河二号等超级计算机虽世界排名前列 , 但无法对单个普通民众提供高性价比服务的原因 。 同时 , 数据传输费用也是传统云服务商的一大笔开销 , 以至于财大气粗的美国NASA都付不起云端数据传输的费用 。
自主创新 , 突破“不可能挑战”由于算法原理的限制 , 目前常用的国外算法若要保持一定精度 , 则在速度上已难有质的突破 。 因此 , 为了能在保证精准的前提下达到速度突破 , 承启生物团队抛开传统算法的框架 , 自主研发了底层算法FANSe系列算法 , 这是目前国内唯一规模化商用的全自主知识产权的高性能测序比对算法 , 其准确度在各种实测中大幅度领先国外算法 。
2017年 , 承启生物基于FANSe3开发的新一代私有云平台Chi-Cloud , 就实现了全转录组测序数据的秒级分析 , 并发表在英国著名的权威学术期刊《核酸研究》上 。 2018年 , 承启生物更是创下了“1分钟解码2万个基因信息(全外显子组)”的世界纪录 。 (原文链接:深企新技术1分钟解析近2万个基因 , 刷新基因检测速度!)
承启生物 再刷世界记录!承启生物单机5分钟解码全基因组
文章图片
承启生物开发人员正在一台高端家用电脑上调试Chi-Cloud
近年来 , 随着医学和遗传学的进展 , 越来越多的疾病被发现与外显子区段以外的部分高度相关 , 因而全基因组测序分析的需求日益增长 。 经过承启生物技术团队不懈的改良优化 , 对数据量扩大了50倍不止的人全基因组测序数据 , 现在也实现了单机5分钟左右得到完整分析结果的“立等可取”的分析速度 。
更值得一提的是 , 达到这个速度 , 承启生物并没有动用大型服务器 , 只是使用了一台高端的家用电脑 。 所有运算只使用CPU , 无需任何GPU、FPGA等专用硬件加速 。 这意味着基因组测序基础分析的成本已达到了几乎忽略不计的程度 。 在对数据保密性有高要求的一些特殊领域(如军事、公共安全、特定的医疗场景等) , 可直接采用这种单机分析的方式 , 而无需采购和维护大型计算集群 , 无需连接到互联网 。
自主研发、不依赖专用硬件的特性使得各种功能增加与改进十分方便 , 可扩展性强 , 且不会受制于特定硬件平台 , 从根本上避免了芯片禁运导致的风险 。 同时 , 该云平台兼容目前国内外所有主流测序仪 , 并针对国产测序仪进行了特别适配和优化 , 有力地保障了精准医学的国家安全 。