萱草|地球上到底有多少物种?99.999%的种类你们没发现( 二 )


相比于一代测序 , 二代测序最大的进步是采用了大规模平行测序(massively parallel)理念 , 以及边合成边测序(SBS)方法 。 这样能够在一定时间内检测更多数据 , 节省大量时间 。
在成本和通量上 , 二代测序都可以说无可挑剔 , 但过短的读长却成了二代测序的硬伤 。 reads的大小只有几百bp , 而整个基因组的数据量往往多达数G , 怎么把这些不计其数的reads按顺序拼成一个完整的基因组于是成了新物种测序的核心问题 。
如何解决读长问题呢?追求长度长的三代测序应运而生了 。
对于二代测序和三代测序的特点有一个形象的比喻:二代测序是吃米饭 , 三代测序是吸面条 。 二代高通量测序和三代单分子测序的区别可以用“吃米饭”和“吃面条”来形容 。
二代术像吃米饭 , 一粒粒的很短 , 但是同时能吃很多粒;三代测序像吃面条 , 抓住一头一吸 , 从头读到尾 , 一次只能吃一根 。 (当然实际肯定不只一根 , 只是数量少于2代)二代测序把基因组染色体打断成了无数小片段 , 同时对许多小片段测序 , 如同吃米饭一样一口就吃进去许多粒米 。
萱草|地球上到底有多少物种?99.999%的种类你们没发现而三代测序则像是在吸长寿面一样 , 它不把长片段打碎 , 而是从长片段的一端像吃面条一样不把面条咬断一口气吸下去 , 直到吸到另一端把面吃完 。
萱草|地球上到底有多少物种?99.999%的种类你们没发现二代测序实现高通量的核心思想正是前面提到的大规模平行测序(massively parallel) 。 也正基于“吃米饭”的道理 , 通过把长片段打断成小片段来实现对几十万个到几千万个DNA短片段的同时检测 。 通过小片段来实现高通量 , 这不幸使得通量与读长陷入了一个鱼和熊掌不能兼得的困境 。
人们对基于纳米孔技术的三代测序一度报以极大的希望 , 但纳米孔技术的不成熟使得希望一再落空 , 最终向传统光学信号妥协的pacbio率先发布了实用化的三代测序仪 。 它的平均读长达到了3000bp(3kb) , 而最高读长甚至达到了40000bp(40kb) , 但成本与通量均弱于Illumina二代平台 , 只有300MB , 而且错误率高达15% , 远高于二代测序 。
在纳米孔测序依然遥遥无期的今天 , 利用已经成熟的现有技术开发新测序平台不失为一个不错的选择 。 在不打断片段的情况下对长片段进行多段同时测序 , 兼具了二代测序与三代测序的优点 , 是一个可供参考的发展方向 。