想要测序结果更好?测序前你得知道这几点......

你要看的是不是《想要测序结果更好?测序前你得知道这几点......》?如果是,那就说明你找对了,缘分啊,继续往下看吧。。。健康摘要: 点击上面免费关注疾病查询:腰痛、腰间盘突出、强身锻炼、背痛、风湿、骨质增生、腿痛、乙肝、肝病、养肝、解酒、胃


正文开始:

测序不要只看价格和参数,测序前采用什么富集技术或建库方案、使用哪家的产品、捕获区域的大小、测序的深度等都直接关系到价格;而漂亮参数背后大都藏有玄机,需要大家对目标区域和自己的研究目的有更深入的了解方可不被表象所迷惑。

外行看热闹,内行看门道。如何评估和选择二代测序靶向捕获基因文库,你已经摸着门道还是就看个热闹?

如果你建库与测序一并外包;如果

困惑于不同厂家的同类捕获 panel;如果

正在因为价格差异而犹豫不决;如果

痴迷于捕获效率、覆盖度;那么

一定要看过来。

大家通常会利用测序的结果来评估一款捕获产品的优劣,通常关注的参数有覆盖度、同样测序量下的测序深度、目标序列比率(或捕获效率)等。咱们先看看这些名字解释,再以市场上几家公司的外显子组产品为例教你如何辨识这些参数。

? 覆盖度(%coverage):一般是指目标区域中被测序覆盖 > 1x 的区域的比例

? 平均测序深度(Sequencing Depth):测序得到的碱基总量与目标序列碱基的比值,也可以理解为被测基因组上单个碱基被测序的平均次数

? 测序深度 > 20x 的覆盖度:目标区域中测序深度 > 20x 的区域占总目标区域的比例

? 目标序列比率或捕获效率(% >

我们都知道,外显子组有的区域 GC 含量低、AT 含量高,探针结合力弱,捕获效率低;有的区域因为存在重复序列、二级结构等不易设计探针,即使有探针覆盖,捕获效率也不高。而像覆盖度、捕获效率这些参数都与靶标的设计直接相关。

也就是说,如果想让这些参数好看,很简单,跳过那些捕获效率低、难设计探针的区域,将设计的靶标区域仅包括那些容易设计探针、捕获效率高而均一的区域。

如果

只关注上面的参数,仅根据这些参数来选择产品的话,最终的结果可能是参数很漂亮,但却承担了丢失真正有意义的靶标的风险,并且这种风险是无法通过提高测序深度来弥补的,因为那些靶标根本不在这款外显子的设计里!

同样以全外显子组为例,评价它的优劣首先要以该产品的设计为出发点,客观的比较它对于各大数据库的覆盖,以及与其它同类产品相比所独有的有意义的靶点的数量。这里特别提醒一下,一些厂家在给出捕获产品的参数时有时会经过「艺术处理

比如,有的厂家给出的捕获区域的大小是期望捕获的区域而非探针实际覆盖的区域

[1]

,在比较数据库的覆盖度时,这些厂家的数据会比较美观,但当我们查看实际测序结果所反映的捕获数据时,那些经过「艺术处理

的厂家就没有那么漂亮了。

其实所有厂家都清楚,设计(design)是一款产品的根基,是产品的关键,如果根基不扎实、不完善,那么后期无论如何努力也是无法弥补这款产品的先天不足的。

安捷伦临床研究外显子组 V2 是专门针对临床研究设计的一款全外显子组产品,它以安捷伦全外显子组 V6 的设计为基础,新增了美国埃默里大学和费城儿童医院精选的新增靶标,同时对疾病相关基因进行了加强覆盖,是目前市场上极为全面的医学研究外显子组。

先看一下它与市场上其它同类产品在各大数据库覆盖上的比较。

表 1. 所选注释源的覆盖率比较

CRE V2

同类产品 I

同类产品 R

数据库*

数据库覆盖百分率

CCDS

99.77%

99.27%

97.99%

GENCODE-v17

99.69%

97.86%

97.44%

UCSC

已知基因

99.60%

96.04%

94.79%

RefSeq

99.63%

98.56%

97.52%

Vega

99.66%

97.57%

96.97%

HGMD

编码区域

99.86%

99.23%

98.31%

OMIM

编码区域

99.76%

99.12%

97.95%

ClinVar

97.63%

96.86%

93.71%

COSMIC

99.76%

98.96%

99.02%

* 数据采集于 2016 年 5 月

再来看看独有的有意义的靶点的数量的差异吧。安捷伦的临床研究外显子组 V2 不仅包含更多的独有的疾病相关变异,同时含有更多独有的 ClinVar 致病 / 可能致病变异,而这些 ClinVar 致病 / 可能致病变异意味着更多种类的疾病被安捷伦的这款产品覆盖。

表 2. 独有的 ClinVar 变异比较

CREv2 

所独有的区域

 

同类产品 I*T 所独有的区域

ClinVar  

变异

768

57

ClinVar  

致病/可能致病变异

177

16

独有的 ClinVar 致病/可能致病变异相关的疾病数

 ↓

114

5

看完了上述比较,一款捕获产品的核心竞争力和对用户的价值一目了然。当然,没有一款产品是完美的,包含的位点越全,设计难度就越大。尽管如此,凭借在靶向捕获领域扎实的功底,安捷伦的这款全面的医学研究外显子组——临床研究外显子组 V2 仍旧在覆盖度和捕获效率上表现非常出色。

除了选产品本身,别忘了考察一下定制能力。数据库更新的速度非常快,厂家推出稳定、可靠的商业化产品的速度无法及时跟上。所以,这里就要强调定制的重要性了。

安捷伦的 SurePrint 打印技术提供了非常强的定制能力,它的免费在线设计工具 SureDesign 就可以在已有目录 panel 的基础上按照用户的要求加入新的基因。这样一来,新的实验数据既与原先的实验数据保持了很好的一致性,又增加了新的内容。

通过以上简短的介绍后,希望大家都能摸到靶向捕获基因文库的门道,不再被表面的热闹所迷惑。

最新预报:

安捷伦即将推出人全外显子组 V7 版本。V7 版本的设计针对外显子组精雕细琢,仅关注外显子区域,设计大小仅为 48M,减少测序成本。

对于最新的数据库有全面的外显子覆盖,且包含了难以捕获的区域。对于不同 GC 区域实现均一的覆盖。这一精选版人全外显子组产品将于 3 月在中国上市。

参考文献:

1. New insights into the performance of human whole-exome capture platforms, Nucleic Acids Res. 2015, 43(11): e76

作者:安捷伦

题图来源:shutterstock.com 正版图库

点击「阅读原文

了解 SureSelect 人全外显子组 V7 更多信息。 ↓↓↓