从头测序工具大全,从此测序研究不外包

经验 | 文献 | 实验 | 工具 | SCI写作 | 国自然

从头测序工具大全,从此测序研究不外包

作者:叶子

转载请注明:解螺旋·临床医生科研成长平台



基因组从头测序可以不依赖已知的参考基因序列,便可对某物种的全基因组序列进行测定,然后借助生物信息学的方法,对所得序列进行拼接、组装,从而获得该物种的全基因组序列图谱。

随着高通量测序技术的发展,测序成本和时间的大幅度降低,全基因组从头测序已成为快速了解物种的一个重要途径,尤其是一些与人类生存息息相关的物种。

水稻、玉米、家蚕、马铃薯等基因组图谱绘制的完成,标志着可以从基因组水平对这些物种的生长、发育、进化、起源等重大问题进行研究,从而对基础生物学、分子育种、遗传基因改良等方面的研究起到巨大的推动作用,目前已有多篇CNS论文用了从头测序技术。

从头测序工具大全,从此测序研究不外包

从头测序工具大全,从此测序研究不外包

从头测序工具大全,从此测序研究不外包

基因组从头测序流程如下,有些步骤和全基因组测序相同。

从头测序工具大全,从此测序研究不外包

基因组组装  

高通量测序产生大量或长或短的DNA读数,这些数据需要通过组装来产生完整的基因组序列。基因组组装一般有基于OLC(先重叠后扩展)和基于De Brujin图(DBG)两种组装算法。

OLC算法适用于reads读长较大的测序数据,如一代和三代的reads。DBG算法适用于reads比较短的测序数据,二代数据。但其难以对重复序列区域进行分析,更依赖于建库。

目前应用最广泛的基因组组装软件是SOAPdenovo。

从头测序工具大全,从此测序研究不外包

组装评估

这是评估重新组装和单个重叠群质量以及可靠性的软件。当一个转录组或基因组组装完成后,通常我们会使用N50和基因的数量来大概的评估组装的结果,但是这些指标只是侧面评估的方法,并不能直接作为衡量的标准,因此,BUSCO等评估组装完整性的软件就应运而生。

从头测序工具大全,从此测序研究不外包

BUSCO抽样了数百个基因组,从中选择单拷贝直系同源>90%的基因作为直系同源基因集。值得注意的是,这个90%的阈值说明了一个事实:即使是保守的基因也有可能在某些家系中遗失,同样也可能会出现不完整的基因注释和少量的基因复制。

按照BUSCO文档给出的说明,基因集用5个CPUs,基因组用12个CPUs,用人的参考基因组(3.1G)和哺乳动物库的4104个BUSCO来评估,要6天15个小时,比对后生动物库是21个小时;用人的基因组(20398个蛋白)和哺乳动物库来评估,只要20分钟,如果比对的是后生动物库,就只要3分钟。

重组 

短读测序数据的从头装配通常导致一组碎片化的基因组序列(重叠群)。对这些重叠群(基架)进行排序和定位代表了向基因组整理迈出的第一步。

总体而言,SGA,SOPRA和SSPACE是目前重组最佳的工具然而,即便是用这3个,结果的质量也高度依赖于所读图谱和基因组的复杂性。

序列可视化检查  

由于现在的大规模基因组测序还有局限,在产生的短子序列重建全基因组序列后,不可避免地需要人工检查数据一致性。这时,序列的可视化就尤为重要。这个领域的可视化工具现在主要关注本地序列错误,难以对装配进行高级检查。

这方面做的最好的工具是ABySS-Explorer,强调全局的装配结构,同时也集成了对序列长度等显着数据特征的分析。

基因组注释  

基因组注释包括几个连续的步骤,包括编码和非编码序列的位置,基因预测,调控元件的鉴定和功能注释。

Orione是基于Galaxy的框架由公开可用的研究软件和专门设计的流水线组成,用于构建复杂的,可重复的新一代测序微生物学数据分析。微生物学研究人员无需安装软件或编程即可进行自定义分析和数据处理,Orione为微生物学和宏基因组学中的数据密集型计算分析提供了新的机会。

系统发育分析  

现代测序技术让生物学家可以收集整个分子证据来重建进化树。ExaBayes可以对任意大小的数据集进行贝叶斯树推理。ExaBayes的显著特点是能够高效地处理大量的数据集,对包含数千个分区的数据集进行高效分析的修改。

从头测序工具大全,从此测序研究不外包

基因比较  

随着我们生成测序数据的能力不断提高,数据分析正取代数据生成,成为基因组研究中的限速步骤。一个好的基因组数据可视化工具可以让研究人员能够探索,解释和操作他们的数据,并在某些情况下执行即时计算,来促进分析任务。

这类软件可以用于分析从头测序装配的图形方法,并阅读比对,还能用于基因组浏览和比较基因组学。

从头测序工具大全,从此测序研究不外包

Circos是可视化工具,用圆形来表示基因组间隔之间的关系,可以显示大量的基因组重排数据。该软件提供了一种可扩展的手段来说明基因组位置之间的关系,并设计为允许在图像中灵活和容易地重新排列元素。它还包含几个工具来帮助分析,过滤和格式化数据。即使是Circos的在线版本,也能做出很漂亮的图。

从头测序工具大全,从此测序研究不外包

点击“阅读原文”就可找到这些工具!除了在线工具外,部分软件需要在linux环境下运行。

从头测序工具大全,从此测序研究不外包

欢迎投稿tougao@helixlife.com.cn合作微信:helixlife6