【干货】生物信息学常用工具介绍

粉丝福利

关注安必奇官方公众号,后台回复关键词“抗体”,“细胞”,“PPT”,“软件”,“简历”,“PS”,“基金”,“基因”+“邮箱地址”可获得相应干货大礼包。   



生物信息学要学习什么

初级阶段:Linux命令操作,Perl编程,Python编程,基本生物信息软件Blasta,Clustal,各种数据库查询等

中级阶段:高通量测序数据处理等,专业分析软件,个性化数据分析,基本统计知识,高级编程,R,作图等。

高级阶段:算法开发,软件开发,系统生物学,数据挖掘,人工智能,解决重要科学问题

应用阶段:解决产业问题,例如基因检测,个性化医疗,基因组辅助育种



信息学主要研究内容和工具

数据库查询与搜索:NCBI,Swissport,MaizeGDB

生物序列对比分析:Blast, Clustal, WuBlast

基因预测: FgeneSH, GeneMark

基因组注释:Gene Ontology, KEGG pathways

分子进化,系统发育:Mega, OrthMCL

高通量测序数据处理:Bowtie,Cufflinks,Tophat,IGV

RNA二级结构预测:RNAfold,miDeep

蛋白质结构预测:Coils,nnPredict

基因表达数据分析:Cluster,TreeView,TMV

基因网络分析:Cytoscape



生物信息学软件种类和目的

http://www.mybiosoftware.com/biology-software-list

(一万多种工具可供参考)

3D molecular model 蛋白质分子三维结构

Alignment/Blast序列对比

Cluster Analysis 聚类分析

DNA/Genome Analysis 基因组分析

Assemby Tools 基因组拼接

Genetics & Pedigree 遗传谱系分析

Microarray Analysis 基因芯片分析

Next-Gen Sequencing 测序数据分析

Phylogenetic Analysis 系统发育分析

Plasmid /Chemical Drawing 质粒绘图

Protein Sequence Analysis 蛋白序列分析

RNA Analysis RNA分析

System Biology & Modeling 系统生物学分析

Biochemical/Engineering 生化,酶动力学分析

Bioinformation Platform 生物信息平台,综合分析

Image Analysis 图像分析

Microbiology 微生物分析

Miscellaneous 其他:文件转换,文本挖掘,计算管理等



常用工具介绍

FASTA & BLAST

序列同源性比较

就是讲待研究序列与DNA或蛋白质序列库进行比较,用于确定该序列的生物属性,也就是找出与之序列相似的已知序列是什么。完成这一工作只需要使用两两序列对比算法。常用程序包有FASTA & BLAST【干货】生物信息学常用工具介绍

FASTA 使用的是Wilbur-Lipman算法的改进算法,进行整体联配,重点查找那些可能达到匹配显著的联配。虽然FASTA 不会错过那些匹配极好的序列,但是要有时候回漏过一些酦醅程度不高但达到显著水平的序列。使用FASTA 和BLAST,进行数据库搜索,找到与查询序列有一定相似度的系列。一般认为,如果蛋白的序列一致性为25~30%,则可认为序列同源 。

FASTA格式【干货】生物信息学常用工具介绍
序列命长以>开始,第二行是序列

BLAST(basic local aligement search tool)基本局部联配搜索工具是基于匹配短序列片段,用一种强有力的统计模型来确定未知序列与数据库序列的最佳局部联配。Blast是现在应用最为广泛的序列相似性搜索工具,相比FASTA有更多改进,速度更快,并建立在严格的统计学基础上。该两个工具都采用局部对比的方法。【干货】生物信息学常用工具介绍

BLAST的6个子程序

BLASTP是蛋白序列到蛋白库中的一种查询

BLASTX是核酸序列翻译成蛋白序列,再对每一条作一对一的蛋白序列对比

BLASTN是核酸序列到核酸库中的一种查询

TBLASTN是蛋白序列到核酸库中的一种查询。与BLASTX相反,是将库中的核酸序列翻译成蛋白序列,再同所查序列蛋白与蛋白比对。

TBLASTX是核酸序列到核酸库中的 一种查询。此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列产生6条可能的蛋白序列),这样每次比对会陈胜36种比对阵列

PSL-BLAST通过迭代搜索,可以搜索到与查询序列相似较低的序列

 Clustal

www.clustal.org

序列同源性分析

是将待研究序列加入到一组与之同源 ,但来自不同物种的序列中进行多序列同时比较,以确定该序列与其它序列间的同源性大小,这是理论分析法中最关键的一步,完成这一工作必须使用多序列比较算法。常用的工具为Clustal。【干货】生物信息学常用工具介绍

Figtree

系统树编辑软件,可以打开“.tre,.tree,.result文件”【干货】生物信息学常用工具介绍

该软件必须在Java环境下才能运行。[FigTree requires a Java Virtual Machine to run. Many systems will 

already have this installed. It requires at least version 1.5 of Java to run. The latest versions of Java can be downloaded from: http://java.sun.com/ .] 

* 该软件可很方便地选择树的分支并根据需要设置不同的颜色,选择合适的图形布局,对树重新赋根,调节树的分支线的粗细,显示或隐藏节点和分支标签及调整比例尺等

MEGA:系统树(进化树)的构建

 主要用于进化分析获得的序列信息。通过它可以编辑序列的数据、进行序列的比对、构建系统发育树和推测对比物种序列间的关联程度及进化距离等。【干货】生物信息学常用工具介绍



生物数据库类

【干货】生物信息学常用工具介绍

Gene ontology

www.geneontology.org

Gene ontology(GO)项目是为了能够使对各种数据库中基因产物功能描述一致的努力结果。

建立一套适用于基因功能标书的同一term

为基因功能提供同一的注释条目和分类标准

方便查询基因和基因功能注释

整合来自不同物种的蛋白信息

判定蛋白的结构域

从文献中获得基因

http://amigo.geneontology.org/amigo【干货】生物信息学常用工具介绍

GO分析【干货】生物信息学常用工具介绍

 SWISS-PROT 蛋白注释数据库

http://www.uniprot.org/downloads

SWISS-PROT中尽可能减少了冗余序列,并与其它30多个数据建立了交叉引用,其中包括核酸序列库、蛋白质序列库和蛋白质结构库等。SWISS-PROT数据库包含了EMBL核酸序列数据库中被经过仔细检查和准确注释了的蛋白质序列,一般地,任何蛋白质序列数据的搜寻和比较都应从SWISS-PROT开始。

SWISS-PROT蛋白质序列数据由大量序列条目组成,每一个序列条目有其自己的格式。为了标准化的目的,SWISS-PROT的格式与EMBL核酸序列数据库的格式尽可能类似。SWISS-PROT涉及已知蛋白质的序列、引用文献信息、分类学信息、注释等,注释中包括蛋白质的功能、转录后修饰、特殊位点和区域、二级结构、四级结构、与其它序列的相似性、序列残缺与疾病的关系、序列变异体和冲突等信息。利用序列提取系统(SRS)可以方便地检索SWISS-PROT和其它EBI的数据库。SWISS-PROT只接受直接测序获得的蛋白质序列,序列提交可以在其Web页面上完成。 

【干货】生物信息学常用工具介绍

综合数据库(信息关联好,冗余少)

http://plants.ensembl.org/index.html【干货】生物信息学常用工具介绍

基因表达谱分析

【干货】生物信息学常用工具介绍

植物基因表达数据库

http://www.plexdb.org

【干货】生物信息学常用工具介绍

植物转录因子数据库

http://planttfdb.cbi.pku.edu.cn【干货】生物信息学常用工具介绍

KEGG

http://www.genome.jp/kegg 

KEGG是系统分析基因功能,基因组信息数据库,它有助于研究者把基因及表达信息作为一个整体网络进行研究。基因组信息存储在GENES数据库里,包括完整和部分测序的基因组序列;更高级的功能信息存储在PATHWAT数据库里,包括图解的细胞生化过程如代谢,膜转运,信号线传递等。

KEGG提供的整合代谢途径(pathway)包括碳水化合物,核苷,氨基酸等的代谢及有机物的生物降解,包含有氨基酸序列,PDB库的链接等。KEGG还进行生物体内代谢分析,代谢网络研究的强有力工具。 【干货】生物信息学常用工具介绍

猜你喜欢

蛋白质组学常用工具网站 |  组学技术干货汇总

实用工具

NCBI | 谷歌学术 | 实验方法查询 | 基金申请

科研经验

科研学习工具汇总 | 清华博士SCI经验

培训课程

AI绘图培训课程

安必奇生物依靠专业的技术团队和多年积累的服务经验,从庞大而复杂的实验数据中寻找生物体的改变以及引起这些改变的源头与机制,为您提供专业可靠有深度的蛋白质组学实生物信息学服务。

关于安必奇

在这里,奇奇会为大家分享科研进展、科研趣事、科研干货,投稿、转载及咨询请添加客服微信号:shengwumiao-AIqiqi;吐槽及建议可直接文末留言。

欢迎识别下方二维码,关注安必奇官方公众账号↓↓↓

【干货】生物信息学常用工具介绍

安必奇官方微信——科技与奉献

文章来源:整理于网络