生物信息学数据库及在线工具汇总 (更新)
文章目录
- 
RNA数据库
- 长非编码RNA数据库
 - 1.短非编码RNA数据库
- 2.长非编码小RNA家族数据库
 - 3.短非编码小RNA家族数据库:
 - 4.长/短非编码小 RNA序列 数据库
 
 
 - 
蛋白质信息库
- 
蛋白序列信息库
 - 
结构蛋白信息库
 - 
组蛋白库
 - 
功能域蛋白库
 - 
相互作用蛋白库
 - 
代谢数据库
 - 
- 1.代谢途径数据库
 - 2.代谢组学常用数据库
 - 3.表型数据库
 
 - 
序列比对
 - 
- 1.序列与数据库比对
 - 2.多序列间比对
 - 3.序列进化树分析
 
 
 - 
 
基因分析
* 0. 基因信息
* 1. 基因注释
* 2. 基因功能预测:
* 3. 基因结构预测
* 4. 同源基因分析
* 5. 亚细胞定位预测
* 6. 启动子分析
* 7. 调控目的基因为miRNA的目标位点预测(对第7条进行了更详细的表述)
* 8. 表达水平评估
* 9. 基因结构绘制
蛋白质分析研究主要包括以下几方面:
* 首先是对蛋白质二级、三级结构的预测及其图形展示进行了深入研究。
* 其次是对蛋白质的各种特性进行了系统性分析。
* 同时对蛋白质与水分子作用特性进行了详细探讨。
* 另外还重点研究了跨膜蛋白的特征识别方法。
* 最后针对信号肽序列展开了功能定位分析。
核酸数据库
NCBI [https://www.ncbi.nlm.nih.gov/genbank/]
NCBI is a center dedicated to advancing biotechnology information services, also known as the National Center for Biotechnology Information, an integral part of public health research and innovation efforts.
EMBL [https://www.ebi.ac.uk/ena]
该欧洲分子生物学实验室 EMBL (The European Molecular Biology Laboratory)
DDBJ [https://www.ddbj.nig.ac.jp/index-e.html]
自1984年创建以来,DDBJ(日本 DNA 数据库)就一直占据着世界三大 DNA 数据库的重要地位,并同 NCBI 的 GenBank 以及 EMBL 的 EBI 数据库共同组成了全球性的 DNA 数据库系统
CNGB [https://db.cngb.org/]
位于深圳大鹏新区的是中国国家数据库(China National GeneBank)。它继世界三大数据库之后成为全球第四大的国家级数据库。该机构是中国首个也是唯一家国基因库相较于全球其他三个基因库而言其样品保存规模最大存储容量最大以及可访问数据量均达到最大。
BIGD [https://bigd.big.ac.cn/]
中国生命健康数据服务整合服务中心 (Global Bioinformatics Platform Big Data Integration Hub)
非编码RNA数据库
1.非编码小RNA数据库
miRBase [http://www.mirbase.org/]
piRNAbank [http://pirnabank.ibab.ac.in/]
piRNAbank [http://gtrnadb.ucsc.edu/]
SILVA [https://www.arb-silva.de/]
2.长非编码RNA数据库:
LncRNAdb [http://www.lncrnadb.org/]
真核生物
LncRNAwiki [http://lncrna.big.ac.cn/index.php/Main_Page]
人类长非编码RNA数据库
3.非编码RNA家族数据库
Rfam[http://rfam.xfam.org/]
类似于Pfam的RNA家族注释数据库
4.非编码RNA序列数据库
- RNAcentral [https://rnacentral.org/ ]
 
蛋白质数据库
0.蛋白质信息
Human protein atlas [http://www.proteinatlas.org/ ]
人体蛋白在细胞、组织、病理条件下的表达
1.蛋白序列数据库
Pfam [http://pfam.xfam.org/]
Pfam是一个蛋白质家族存储库,并包含基于隐马尔可夫模型的注释以及序列对齐。
SwissProt [http://us.expasy.org/sprot/]
手动注释的非冗余蛋白序列数据库
UniProt [ https://www.uniprot.org/]
PIR [http://www.proteininformationresource.org/]
Antibodies [http://www.bioinf.org.uk/abs/]
BRENDA [ http://www.brenda-enzymes.org/]
HPRD [http://www.hprd.org/]
InterPro [http://www.ebi.ac.uk/interpro/]
通过综合运用多个蛋白相关数据库资源,在开发出一个便捷的功能注释平台的基础上系统性地支持了对蛋白质家族、结构域以及功能位点的深入分析。
iProClass [http://pir.georgetown.edu/iproclass/]
PRF [http://www.prf.or.jp/]
REBASE [http://rebase.neb.com/rebase/rebase.html]
2.蛋白质结构数据库
PDB [http://www.rcsb.org/]
通过实验测定的结构
SCOP [http://scop.mrc-lmb.cam.ac.uk/scop/]
CATH [http://www.cathdb.info/]
PSI [http://www.uwstructuralgenomics.org/]
3.蛋白组数据库
4.蛋白质功能域数据库
PROSITE [https://prosite.expasy.org/]
最全面
Pfam [http://pfam.xfam.org/]
最专业
ProDom [http://prodom.prabi.fr/]
CCD [http://www.ncbi.nlm.nih.gov/Structure/cdd/cdd.shtm]
Prints [http://www.bioinf.man.ac.uk/dbbrowser/PRINTS/index.php]
SMART [ http://smart.embl-heidelberg.de/]
TIGRFAM [http://www.tigr.org/TIGRFAMs/]
5.蛋白互作数据库
STRING [https://string-db.org/]
DIP [https://dip.doe-mbi.ucla.edu/dip/Main.cgi]
实验验证的蛋白相互作用数据库
BioGRID [https://thebiogrid.org/] :
IntAct [ https://www.ebi.ac.uk/intact/]
代谢数据库
MapMan:一个功能强大的代谢途径查看和编辑软件
1.代谢途径数据库
KEGG [https://www.kegg.jp/]
GO [http://www.geneontology.org/]
NCBI BioSystems [https://www.ncbi.nlm.nih.gov/biosystems]
IMP [http://imp.princeton.edu/]
plantCyc [https://www.plantcyc.org/]
MANET [ https://manet.illinois.edu/]
MetaNetX [ https://www.metanetx.org/]
2.代谢组学常用数据库
MataboLights [https://www.ebi.ac.uk/metabolights/]
HMDB [http://www.hmdb.ca/]
YMDB [http://www.ymdb.ca/]
ECMDB [http://ecmdb.ca/]
3.表型数据库
Planteome [http://www.planteome.org/]
dbGaP [https://www.ncbi.nlm.nih.gov/gap/]
IPPN [https://www.plant-phenotyping.org/]
序列比对
1.序列与数据库比对
2.多序列间比对
- Clustal
 
3.序列进化树分析
- MEGA
 
基因分析
0.基因信息
GeneCard [https://www.genecards.org/]
Gene Wiki[https://en.wikipedia.org/wiki/Wikipedia:Gene_Wiki ]
1.基因注释
Blast [https://blast.ncbi.nlm.nih.gov/Blast.cgi]
Interproscan [http://www.ebi.ac.uk/interpro/],
WEGO [http://wego.genomics.org.cn/]
KAAS [https://www.genome.jp/tools/kaas/]
2.基因功能预测:
GenShi software: Access the .phtml file on SoftBerry’s official website at http://linux1.softberry.com/berry.phtml?topic=fgenesh&group=programs&subgroup=gfind. This particular page focuses on page topic and falls under the category of programs within subgroup gfind.
AUGUSTUS [http://bioinf.uni-greifswald.de/augustus/submission.php ]
GENESCAN [http://argonaute.mit.edu/GENSCAN.html]
GeneMark [http://topaz.gatech.edu/GeneMark/]
Glimmer [http://ccb.jhu.edu/software/glimmer/index.shtml]
3.基因结构预测
Exon-Intron Graphic Maker [http://wormweb.org/exonintron]
根据候选基因的外显子和内含子等信息绘制基因结构
Blastp [https://blast.ncbi.nlm.nih.gov/Blast.cgi?PROGRAM=blastp&PAGE_TYPE=BlastSearch&LINK_LOC=blasthome]
可在线获取蛋白结构域的注释和位置信息
4.同源基因分析
- OrthoDB是直系同源物的综合目录[https://www.orthodb.org/]
 
5.亚细胞定位预测
- PSORT Prediction [http://psort1.hgc.jp/form.html]
 
6.启动子分析
7.调控目的基因的miRNA预测
8.表达分析
ArrayExpress [https://www.ebi.ac.uk/arrayexpress/ ]
数据来自EMBL的高通量功能基因组学实验的数据;
BAR [http://bar.utoronto.ca]
研究基因为功能时常会利用其在植物不同组织和发育阶段的差异性表达情况。针对候选基因为对象,在网络平台BAR上进行详细的数据分析和可视化展示。
9.基因结构绘制
GSDS [http://gsds.cbi.pku.edu.cn/]
Gene Structure Display Server是一个能够根据基因组注释文件展示序列的基因结构的应用程序
蛋白质分析
1.蛋白二级三级结构预测及绘图
- Chou-Fasman [http://www.biogem.org/tool/chou-fasman/]
 - NPSA-Prabi [https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html]
 - PredictProtein [https://www.predictprotein.org/]
 - SWISS-MODEL [https://swissmodel.expasy.org/interactive]
 
2.蛋白特性分析
ProtParam [http://web.expasy.org/protparam/]
蛋白质特性分析主要涉及其物理性质与化学组成。如分子量、等电点、氨基酸及原子组成等关键指标。这些关键指标对于开展蛋白质相关的生化研究具有重要意义。例如,在大肠杆菌或酵母菌等生物体外系统中进行目的蛋白的表达与纯化过程中,则需要考虑蛋白的分子量、等电点以及消光系数等因素的影响;同时,在酶活性实验中也需要根据这些参数优化实验体系。
3.蛋白亲疏水性分析
Protscale [https://web.expasy.org/protscale/]
蛋白质氨基酸的亲疏水性主要由其侧链基团R决定。如果R仅由H或C元素构成,则这类氨基酸属于疏水性;若含有-OH、-SH、-COOH或-NH2等极性基团,则属于亲水性(即极性)氨基酸。疏水性质的氨基酸包括酪氨酸、色氨酸、苯丙氨酸、缬氨酸、亮氨酸、异亮氨酸、丙氨酸以及甲硫氨酸(蛋氨酸)。这些疏水性质的氨基酸在蛋白质内部发挥重要作用,在维持蛋白质三级结构的同时也参与酶与介质、抗体与抗原之间的相互作用以及其他非共价键分子间作用等关键过程。
4.跨膜结构分析
TMHMM [http://www.cbs.dtu.dk/services/TMHMM/]
通过分析蛋白质的跨膜结构特征可以预判其亚细胞定位位置。如果一种蛋白质具有明显的跨膜特征那么它通常会附着于细胞内的特定内质网系统如囊泡运输系统或者高尔基体等处。此外研究蛋白质的跨膜结构有助于推测其功能特性。例如某个蛋白不具备明显的跨膜特征但在亚细胞定位实验中发现它附着于某些内质网或高尔基体等处这提示该蛋白可能通过相关伴侣蛋白被转运至这些内质网系统从而完成其功能过程。
5.信号肽分析
SignalP [http://www.cbs.dtu.dk/services/SignalP/]
峰信号位置为信号肽切割点,峰之前的序列为信号肽
信号肽是一种指导新合成蛋白质向分泌通路转移的短肽链片段,在蛋白质的N末端通常停留,并负责将蛋白质运送到胞内不同膜结构的亚细胞器中。在mRNA翻译过程中首先生成N端的信号肽链,该肽由信号肽识别蛋白(SRP)介导识别并结合到核糖体上以定位至内质网。随后内质网膜上的SPR受体通过相互作用与核糖体连接以促进蛋白质转运至内质网腔内。在此过程中生成的新多肽经由信号肽酶的作用被切除后即可进入胞质基质并通过内质网膜进入腔体内部最终实现分泌功能。在宿主菌中利用外源信号肽可引导外源蛋白定位到胞外分泌部位从而提高蛋白溶ubility特性这一功能在大肠杆菌芽孢杆菌以及毕赤酵母等多种生物系统中得到了广泛应用
6.磷酸化位点分析
NetPhos [http://www.cbs.dtu.dk/services/NetPhos/]
KinasePhos-2.0 [http://kinasephos2.mbc.nctu.edu.tw/]
该过程涉及由蛋白质激酶催化的ATP磷苷键转移到特定氨基酸残基(如丝氨酸、苏氨酸或酪氨酸)上的作用机制;此外,在 signal 激素存在下可与 GTP 结合(通常用 GTP 替代原有的 GDP),这是一类普遍存在的调节机制,在细胞信息传递过程中发挥着关键作用;当外界 signal 存在时会积累一个或多个磷羟基而被激活;而当 signal 不存在后会移除这些位点从而丧失活性;值得注意的是某些特定类型的 signal 蛋白常导致下游一系列蛋白依次发生磷苷修饰形成分级递进式的磷苷修饰反应。
参考:
可访问于http://www.pathguide.org
可通过https://www.jianshu.com/p/e09dd3db76c3?utm_campaign=haruki&utm_content=note&utm_medium=reader_share&utm_source=weixin_timeline&from=timeline访问
访问于http://m.sohu.com/a/202115741_629408
可通过https://bigd.big.ac.cn/?lang=zh访问
