2023.11.13【读书笔记】丨生物信息学与功能基因组学(第六章 多重序列比对 下)
目录
- 6.4 多重序列比对数据库
- 6.5 基因组区域的多重序列比对
- 6.6 展望
- 6.7 常见问题
- 总结
6.4 多重序列比对数据库
Pfam:基于谱隐马尔可夫模型构建的蛋白质家族数据库


SMART是基于简单分子构型研究工具构建的一个数据库,在涉及细胞信号传导、细胞表面结构以及染色质功能的相关蛋白质家族方面具有重要价值
conserved structure domain database (CDD):通过查询 Pfam 和 SMART 数据库来分析其序列数据以识别其保守结构域
多序列比对数据库整合平台:InterPro和iProClass

6.5 基因组区域的多重序列比对
基因组领域与传统的多重序列对比存在显著差异。尽管序列数量相对较少,但每个序列的长度却有所增加。远缘物种多见于具有明确的岛状保守区域,并在此基础上形成了关于‘锚’的概念。真核生物中存在大量重复区域,并且这些重复区在结构上具有一定的保守性。出现了大片明显染色体缺失或倒位的现象,在这种情况下基因组对比缺乏统一的标准基准集。
使用UCSC分析基因组DNA比对

通过Galaxy平台进行基因组DNA对比分析;比对提取器的作用在于从结果中筛选并裁剪感兴趣的部分进行进一步对比;格式转换器的功能是将MAF格式的数据转换为FASTA格式;MAF装订器的作用是将相邻区域的数据进行整合
使用Ensembl分析基因组DNA比对
比对工具:BLASTZ与translated BLAT

EPO流程

Alignathon大赛评估各种全基因组比对方法
6.6 展望
该方法旨在处理可能被归类在同一组的蛋白质家族。
不仅有助于鉴定具有重要功能的部分,
采用渐进式策略进行迭代比较,
并综合考虑一致性或结构特征。
其中大部分程序在近缘物种对比中表现出色,
而远缘物种之间的对比则效果差异显著。
6.7 常见问题
由于缺少标准而使得难以判断不同程序在远缘物种与近缘物种之间比对结果之间的准确性。由此可见,在分子系统发育研究中构建合适的多重序列比对方法具有重要意义。
总结
诚挚地邀请您通过vx平台加入我们的学习社群!vx号:bbplayer2023。名额有限哦!许多成员表现突出,大家乐于助人、共同进步!值得深入探讨!
