2020.11.14【读书笔记】丨生物信息学与功能基因组学(第三章 双序列比对 引言)
-
学习目标
-
理解同源(包括直系和旁系同源)的含义;
-
阐释如PAM(可被接受的点突变)矩阵的生成方法;
-
比较PAM和BLOSUM打分矩阵的用途;
-
理解动态规划定义,并解释全局和局部序列比对算法是如何工作的;
-
-
在NCBI网页上利用蛋白质或DNA进行双序列比对
- 3.1 引言
- 在完成多个物种基因组测序后,在同一物种内部及不同物种之间发现某些蛋白质在进化过程中表现出相关性。
-
通过序列水平分析的结果表明,在进化关系上具有同源性的两个蛋白质。
-
具有相似或者相同的功能
-
- 在完成多个物种基因组测序后,在同一物种内部及不同物种之间发现某些蛋白质在进化过程中表现出相关性。
- 3.1 引言
-
蛋白质比对:相较于DNA比对而言, 包含了更为丰富的信息内容
-
尽管存在DNA序列的变化情况出现, 所编码的氨基酸序列并未发生任何变化
-
氨基酸之间具有类似的生物物理性质。
-
比对蛋白质可以发现同源序列,比对DNA无法做到
-
-
在特定条件下,进行核苷酸对齐更为适宜。鉴定DNA序列与其数据库中的对应序列的一致性和吻合度。
* 搜索多态性
* 分析克隆的cDNA片段的一致性
* 比较调控区域
-
-
核心术语:同源性、相似性和一致性
-
同源性:在生物信息学领域研究的重要基础概念之一。它指的是两条DNA或蛋白质序列之间基于共同演化根源的关系特征。
-
具有共同演化根源的两条DNA或蛋白质被称作具有互惠关系
-
同源性无程度之分:只有同源和非同源
-
同源蛋白质
- 三维结构上有相似性
-
-
其亲缘关系可能包括直系亲属关系的亲缘关系或非直系的亲缘关系。
其中:
-
直系同源序列:在物种进化过程中
-
由共同祖先遗传下来的基因片段会被各个分化物种继承下来。
* 旁系同源序列:通过类似基因复制这样的机制产生的同源序列。 * 直系同源序列和旁系同源序列并不一定具有相同的功能- 同源序列
- 在氨基酸或核苷酸序列有显著相似性
- 同源序列
-
相似性与一致性:在数量推断领域中用于衡量序列之间的相关程度。
-
一致性:用来衡量两条氨基酸序列之间变化的幅度。
-
通过NCBI BLASTP或者BLASTN进行双序列比对来评估蛋白质的相关性
-
双序列比对目的:
-
衡量两个分子的相似性程度和同源的可能性。
-
如果两条序列一致性足够大,那么这两条序列可能是同源的。
-
-
-
双序列对比分析流程如下: * 1.通过BLASTP工具实现两个蛋白质的对比分析; 2.选择‘Align two or more sequences’选项完成比对。
* 2\. 输入序列或者它们的索引编号。 * 3\. 根据需要设置可选参数 * 选择PAM或BLOSUM的打分矩阵 * 改变空位起始罚分和空位延伸罚分 * BLASTN搜索,可以改变奖分和罚分标准 * 改变其他参数,如序列字符数、期望值、过滤参数和释放参数 * 4\. 点击“Align”,输出比对结果-
双序列比对结果:
-
两条序列分别位于“query”和“subject”
-
中间一行会显示在比对中出现的相同的氨基酸
-
Identities为一致性,Positives为相似性
-
保守性替换用“+”号显示
-
-
双序列比对特点:
-
可以进行局部双序列比对
-
相似的残基对可能具有相近的结构或功能
-
基本氨基酸
-
酸性氨基酸
-
羟基化氨基酸
-
疏水性氨基酸
-
-
相似百分比:
-
-
相同或相似残基所占的百分比之和
-
通常情况下,将两条蛋白质序列之间的一致度视为比其相似度更为重要;这是因为计算相似性的标准涉及不同氨基酸残基间相似程度的定义方式。
-
空位
-
常见的突变类型主要有替换、插入以及缺失三种。
-
在序列比对过程中,插入与缺失行为都被视为空位的表现。
-
空位可以出现在蛋白质的两端或中间
-
添加空位可以使得比对后的两条序列全长一致
-
-
-
双序列对比分析及其生物进化的特征
- 通过双序列对比分析蛋白质(或DNA)序列间的同源特征旨在探索其背后生物进化的历史进程。
