生物信息学——RNA的剪切过程
外显子(exon expressed exon)是真核生物基因的重要组成部分,在剪接完成后仍然得以保留,并在其蛋白质合成过程中被转化为蛋白质序列。外显子通常位于mRNA序列的末端,并与编码其对应mRNA外显子的DNA区域相对应[1] 。这些非编码区段不仅存在于原始转录产物中,在最终生成的mRNA分子中也同样存在这一特征序列[2] 。
内含子(intron)则是在转录生成的初步产物中被去除的一系列内部核苷酸片段,在基因线性表达过程中起到阻隔作用。
在转录过程中产生的原始信使RNA(Pre-RNA)即为前体信使RNA(pre-mRNA),它是后续加工成标准mRNA之前的中间产物。
对于mRNA前体(mRNAs pre-body),其特异性由核糖核苷酸组成的不同聚合物差异决定。
断裂基因(splite gene)属于真核生物的结构基因,在其组成中由多个编码区和非编码区交替排列并紧密连接构成。通过去除非编码区域后重新连接的方式处理后即可生成由连续排列的氨基酸组成的完整蛋白质;这些结构则被统称为断裂基因(splite gene)。
DNA包括两个主要部分:编码区(coding region)和非编码区(non-coding region)。其中,编码区进一步划分为外显子(exons)和内含子(intron)。
剪切过程(splicing):从DNA模板链生成最初的转录片段并将其内部切割以除去中间区域后将剩余部分连接形成连续完整的mRNA分子的过程。 RNA剪接则是指从断裂基因组所转录产生的mRNA中剔除内部非编码区域以恢复基因组完整性的过程。
在真核细胞基因表达过程中发挥重要作用的是 RNA 剪接这一生物现象。通过 RNA 剪接作用可导致大量具有功能且带有编码信息的 mRNA 的生成。正确判断基因表达过程的关键步骤在于准确识别 RNA 剪切位点。其预转录 mRNAs 配备特定序列稳定性,在其转录起始前需确定 5' 端(供体位点)与 3' 端(受体位点)的具体碱基组成情况;这些碱基大多呈现 GT 和 AG 结构特征;因此遵循 GT/AG 交联规则被称为 GT/AG 规则
由DNA转录生成的基本转录产物——核不均一RNA ,即称为mRNA的主要前驱体,在经过特定酶作用剪切后 ,整合成一个连续的部分成为具有开放阅读框(open reading frame ORF)的存在 。该结构能够通过核孔通道进入细胞质基质 ,从而充当蛋白质合成过程中的模板
