生物信息学导论-北大-RNA-Seq数据分析
 发布时间 
 阅读量: 
 阅读量 
ref: https://www.coursera.org/learn/sheng-wu-xin-xi-xue/home
本文主要来自本课的讲义+搜索内容。
已不再上课,所以本文只是笔记,恕不能提供讨论与答疑。
junction reads
在对转录本进行测序后将获得的reads进行基因组定位时, 其中一些reads可能源自跨越不同基因或exon的连接区间的序列(这通常与基因剪接相关)。这些特定的reads被称为junction reads, 因为它们连接了两个不同的序列片段. 通过分析这些reads能够识别剪接变异及其与不同转录本的关系(detect novel splicing isoforms),这对于深入理解基因表达调控机制及其功能具有重要意义.
处理方法
- 
exon联合策略
 - 
构建一个概念性接合物图书馆(...),用于存储已知的所有剪接异构体。
 - 
将reads同时映射至基因组与CJL中进行分析:若无剪切地匹配至基因组,则判定为非接合读;否则进行与CJL的数据比对。
 - 
该方法的优势在于其高效性以及能够识别新型接合异构体的能力。
 - 
然而该方法存在一定的局限性:无法检测出新增外显子及新增基因。
 - 
分段读取策略
 - 
相较于join exon而言,在无法直接映射至基因组的那些read fragments中采取以下步骤:
 - 
首先采用类似滑窗技术将这些read fragments分割成多个k-mer seed
 - 
然后将这些k-mer seed再次映射至基因组
 - 
最后将所有映射到基因组上的k-mer seed整合汇总
 - 
优点:能够识别新的剪接异构体类型,并可发现潜在的新外显子及新基因候选
 - 
缺点:相较于join exon而言计算效率较低
 
可用工具
TopHat
Cufflinks
Cuffmerge
Cuffdiff
- 评估两个或多个样本组别在表达水平上的差异,并通过统计检验确定各变化是否具有显著意义
 - 重要参数:-u
 
CummeRbund
* 方便分析Cufflinks结果的R包,可以绘图
            > source('http://www.bioconductor.org/biocLite.R')
    > biocLite('cummeRbund')
    
    
    r
        - 常用命令:
 
    > csDensity(genes(cuff_data))
    > csScatter(genes(cuff_data), 'C1', 'C2')
    > csVolcano(genes(cuff_data), 'C1', 'C2')
    > expressionBarplot(mygene)
    > expressionBarplot(isoforms(mygene))
    
    
    r
        全部评论 (0)
 还没有任何评论哟~ 
