Advertisement

生物信息学导论-北大-RNA-Seq数据分析

阅读量:

ref: https://www.coursera.org/learn/sheng-wu-xin-xi-xue/home

本文主要来自本课的讲义+搜索内容。

已不再上课,所以本文只是笔记,恕不能提供讨论与答疑。


junction reads

在对转录本进行测序后将获得的reads进行基因组定位时, 其中一些reads可能源自跨越不同基因或exon的连接区间的序列(这通常与基因剪接相关)。这些特定的reads被称为junction reads, 因为它们连接了两个不同的序列片段. 通过分析这些reads能够识别剪接变异及其与不同转录本的关系(detect novel splicing isoforms),这对于深入理解基因表达调控机制及其功能具有重要意义.

处理方法

  1. exon联合策略

  2. 构建一个概念性接合物图书馆(...),用于存储已知的所有剪接异构体。

  3. 将reads同时映射至基因组与CJL中进行分析:若无剪切地匹配至基因组,则判定为非接合读;否则进行与CJL的数据比对。

  4. 该方法的优势在于其高效性以及能够识别新型接合异构体的能力。

  5. 然而该方法存在一定的局限性:无法检测出新增外显子及新增基因。

  6. 分段读取策略

  7. 相较于join exon而言,在无法直接映射至基因组的那些read fragments中采取以下步骤:

  8. 首先采用类似滑窗技术将这些read fragments分割成多个k-mer seed

  9. 然后将这些k-mer seed再次映射至基因组

  10. 最后将所有映射到基因组上的k-mer seed整合汇总

  11. 优点:能够识别新的剪接异构体类型,并可发现潜在的新外显子及新基因候选

  12. 缺点:相较于join exon而言计算效率较低

可用工具

TopHat

Cufflinks

Cuffmerge

Cuffdiff

  • 评估两个或多个样本组别在表达水平上的差异,并通过统计检验确定各变化是否具有显著意义
  • 重要参数:-u

CummeRbund

复制代码
* 方便分析Cufflinks结果的R包,可以绘图
复制代码
    > source('http://www.bioconductor.org/biocLite.R')

    > biocLite('cummeRbund')
    
    
    r
  • 常用命令:
复制代码
    > csDensity(genes(cuff_data))

    > csScatter(genes(cuff_data), 'C1', 'C2')
    > csVolcano(genes(cuff_data), 'C1', 'C2')
    > expressionBarplot(mygene)
    > expressionBarplot(isoforms(mygene))
    
    
    r

全部评论 (0)

还没有任何评论哟~