北京大学生物信息学(转录组)
 发布时间 
 阅读量: 
 阅读量 
特征选择
启发式选择
前向选择
后向选择
双向选择
转录组测序 精度严重依赖于测序深度,因此需要对测序深度进行read 归一化。常用的方法是RPKM ,除了RPKM 外还有TMM,deseq,以及TPM。

除了测序深度外,还有练的特异性也会影响基因的表达,需要考虑基因的链的特异性。

常见的基因组mapping 的工具

Tophat

参数
-r 内部的插入片段
-G 是否需要参考基因组


文库的类型:不同的测序平台,建库的方式不同,因此,会决定测序结果是否分链

模拟数据集

Tophat 流程
1.bowtie2 索引构建
2.gtf 文件
命令形式

bam文件详细记录了reads 回贴到基因组的描述,使用samtools 软件查看
16 reads 的名字
99 回帖情况的描述,有咩有贴上,正链负链
2L 贴到参考序列的名字
7902是 read最左端在参考基因组上的位置
50 回帖的质量
75M 表示此read的75个碱基贴到了基因组上。下图每行的的解释
tophat 有参比对
Cufflinks可进行有参和无参比对

cuflinks 的参数



命令的运行

BAM 文件的解读


参数设置

命令的执行

差异表达分析
cuffdiff

转录本的reads数与其丰度成正比,在转录本长度和测序深度一定的情况下。


对上述得到的结果进行可视化

常见的绘图命令

全部评论 (0)
 还没有任何评论哟~ 
