Advertisement

科研小白--Day3序列比对

阅读量:

利用star软件进行比对

建立索引的时候首先确定基因组文件是人还是小鼠的

方式一:建立索引

STAR --runThreadN 6 #(指定使用的线程数量)--runMode genomeGenerate #(配置工作模式为建立索引)

-- genomeDir 输出文件位置\ # (输出文件在哪里)

-- genomeFastaFiles 参考基因组文件名称位置\ #(输入文件在哪里)

--sjdbGTFfile 注释文件位置 \

--sjdbOverhang 149 # reads长度-1,默认100

运行结果: 染色体长度、染色体名称、基因信息及注释信息

方式二:简介版比对

STAR --runThreadN 5 -- genomeDir 索引文件 \

--readFilesCommand zcat \

--readFilesIn 一端序列文件 另一端序列文件 \

--outFileNamePreix 输出文件的位置/命名格式 \

sam包含具体的比对结果

运行结果日志记录了处理流程中的关键指令Final以及若干统计数据SAM所存储的各种信息,请问哪些reads配对成功?

方式三 复杂版本

STAR --runThreadN 5 -- genomeDir 索引文件 \

--readFilesCommand zcat \

--readFilesIn 一端序列文件 另一端序列文件 \

--outFileNamePreix 输出文件的位置/命名格式 \

--outSAMtype BAM SortedByCoordinate \

--outBAM sortingThreadN 5 \

--quantMode TtranscriptomeSAM GeneCounts

出现问题:

Because of a SEVERE ERROR encountered during reading the input, there is a discrepancy between the lengths of the quality string and the sequence.

SOLUTION: fix your fastq file

文件损毁,记得检查md5值!!

该平台提供了一款专业的转录组数据分析比对工具功能概述

全部评论 (0)

还没有任何评论哟~