科研小白--Day3序列比对
利用star软件进行比对
建立索引的时候首先确定基因组文件是人还是小鼠的
方式一:建立索引
STAR --runThreadN 6 #(指定使用的线程数量)--runMode genomeGenerate #(配置工作模式为建立索引)
-- genomeDir 输出文件位置\ # (输出文件在哪里)
-- genomeFastaFiles 参考基因组文件名称位置\ #(输入文件在哪里)
--sjdbGTFfile 注释文件位置 \
--sjdbOverhang 149 # reads长度-1,默认100
运行结果: 染色体长度、染色体名称、基因信息及注释信息
方式二:简介版比对
STAR --runThreadN 5 -- genomeDir 索引文件 \
--readFilesCommand zcat \
--readFilesIn 一端序列文件 另一端序列文件 \
--outFileNamePreix 输出文件的位置/命名格式 \
sam包含具体的比对结果
运行结果日志记录了处理流程中的关键指令Final以及若干统计数据SAM所存储的各种信息,请问哪些reads配对成功?
方式三 复杂版本
STAR --runThreadN 5 -- genomeDir 索引文件 \
--readFilesCommand zcat \
--readFilesIn 一端序列文件 另一端序列文件 \
--outFileNamePreix 输出文件的位置/命名格式 \
--outSAMtype BAM SortedByCoordinate \
--outBAM sortingThreadN 5 \
--quantMode TtranscriptomeSAM GeneCounts
出现问题:
Because of a SEVERE ERROR encountered during reading the input, there is a discrepancy between the lengths of the quality string and the sequence.
SOLUTION: fix your fastq file
文件损毁,记得检查md5值!!
该平台提供了一款专业的转录组数据分析比对工具功能概述
