基因组组装程序linux,spades基因组组装软件简介
欢迎关注"生信修炼手册"!
该软件是一种基于de novo的基因组 assembler,默认专为构建小型生物或微生物的完整基因组设计。它不建议用于动植物复杂的大型基因组分析。该工具主要适用于illumina和IonTorrent sequencing平台提供的高通量测序数据集;此外还支持PacBio、Oxford Nanopore、Sanger sequencing等技术的数据分析。
官网如下
http://cab.spbu.ru/software/spades/
spades是一套软件,类似office办公软件系列,包含了以下5个可执行文件
metaSPAdes
plasmidSPAdes
rnaSPAdes
truSPAdes
disSPAdes
metaSPades专为构建宏基因组测序数据而设计,
plasmidSPades则专门针对叶绿体和线粒体基因组的构建而开发,
rnaSPAdes则专注于RNA-sequencing数据集的构建,
trusPades被设计来处理trex测序相关的barcodes,
disSPades则专门针对高杂合度二倍体基因组的数据进行整合。
软件的安装过程如下
wget http://cab.spbu.ru/files/release3.12.0/SPAdes-3.12.0-Linux.tar.gz
tar xzvf SPAdes-3.12.0-Linux.tar.gz
cd SPAdes-3.12.0-Linux
可以直接从官网获取二进制文件包,并进行解压即可完成安装流程。在bin目录中包含了许多可执行文件。
./
├── dipspades.py
├── metaspades.py -> spades.py
├── plasmidspades.py -> spades.py
├── rnaspades.py -> spades.py
├── spades-bwa
├── spades-core
├── spades-corrector-core
├── spades-dipspades-core
├── spades-gbuilder
├── spades-gmapper
├── spades-hammer
├── spades_init.py
├── spades_init.pyc
├── spades-ionhammer
├── spades-kmercount
├── spades.py
├── spades-truseq-scfcorrection
└── truspades.py
其中spades.py 就是主要的提交脚本,该软件支持多种测序类型
单端数据
建议使用--s1参数配置单独测序的序列文件路径,并在存在多个文库时采用数字后缀形式进行区分示例如--s1,--s2
双端数据
用于分别指定双端测序两端的序列文件参数,请注意多个文库可使用数字后缀区分,请问您是使用--pe2-1还是--pe2-2?
基本用法如下:
spades.py -k 21,33,55,77,99,127 --careful --pe1-1 R1.fastq --pe-2 R2.fastq -o spades_output
该目录输出将生成多个文件,在此过程中特定的fastq文件将被创建出来
扫描关注微信号,更多精彩内容等着你!
