Advertisement

基因组组装程序linux,spades基因组组装软件简介

阅读量:

欢迎关注"生信修炼手册"!

该软件是一种基于de novo的基因组 assembler,默认专为构建小型生物或微生物的完整基因组设计。它不建议用于动植物复杂的大型基因组分析。该工具主要适用于illumina和IonTorrent sequencing平台提供的高通量测序数据集;此外还支持PacBio、Oxford Nanopore、Sanger sequencing等技术的数据分析。

官网如下

http://cab.spbu.ru/software/spades/

spades是一套软件,类似office办公软件系列,包含了以下5个可执行文件

metaSPAdes

plasmidSPAdes

rnaSPAdes

truSPAdes

disSPAdes

metaSPades专为构建宏基因组测序数据而设计,
plasmidSPades则专门针对叶绿体和线粒体基因组的构建而开发,
rnaSPAdes则专注于RNA-sequencing数据集的构建,
trusPades被设计来处理trex测序相关的barcodes,
disSPades则专门针对高杂合度二倍体基因组的数据进行整合。

软件的安装过程如下

wget http://cab.spbu.ru/files/release3.12.0/SPAdes-3.12.0-Linux.tar.gz

tar xzvf SPAdes-3.12.0-Linux.tar.gz

cd SPAdes-3.12.0-Linux

可以直接从官网获取二进制文件包,并进行解压即可完成安装流程。在bin目录中包含了许多可执行文件。

./

├── dipspades.py

├── metaspades.py -> spades.py

├── plasmidspades.py -> spades.py

├── rnaspades.py -> spades.py

├── spades-bwa

├── spades-core

├── spades-corrector-core

├── spades-dipspades-core

├── spades-gbuilder

├── spades-gmapper

├── spades-hammer

├── spades_init.py

├── spades_init.pyc

├── spades-ionhammer

├── spades-kmercount

├── spades.py

├── spades-truseq-scfcorrection

└── truspades.py

其中spades.py 就是主要的提交脚本,该软件支持多种测序类型

单端数据

建议使用--s1参数配置单独测序的序列文件路径,并在存在多个文库时采用数字后缀形式进行区分示例如--s1,--s2

双端数据

用于分别指定双端测序两端的序列文件参数,请注意多个文库可使用数字后缀区分,请问您是使用--pe2-1还是--pe2-2?

基本用法如下:

spades.py -k 21,33,55,77,99,127 --careful --pe1-1 R1.fastq --pe-2 R2.fastq -o spades_output

该目录输出将生成多个文件,在此过程中特定的fastq文件将被创建出来

扫描关注微信号,更多精彩内容等着你!

全部评论 (0)

还没有任何评论哟~