Linux下BLAST的安装与使用

原本计划对几个亚洲棉基因进行blast比对寻找在陆地棉中的同源基因,但是服务器抽风了,导致计划被打乱,不过刚好也乘此机会学习和总结一下BLAST+的安装和使用。
本文实测环境为Linux64位系统。

##1.安装配置BLAST+
首先是下载程序,

wget ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ncbi-blast-2.2.30+-x64-linux.tar.gz

对文件解压

tar -zxvf ncbi-blast-2.2.30+-x64-linux.tar.gz

为了方便管理,更喜欢将其移至我的本地安装目录中

mv ncbi-blast-2.2.30+ ~/local/app/ # 移动
cd ~/local/app/                    # 进入本地程序安装路径
mv ncbi-blast-2.2.30+ blast        # 修改目录名

这样就安装到我平时安装本地软件的文件夹里了,当然和其他软件的安装方法一样,你需要将blast+的路径加入到环境变量中,方便以后的调取。

echo "export PATH=/db/home/shenwei/local/app/blast/bin:\$PATH" >> ~/.bashrc
source ~/.bashrc

现在一切安装工作已经就绪了

##2.配置本地的BLAST库
为了方便大批量的比对工作,提高工作效率,本地化库是个很好的方法。
建立并编辑BLAST全局配置文件

[hsi@node102 ~]$ cat .ncbirc  #内容如下

[BLAST]
BLASTDB=/home/hsi/blast/db

这样配置的好处在于以后调用库的时候不需要写绝对路径,只输入名称就可以。

##3.准备库文件
因为我本地文件夹中有一套fastq格式的基因组序列,所以我直接就用本地文件,不再去下载了,这一部分就不再包括如何下载,如何更新的内容了。

FAST格式的文件不能作为库直接用于本地的blast,必须要利用makeblastdb进行格式化

makeblastdb -in input_db -dbtype nucl -parse_seqids -out dbname

-in: 后加输入文件
-dbtype: 代表数据库的类型,nucl是核酸类型,prot是蛋白质类型

如果该库需要经常使用,可将库文件移到前面配置的库文件的目录,今后在其它目录运行blast的时候,便可直接输入库名(不用输入绝对路径),直接使用。

mv dbname.* ~/data/blast

##4.执行BLAST

blastn -query test.fa -db nt -outfmt 6 -evalue 1e-5 -out "test.blastn@dbname" -num_threads 8

参数说明:
-query: 输入文件路径及文件名
-out:输出文件路径及文件名
-db:格式化了的数据库路径及数据库名
-outfmt:输出文件格式,总共有12种格式,6对应的是blast的m8格式
-evalue:设置输出结果的e-value值
-num_descriptions:tabular格式输出结果的条数
-num_threads:线程数

结果文件解读:
进行Blast+比对,用参数-outfmt 6可以以列表的方式输出结果,结果中从左到右每一列的意义分别是:

[00] Query id

[01] Subject id

[02] % identity

[03] alignment length

[04] mismatches

[05] gap openings

[06] q. start

[07] q. end

[08] s. start

[09] s. end

[10] e-value

[11] bit score

核酸序列比对核酸数据库(blastn)以及核酸序列比对蛋白数据库(blastx)
与上面的blastp用法类似:

blastn -query seq.fasta -out seq.blast -db dbname -outfmt 6 -evalue 1e-5 -num_descriptions 10 -num_threads 8

blastx -query seq.fasta -out seq.blast -db dbname -outfmt 6 -evalue 1e-5 -num_descriptions 10 -num_threads 8

详情请参考《BLAST® Command Line Applications User Manual》BLAST+使用方法《Linux系统中NCBI BLAST+本地化教程》

Share (本文总阅读量 次)