||
以在文昌鱼、海鞘等基因组中检索***为例
Blast本地化构建
程序下载 链接到:ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/
安装流程 建议安装在非系统盘,如将下载的 BLAST 程序安装到 D:\blast,生成 bin、doc 两个子目录,其中 bin 是程序目录,doc是文档目录,安装完毕。
用户环境变量设置
数据的获取 :直接从 NCBI或者其他数据库网站下载所需序列做成数据库,或者自己已有的测序数据(格式为 fasta,可自己命名)。 下载的基因组先用压缩软件解压,然后用makeblastdb.exe格式化。
格式化命令:makeblastdb.exe -in 基因组genomic.fna -parse_seqids -hash_index -dbtype nucl
序列检索和比对
BLAST+ 系列程序均要求查询序列以“.fasta” 格式,“.fasta”格式是指DNA序列第一行开始于一个标识符:“>”,紧接着(无空格)是对该序列的唯一描述(即ID),然后一个空格,接着是对该序列 的描述(也可有可无),从第二行开始即为序列,中间的空格,换行无影响。为了方便阅读,建议每一行序列不要超过80个字母。
首先将slCaMlsp.fasta放到D:\blast文件夹下,然后调出MS-DOS命令行,转到D:\blast文件夹下运行以下命令:
blastn.exe -task blastn -query 查询序列名称.fasta -db 基因组名称genomic.fna -out 输出文件名.txt
相关参数说明:blastp.exe 程序执行命令,exe 前的程序根据自己的需要而换;
-task 后面选择所需的程序,blastn, blatp, tblastx 等;
-query 后接查询序列的文件名称,文件名中不能有空格;
-db 后接格式化好的数据库名称;
-out 后接要输出的文件名称及格式。
注:本教程参考fangchun0178的博客(http://blog.sina.com.cn/s/blog_54008f790100xwwk.html),结合本人的操作过程实践写作此文。在此向fangchun0178表示诚挚的感谢!
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-5-16 03:59
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社