YYJJWW的个人博客分享 http://blog.sciencenet.cn/u/YYJJWW 回首向来萧瑟处,归去,也无风雨也无晴。

博文

Windows10 Blast本地化构建、本地数据库构建及序列检索

已有 15247 次阅读 2018-3-28 12:26 |系统分类:科研笔记|关键词:学者

以在文昌鱼、海鞘等基因组中检索***为例

Blast本地化构建

程序下载 链接到:ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/

image.png


image.png

安装流程 建议安装在非系统盘,如将下载的 BLAST 程序安装到 D:\blast,生成 bin、doc 两个子目录,其中 bin 是程序目录,doc是文档目录,安装完毕。

image.png

用户环境变量设置

image.png

image.png

数据的获取 :直接从 NCBI或者其他数据库网站下载所需序列做成数据库,或者自己已有的测序数据(格式为 fasta,可自己命名)。 下载的基因组先用压缩软件解压,然后用makeblastdb.exe格式化。

image.png

image.png

image.png

格式化命令:makeblastdb.exe -in 基因组genomic.fna -parse_seqids -hash_index -dbtype nucl

image.png

序列检索和比对

BLAST+ 系列程序均要求查询序列以“.fasta” 格式,“.fasta”格式是指DNA序列第一行开始于一个标识符:“>”,紧接着(无空格)是对该序列的唯一描述(即ID),然后一个空格,接着是对该序列 的描述(也可有可无),从第二行开始即为序列,中间的空格,换行无影响。为了方便阅读,建议每一行序列不要超过80个字母。

首先将slCaMlsp.fasta放到D:\blast文件夹下,然后调出MS-DOS命令行,转到D:\blast文件夹下运行以下命令:

blastn.exe -task blastn -query 查询序列名称.fasta -db 基因组名称genomic.fna -out 输出文件名.txt

相关参数说明:blastp.exe  程序执行命令,exe 前的程序根据自己的需要而换;

-task  后面选择所需的程序,blastn, blatp, tblastx 等;

-query  后接查询序列的文件名称,文件名中不能有空格;

-db  后接格式化好的数据库名称;

-out  后接要输出的文件名称及格式。


注:本教程参考fangchun0178的博客(http://blog.sina.com.cn/s/blog_54008f790100xwwk.html),结合本人的操作过程实践写作此文。在此向fangchun0178表示诚挚的感谢!



https://m.sciencenet.cn/blog-3375649-1106079.html

上一篇:部分常见物种拉丁名中文名对照
下一篇:限制性核酸内切酶的命名及规范书写

1 杨婵

该博文允许注册用户评论 请点击登录 评论 (3 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-16 03:59

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部