zbzhang的个人博客分享 http://blog.sciencenet.cn/u/zbzhang

博文

生物信息小软件:本地BLAST

已有 3965 次阅读 2021-6-11 17:31 |个人分类:高通量|系统分类:科研笔记

      高通量测序后会获得很多序列,一般公司都会进行注释,但是如果参考基因组或参考序列注释不完整的情况下,往往需要我们开展本地blast。NCBI的BLAST+是常用的程序,但是需要输入参数和语言。实践证明,这会将N多人挡在门外。为此,利用python语言特编写了一个小程序,以方便使用。

      此外,这个小程序还有一个额外的功能,即可以实现将多对引物与拟进行扩增的靶序列进行比对,尤其是设计好序列的特异性引物后,检查能否扩增出若干个相似度高的序列(如不同剪切体),即检查引物的脱靶效应时能派上用场。

     

下载地址:

                  链接:https://pan.baidu.com/s/1VuDFO3esJlTZPmbNV5AQGA 

                  提取码:wwr8 



使用说明: 

              1. 请提前安装NCBI的BLAST+(https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/),并按照安装说明将BLAST+加入环境变量中(参考:https://www.cnblogs.com/yahengwang/p/9414163.html)。加入环境变量的方法是很多软件通用的方法,仅第一次使用的时候需要,后续就不需要了。

              2. 拟比对的序列或引物以fasta格式的形式存储在记事本(.txt)文件中;相应的序列库需要是.fasta格式的文件。

              3. 将此exe文件和上述的.txt和.fasta文件放在任一文件夹中,双击后根据提示操作即可。


注意事项:

                1. 本程序仅适用于win10操作系统。

                2. 一定要将blast+加入环境变量。

                3. 有的时候报错,可能是由于所在盘的空间不够。

                4. 最后会输出2个文件,一个是简化的版本的txt文件,一个是详细的版本的txt文件,建议先浏览详细版本的文件,简化版本的有它用,推荐使用EditPlus、Notepad++(免费, https://notepad-plus-plus.org/downloads/等软件查看。


致谢:

        1. 特别感谢温州大学肖鹏老师的帮助。

        2. python 社区(https://www.python.org/)。

        3. Biopython, CSV, BLAST+软件包的开发者、维护团队及资助者。




https://m.sciencenet.cn/blog-3446543-1290789.html

上一篇:办公小程序:文件排序用于PDF合并软件,同时批量提取文件名
下一篇:小程序:用序列号实现从NCBI或Ensembl 批量下载序列

0

该博文允许注册用户评论 请点击登录 评论 (4 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-14 00:48

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部