vesperlight的个人博客分享 http://blog.sciencenet.cn/u/vesperlight

博文

基因预测工具:Prodigal

已有 20039 次阅读 2017-11-16 12:15 |个人分类:生信|系统分类:科研笔记|关键词:学者| 基因组, CDS, 宏基因组, 基因预测

1 简介

prodigal(Prokaryotic Dynamic Programming Genefinding Algorithm)用于原核微生物基因组和宏基因组的基因预测,Oak Ridge National LaboratoryUniversity of Tennessee-Knoxville 在2007年联合开发的。更多信息(https://github.com/hyattpd/Prodigal/wiki/introduction)

2下载及安装

代码托管于github上,主页地址为:https://github.com/hyattpd/Prodigal

从github上下载压缩包

使用tar -xzvf解压,进入文件目录,使用make install安装即可。

3 使用方法

prodigal [-a trans_file] [-c] [-d nuc_file] [-f output_type]

                [-g tr_table] [-h] [-i input_file] [-m] [-n] [-o output_file]

                [-p mode] [-q] [-s start_file] [-t training_file] [-v]


        -a: 输出的蛋白序列文件名

        -c: 封闭的两端。即不允许基因的一端没有起始和终止结构.

        -d: 输出的核酸序列文件名

        -f:  输出文件格式(gbk, gff, or sco),默认gbk.

        -g:  指定密码子表(默认11).

        -h:  帮助.

        -i:  指定FASTA/Genbank输入文件(默认标准输入).

        -m:  屏蔽碱基N.

        -n:  Bypass Shine-Dalgarno trainer and force a full motif scan.

        -o:  指定输出文件(默认标准输出).

        -p:  选择过程(单个样品或meta样品),默认单个样品。

        -q:  Run quietly (suppress normal stderr output).

        -s:  将所有带有得分的潜在基因写入到指定文件中

        -t:  写入一个训练文件。否则读取并使用一个指定的训练文件

        -v:  打印版本号


以基因组contig文件为例:

   prodigal -a protein_seq.fasta -d nucleotide_seq.fasta -o genes.gff -s poteintial.stat -i contig.fasta")



https://m.sciencenet.cn/blog-2379401-1085480.html

上一篇:序列多重比对工具:MUSCLE
下一篇:宏基因组分析流程(1):质控

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-18 09:05

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部