|||
大部分杂志对测序数据的文章都要求数据要公开化(In public), 但是测序数据往往是一个完整的sff文件,且在研究过程中一个sff文件往往包含不同研究的数据,因此,将一个具有所有信息的sff文件分解成只包含某样品的sff文件有助于数据提交。这里就介绍一下如何用Mothur或者QIIME按样品名来拆分sff文件。
Mothur:
sffinfo(sff=test.sff, oligos=test.oligos, pdiffs=2, bdiffs=1)
QIIME:
process_sff.py -i test.sff -o process_sff_output
split_libraries.py -m test_map.txt -f test.fna -q test.qual -z truncate_only -a 0 -M 2 -b 10 -o split_libraries_output/
make_library_id_list.py -i test.fna -o results/
make_per_library_sff.py -i test.sff -l results/
Mothur 产生的文件比QIIME产生的文件大,Mothur产生的文件是sff文件,且包含更多的有意义的信息,而QIIME产生的文件可能是fastq文件,且有时候是fasta文件。
Mothur生成的sff文件有助于SRA submissions.
现在用于数据上传的数据库有NCBI的SRA, European Nucleotide Archive, DNA Data Bank of Japan (DDBJ),且上传的这三个数据库的数据每天都会交互。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-5-19 14:25
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社