
Genome MuSic(Mutational Significance in Cancer)Linux下的安装
肖斌 2016-5-5 14:40
参考资料: http://gmt.genome.wustl.edu/packages/genome-music/install.html http://readline.net/?tag=music Genome MuSic是perl包,安装过程主要是 1、 perl -MCPAN -e shell & ...
个人分类: 科研文章|4869 次阅读|没有评论
肖斌 2016-4-17 10:33
http://www.ruanyifeng.com/blog/2011/07/principle_of_similar_image_search.html http://www.ruanyifeng.com/blog/2013/03/similar_image_search_part_ii.html
个人分类: 数据分析|1885 次阅读|没有评论
肖斌 2016-4-15 10:45
文章: A Rapid and Economical Method for Efficient DNA Extraction from Diverse Soils Suitable for Metagenomic Applications 2015 ( https://www.ncbi.nlm.nih.gov/pubmed/26167854 )
个人分类: 科研文章|2228 次阅读|没有评论
metagenomic data的strain鉴定工具
肖斌 2016-4-15 10:24
文章: ConStrains identifies microbial strains in metagenomic datasets 2015 ( https://www.ncbi.nlm.nih.gov/pubmed/26344404 )
个人分类: 科研文章|1807 次阅读|没有评论
肖斌 2016-4-12 22:40
文章: myPhyloDB: a local web server for the storage and analysis of metagenomic data 2016 https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4809264/ 文章: Integrative workflows for metagenomic analysis 2016 http://www.ncbi.nlm.nih.gov/pubmed/2547856 文章: ...
个人分类: 科研文章|2787 次阅读|没有评论
肖斌 2016-4-7 22:39
MetaPhlAn是根据metageome的测序数据进行菌群定性和定量的分析(MetaPhlAn is a computational tool for profiling the composition of microbial communities from metagenomic shotgun sequencing data.)MetaPhIAn的基本处理思想,1)将已知数据库的序列信息进行分析,最终形成每个物种独特的marker,2) ...
个人分类: 科研文章|12085 次阅读|没有评论
肖斌 2016-3-30 11:41
metagenomeSeq是用R开发的一个包,其安装可以直接R CMD INSTALL metagenomeSeq_1.12.0.tar.gz,不过metagenomeSeq依赖Biobase、BiocGenerics、limma等包,需要把这些安装OK后才能顺利安装metagenomeSeq。 metagenomeSeq的基本思想,用normalization实现分类注释时的biases处理,同时用零 ...
个人分类: 科研文章|10722 次阅读|没有评论
TruSPAdes和truseq synthetic long reads的策略简读
肖斌 2016-3-18 21:47
文章: trusPades: barcode assembly of truseq synthetic long reads 在宏基因组的研究中,目前测序策略主要基于Illumina的PE100,PE150。在宏基因组的研究中,关键点在于reads的组装,因为各菌种间的序列有重复的地方,导致PE100、PE150组装过后,对菌种的分类效果不一定能达到期望中地步。 ...
个人分类: 科研文章|5146 次阅读|没有评论
肖斌 2016-3-7 14:11
FastQC ( http://www.bioinformatics.babraham.ac.uk/projects/fastqc/), which can evaluate multiple aspects of the raw sequencing data quality, such as per base quality, per base GC content and sequence length distribution. It provides the user a quick overview of whether the data has any p ...
个人分类: 科研文章|3485 次阅读|没有评论
肖斌 2016-2-26 16:58
Weka: http://www.cs.waikato.ac.nz/ml/weka/ scikit-learn: http://scikit-learn.org/stable/ Orange: http://orange.biolab.si/getting-started/ xgboost: http://www.tuicool.com/articles/FNzI3aZ
个人分类: 数据分析|1779 次阅读|没有评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-16 14:56

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社
