MWASTools是一个整合分析大规模流行病学研究中代谢组数据的R包。 关键功能包括:质控分析;使用各种模型(部分相关,广义线性模型)进行全代谢组关联分析;统计结果可视化;使用统计全相关谱(statistical total correlation spectroscopy (STOCSY)进行代谢物分配;和全代谢组关联研究(metabolome-wide association studies,MWAS)结果的生物学解释。 网址:https://bioconductor.org/packages/MWASTools/ 时间:20170726 参考: MWASTools: an R/Bioconductor package for metabolome-wide association studies
大数据包含三个层面:量大,多维度,完备性。量大这方面目前的基因测序数据已经体现,一个基因组有好几个 G ;多维度这个体现就是基因变异的数量,这个也具备了,即资源群体的全基因组测序已经具备了这个条件,但是农艺表型的维度不够,代谢表型和分子表型的拓展才能将维度不断加大;完备性就是不同变异的组合完备性,目前是最欠缺的,一个普通物种的基因有几万个,而我们研究的群体只有几百个,而按照完备性考虑,样本量达到上万才能基本达到要求; 于是可以预测,转录组检测、代谢组检测和基因编辑创造新材料将是生命科学大数据研究的支撑。