科学网 › 标签 › 宏基因组

标签: 宏基因组

相关帖子	版块	作者	回复/查看	最后发表

没有相关内容

相关日志

基因预测工具：Prodigal: vesperlight 2017-11-16 12:15; 1 简介 p rodigal(Prokaryotic Dynamic Programming Genefinding Algorithm)用于原核微生物基因组和宏基因组的基因预测, 是 Oak Ridge National Laboratory 和 University of Tennessee-Knoxville 在2007年联合开发的。更多信息（https://github.com/hyattpd/Prodigal/wiki/introduction） 2下载及安装代码托管于github上，主页地址为： https://github.com/hyattpd/Prodigal 从github上下载压缩包使用tar -xzvf解压，进入文件目录，使用make install安装即可。 3 使用方法 prodigal -a: 输出的蛋白序列文件名 -c: 封闭的两端。即不允许基因的一端没有起始和终止结构. -d: 输出的核酸序列文件名 -f: 输出文件格式(gbk, gff, or sco)，默认gbk. -g: 指定密码子表(默认11). -h: 帮助. -i: 指定FASTA/Genbank输入文件(默认标准输入). -m: 屏蔽碱基N. -n: Bypass Shine-Dalgarno trainer and force a full motif scan. -o: 指定输出文件（默认标准输出）. -p: 选择过程（单个样品或meta样品），默认单个样品。 -q: Run quietly (suppress normal stderr output). -s: 将所有带有得分的潜在基因写入到指定文件中 -t: 写入一个训练文件。否则读取并使用一个指定的训练文件 -v: 打印版本号以基因组contig文件为例： prodigal -a protein_seq.fasta -d nucleotide_seq.fasta -o genes.gff -s poteintial.stat -i contig.fasta); 个人分类: 生信|20045 次阅读|0 个评论

让尸体说话-法医密档: woodcorpse 2017-9-2 08:06; 本网与宏基因组公众号内容同步，获得更佳阅读体验请跳转至公众号阅读，关注公众号获得相关文章推送。写在前面周末总得休息一天，陪陪家人。“宏基因组”公众号每周六给大家推荐一部科普神剧，即涨姿势，又适合周末和老婆孩子一起看，绝对让你B格更高。前两周推荐了日本NHK的《生命大跃进》和英国BBC的《人体奥秘》，阅读人数分别为4000+和1000+，成为本公众号历史阅读排名第一和第三的文章。看来大家是喜欢看科普的，只是缺少宣传，接触的途径太少。这更使小编我坚定每周传播一次科普的决心。本周向大家推荐的是国产生物科普剧——《法医密档》，不仅和大家生活相关，而且是宏基因组领域结合最紧密的研究方向。法医密档 ◎译　　名　ForensicFiles ◎片　　名　法医密档 ◎年　　代　2016 ◎产　　地　中国大陆 ◎类　　别　纪录片 ◎语　　言　汉语普通话 ◎上映日期　2016-08-22(中国大陆) ◎豆瓣评分　8.1/10 from 1,894 users ◎豆瓣链接　 https://movie.douban.com/subject/26862279/ ◎集　　数　10 ◎片　　长　25分钟 ◎导　　演　胡志堂 Zhitang Hu 《法医密档》以一个个经典案例为载体，从法医的视角讲述案件侦破的过程，将刑事科学技术与刑侦紧密结合。例如死亡时间的概念，《法医密档》中就会对死亡时间做详细的介绍。法医是通过什么方式，能够精准的推算出死者的死亡时间，进而为刑侦人员提供可靠的破案依据。除了“死亡时间”之外，还有如何确定“死者身份”、如何通过一滴干枯的血迹寻找凶手等等。节目在破解案件的同时，也在传递法医“为死者代言，为生者谋权”的职业精神。整部纪录片一共有十集，每集不过25分钟，但制作周期却长达三年。为求严谨，主创人员在筹备阶段就翻阅了大量法医学专著，并接受规范化培训。之后，摄制组联系了全国近五十个省、市的公安部门，奔赴实地进行考察。又在100多个案件中尽心挑选，最终才确定下来10个既典型又适合影像化的案例。而另一方面，虽然本片由官媒央视出品，但所搭配的文案都相对克制。不煽情，不做作，偶有说教却也绝对达不到令人讨厌的程度。所有推理环节也都有理有据，考究严谨，而且极涨知识。正因如此，整部纪录片看起来既专业详实，又不枯燥乏味。甚至很多案件的精彩程度，堪比电影。下面对每集中的知识要点进行总结，以第5集为例进行图文详细解读(只喜欢看图文朋友有福了)。有时间一定后台回复”法医密档”下载1080p高清版观看。文中视频清楚太一般，仅供预览。 01-显微镜下的真相(水库女尸) 这个案子来自纪录片的第一集，发生于湖北武汉。受害人是一位15岁的小女孩，案发当日下午五点钟的时候跟家人发生矛盾，之后独自出门。到了晚上十点女孩还没回来，于是感觉到有些不安的全家便出门寻找。最终在附近的水库旁，找到了女孩的尸体。视频链接： https://v.qq.com/x/page/h0336mqnyap.html 第一集详细图文介绍，请点击《这部国产片用一具具尸体告诉我们，乱搞男女关系后果有多严重》一文中有详细介绍。知识点：案发现场，发现泥土有新鲜翻动的痕迹，草有成趟的倒伏现象。由此，她推断曾经发生过人为的拖拽行为死者阴道内侧有擦伤，身体内并没有精斑；推测——嫌疑人可能患有性功能障碍，无法进行常规性行为。长期得不到满足的欲望，只有采取其他方式宣泄，擦伤就是手指抓挠形成；硅藻是水中单细胞生物，如果生前入水能够进入血液循环，在人体脏器内被找到。用于判断是人是否死前入水，还是死后抛尸。 02-犯罪心理画像一起命案的侦破离不开办案人员对尸体特征和案发现场的分析，而这一过程中的一项重要内容便是犯罪嫌疑人刻画。在湖北省武汉市发生的一起案件中，法医正是根据血迹斑斑的现场和高度腐化的尸体，再加上办案人员的走访调查准确刻画出犯罪嫌疑人的特征，最终从茫茫人海中揪出真凶，还原事实真相，为受害者讨回公道。通常对作案现场和尸体的分析，推断犯罪嫌疑人的性别、年齡、和死者关系、生活习惯等，以了辅助按件侦破。视频链接： https://v.qq.com/x/page/e0336frgg7y.html 03-死亡时间之谜一女学生死在离家不远的上学路上，死亡原因是窒息。警方通过问询亲属，得知女孩早上上学前曾跟姐姐、姐夫有过对话，但是法医在对尸体进行检查时，发现尸体已出现尸僵、尸斑现象，死亡时间应超过12小时，这一点和亲属的供述极不吻合。为了让亲属说出真相，警方拿出了一系列证据，在事实面前，姐夫承认犯罪。原来姐夫是入赘女婿，长期遭到女方家里的冷眼，事发当晚因为喝了酒，和小姨子发生冲突，醉意加恨意，用棉被闷死了死者。视频链接： https://v.qq.com/x/cover/z0yjy1a4ihn299h/c0337vryb1e.html 04-死者身份之谜在四川省成都市某段绕城高速路旁，一具高度腐烂的无名尸体让警方的侦破陷入困境。要想顺利破案，就必须尽快确定死者的真实身份。然而，在死者面目全非、线索全无的情况下，如何才能确定死者身份，进而揭开案件真相，法医成为破案的关键。他们将通过神奇的法医人类学为我们揭开答案。视频链接： https://v.qq.com/x/page/f0337pguybc.html 05-无声的证人 2011年11月吉林省四平市正值深秋，公安局接到一起疑点重重的案件，一名工厂的夜班守门人被发现勒死在值班室内，然而让办案人员大感不解的是在案发现场并没有发现他人进入的痕迹，在死者身上也没有任何搏斗过的迹象。在办案过程中，现勘人员对每一个案发现场都仔细勘察并提取潜在的物证，这些物证被称为“无声的证人”。这起案件就是通过对这些“无声的证人”仔细分析研究才扭转局面，让真相浮出水面。视频链接： http://v.qq.com/x/page/f0337d57zcg.html 知识点：物证，即无声的证人，包括实物、痕迹；分另物品物证(纤维、油漆)、痕迹(撬压痕、指纹、足迹)和生物物证；勒死，且身体无创伤可考虑为自杀人窒息2-3分钟会失去意识；痕迹物证，是指两个物体一旦接触，即会产生物质交换，如指纹、足迹，只要进入现场即有痕迹；犯罪心里测试技术，俗称测谎，判断嫌疑人与案件的相关度。通常监测心率、呼吸、血压、皮电指数等，判断是人否参与犯罪或说谎，因为通常真正的罪犯被问询时会浮现当时的场景。但准确度有限，不可作为证据，主要用于排除无辜。生物物证：血液、接触痕等，含有DNA遗传信息，是最重要的物证之一死者的死亡方式相当离奇——眼睛上蒙了块黑布，脖子上绑了个领带，领带背后有个小木棍绞这个领带。一般的勒死不会这么复杂，民警也感觉非常疑惑。但了解字母圈的同学肯定已经猜到了是怎么回事——死者生前就有特殊的癖好，平日里就比较喜欢自己勒自己以获取快感。 06-血迹密码在很多刑事案件中，现场留给办案人员的线索十分有限，除了死者之外，就只剩下斑斑血迹。在外行人眼里，这些血迹只能让他们头晕目眩，但是对于法医而言，这些形态各异的血迹却隐藏着至关重要的破案线索，每一种形态都在向法医诉说着现场真相。民警始终在找杀害这三名死者的凶手，但最后出人意料的是——其中的一个死者就是凶手，凶手是先杀人，再自杀。而更让人唏嘘的是，三位死者本是从小一块长大的，是非常要好的兄弟，之所以会反目成仇，无非是为了点钱，无非是由于人的贪欲。视频链接： http://v.qq.com/x/page/k0339m06v0b.html 07-白骨的倾诉西南边陲的一处山洞中，一堆白骨打乱了当地人的生活。白骨已经风化严重，而且白骨下方还有腐烂的绳索。警方初步认定这是一起谋杀案件，虽然这些白骨风化严重，但还是给法医留下了最后的证言。法医推断出死者的年龄，并在失踪适龄人员中展开排查，终于破获这起十年前的凶杀案。杀人动机就这么简单，被害者让加害者把老婆让给他。为什么又是情杀。视频链接： https://v.qq.com/x/page/l0339md2nio.html 08-离奇的车祸现场本集的开篇就悬疑感十足——深夜里一名女子突然接到老公的求救电话，电话那边只传来五个字：老婆，来救我。于是第二天一早，妻子余红便带领同村人寻找彻夜未归的丈夫张仲喜。几经搜寻，她终于在盘山公路的急转弯处发现了丈夫的尸体和摩托车。视频链接： https://v.qq.com/x/page/n0355xm5zir.html 第八集的详细图文介绍，请点击《这部国产片用一具具尸体告诉我们，乱搞男女关系后果有多严重》一文。知识点：发现场的血迹有抛甩状、溅落状、滴落状、擦拭状、稀释状、血泊等多种形态。溅落状：从拖尾现象中就可以判断出血溅的方向。再通过几何原理算出血滴接触物体表面的角度，画出延长线——交汇处，便是出血点的位置。滴落表面并非完全光滑，因此这类血迹周围常伴有毛刺。如果是运动状态下，毛刺会长短不一。长的那边，便是出血者的运动方向。第三类是擦拭性血迹，血的物体以擦层、触摸等方式留下的，边缘不规则，界限不清晰。通过它，也可以大致判断打斗的过程、案犯清理现场的过程等等法医从凶器上检测出了除死者外第二个人的DNA，经过比对——和妻子余红DNA完全吻合。这确实是一件预谋已久的谋杀。又是情杀。 09-自缢之迷所谓触物必留痕，作为案件现场出现频率最高的痕迹之一，现场足迹包含着丰富的犯罪信息。通过对现场足迹的花纹、大小、遗留部位等特征进行分析，可以得到犯罪嫌疑人人身特点、行走特点等信息，再结合现场提取到的其他物证，办案人员还能对案件现场进行重建，确定重点人员。贵州省松桃县发生的这起少女自缢案件正是通过对现场足迹的分析，扭转了案件侦破方向，最终揭开自杀背后的真相。视频链接： https://v.qq.com/x/page/d0355s6ahmm.html 10-沉尸 2014年4月10日，贵州乌江下游河段发现一具尸体，全身高度腐烂，面目全非，现场只有一部被水泡过的手机，种种迹象表面这是一起谋杀案。为此，法医们连续三天三夜对尸体进行反复检验，最终还原了死者身份，找到了死亡原因，在刑侦人员的共同努力下，发现第一案发现场，将被掩盖了半年之久的血迹重现进而将凶手绳之以法，还死者一个公道。视频链接： https://v.qq.com/x/page/z0330uu6qha.html 写在后面你既可以在本套纪录片中学到一些基本的法医学知识（当然最好用不上），又可以看到法医们“为生者谋权，为死者代言”的职业精神。而更重要的是这些光怪陆离的案子为我们提供了一个窗口，透过真实发生的一出出悲剧——你能更近距离的窥视人性，打量现实，并借此反思我们的生活与社会。本领域的小伙伴们更应该为我们的研究感到自豪，利用”宏基因组”学技术，为死者伸张正义，让坏人无处可逃。参考资料豆瓣 https://movie.douban.com/subject/26862279/ 六维 http://bt.neu6.edu.cn/thread-1592192-1-1.html 有部电影 http://mp.weixin.qq.com/s/YUx11LwwE_M1DnS_tF3ifA 更多相关文章，请点击 “宏基因组”文章目录阅读；想了解更多16S/ITS/18S扩增子、宏基因组、宏转录组文献阅读和分析相关文章，快关注“宏基因组”公众号，干货第一时间推送。系统学习生物信息，快关注“生信宝典”，那里有几千志同道合的小伙伴一起学习。; 个人分类: 科普|2472 次阅读|0 个评论

扩增子图表解读4曼哈顿图：差异OTU或Taxonomy: woodcorpse 2017-7-8 07:06; 科学网对Markdown排版支持较差，对格式不满意的用户请跳转至 CSDN 或 “宏基因组”公众号阅读；想了解更多宏基因组、16S文献阅读和分析相关文章，快关注“宏基因组”公众号，干货第一时间推送。系统学习生物信息，快关注“生信宝典”，那里有几千志同道合的小伙伴一起学习。作者: 刘永鑫日期：2017-6-30 阅读时长：10min 背景介绍(Introduction)宏基因组学宏基因组学目前的主要研究方法包括：16S/ITS/18S扩增子、宏基因组、宏转录组和代谢组，其中以扩增子研究最为广泛。目的意义本系列文章将带领大家结合较新的16S扩增子相关文献，来理解宏基因组16S扩增子文章中常用图表种类、图中包括的基本信息，以及作者想表达的结果。主要内容本系列文章内容包括：箱线图、散点图、热图、曼哈顿图、维恩图、三元图和网络图等。学习思路罗列知识点，熟悉专业名词，弄个脸熟，即使理解不深刻起码在阅读中不会有抵触情绪；结合具体文章读图，实战两三次，基本就是专业人士了。将来在大家可以很好理解相关文章图表的基础上，希望对分析、统计和绘图相关技术有进一步学习的小伙伴请积极回复并留言吧。如果本系统文章阅读过万，想学分析的留言过百。我还将详细讲解扩增子分析、统计和绘图各步骤的分析实例和源代码，希望大家多多鼓励和支持。声明：文章的解读仅代表个人理解和观点，有不足处，请读者积极留言批评指正，互相学习，共同进步。知识点(Method)曼哈顿图 Manhattan Plot 曼哈顿图本质上是一个散点图，用于显示大量非零大范围波动数值，最早应用于全基因组关联分析(GWAS)研究展示高度相关位点。它得名源于样式与曼哈顿天际线相似(如下图）。 Manhattan plot is a type of scatter plot, usually used to display data with a large number of data-points - many of non-zero amplitude, and with a distribution of higher-magnitude values, for instance in genome-wide association studies (GWAS). It gains its name from the similarity of such a plot to the Manhattan skyline: a profile of skyscrapers towering above the lower level “buildings” which vary around a lower height. 近几年，在宏基因组领域，尤其是差异OTU结合分类学结果，采用Manhattan plot展示有非常好的效果，倍受推崇。曼哈顿图优点大数据中，即展示数据全貌，又能快速找到目标基因或OTU，同时可知目标的具体位置和分类、显著程度等信息。绝对高端大气，而且还有内涵。数据坐标轴介绍以上图GWAS研究结果为例： X轴为染色体编号，且每个基因组SNP位点沿染色体序列排列；在16S扩增子或宏基因组中则为OTU按Taxonomy某一级别排序。 Y轴为该位点相关的统计显著性Pvalue值，由于pvalue值范围是从0-1，且越小越好，直接展示非常密集于0附近，很难区分。如何使越近0的显著数值变大，且而容易区分开，log10变换是非常好的方法，直接把关注的高显著性(Pvalue趋近零)值高位显示，远离整体，目标一目了然。图中水平线一般为设定的不同显著性水平阈值，方便读出每个点的显著性水平；或只添加一条显示性阈值，高于则显著。曼哈顿图绘制工具散点图，自然还是R语言，ggplot2可以画的非常漂亮。看图实战(Result)示例1. 双曼哈顿图展示WT和mutant间差异富含OTU分布在那些菌目 Zgadzaj, R., et.al., 2016 .PNAS 这篇文章分析了百脉根根瘤的微生物组成，同时在根瘤缺失突变体条件下发现根和根际微生物组均有较大差异的变化。图5.A/B 曼哈顿图展示野生型，突变体根相对于根际土显著差异的OTU类型图中元素解释 X轴标签“OTU… respect to rhizosphere”表示：根际土壤作为背景对照，计算富集的OTU； X轴OTU按分类学目水平(order)字母顺序排列显示，由于数量太多，不显示OTU编号标签反而更美观； Y轴为-log10(Pvalue)；将pvalue转换为越显著越大，便于观察；主图区的每个圆点或圈代表1个OTU，大小代表其相对丰度；其中存在显著富集OTU的目中所有OTU用彩色实心圆点显示，并添加灰度背景，且该目的名称标注于图顶部；目中内无显著富集OTU的目为空心灰点，且背景为白色。图表结果：两个曼哈顿图展示WT和mutant间差异富含OTU分布在那些菌目；而且与野生型相比，在突变体中许多显著富集的菌目消失；经验和技巧：单曼哈顿图显示显著富集的OTU已经信息非常丰度；采用曼哈顿图展示两中组差异的OTU，让读者自己去比较差异，反而更突出结果的显著差别。分类学注释级别选择目，找到了一些差别的类，要保证这些类即不能太多，也不能太少，才便于传递给读者工作即全面、又细致的印像。附图注原文： Fig. 5. Manhattan plots showing root-enriched OTUs in WT (A) or in the mutants (B) with respect to rhizosphere and rhizosphere-enriched OTUs in WT (C) or in the mutants (D) with respect to root. OTUs that are significantly enriched (also with respect to soil) are depicted as full circles. The dashed line corresponds to the false discovery rate-corrected P value threshold of significance (α = 0.05). The color of each dot represents the different taxonomic affiliation of the OTUs (order level), and the size corresponds to their RAs in the respective samples . Gray boxes are used to denote the different taxonomic groups (order level). 示例2 这是我自己画的一个样式，对上图的样式做了一些改进，展示一个基因敲除突变体(KO/mutant)与野生型(WT)细菌组的比较；图中元素解释 X轴为OTU，按分类学门水平字母排序； Y轴两组比较的Pvalue值，取loge(P)，即自然对数转换；图中点的大小代表该OTU的相对丰度，取log2(CPM)对数，即2的对数；CPM为count per million的缩写，和RPM类似，都是百万分数；图中点颜色代表分类学门类型，便于从门水平找规律；图中点的形状标注了其变化的类型，是上调enriched(正实心三角)，还是下调depleted(倒空心三角)，还是没有显著差异变化nosig(实心圆点)；图表结果：展示了KO突变体基因型相较WT有较明显的细菌组变化，尤其是放线菌门上调较多，变型菌门上调和下调都很多，但上调的更显著；图表经验：从门水平先看整体规律，再一步步往纲、目、科、属去找规律的具体细节；用形状区分上调或下调，让结果更清楚。 Reference https://en.wikipedia.org/wiki/Manhattan_plot Zgadzaj, R., Garrido-Oter, R., Jensen, D.B., Koprivova, A., Schulze-Lefert, P. and Radutoiu, S., 2016. Root nodule symbiosis in Lotus japonicus drives the establishment of distinctive rhizosphere, root, and nodule bacterial communities. Proceedings of the National Academy of Sciences, 113(49), pp.E7996-E8005.; 个人分类: 读文献|3276 次阅读|0 个评论

宏基因组公众号创立——如何注册一个名字好记的公众号: 热度 1 woodcorpse 2017-5-23 15:33; 我为什么注册公众号？科学网对Markdown排版支持较差，对格式不满意的用户进跳转至 CSDN 或微信阅读；如果感觉文章对您有帮助，想阅读同类文章，请扫描下方二维码关注“生信宝典”公众号，每天定时接收最新生物信息学技术原创文章。只关注宏基因方向的用户请微信搜索“宏基因组”a或扫描下方二维码添加。分享知识！做技术的人一定会有这样的经历：经常会碰到很多技术问题，最快的方法是在百度上搜索问题的描述，找到各类博客、论坛上中文的解决方法；其次是请教身边有经验的大牛，直接一两句话搞定；都没有才会在google上硬着头皮搜英文关键字，一个一个找相关方法，尝试，但有时会试了多种方法仍然无效，只能先放一放。对于必做的事有时也必须反复尝试一下，逐渐积累经验，最终结合多篇文章的方法组合或修改出一个适合自己特写环境的解决方法。有心人会将问题的解决过程整理成笔记，以便下次再碰到同样或类似事情可以高效解决。这样的经历虽然提高了解决问题的能力，但体验是痛苦甚至抓狂的，而且消耗的时间成本也是巨大的。而我经常会想，这么常见的问题为什么没人遇见呢？为什么在网上找不到解决方法呢？如果能找到一篇应对自己问题解决方法的中文教程，那绝对是一件极幸福的事情。而自己笔记中有针对性的解决方案却静静地躺在我电脑的硬盘及云端的帐号里面。如果每个人都将经验花点时间分享出来，我想我们的工作应该会更高效，生活也会更美好。分享的经验是否真的有人需要吗？我估计会有非常多有相似工作的受众会需要。而且早在2011就刚开始读博就开始使用博客分享经验，只是没有坚持下来。举我自己的两个例子。 2011年在网易博客发布的《Ubuntu11.10 root密码重置》已经被阅读了1238次。这种半年更新一次的操作系统相关技术解决方案，一般时效也只有半年至两年。 http://woodcorpse.blog.163.com/blog/static/634420312011105113524943 2013年在PLOB上发布的《RepeatMasker安装方法与使用》已经被阅读了6877次。而且在Google和百度搜索“repeatmasker”均为第一个中文页面，可见此文大家的关注程度。 https://www.plob.org/article/5743.html 笔记的记录方式笔记是个人能力提高的关键性习惯！常见的笔记记录方式有三种，其实也是我个人笔记记录方式成长的三个阶段。传统的纸记录方法。2008年我大学本科毕业前的记录方式，也可能是绝大多数人的习惯，最近问了6个使用程序语言工作的新手，居然有3人还使用纸记录的方式记录编程经验笔记，实在令我很吃惊，首先不用説代码的体量，就是以后想重用查找和输入就是极耗时的，绝不可取。 Word或常见代码格式记录。2014年前我硕士和博士阶段的主要记录方式，积累了大量的知识和问题解决方法，这是我最近问的6个程序语言新手另外三人的笔记记录方式，也看到了我几年前的影子。此事表明他们有学习的进取心和数字化知识积累过程，不容易被同一块石头绊倒两次，但编辑和阅读仍有缺陷，如Word排版比较耗时，而代码中注释则阅读体验不够好。云笔记及Markdown语言的记录方式。2014年博士毕业后的主要笔记方法，云笔记的优点很多，如快速编辑，保存网页，数据云同步，支持电脑、手机和网页随时编辑及查看等优点。安全与高效并重，用上了根本就停不下来，而且有道云笔记最近还开始支持Markdown语言，可以纯本编写文章、注释和代码混排并且带格式的文档，也容易保存或转发到github、 blog或微信公众号上，即方便自己的知识经验重用，也方便其它人遇到类似问题快速找到解决方法。注册一个名字好记的微信公众号如何开始注册微信公众号前提你得有个邮箱。在百度上搜索“微信公众号”；结果第一条显示“微信公众平台”官网即可点击进入，点击右上角“立即注册”，个人发表文章或技术贴建议选择“订阅号”类型；输入邮箱，密码(以后的公众号登陆密码，不是你邮箱密码，设成一致也可以)，确认密码即再输一次(怕你输错了)，和验证码，点击确认；这时需要点击“登陆邮箱”去查收你自己邮箱收到的确认邮件，并点击链接以激活并继续注册；在订阅号类型下点击“选择并继续”，弹出窗口确认即可；信息登记页中选择个人，并填写姓名、身份证号，用自己的微信扫码确认绑定，并输入手机号及收到的验证码绑定手机，点击确认，弹窗再确认；公众号信息填写帐号名称、功能介绍及选择运营国家即可。名字的选择一个好的名字，方便大众及专业人士记忆和查找，极有利用信息的传播。我作为生物信息学-植物微生物组学研究方向的工程师，首先想到了大众和专业人士均能非常好记忆而且表意神似的成语“无微不至”，方便专业技术和和科普知识的传播，可惜已经被注册；第二选择是“微生物组”，即英文的microbiome，也被注册了；无耐使用第三选择“宏基因组”，即英文的metagenome，获得成功。此外的第四选择“微生物群”，即英文microbiota也用另一备用邮箱抢注成功。将来本人研究的相关技术、问题解决方案、研究技展、学习心得均分享在些平台上。欢迎大家关注我的公众号”宏基因组”；也希望大家关注我们课题组的公众号“植物微生物组”，了解更多植物微生物组相关内容。以后登陆公众号平台发布文章，可直接访问 https://mp.weixin.qq.com/ 登陆即可。; 2989 次阅读|1 个评论

QIIME安装及设置: luria 2017-5-21 11:25; 在微生物基因组扩增子测序领域，QIIME可谓是一道标杆。QIIME全称Quantitative Insights Into Microbial Ecology，主要由美国科罗拉多大学Rob Knight实验室的一帮牛人开发的。编程语言主要为Python，官方提供的引文为 J Gregory Caporaso, Justin Kuczynski, Jesse Stombaugh, et al. QIIME allows analysis of high-throughput community sequencing data. Nature Methods, 2010; doi:10.1038/nmeth.f.303 本篇仅介绍QIIME的安装，后期博文会尝试从代码深入理解QIIME每步分析过程，敬请期待。像QIIME这类Pipeline通常程序众多，安装升级牵扯的相联关系比较复杂，这里建议直接使用QIIME VirtualBox。 1. 下载安装VirturalBox，地址：https://www.virtualbox.org/ 下载QIIME，地址：http://qiime.org/install/virtual_box.html 文件大小约大于4G，解压后约51G。 2. 解压后为QIIME-1.9.1-amd64.vdi文件，将其放到某处（注意此位置以后不能调整）。安装好VirtualBox后，点击常用工具栏的新建图标 = 在虚拟电脑名称和系统类型中输入名称（Qiime）类型（Linux）版本Ubuntu(64-bit) = 下一步 (如图1) = 内存大小对话框中选绿色标线最大处的内存(这里以后也可以调) = 下一步 = 在新建虚拟电脑对话框中选择“使用已有的虚拟硬盘”，并加载上QIIME-1.9.1-amd64.vdi（如图2）= 创建图1 图2 3. 装好后界面如下：按Ctrl+D安装增强工具，这时会自动弹出安装增强工具，如果不小心关掉了，可以打开文件资源管理器，进入VBOXADDITIONS(如下图左栏)进入加载的增强工具盘双击autorun.sh # 如果想用命令行进入VBOXADDITIONS，其位置在/media/下面，需要 sudo chmod 755 * 一路运行如下，完成后回车之后再重启一下 4. 安装好增强功能后，做以下设置： 4.1 调整屏幕分辨率：单击右上角的设置按钮（齿轮）- Displays，我这里选1920*1080(16:9) 4.2 修改QIIME的主机名打开终端 sudo vim /etc/hostname 然后将其中的名字修改一下，即可完了之后需要重启才能生效 4.3 在虚拟机中共享主机文件夹先在VirtualBox虚拟机中开启主机文件夹共享，如下图其中luria是我的主机用户名，你可以在Linux下输入 whoami 命令查看你的主机用户名，将以下步骤中的luria换成你的主机用户名。这时df -h可以查看到已加载上主机共享的文件夹如下图，但是这里没有权限打开。需将luria用户加入到vboxsf组中，才有权限访问挂载的目录，以实现文件共享! 执行： sudo adduser scg vboxsf 然后sudo reboot重启生效; 个人分类: Metagenomics|8005 次阅读|0 个评论

The pangenome of hexaploid bread wheat: 热度 1 mashengwei 2017-2-26 22:20; The pangenome of hexaploid bread wheat 　　今天看到这样一篇文章，着实高兴了一番。在小麦参考基因组刚刚公布，文章还未发表的情况下，突然跳出了一篇小麦宏基因组的文章，让人不得不得感叹，这都是什么世道。匆匆看过一遍之后，有点失望，这分析也太简单了，怪不得只发在了The plant journal上，需要挖掘的信息很多。　　文章一共使用了18个小麦品种，其中就包括中国春，还有其他16个澳大利亚的小麦品种。分析的内容都很初级，这里不再详谈了。说点和它的原始数据有关的事。看完文章之后，竟然没说原始数据在哪里可以下载。于是匆忙给 David Edwards 教授发邮件询问。发完之后我就下载附件信息再看，结果竟然有说在什么地方下载原始数据。看到这，我寻思大事不好，人家提供了我竟然发邮件说没有，闹了国际大笑话。我于是赶紧看看是否发出去了。结果又让我大吃了一惊，David教授竟然回我邮件了。大意就是说我们提供了，只不过文章还未正式上线，数据还未整理好。我看看了时间，可能恰好是David教授刚刚上班，正在收邮件呢。我看了下原始数据从2011年就有了一部分数据，后面陆陆续续又补充了很多。也难怪，写文章时小麦还没有一个像样的参考基因组，de novo组装也不太现实。　　在这里还是感谢David教授，非常及时又爽快的给我回邮件。貌似和老外邮件交流很少碰到有去无回的。这让我想起了给国内的一些老板发邮件请教问题的时候，绝大部分老板不会回我。印象中老师华中农大研究玉米的严建兵老师给我回过几次，还有凌宏清老师给我回过一次。; 3504 次阅读|3 个评论

文章Microbial diversity in individuals and their的解读: xbinbzy 2016-10-9 15:47; 文章： Microbial diversity in individuals and their household contacts following typical antibiotic courses 时间：2016 杂志：Microbiome 研究目的： (1) discern the effects of the 2 most commonly prescribed antibioticson the microbiota of the skin, gut, and mouth, (2) characterize the degree of similarity in the microbiota of unrelated household contacts and decipher whether it is significantly affected by antibiotic use, (3) characterizethe long-term effects of typical antibiotic prescriptionson microbiota diversity, and (4) discern whether there may be collateral effects to antibiotic use for the diversity of microbiota in household contacts. 研究方案： We recruited and sampled the feces, saliva, and skin from a cohort of 56 subjects over a 6-month period fromthe University of California, San Diego, campus. Of those 56 individuals, there were 24 separate households consisting of 2 individuals and 8 separate controls not enrolled with a housemate. 研究结果： 1) between household pairs longitudinally and comparing with individuals from separate households, we found smaller distances among the household pairs, which was statistically significant ( p 0.05) in the gut, saliva, and skin for all households. The similarity observed in the bacterial biota was not significantly affected by the use of antibiotics, as the same patterns were observed in households that received azithromycin and those that received amoxicillin. 2) 样品间的差异随时间延长而增加，无论抗生素使用与否。 a clear trend could be ob-served for most time points, as those control subjects who received no treatment also demonstrated the same trend. 3) 样本无法根据抗生素使用与否、时间等因素分开，差异更多体现在取样部位上 4) 差异的菌属分析 5) alpha多样性的分析，抗生素与安慰剂组的差值进行作图心得： 1）在菌群的研究中，如何将众多的菌整合成1个或少数几个指标是数据处理的关键，文章利用 weighted UniFrac distances作为一个值整体代表群体状态进行比较分析，值得类似研究中学习和借鉴。; 个人分类: 科研文章|2764 次阅读|0 个评论

metagenomic不同环境样品的DNA提取: xbinbzy 2016-4-15 10:45; 文章： A Rapid and Economical Method for Efficient DNA Extraction from Diverse Soils Suitable for Metagenomic Applications 2015 （ https://www.ncbi.nlm.nih.gov/pubmed/26167854 ）; 个人分类: 科研文章|2272 次阅读|0 个评论

metagenomic data的strain鉴定工具: xbinbzy 2016-4-15 10:24; 文章： ConStrains identifies microbial strains in metagenomic datasets 2015 （ https://www.ncbi.nlm.nih.gov/pubmed/26344404 ）; 个人分类: 科研文章|1847 次阅读|0 个评论

metagenomic数据的在线分析工具: xbinbzy 2016-4-12 22:40; 文章： myPhyloDB: a local web server for the storage and analysis of metagenomic data 2016 https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4809264/ 文章： Integrative workflows for metagenomic analysis 2016 http://www.ncbi.nlm.nih.gov/pubmed/2547856 文章： The metagenomics RAST server – a public resource for theautomatic phylogenetic and functional analysis of metagenomes 2008 （工具地址： http://metagenomics.anl.gov ）; 个人分类: 科研文章|2822 次阅读|0 个评论

metagenomics的数据库: xbinbzy 2016-2-21 21:38; 文章： EBI metagenomics in 2016 - an expanding and evolving resource for the analysis and archiving of metagenomic data 2016 （ https://www.ncbi.nlm.nih.gov/pubmed/26582919 ）文章： HPMCD: the database of human microbial communities from metagenomic datasets and microbial reference genomes 2016 （ http://www.ncbi.nlm.nih.gov/pubmed/26578596 ）; 个人分类: 科研文章|2022 次阅读|0 个评论

metagenomics差异分析工具的文章: xbinbzy 2016-2-21 21:24; 文章： Partial Least Squares Regression Can Aid in Detecting Differential Abundance of Multiple Features in Sets of Metagenomic Samples 2015 （ http://www.ncbi.nlm.nih.gov/pubmed/26734061 ）文章： A robust approach for identifying differentially abundant features in metagenomic samples 2015 （ http://www.ncbi.nlm.nih.gov/pubmed/25792553 ）文章： MetaBoot: a machine learning framework of taxonomical biomarker discovery for different microbial communities based on metagenomic data 2015 （ http://www.ncbi.nlm.nih.gov/pubmed/26213658 ）文章： FCMM: A comparative metagenomic approach for functional characterization of multiple metagenome samples 2015 （ http://www.ncbi.nlm.nih.gov/pubmed/26027543 ）文章：Differential abundance analysis for microbial marker-gene surveys 2013 （ http://www.nature.com/nmeth/journal/v10/n12/full/nmeth.2658.html ）文章： Metastats: an improved statistical method for analysis of metagenomic data 2011 （ http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3439073/ ）文章： STAMP: statistical analysis of taxonomic and functional profiles 2014 （ http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4609014/ ）; 个人分类: 科研文章|2218 次阅读|0 个评论

metagenomic数据的注释: xbinbzy 2016-2-21 20:59; 文章： EXTRACT: interactive extraction of environment metadata and term suggestion for metagenomic sample annotation 2016 （ http://www.ncbi.nlm.nih.gov/pubmed/26896844 ）文章： Network construction and structure detection with metagenomic count data 2015 （ http://www.ncbi.nlm.nih.gov/pubmed/26692900 ）文章： COGNIZER: A Framework for Functional Annotation of Metagenomic Datasets 2015 （ http://www.ncbi.nlm.nih.gov/pubmed/26561344 ）文章： SUPER-FOCUS: a tool for agile functional analysis of shotgun metagenomic data 2016 （ http://www.ncbi.nlm.nih.gov/pubmed/26454280 ）; 个人分类: 科研文章|2208 次阅读|0 个评论

metagenomics组装工具的文章: xbinbzy 2016-2-19 09:35; 文章：GenSeed-HMM: A Tool for Progressive Assembly Using Profile HMMs as Seeds and its Application in Alpavirinae Viral Discovery from Metagenomic Data （2016.03） https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4777721/ 文章： TruSPAdes: barcode assembly of TruSeq synthetic long reads 2016 （ http://www.nature.com/nmeth/journal/vaop/ncurrent/full/nmeth.3737.html ）文章： InteMAP: Integrated metagenomic assembly pipeline for NGS short reads 2015 （ http://www.ncbi.nlm.nih.gov/pubmed/26250558 ）文章： Xander: employing a novel method for efficient gene-targeted metagenomic assembly 2015 （ http://www.ncbi.nlm.nih.gov/pubmed/26246894 ）文章： IDBA-UD: a de novo assembler for single-cell and metagenomic sequencing data with highly uneven depth 2012 （ http://www.ncbi.nlm.nih.gov/pubmed/22495754 ）文章： Grid-Assembly: An oligonucleotide composition-based partitioning strategy to aid metagenomic sequence assembly 2015 （ http://www.ncbi.nlm.nih.gov/pubmed/25790784 ）文章： DIME: a novel framework for de novo metagenomic sequence assembly 2015 （ http://www.ncbi.nlm.nih.gov/pubmed/25684202 ）文章： SFA-SPA: a suffix array based short peptide assembler for metagenomic data 2015 ( http://www.ncbi.nlm.nih.gov/pubmed/25637561 ) 文章： An ensemble strategy that significantly improves de novo assembly of microbial genomes from metagenomic next-generation sequencing data 2015 （ http://www.ncbi.nlm.nih.gov/pubmed/25586223 ）文章： MetaVelvet-SL: an extension of the Velvet assembler to a de novo metagenomic assembler utilizing supervised learning 2015 （ http://www.ncbi.nlm.nih.gov/pubmed/25431440 ）、文章： Improved assemblies using a source-agnostic pipeline for MetaGenomic Assembly by Merging (MeGAMerge) of contigs 2014 （ https://www.ncbi.nlm.nih.gov/pubmed/25270300 ）; 个人分类: 科研文章|2982 次阅读|0 个评论

megagenomics分析方法与工具的文章: xbinbzy 2016-2-19 09:20; 文章： Accurate binning of metagenomic contigs via automated clustering sequences using information of genomic signatures and marker genes 2016 （ https://www.ncbi.nlm.nih.gov/pubmed/27067514 ）文章： MetaCRAM: an integrated pipeline for metagenomic taxonomy identification and compression 2016 （ http://www.ncbi.nlm.nih.gov/pubmed/26895947 ）文章： Evaluating the Quantitative Capabilities of Metagenomic Analysis Software 2016 （ http://www.ncbi.nlm.nih.gov/pubmed/26831696 ）文章： MaxBin 2.0: an automated binning algorithm to recover genomes from multiple metagenomic datasets 2016 （ http://www.ncbi.nlm.nih.gov/pubmed/26515820 ）文章：Metagenomic Classification Using an Abstraction Augmented Markov Model 2015 （ http://www.ncbi.nlm.nih.gov/pubmed/26618474 ）文章：DectICO: an alignment-free supervised metagenomic classification method based on feature extraction and dynamic selection 2015 （ http://www.ncbi.nlm.nih.gov/pubmed/26446672 ）文章： MetaPhlAn2 for enhanced metagenomic taxonomic profiling 2015 （ http://www.ncbi.nlm.nih.gov/pubmed/26418763 ）文章： Multi-Layer and Recursive Neural Networks for Metagenomic Classification 2015 （ http://www.ncbi.nlm.nih.gov/pubmed/26316190 ）文章： deFUME: Dynamic exploration of functional metagenomic sequencing data 2015 （ http://www.ncbi.nlm.nih.gov/pubmed/26227142 ）文章： Spaced seeds improve k-mer-based metagenomic classification 2015 （ http://www.ncbi.nlm.nih.gov/pubmed/26209798 ）文章： Investigating microbial co-occurrence patterns based on metagenomic compositional data 2015 （ http://www.ncbi.nlm.nih.gov/pubmed/26079350 ）文章： Reconstructing 16S rRNA genes in metagenomic data 2015 （ http://www.ncbi.nlm.nih.gov/pubmed/26072503 ）文章： Bayesian mixture analysis for metagenomic community profiling 2015 （ http://www.ncbi.nlm.nih.gov/pubmed/26002885 ）文章： MICCA: a complete and accurate software for taxonomic profiling of metagenomic data 2015 （ http://www.ncbi.nlm.nih.gov/pubmed/25988396 ）文章： Identifying personal microbiomes using metagenomic codes 2015 （ http://www.ncbi.nlm.nih.gov/pubmed/25964341 ）文章： CS-SCORE: Rapid identification and removal of human genome contaminants from metagenomic datasets 2015 （ http://www.ncbi.nlm.nih.gov/pubmed/25944184 ）文章：T reeSeq, a Fast and Intuitive Tool for Analysis of Whole Genome and Metagenomic Sequence Data 2015 （ http://www.ncbi.nlm.nih.gov/pubmed/25933115 ）文章：MUSiCC: a marker genes based framework for metagenomic normalization and accurate profiling of gene abundances in the microbiome 2015 （ http://www.ncbi.nlm.nih.gov/pubmed/25885687 ）文章： CLARK: fast and accurate classification of metagenomic and genomic sequences using discriminative k-mers 2015 （ http://www.ncbi.nlm.nih.gov/pubmed/25879410 ）文章： Woods: A fast and accurate functional annotator and classifier of genomic and metagenomic sequences 2015 （ http://www.ncbi.nlm.nih.gov/pubmed/25863333 ）文章： METAXA2: improved identification and taxonomic classification of small and large subunit rRNA in metagenomic data 2015 （ http://www.ncbi.nlm.nih.gov/pubmed/25732605 ）文章： Exploiting topic modeling to boost metagenomic reads binning 2015 （ http://www.ncbi.nlm.nih.gov/pubmed/25859745 ）文章： MBBC: an efficient approach for metagenomic binning based on clustering 2015 ( http://www.ncbi.nlm.nih.gov/pubmed/25652152 ) 文章： VizBin - an application for reference-independent visualization and human-augmented binning of metagenomic data 2015 （ http://www.ncbi.nlm.nih.gov/pubmed/25621171 ）文章： Binpairs: utilization of Illumina paired-end information for improving efficiency of taxonomic binning of metagenomic sequences 2015 （ http://www.ncbi.nlm.nih.gov/pubmed/25551450 ）文章： MetaObtainer: A Tool for Obtaining Specified Species from Metagenomic Reads of Next-generation Sequencing 2015 （ https://www.ncbi.nlm.nih.gov/pubmed/26293485 ）文章： MetaBoot: a machine learning framework of taxonomical biomarker discovery for different microbial communities based on metagenomic data 2015 （ https://www.ncbi.nlm.nih.gov/pubmed/26213658 ）文章： BioMaS: a modular pipeline for Bioinformatic analysis of Metagenomic AmpliconS 2015 （ https://www.ncbi.nlm.nih.gov/pubmed/26130132 ）文章： FCMM: A comparative metagenomic approach for functional characterization of multiple metagenome samples 2015 （ https://www.ncbi.nlm.nih.gov/pubmed/26027543 ）文章： MetaGeniE: characterizing human clinical samples using deep metagenomic sequencing 2014 （ http://www.ncbi.nlm.nih.gov/pubmed/25365329 ）文章： Binning metagenomic contigs by coverage and composition 2014 （ https://www.ncbi.nlm.nih.gov/pubmed/25218180 ）文章：COVER: a priori estimation of coverage for metagenomic sequencing 2012 （ http://www.ncbi.nlm.nih.gov/pubmed/23760797 ）; 个人分类: 科研文章|5476 次阅读|0 个评论

宏基因组DNA的提取: xbinbzy 2016-1-25 09:10; Comparison of direct boiling method with commercial kits for extracting fecal microbiome DNA by Illumina sequencing of 16S rRNA tags 2013 （ http://www.ncbi.nlm.nih.gov/pubmed/23899773 ）; 个人分类: 科研文章|3017 次阅读|0 个评论

metagenome分析中涉及到的工具: 热度 1 xbinbzy 2016-1-10 21:13; FastQC: Quality control tool for high-throughput sequence data using modular options and giving graphic results of quality per base sequence, GC content, Nnumbers, duplication, and over represent ( http://www.bioinformatics.babraham.ac.uk/projects/fastqc/ ) Fastx-Toolkit: Command line tools for Short-reads quality control. These allow processing, cutting, format conversion, and collapsing by sequence length and identity ( http://hannonlab.cshl.edu/fastx_toolkit/index.html ) PRINTSEQ: Quality control tool for sequence trimming based in dinucleotide occurrence and sequence duplication(mainly 5′/3′) ( http://prinseq.sourceforge.net/ ) NGS QC Toolkit: Tool for quality control analysis performed in parallel environment ( http://www.nipgr.res.in/ngsqctoolkit.html ) Meta-QC-Chain: Parallel environment tool for quality control. This performs a mapping against 18S rRNA databases for removing eukaryotic contaminant sequences ( http://www.computationalbioenergy.org/qc-chain.html ) Mothur: From reads quality analysis to taxonomic classification, calculus of diversity estimators and ribosomal gene metaprofiling comparison ( http://www.mothur.org/ ) QIIME: Quality pre-treatment of raw reads, taxonomic annotation, calculus of diversity estimators, and comparison of metaprofiling or metagenomic data ( http://qiime.org/ ) MEGAN: Taxonomy and functional analysis of metagenomic reads. It based on BLAST output of short reads and performs comparative metagenomics. Graphical interface ( http://ab.inf.uni-tuebingen.de/software/megan5/ ) CARMA: Phylogenetic classification of reads based on Pfam conserved domains ( http://omictools.com/carma-s1021.html ) PICRUSt: Predictor of metabolic potential from taxonomic information obtained of 16S rRNA metaprofiling projects ( http://picrust.github.io/picrust/ ) Parallel-meta: Taxonomic annotation of ribosomal gene markers sequences obtained by metaprofiling or metagenomic reads. Functional annotation based on BLAST best hits results. Comparative metagenomics ( http://www.computationalbioenergy.org/parallel-meta.html ) MOCAT: Pipeline that includes quality treatment of metagenomic reads, taxonomic annotation based on single copy marker genes classification, and gene-coding prediction ( http://vm-lux.embl.de/~kultima/MOCAT2/index.html ) TETRA: Taxonomic classification by comparison of tetranucleotide patterns. Web service available ( http://omictools.com/tetra-s1030.html ) PhylophytiaS: Composition-based classifier of sequences based on reference genomes signatures ( http://omictools.com/phylopythia-s1455.html ) MetaclusterTA: Taxonomic annotation based on binning of readsand contigs. Dependent of reference genomes ( http://i.cs.hku.hk/~alse/MetaCluster/ ) MaxBin: Unsupervised binning of metagenomic short reads and contigs ( http://sourceforge.net/projects/maxbin/ ) Amphora and Amphora2: Metagenomic phylotyping by single copy phylogenetic marker genes classification ( http://pitgroup.org/amphoranet/ ) BWA: Algorithm for mapping short-low-divergent sequences to large references. Based on Burrows–Wheeler transform ( http://bio-bwa.sourceforge.net/ ) Bowtie: Fast short read aligner to long reference sequences based on Burrows–Wheeler transform ( http://bowtie-bio.sourceforge.net/index.shtml ) Genometa: Taxonomic and functional annotation of short-reads metagenomic data. Graphical interface ( http://genomics1.mh-hannover.de/genometa/ ) SORT-Items: Taxonomic annotation by alignment-based orthology of metagenomic reads ( http://metagenomics.atc.tcs.com/binning/SOrt-ITEMS ) DiScRIBinATE: Taxonomic assignment by BLASTx best hits classification of reads ( http://metagenomics.atc.tcs.com/binning/DiScRIBinATE ) IDBA-UD: Assembler de novo of metagenomic sequences with uneven depth ( http://i.cs.hku.hk/~alse/hkubrg/projects/idba_ud/ ) MetaVelvet: De novo assembler of metagenomic short reads ( http://metavelvet.dna.bio.keio.ac.jp/ ) Ray Meta: Assembler of de novo of metagenomic reads and taxonomy profiler by Ray Communities ( http://denovoassembler.sourceforge.net/ ) MetaGeneMark: Gene coding sequences predictor from metagenomic sequences by heuristic model ( http://exon.gatech.edu/index.html ) GlimmerMG: Gene coding sequences predictor from metagenomic sequences by unsupervised clustering ( http://www.cbcb.umd.edu/software/glimmer-mg/ ) FragGeneScan: Gene coding sequences predictor from short reads ( http://sourceforge.net/projects/fraggenescan/ ) CD-HIT: Clustering and comparing sequences of nucleotides or protein ( http://weizhongli-lab.org/cd-hit/ ) HMMER3: Hidden Markov models applied in sequences alignments ( http://hmmer.janelia.org/ ) BLASTX: Basic local alignment of translated sequences ( http://blast.ncbi.nlm.nih.gov/blast/Blast.cgi?PROGRAM=blastxPAGE_TYPE=BlastSearchLINK_LOC=blasthome ) MetaORFA: Assembly of peptides obtained from predicted ORFs Min Path: Reconstruction of pathways from protein family predictions ( http://omics.informatics.indiana.edu/MinPath/ ) MetaPath: Identification of metabolic pathways differentially abundant among metagenomic samples ( http://metapath.cbcb.umd.edu/ ) GhostKOALA: KEGG’s internal annotator of metagenomes by k-number assignment by GHOSTX searches against a non-redundant database of KEGG genes ( http://www.kegg.jp/ghostkoala/ ) RAMMCAP: Metagenomic functional annotation and data clustering ( http://weizhong-lab.ucsd.edu/rammcap/cgi-bin/rammcap.cgi ) ProViDE: Analysis of viral diversity in metagenomic samples ( http://metagenomics.atc.tcs.com/binning/ProViDE/ ) Phyloseq: Tool-kit to row reads pre-processing, diversity analysis and graphics production. R, Bioconductor package ( https://joey711.github.io/phyloseq/ ) MetagenomeSeq: Analysis of differentially abundance of 16S rRNA gene in metaprofiling data. R, Bioconductor package ( http://bioconductor.org/packages/release/bioc/html/metagenomeSeq.html ) ShotgunFunctionalizeR: Metagenomic functional comparison at level of individual genes (COG and EC numbers) and complete pathways. R, Bioconductor package ( http://shotgun.math.chalmers.se/ ) Galaxy portal: Web repository of computational tools that can be run without informatic expertise. Graphical interfaceand free service ( https://usegalaxy.org/ ) MG-RAST: Taxonomic and functional annotation, comparative metagenomics. Graphical interface, web portal, andfree service ( http://metagenomics.anl.gov/ ) IMG/M: Functional annotation, phylogenetic distribution of genes and comparative metagenomics. Graphical interface, web portal, and free service ( https://img.jgi.doe.gov/cgi-bin/m/main.cgi ) 参考文章： The Road to Metagenomics: From Microbiology to DNA Sequencing Technologies and Bioinformatics （http://journal.frontiersin.org/article/10.3389/fgene.2015.00348/abstract）; 个人分类: 科研文章|9906 次阅读|1 个评论

Paper：能否通过婴幼儿时期的肠道菌群预测未来食物过敏情况？: xbinbzy 2015-11-24 06:19; 文章：Can we predict future allergies from our infant gut microbiota？ Sensitization to food allergens is common during early life, affecting up to 28% of preschool children（学龄前的儿童多会发生食物过敏的情况）. While 66 – 90% of infants outgrow their sensitization to egg and milk, respectively, and prevalence rates drop to around 2% by age 5（随着年龄的增长，这种情况有所减轻）。文章“ The psychosocial impact of food allergy and food hypersensitivity in children, adolescents and their families: areview ”总结了小孩和青少年的食物过敏对于家庭的影响。为了提前进行预测以更早进行干预，文章 “ Skin prick test responses and allergen-specific IgE levels as predictors of peanut, egg,and sesame allergy in infants. ” 总结了利用皮试检测IgE的水平以判断infants对于penaut、egg和sesame的过敏情况。随着新一代测序技术的发展，目前的趋势呈现为： more complete assessment of gut microbial communities during infancy enhances our ability to identify gut microbiome biomarkers which can predict future allergic disease. 有研究发现： 1）在European cohort的研究中，1个月大的infants，肠道菌群多样性的减少、 Bacteroides 含量的减少是 atopic dermatitis 的标志现象。如果母亲患有哮喘，infants的菌群多样性较少，在6岁时，具有较高风险的 allergic sensitization。 2）在KOALA birth cohort study of 1000 infants中，1个月时肠道内繁殖有 Clostridium difficile ，则在2岁时会出现 atopic sensitization. 3）在18个月大时，诊断有 atopic dermatitis的小孩体内会聚集 Clostridium ，而 Bacteroides spp. 的含量则会下降。 4）在肠道生态出现紊乱的infants中，确定有food allergy. 5）在5个月大具有food allergy的infants中, Firmicutes 含量较高、 Bacteroidetes 含量较低，菌群多样性未见到呈现变化。 6）在具有cow’s milk allergy的infants中，多发现有 Clostridium coccoides 、 lactobacilli 和其他的厌氧菌，同时具有较少量的 bifidobacteria 和 enterobacteria . 7） food-sensitized infants are twice as likely to experience the “ atopic march ” to conditions such as atopic dermatitis, allergicrhinitis and asthma. 3个月时体内 Bacteroidaceae 含量的减少会在9个月时出现food sensitization . 在这些研究中有几个需要关注的情况： 1）不同的生育方式、不同的母乳喂养方式对infants中的菌群影响存在差异。 2）结果是不能通用的，每个国家的情况可能还不一致。 A taxonomic marker that works well in Canada and Finland may not work well in Germanyor the USA. 为此有必要中国人群自己的数据集。 3）预测模型无论基于IgE或者是microbiota，效果都有待提高，或许很多症状的出现不是一个层面，一个维度的数据可以简单判断的，是一个综合的效应。; 个人分类: 科研文章|6755 次阅读|0 个评论

多基因DNA条形码系统MEE在线发表（Early View全文分享）: 热度 1 zhuchaodong 2015-3-2 21:18; Early View全文分享： 2015-Douglas et al.-A DNA Barcoding system integrating multigene sequence data.pdf 自2003年在加拿大多伦多大学，了解了DNA条形码的理念后，我个人持续关注。2005年在伦敦自然历史博物馆参加第二届世界DNA条形码大会后，自己更加希望做些工作，推动昆虫系统学工作。基于 DNA 序列，学界已经开发了很多用于分类鉴定的方法和系统。但是，在真核生物中，大多数系统使用单个预设的基因片段，如 COI 、 16S 等。有限数据信息可能导致鉴定结果出现一定的偏差。这些系统也很难识别并分析基因组来源的大量基因数据。今天收到 Methods in Ecology and Evolution 编辑部来信， Douglas Chesters 博士等整合多基因数据的 DNA 条形码系统的研究论文已经被正式接受，并将于近日在线发表。在这篇论文中，我们实现了多个基因的 DNA 条形码功能： 1 ）基于经常测定的基因位点数据，建立一个参考框架性数据集； 2 ）其它基因数据和参考序列进行同源比对、剪切，同时在种内变异范围内对查询基因片段赋予物种分类阶元信息。我们把该方法和现有一些方法进行了比较，如“ bagpipe_phylo” 。后者在系统发育树上给序列重新赋予分类阶元信息。上述建议的多基因系统正确推断了 GenBank 中节肢动物 78% 的物种和 94% 的属级阶元。尤为关键的是，物种鉴别的比例高于仅仅用 COI 的方法。测试数据中， 24% 的物种仅仅见于非 COI 基因，而且这些 COI 之外的基因的物种阶元信息赋予正确率并没有明显的降低。同法，我们应用非 COI 的数据栏对建立的宏基因组数据进行了额外的物种阶元信息赋予。通过测试 1 个 273 条蜜蜂基因序列的数据，我们通过改变遗传距离的计算方法，物种赋予正确率和基于系统发育的分类鉴定结果差异不明显。标准的单基因片段 DNA 条形码仍然是基于 PCR 产生数据的物种鉴定的重要鉴定工具。对于已经建立的大量物种 DNA 条形码“骨干数据”而言，本文方法可以补充下列几点： 1 ）基因组数据； 2 ）通过整合其它独立的基因位点降低错误； 3 ）对非条形码片段进行额外的物种鉴定。通过新一代测序平台，后面两点和群落基因组监测工作尤其相关。学海无涯勤作舟。 Douglas 博士来组里以后，努力工作，取得了一系列的研究进展。在基于基因序列的物种界别的方向上， Douglas 博士已经连续在 Systematic Biology （ 2 篇）和 Methods in Ecology and Evolution （ 2 篇）上发表论文，把单个基因的思路推广到多个基因，并实现了大数据库中基因物种信息的自动矫正和赋予。功夫不负有心人：2014年，他获得中国科学院院长国际学者1年期项目（PIFI），获得一项国家自然科学基金项目，并于年底成功竞聘为动物研究所副研究员。后续我们计划在下面几个方面继续努力： 1 ）把该方法推广到基因组。这个功能已经部分实现，但是还需要较多组学数据的实际测试。 2）把该方法推广到系统树上的一些关键节点。这是我个人最感兴趣的点。 3 ）把该方法和其它学科，特别是昆虫多样性和物种互作研究结合起来。 4 ）把该方法更系统地应用到蜜蜂物种较为丰富的几个属中，加快蜜蜂总科系统学研究工作。原文摘要和全文将于在线后和大家分享: A DNA Barcoding system integrating multi-gene sequence data Douglas Chesters, Wei-Min Zheng and Chao-Dong Zhu Accepted manuscript online: 4 MAR 2015 04:41AM EST | DOI: 10.1111/2041-210X.12366 Abstract PDF(223K) Supporting Information Request Permissions; 4989 次阅读|2 个评论

功能基因组学知识（三）：比较基因组学: hsm 2015-1-11 10:35; 美国能源部一直持续大额资助绿色植物比较基因组研究（www.phytozome.net），绿色植物的太阳能储存模式是最经济的太阳能利用模式。从此可以看出，比较基因组研究的重要性。比较基因组研究主要研究基因组的序列特征，包括DNA序列，基因，基因顺序，调控序列及其他结构特征。比较基因组研究的目标就是找出基因组的保守特征，从而发现那些基因是保守的，那些基因是分歧快的。从而发现表型变异的基因组基础。目前比较基因组研究凸显了量大主题： 1）在植物，部分基因组即使在不同属间，也呈现了高度的保守性，即使生殖隔离了数百万年，也还呈现了大量的相似性。 2）通过古老的全基因组复制事件（WGD）或部分基因组复制事件(SD)，出现了DNA序列的移动（易位），基因丢失，局部重排，造成了大量的共线性偏离。随着基因组测序技术的进步，比较基因组不再局限于种间，也拓展到种内，拟南芥和大豆都做了多个品系的全基因组测序。不同品系的基因组也存在很多差异。宏基因组（pan-genome）的研究提上日程，宏基因组研究的目标就是找到核心基因组（core genome），与之相对的是可有可无基因组（ dispensable genome ），还可以挖掘独特的特异基因（unique genes）。但是这些结果仅仅是在有限样本里面研究出来的，不是严格生物学意义上的。; 个人分类: 功能基因组|6167 次阅读|0 个评论

更多...

帐号		自动登录	找回密码
密码			注册

关闭 安全验证

标签: 宏基因组

相关帖子

相关日志

关闭安全验证