科学网

 找回密码
  注册

tag 标签: 物种界定

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

每日翻译20190730
Bearjazz 2019-7-30 14:39
# 编者信息 熊荣川 明湖实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz Species Delimitation Different quantitative methods for species delimitation were applied, implemented by visual inspection of the variable nucleotide positions and trees derived from these. These procedures were conducted only within the independent networks defined in the statistical parsimony analysis, greatly reducing the complexity of scoring separated groups. Population profiles of character variation were established according to Sites and Marshall (2003) as the basis for PAA (Davis and Nixon, 1992) and CHA (Brower, 1999), the latter by assessing variable characters on the likelihood tree shown below. The WP method also used this tree to delimit “exclusive” populations, defined as the monophyly of geographically restricted genotypes to the exclusion of clades elsewhere. Fst values were used for aggregating samples with non-significant pairwise Fst, in analogy to the grouping of populations under PAA (Supplementary Fig. S1). 物种划分 采用不同的物种定界定量方法,通过目视检查核苷酸变异位点和由此衍生的树来实现。这些程序仅在简约统计分析中定义的独立网络内进行,大大降低了分组评分的复杂性。根据 Sites 和 Marshall ( 2003 年) 建立了特征变异的种群概况,作为 PAA ( Davis and Nixon, 1992 )和 CHA ( Brower, 1999 )的基础,后者通过评估似然树(如下所示)上的变异特征。 WP 方法还使用这棵树来划分“排他”种群,即局限于一定地地域的基因型的单系,且不包括其他分支。 Fst 值用于将两两间 Fst 不显著的样本进行聚集,类似于 PAA 下的种群分组(附图 S1 )。 Pons J, Barraclough T G, Gomez-Zurita J, et al. Sequence-based species delimitation for the DNA taxonomy of undescribed insects . Systematic biology, 2006, 55(4): 595-609.
个人分类: 翻译作品|3012 次阅读|0 个评论
每日翻译20190725
Bearjazz 2019-7-25 13:38
# 编者信息 熊荣川 明湖实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz These observations would suggest the possibility of using analyses of branch lengths on a DNA tree for explicit tests of species boundaries, based on the difference in branching rates at the level of species and populations. Branch lengths between species are determined by speciation and extinction rates (macroevolution) (Nee et al., 1994), whereas branch lengths within a species reflect coalescence processes at the level of populations (microevolution) (Hudson, 1991; Rosenberg and Nordborg, 2002; Wakeley, 2006). Well-developed approaches exist for analyzing branching rates in either framework. Combining equations that describe processes of lineage birth at the species level with coalescence models within species, it is possible to develop a statistical framework for estimating the predicted shift in dynamics of branching associated with the species boundary. Here we develop a method that determines the locations of ancestral nodes that define putative species and applies a likelihood ratio test to assess the fit of the branch lengths to a mixed lineage birth-population coalescence model. 这些观察结果表明,根据物种和种群水平上的分支速率差异,可以利用 DNA 树上的分支长度分析来明确探测物种边界。物种间的分支长度由物种形成和灭绝率(宏观进化)决定( Nee et al., 1994 ),而物种内的分支长度反映了种群水平上的溯祖过程(微观进化)( Hudson, 1991; Rosenberg and Nordborg, 2002; Wakeley, 2006 )。在这两个框架中,都存在分析分支率的成熟方法。将描述物种层次上谱系产生过程的方程与物种内部的溯祖模型相结合,可以建立一个统计框架来估计与物种边界相关的分支动态变化。在这里,我们开发了一种方法,确定祖先节点的位置以定义推定物种,并应用似然率测试来评估分支长度匹配混合的谱系发生 - 种群溯祖模型的程度。 Pons J, Barraclough T G, Gomez-Zurita J, et al. Sequence-based species delimitation for the DNA taxonomy of undescribed insects . Systematic biology, 2006, 55(4): 595-609.
个人分类: 翻译作品|2597 次阅读|0 个评论
每日翻译20190720
Bearjazz 2019-7-20 22:21
# 编者信息 熊荣川 明湖实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz Cataloging the very large number of undescribed species of insects could be greatly accelerated by automated DNA based approaches, but procedures for large-scale species discovery from sequence data are currently lacking. Here, we use mitochondrial DNA variation to delimit species in a poorly known beetle radiation in the genus Rivacindela from arid Australia. Among 468 individuals sampled from 65 sites and multiple morphologically distinguishable types, sequence variation in three mtDNA genes (cytochrome oxidase subunit 1, cytochrome b, 16S ribosomal RNA) was strongly partitioned between 46 or 47 putative species identified with quantitative methods of species recognition based on fixed unique (“diagnostic”) characters. The boundaries between groups were also recognizable from a striking increase in branching rate in clock-constrained calibrated trees. Models of stochastic lineage growth (Yule models) were combined with coalescence theory to develop a new likelihood method that determines the point of transition from species-level (speciation and extinction) to population-level (coalescence) evolutionary processes. 基于 DNA 的自动化方法,对大量未被描述的昆虫物种的分类有较大提升,但目前尚缺乏从序列数据中大规模发现物种的程序。在这里,我们使用线粒体 DNA 变异来界定虎甲属( Rivacindela )中一群鲜为人知的辐射进化而来的澳大利亚甲虫物种。从 65 个地点采集的 468 个标本和多个形态可区分模式标本中,扩增的 3 个线粒体基因(细胞色素氧化酶亚基 1 、细胞色素 B 、 16S 核糖体 RNA )的序列变异强烈支持 46 个或 47 个的可能物种,通过稳定的鉴别特征定量方法鉴定相近的物种数。在受时钟约束的校准树中,分支率显著增加,也可以识别出组与组之间的界限。将随机谱系增长模型( Yule 模型)与溯祖理论相结合,提出了一种新的似然方法,确定了从物种水平(物种形成和灭绝)到种群水平(溯祖)进化过程的转变点。 Pons J, Barraclough T G, Gomez-Zurita J, et al. Sequence-based species delimitation for the DNA taxonomy of undescribed insects . Systematic biology, 2006, 55(4): 595-609.
个人分类: 翻译作品|1773 次阅读|0 个评论
不同的物种往往在简约网络中分割为独立的网络
Bearjazz 2017-11-16 22:55
分道扬镳:生物学物种常常形成不相连的简约网络 # 编者信息 熊荣川 明湖实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz 分道扬镳:生物学物种常常形成不相连的简约网络 可操作物种概念的通用性往往受限于物种间分化的模糊界定。近年来,一种基于简单而客观的度量遗传分化统计显著性的系统发育物种概念把原本用于种内种群遗传分析的统计简约网络用于种间水平。(i)DNA序列比对后,不同林奈物种的序列往往能分类到不同的独立的子网落中(线粒体DNA数据表现得尤为明显);(ii)单一物种的DNA序列,通常聚在一个单一的单倍型网络中。而与以上两种情况背离的情形,往往与隐存物种多样性有关。 物种形成事件中的基因流中断被广泛认为会产生较大的可观察到的遗传不连续性,而这种不连续可用于物种或进化显著单元(ESUs)的行之有效的定义(Mallet 1995; Sites Marshall 2003, 2004; Vogler Monaghan 2007)。 例如,“生命条形码行动计划”就主要是对种间“显著”遗传不连续性的测量来记录生物多样性物(Hebert et al. 2003; Moritz Cicero 2004; Meyer Paulay2005).。一个老生常谈的问题是,这种不连续性应该有多大(Blaxter et al. 2005)。 答案往往是基于主观和与特定类群相关的经验或模式。最近的一些研究(Wiens Penkrot 2002; Morando et al. 2003; Cardoso Vogler2005; Hart et al. 2006; Monaghan et al.2006; Pons et al. 2006)表明在具体情况中,传统的物种或者进化显著单元的相似性上可以有一个简单的对应,可以使用统计简约网络中的95%连接限制作为(种间或进化显著单元间)遗传分化的客观标准。 最近统计而客观的系统发育物种概念的有两个进步使用了在最大似然法和贝叶斯框架下的二岐分叉树。Matz Nielsen (2005) 和 Nielsen Matz (2006) 开发了一个似然率检验,检验某一被试序列是否属于特定物种的样本。Pons et al.(2006) 确定两个物种之间的边界时认为,种内序列间枝长较短(因为种群的最近溯祖过程),种间序列间枝长较长(因为物种形成和解决事件),类似于统计简约网络中物种间和种间支系分化的差异。 最近在具体的类群的分析上表明,95%的简约连接的限制可以提供额外的、简单的系统发生种的定量标准(Monaghan等人。2006)。我们的综述和分析表明,该标准在很多门类、物种形成问题以及遗传都标记的研究中,具有较低的假阳性错误,它可以将未知样品归到取样充分的已知的分类单元中去(由Vogler Monaghan 2007定义的DNA条形编码)。 这种方法可能对条形码研究特别有用,在这类研究中,物种的形态和生态标记是不稳定的(如毛毛虫的寄主植物A. fulgerator所使用的f INGCUP以及FABOV 表格; Hebert et al. 2004)。 简约连接上限方法在成功地识别已知物种的界限上似乎有较高的正确率,并可以进一步扩展到从序列数据中发现新的隐蔽物种(DNA分类;Vogler Monaghan 2007),当应用于快速分化的非重组位点时(mtDNA;Moore 1995)。 参考文献: Hart M W, Sunday J. Things fall apart: biological species form unconnected parsimony networks . Biology Letters, 2007, 3(5):509-512.
个人分类: 我的研究|4629 次阅读|0 个评论
Rudolf Meier论“分类学论文引用”(附译文)
热度 1 zhuchaodong 2017-3-18 22:45
分类学文献引用: 为什么引用?什么时间引用?什么内容可以和不可以:物种引用 MEIER-2016-Systematic_Entomology.pdf 最近部分期刊提出对分类学论文进行引用。特别是 Zootaxa 在 给作者的说明中就指出,当任何物种的学名第一次被提到的时候,也应当提到这个物种的命名人。 个人感觉这是一个积极的信号,说明大家已经关注到分类学在引证评价体系中被边缘化的问题,并在想办法提高分类学成果的认知度。 前段时间,陈华燕在他 的博文“拿什么来拯救经典生物分类学”( http://blog.sciencenet.cn/blog-361302-1036121.html )中提到:“如果非得按影响因子来评判,分类学文章应该得到应有的引用。因为现行的惯例是生物学的各个学科在使用物种名的时候根本就没有引用发表这个物种的文章”。但是如何引用分类学论文及其物种,学界还是有所分歧。 新加坡国立大学的Rudolf Meier教授(http://www.dbs.nus.edu.sg/staff/meier.htm)2016年在Systematic Entomology上撰文,讨论了分类学文献引用。 Rudolf Meier教授曾经和Quentin Wheeler教授(http://www.esf.edu/president/)合作,组织提出不同物种概念的学者,通过文字辩论的方式,对这些概念进 行了剖析(Species Concepts and Phylogenetic Theory: A Debate)(http://www.jstor.org/stable/10.7312/whee10142)。他在这篇论文中关于 物种描述、物种界定过程、物种定名人等引用的相关观点,值得我们结合系统学工作进行思考。 翻译:中国科学院大学硕士研究生张丹 物种分类研究的引用存在很多不足。虽然这个问题很久之前就已经意识到了,但是没有引起足够的重视。直到文章被引的次数开始影响经费以及工作,这个问题才开始被重视。目前提出了一个看似简单的改革方法。有些学术期刊强制执行这个方法,他们要求作者完整地引用物种的原始的描述。 例如, Organisms , Diversity Evolution 这些期刊现在都要求作者在文章中引用的物种,都应当有一个完整的支撑,要有参考文献,并且 Zootaxa 在 给作者的说明中就指出,当任何物种的学名第一次被提到的时候,也应当提到这个物种的命名人(发表的时间不需要给出,如果你给出了时间,那么就要在参考文献中提出一份完整的参考文献)。其他的学术期刊鼓励或者允许一些引用。 我认为,对于物种原始描述的引用依旧有不恰当的地方:适当的引用应该替代描述标本的文献;而且在发表的文章中,应当包括当前最新的分类研究的方法,有最准确的物种概念。我认为,生物学领域发表的文章在“方法”那部分应当包括物种鉴定方法和分类学的概念,而且鉴定结果应当被视为是“结果”的一部分。给出一个简洁明了的信息,以便审稿人和编辑的评定。 为什么许多物种的描述不能引用 如果已经发表的文章包含重要的科学信息或者支持某一个论点的,这个文章是可以被引用的。许多原始物种的描述并不符合阈值,大多是18-19世纪的物种描述。这意味着引用这样的文献是不恰当的。我用 Meigen 黑腹果蝇的描述为例:在有的地方认为,现代关于黑腹果蝇的文章应该要引用这个描述。 Meigen 是这样描述的:头,盾片,足是土黄色,腹部黑色。颈部白色,翅膀没有颜色。体长3mm.发表在一个专著中,这个专著包括了对9个新种的描述,其中的4个种是异名。很明显的是,其中的一个种 D. fasciata 现在是黑腹果蝇的异名。这意味着,就目前我们对物种概念的理解, Meigen 对这个物种区分的界限是不正确的。现在,无论是谁在文章中引用Meigen的文章都是错误的,因为他的黑腹果蝇不是我们现在所用的分类单元。如果作者现在的文章支持Meigen的观点,那么他们在文章中要提供一个引证,其中要包括当前的分类概念。他们必须声明:我们现在使用的物种之间区分的界限。引用后来描述黑腹果蝇的文章也是很必要的,因为在21世纪,Meigen对黑腹果蝇的描述还是远不够的。 当然,Meigen的工作与现在的研究依然是相关的。首先,他的命名能力是无可挑剔的,他选择的(黑腹果蝇)这个名字之前没有用过(这符合今天所有的命名惯例);第二,这个名字和这个物种通过具名模式联系在一起。这意味着,一些作者回顾黑腹果蝇的分类历史时必须查阅Meigen的描述。 分类单元的界定与命名 我反对机械地引用原始物种描述的原因是,分类单元概念和物种命名(物种的界定)。分类单元的界定是一个假说驱动,因为物种是分类单元基于明确的物种概念的假设。尽管分类技术很重要,但类群的命名不是一个假设驱动,毕竟,物种需要一个明确的命名系统,那么关于物种的所有的信息可以精确地检索到。因此,作者想要命名一个物种时应该核对是否需要引用后来的提供校正分类概念的文章。双重的引用在以前的文章中很常见,在那些充分信任给物种命名以及校正物种概念的作者的文章里面。 什么应当被引用? 生物学研究的标本,在发表之前必须要鉴定到种。在生物模式中,原始标本的来源通常是在作者说明文化来源的时候就揭示了。遗憾的是,大多数仅存的生物学文献都没有类似的透明度。在大多数的文章中,鉴定的程序没有提及到这些,而且利用的资源也没有引用(例如,最近的物种分类文章)。我认为这是分类学中引用危机的根本来源。主要的问题是,目前,标本鉴定并没有被当做“方法”的一部分,在“结果”中也没有考虑这个鉴定结果。政策的改变对文献的引用很有帮助。基因数据的提供,要求这些研究使用分子数据。我们对所有的研究都报以相同的要求,即要求物种标本的的鉴定。一些研究应当包含明确的分类和鉴定概念的表述。对于一个大规模的研究,这些信息应该以表格的形式呈现,行表示物种,列应当包含这些信息:(1)鉴定方法/文献,(2)鉴定每一个物种时使用的物种概念,(3)证据标本存放地。当以表格的形式呈现的时候,编辑和审稿人会很容易了解在文章中鉴定和物种概念是否被正确对待。注意,一旦鉴定包含了方法和结果的部分,发表的高质量的分类学文章的引用次数也会增多,因为综合修订的检索表被引用的机会也更高。原始的物种描述仅是在它们经受住了时间的考验以及包含有效的分类学概念或者鉴定方法的时候才可以继续引用。 有很多的原因解释为什么标本的鉴定应当被视为“方法”并且在“结果”中显示。大多数发表的文章的精确度和质量高度依赖于标本的鉴定。如果这个步骤不严谨将会使得发表的文章的质量下降。我的实际经验是,检索表中的错误将会导致一个错误名称的使用。我们错误的将一个物种鉴定为 Sepsis monostigma ,而它正确的物种名是 S. latiforceps 。 我们根据检索表鉴定,但很不幸的是这个检索表本身就有问题。我们对照检索表鉴定物种,但是检索表中提供的物种名是错误的。如果我们的原稿清楚地阐明鉴定方法,那么这些错误将会被关心这个问题的审稿人早一些发现。这也可以让后来的引用者避免这种错误。精确的鉴定方法和分类概念也能帮助避免一些问题,例如,在研究中用到的许多水蛭,医疗中发现属于多个物种。要求明确的鉴定文献信息,可以减少这种虽然缺乏同行评议但是在生态学研究中经常使用的“灰色”文献的使用。 整合分类和物种界限 在21世纪,精确的鉴定方法和物种界限相当重要,因为大多数的物种界限是基于最近的分子数据修订的。发现了许多形态学特征模糊的物种,这意味着“老的”物种界限都在改变,而且很多“老的”物种被分成了很多物种。作者的引用说明,含有明确的物种界限和鉴定物种的检索表的文章很重要。当然,这些文章的正确引用,是对最新和最近的分类工作的信任,这些文章中的描述往往比许多原始的描述有更高的质量。例如,在2000年发表的对鸟类的描述的文章很详细(描述,分布图)。它基于很多材料(更多的标本,物种,对比),而且相对于19世纪30年代的描述,这个描述被修改的机会更少。作为对比,机械地引用物种的原始描述可能达不到预期的目标,因为它忽略了早期和现代的分类工作之间质量上的差异而且还表示分类学是一个静态的没有发展的学科。 物种名是假说吗? 这个已经反复的强调(从根本上说,物种名是进化假说,新数据测试的时候物种之间的地理关系可能会改变)。但是,一些报告中合并分类单元的概念和物种名称,物种名称和类型之间有很密切的关系,而且是不可验证的。让我解释一下。如果我们假设物种不是人为确定的,那么生物的世界将一直被成千上万的物种占据。在某一个时刻,智人进化,而且在不久之后,分类学家基于一些在科学研究中采集的标本的数据来划分物种。当发现一个新的物种,一个或者一系列的标本将被指定为载名模式,而且物种名称和标本有关。一个物种有多个标本,限定的这个物种,以及决定新物种是假说驱动的延伸内容。然而,标本上只有一种类型的标签是不正确的。确实,如果物种名称是假设,那么它们应当是可以测试的,但是不管收集到多新的证据,物种的类型和名称之间始终有关系。物种之间的界定可能会继续发展,但是确定一个正确的物种名称是一个机械过程:如果一个物种在界定的物种水平范围内没有这个类型的标本,那这个物种是一个新种,而且应当描述。如果,标本处于一个新的物种范围,那么物种的名称可以基于标签信息确定。如果在这个物种水平的单位中有多个标本,那么命名法会根据优先权处理标本。 毫无疑问,当前生物学中引用的实践对分类学产生了一定的影响。我认为,主要的原因是物种的鉴定还没有包括在实验方法中,物种的检索表还没有包含实验的结果中。一旦期刊正式地要求作者给出物种如何鉴定,那么这个长期存在的分类学文献的引用问题将不再存在。一些要求也希望可以鼓励作者去反映研究中这重要的一步;同时,机械地引用物种描述,仅仅是给本科生的研究助理产生了更多的工作。 See discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/309363274 Citation of taxonomic publications: the why, when, what and what not: Species citations Article in Systematic Entomology · October 2016 DOI: 10.1111/syen.12215
个人分类: 论文精读|4813 次阅读|1 个评论
测序所有物种的DNA?请邀请分类学家参与
热度 12 huayanc 2017-2-27 01:57
测序所有物种的 DNA ?请邀请分类学家参与 陈华燕 Science 昨日( 2017.02.24 )新闻报道,美国 史密森尼生物多 样 性基因 组 学 计划( Smithsonian Initiative on Biodiversity Genomic )和中国深圳的华大基因( BGI )近日在美国华盛顿召开的一个小型会议上宣布了一个名为地球生物基因组计划( Earth BioGenome Project , EBP )的宏大目标,旨在测序 “ 地球上的所有生物 ” ( https://www.sciencemag.org/news/2017/02/biologists-propose-sequence-dna-all-life-earth )。该计划将分为 3 步走。第一步先对 9000 种真核生物(包括所有植物,动物和单细胞生物在内的生物)进行深度测序,以期获得与人类参考基因组相当或比人类参考基因组更详细的参考基因组。第二步将程度稍浅地测序所有的 15 万至 20 万个真核生物属中的一个种。最后一步是对剩下的 150 万种真核生物进行粗略测序。该计划估算所需经费至少要几十亿美金,而且该计划的组织者认为,如果能得到像人类基因组计划得到的那样大量的支持,这个计划可能在 10 年内完成。据说这样的乐观估计是基于不断下降的 DNA 测序成本核和更先进的测序技术。 值得注意的是,该计划的团队强调了要制定标准以确保测序了高质量的基因组序列和保存每个被测序生物体的相关信息(如采集地和形态等),而且呼吁大量的专业学者的广泛参与。 新闻下面有个名为 Gaurav Prakash 的读者的评论很是耐人寻味。他说,作为一个搞基因组的,他真心喜欢新闻的第一句话 “When it comes to genome sequencing, visionaries like to throw around big numbers ( 当谈及基因组测序时,远见者(或空想主义者)喜欢玩弄大数字 )” 。既然这个读者是搞基因组的,而这个新闻又是关于大基因组的,估计他是真心喜欢的了。我本身是同时做分类学和基因组的,当我看到第一句话的时候,我多少觉得带点讽刺的意味。这个大数字或许没有该计划组织者鼓吹的那么容易。正如新闻中有位科学家指出的,我们将可能烧了一堆钱真的测序了地球上的所有物种,但也有可能是生产了一堆垃圾数据。我个人认为这样的担忧并不是无根据的。看看 GenBank 就知道了,相信很多做分子的都知道上面有很多垃圾数据。 有意思的是, Science 同一天的另一篇新闻报道是有关帝王蝶( Danaus plexippus )(图 1 , 2 )的染色体数量的错误计算可能是由于物种的错误鉴定( https://www.sciencemag.org/news/2017/02/monarch-miscalculation-has-scientific-error-about-butterflies-persisted-more-40-years )。根据该文的报道,一位叫 Christopher Hamm 的学者发现所有学术文章都提到帝王蝶的染色体数量是 30 条,但他自己的研究发现却只有 28 条。后来他查证原始文献,发现帝王蝶的染色体数量竟是两个印度的学者 1975 年最先根据印度的 “ 帝王蝶 ” 测量出来的。搞笑的是,真正的帝王蝶只分布于北美,印度的学者根本就不可能在印度发现。后来有学者发现,印度的 “ 帝王蝶 ” 其实是一种与帝王蝶很像的 “ 常见虎蝶( Danaus genutia , common tiger butterfly )(图 2 ) ” 。更搞笑的是,印度学者的结果在接下来的 40 年里一直被引用。事情更戏剧化的是, Hamm 在 bioRxiv 上报道了自己的发现后不久,他在堪萨斯大学的前同事也在 bioRxiv 报道了帝王蝶雌雄性的染色体数量都是 30 条(印度学者报道的是只有雄性才是 30 条)。目前 Hamm 的前同事拒绝评论 Hamm 的发现。 Hamm 坚持认为自己的发现是对的,但认为他的同事也可能是对的,因为鳞翅目昆虫的遗传学是很诡异的,同一个种的不同种群,甚至同一个个体的不同细胞都有可能有不同的染色体数量。这个新闻说明的是,物种的鉴定与界定远比我们认识的复杂得多。 所以,可以很肯定的说, EBP 计划如果没有生物分类学家的参与,结果真的可能会跟 EBP 的一些学者担心的那样:烧了一堆钱生产了一堆 crap (垃圾)。然后可能就会有人跳出来说了,分子可以用于鉴定和区分不同物种,经典分类学家可以退休了。我个人完全赞同分子特别是基因组很重要。但我个人觉得,这个论调简直和倡议 DNA 条形码( DNA barcodes )技术的学者认为该技术可以鉴定所有的物种的想法一样可笑。 Hebert 等 2003 年首倡 DNA 条形码技术时在文章中写到,在 COI ( DNA 条形码技术所用的遗传标记)数据库建成后,这个数据库可以让任何一个分子实验室鉴定任何个动物类群( Hebert et al. 2003 )。然后 Hebert 等人后来自己的文章就各种自己打脸,爆出了 DNA 条形码技术鉴定和区分物种的各种局限性。现在对认为 DNA 条形码技术可作为物种鉴定的终极手段的想法的批评文章简直可以说是浩瀚如烟。 物种的界定一直以来就是个充满争议的话题,这个话题似乎是没有答案的,而且会被一直讨论下去。生物的特性以及物种的界定远比我们想象的复杂得多。如果说有终极的解决方法的话,我个人认为,那就是收集所有能够收集有关物种的数据(证据),即所谓的 total evidence approach , 包括形态,生态,生理,行为, DNA 等等。而形态是最直观的,应该是必须的。所以,我认为 EBP 必须有分类学家的参与。 另外,从科学普及的角度来看,经典分类学家的作用功不可没,即使经典分类学家正在成为濒危物种(见我最近的博文《 拿什么来拯救经典生物分类学》 http://blog.sciencenet.cn/blog-361302-1036121.html )。你会通过外观特征来告诉你的孩子为什么这个是老虎,那个是猫,而不是跟他们说这个是老虎是因为它的 DNA 有这些 ATGC 组合。 图 1 帝王蝶 Danaus plexippus 。 只生活于北美。 图 2 左图为印度的常见虎蝶 Danaus genutia ,很像右图的帝王蝶 Danaus plexippus 。(引自 https://www.sciencemag.org/news/2017/02/monarch-miscalculation-has-scientific-error-about-butterflies-persisted-more-40-years ) Reference: Hebert et al. 2003.Biological identifications through DNA Barcodes. Proceedings of the Royal Society B 270: 313-321.
7961 次阅读|22 个评论
DNA条形码最小取样量研究进展
zhuchaodong 2016-2-15 21:53
DNA BARCODING , DNA TAXONOMY , TAXONOMY The minimum sample size for DNA Barcoding We recently published a paper on the minimum sample size in DNA Barcoding in the journal Ecology and Evolution (doi: 10.1002/ece3.1846). It tried to use simulated datasets to examine the effects of sample size on four estimators of genetic diversity, mismatch distribution, nucleotide diversity, the number of haplotypes, and maximum pairwise distance. As found by the previous project by Ai-Bing ZHANG et al. (2010, doi:10.1016/j.ympev.2009.09.014 ), this project confirms again that larger sample size helps to find the better results from DNA Barcoding. Besides, we found the minimum sample size of 20 individuals is required for each subsample. Dr A-Rong LUO led the project. She collaborated with researchers and student in Yunnan University, Beijing University of Chemical Technology, Capital Normal University and University of Sydney. Mr. Hai-Qiang LAN, the joint graduate student between Yunnan University of Finance and Economics and Institute of Zoology, Chinese Academy of Sciences finished his thesis during the project. The project was mainly supported by grants from the National Science Foundation, China, and partially supported by the Program of Ministry of Science and Technology of the People’s Republic of China. 我们最近在Ecology and Evolution上发表了一篇论文,研究了DNA Barcoding的最小取样量问题(doi: 10.1002/ece3.1846)。该工作用模拟数据,对错配分布、核苷酸多样性、单倍型数量和最大配对距离等四个估量对遗传多样性的取样量效应进行了比较分析。和张爱兵等(2010, doi:10.1016/j.ympev.2009.09.014 )发现的一样,我们发现取样量越大,DNA Barcoding的结果越好;同时,我们的结果发现每个亚群取样量至少为21个个体。 罗阿蓉博士为第一作者。她和云南财经大学、北京化工大学、首都师范大学、悉尼大学等研究人员合作完成。通过这个项目,云南大学和中国科学院动物研究所联合培养了一名硕士研究生,蓝海强完成一篇学位论文。该工作主要得到自然科学基金委面上和特殊学科点项目,部分得到科学与技术部基础专项的支持。 Luo, A., Lan, H., Ling, C., Zhang, A., Shi, L., Ho, S. Y. W. and Zhu, C. (2015), A simulation study of sample size for DNA barcoding. Ecol Evol, 5: 5869–5879. doi:10.1002/ece3.1846 ( Luo_et_al-Ecology_and_Evolution.pdf ) English Abstract: For some groups of organisms, DNA barcoding can provide a useful tool in taxonomy, evolutionary biology, and biodiversity assessment. However, the efficacy of DNA barcoding depends on the degree of sampling per species, because a large enough sample size is needed to provide a reliable estimate of genetic polymorphism and for delimiting species. We used a simulation approach to examine the effects of sample size on four estimators of genetic polymorphism related to DNA barcoding: mismatch distribution, nucleotide diversity, the number of haplotypes, and maximum pairwise distance. Our results showed that mismatch distributions derived from subsamples of ≥20 individuals usually bore a close resemblance to that of the full dataset. Estimates of nucleotide diversity from subsamples of ≥20 individuals tended to be bell-shaped around that of the full dataset, whereas estimates from smaller subsamples were not. As expected, greater sampling generally led to an increase in the number of haplotypes. We also found that subsamples of ≥20 individuals allowed a good estimate of the maximum pairwise distance of the full dataset, while smaller ones were associated with a high probability of underestimation. Overall, our study confirms the expectation that larger samples are beneficial for the efficacy of DNA barcoding and suggests that a minimum sample size of 20 individuals is needed in practice for each population. 中文摘要: DNA条形码可以为某些生物类群分类、进化生物学和物种多样性评估等研究提供有效的辅助性作用。但是,条形码的效力取决于每个物种的取样程度。只有足够的取样量才能可靠地估计遗传多样性,从而精确界定物种。我们通过数据模拟,对4个影响DNA条形码相关的遗传多样性变量进行了分析:错配分布、核苷酸多样性、单倍型数量和最大配对距离。我们的结果表明:20个(包括)以上的个体组成亚组得到的错配分布和全数据集的相似;20个以上个体亚组的核苷酸多样性估值在全数据集附近形成钟形分布,而20个以下个体亚组则非钟形分布;加大取样量通常会提高单倍型数量;20个以上个体亚组可以较好估计全数据集的最大配对距离。综上,我们的研究确认DNA条形码取样量的重要性,每个种群至少取样20个。
4105 次阅读|0 个评论
多基因DNA条形码系统MEE在线发表(Early View全文分享)
热度 1 zhuchaodong 2015-3-2 21:18
Early View全文分享: 2015-Douglas et al.-A DNA Barcoding system integrating multigene sequence data.pdf 自2003年在加拿大多伦多大学,了解了DNA条形码的理念后,我个人持续关注。2005年在伦敦自然历史博物馆参加第 二届世界DNA条形码大会后,自己更加希望做些工作,推动昆虫系统学工作。 基于 DNA 序列,学界已经开发了很多用于分类鉴定的方法和系统。但是,在真核生物中,大多数系统使用单个预设的基因片段,如 COI 、 16S 等。有限数据信息可能导致鉴定结果出现一定的偏差。这些系统也很难识别并分析基因组来源的大量基因数据。 今天收到 Methods in Ecology and Evolution 编辑部来信, Douglas Chesters 博士等整合多基因数据的 DNA 条形码系统的研究论文已经被正式接受,并将于近日在线发表。 在这篇论文中,我们实现了多个基因的 DNA 条形码功能: 1 )基于经常测定的基因位点数据,建立一个参考框架性数据集; 2 )其它基因数据和参考序列进行同源比对、剪切,同时在种内变异范围内对查询基因片段赋予物种分类阶元信息。我们把该方法和现有一些方法进行了比较,如“ bagpipe_phylo” 。后者在系统发育树上给序列重新赋予分类阶元信息。 上述建议的多基因系统正确推断了 GenBank 中节肢动物 78% 的物种和 94% 的属级阶元。尤为关键的是,物种鉴别的比例高于仅仅用 COI 的方法。测试数据中, 24% 的物种仅仅见于非 COI 基因,而且这些 COI 之外的基因的物种阶元信息赋予正确率并没有明显的降低。同法,我们应用非 COI 的数据栏对建立的宏基因组数据进行了额外的物种阶元信息赋予。通过测试 1 个 273 条蜜蜂基因序列的数据,我们通过改变遗传距离的计算方法,物种赋予正确率和基于系统发育的分类鉴定结果差异不明显。 标准的单基因片段 DNA 条形码仍然是基于 PCR 产生数据的物种鉴定的重要鉴定工具。对于已经建立的大量物种 DNA 条形码“骨干数据”而言,本文方法可以补充下列几点: 1 )基因组数据; 2 )通过整合其它独立的基因位点降低错误; 3 )对非条形码片段进行额外的物种鉴定。通过新一代测序平台,后面两点和群落基因组监测工作尤其相关。 学海无涯勤作舟。 Douglas 博士来组里以后,努力工作,取得了一系列的研究进展。 在基于基因序列的物种界别的方向上, Douglas 博士已经连续在 Systematic Biology ( 2 篇)和 Methods in Ecology and Evolution ( 2 篇)上发表论文,把单个基因的思路推广到多个基因,并实现了大数据库中基因物种信息的自动矫正和赋予。 功夫不负有心人:2014年, 他获得中国科学院院长国际学者1年期项目(PIFI),获得一项国家自然科学基金项目,并于年底成功竞聘为动物研究所副研究员。 后续我们计划在下面几个方面继续努力: 1 ) 把该方法推广到基因组。这个功能已经部分实现,但是还需要较多组学数据的实际测试。 2)把该方法推广到系统树上的一些关键节点。这是我个人最感兴趣的点。 3 )把该方法和其它学科,特别是昆虫多样性和物种互作研究结合起来。 4 )把该方法更系统地应用到蜜蜂物种较为丰富的几个属中,加快蜜蜂总科系统学研究工作。 原文摘要和全文将于在线后和大家分享: A DNA Barcoding system integrating multi-gene sequence data Douglas Chesters, Wei-Min Zheng and Chao-Dong Zhu Accepted manuscript online: 4 MAR 2015 04:41AM EST | DOI: 10.1111/2041-210X.12366 Abstract PDF(223K) Supporting Information Request Permissions
5004 次阅读|2 个评论
我研究组Systematic Biology在线发表面向DNA数据库物种界定规程
热度 1 zhuchaodong 2014-2-3 22:46
论文在线发表,引用信息如下: A Protocol for Species Delineation of Public DNA Databases, Applied to the Insecta. Douglas Chesters; Chao-Dong Zhu Systematic Biology 2014; doi: 10.1093/sysbio/syu038 论文全文下载: 相关数据: http://datadryad.org/resource/doi:10.5061/dryad.k7t50 论文在线发表: Abstract: http://sysbio.oxfordjournals.org/cgi/content/abstract/syu038?ijkey=tS8O8zuszBKwUulkeytype=ref PDF: http://sysbio.oxfordjournals.org/cgi/reprint/syu038?ijkey=tS8O8zuszBKwUulkeytype=ref 网站: phylolab.ioz.ac.cn 软件链接: 1、 Automated taxonomic identification of Apoidea (bee) DNA sequences 2、 Multi-Gene DNA Barcoding for Arthropods (beta) 介绍 大量 DNA 条形码数据为实现快速物种界定提供了可能性,也带来了两个问题:1)基于单个位点信息的物种界定是否可靠?2)依据公共数据库信息,实现物种界定的可靠性有多高? MEE 论文 (http://onlinelibrary.wiley.com/doi/10.1111/2041-210X.12104/abstract) 解决了多基因物种界定的全局参数优化 问题。我们 在提交MEE论文的前一天,也向另外一个专业杂志, Systematic Biology 提交了另外一篇论文。该论文最早的想法:飞速发展的测序技术至今测定了多少物种?公共数据库中有多少具有物种水平分类学信息的序列?这些分类学信息是否真实反映了物种界限?在无法完成形态分类学验证的情况下,如何基于多基因片段的信息,为无标记序列提供并验证物种分类信息? 为了实现上述想法, Douglas Chesters 博士开发并测试了一套流程,把 MEE 论文的方法从蜜蜂总科进一步推广到昆虫纲,从少数几个基因片段推广到n个,以期获得更加普遍而可靠的结论。经过审稿人、编辑、副主编和主编的3轮密集审阅,我们收获了很多建设性的建议和想法,并规划了下一步工作。 公共 DNA 数据库中昆虫物种界定规程 公共 DNA 数据库中包含很多生物类群,为系统学研究提供了大量数据来源。目前,基于分子数据的物种鉴别和界定工作已经逐步开展。现代测序技术的飞速发展,带来了海量分子数据的同时,也导致很多研究人员无法为相关数据提供准确的分类学信息。这些分类信息不够完整的分子数据,阻碍了在物种一级水平上开展精细的数据挖掘。同时,基于较大数据库进行物种聚类研究,也需要整合多个基因片段,从而在数据结构和计算过程中产生了很多问题。 作者研发了一种在分子序列数据库中界定物种的方法: 1) 首先获取所有昆虫的 DNA 序列,并对它们进行文本加工; 2) 根据一定的规则过滤掉重复数据; 3) 划分遗传位点 L ; 4) 根据每个位点信息,界定物种 S ; 5) 物种单元与位点相匹配,形成一组多位点物种界定的数据矩阵 L × S 。 作者应用马尔科夫聚类的方法将数据库划分为同源基因片段数据集。基于包含大部分物种多样性的基因,完成物种鉴定,并同时对物种单元名字赋予物种名。在物种聚类过程中,两两相似之处计算的复杂性的主要来源于线粒体基因组中的 COI 位点。自主研发的软件解决了这个复杂的过程:在分类的体系内执行序列两两比对,且为不同阶元的序列标注分类信息。 该工作研究了 GenBank 中超过 24 个不同同源基因, 194000 个未带分类标签的序列,包含 41 525 个带分类标签的物种( 98.7% 从昆虫数据库中获得)。通过对每个位点的分层聚类,利用独立的最优参数,这些序列被分组到 59173 个基于单个位点的分子分类单元( MOTU )中。来自不同位点的 MOTU ,由多部匹配算法进行匹配。这样,位点之间形成不一致性最低的多位点单元。匹配后,我们 发现了在目前的昆虫数据库中,存在 78091 个基于多位点信息的 MOTU 。其中, 38 574 个单元包含物种分类学信息,而 34 891 个则没有包含物种分类标签 。 除了可以估算物种多样性,我们开发的规程还将促进现代序列数据集的物种界定。特别是 L × S 矩阵代表了后分类学思路,将可以解构种级元基因组数据。这些方法将可以在多个基因位点,甚至基因组水平提取大量数据,产生更多研究物种多样性的 L × S 矩阵,从而整合到后续的系统发育的流程。 上述研究成果,已经被Systematic Biology接收: 17-Jan-2013 Submitted 18-Apr-2013 Reject; resubmission encouraged 08-Aug-2013 Resubmission 21-Nov-2013 Accept with major revisions 06-Jan-2014 Resubmission of R1 14-Apr-2014 Accept with minor revision 19-Apr-2014 Resubmission of R2 28-Apr-2014 Accept pending receipt of final changes 29-Apr-2014 Resubmission of R3 10-May-2014 Accept, Production Checklist 11-June-2014 Awaiting Assignment to Batch 15-June-2014 Published on-line
个人分类: 论文简介|7130 次阅读|4 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-29 16:44

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部