科学网

 找回密码
  注册

tag 标签: 分歧时间

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

当利用化石记录进行分歧时间标定时,如何选取化石记录?
热度 1 hypermarket 2016-12-23 16:43
当研究者可以构建比较可靠的系统发育结果之后,大多会考虑进而进行分歧时间推断,绘制chronogram。随之而来会遇到的最大的问题,一般就是选取哪些化石记录来进行分歧时间标定。当分子钟模型不再是问题之后,化石记录选取成为分子系统发育研究方法体系中少数尚未进行有效标准化的步骤。 到底应该如何选取化石记录才比较合理呢,是不是从数据库中选取某类群中最早的就可以了?如果缺少相关的古生物学和形态学知识背景,大概一般只能做到这种程度,但是这样可能导致分歧时间推断的结果过早,因为所选取的化石很可能属于基干类群(stemgroups),而不属于基于现生物种所定义的单系。以目前使用最为广泛的分歧时间推断软件BEAST为例,虽然其中也支持定义主干种的时间,但是目前绝大多数案例中使用的都是点标定,因此在选取化石记录的过程中要注意区分基干类群和非基干类群(图1)。 图1.对于高级阶元中一个已知的分类单元,化石记录有若干种可能的位置 假设一个种上分类单元N,包含两个亚单元N1和N2。那么,化石类群1肯定是不能用的,这个没有问题。化石类群2和3的情况比较复杂,因为他们属于分类单元N,但是却在N中所有现生类群分化之前就已经形成分支,因而不属于由现生类群定义或描述的分类单元N';由于分子数据基本上只来源于现生类群,而N'和N之间存在区别,因此化石类群2和3也不宜用来作为基于分子系统发育结果的分歧时间点标定(同理,化石类群4和5不能用来标定N1,化石类群6也不能用来标定N2)。化石类群4和6可以用来标定N'(化石类群5也可以用来标定N',尤其是在4未必可靠的情况下),并且在已有的案例实践中普遍被视为对N进行标定。化石类群7可以用来标定N2。 从图1中可以看出,用化石类群4-6来对N'进行标定,应该会低估分歧时间,再加上N'和N之间的差距,这很可能会形成一个低估分歧时间的系统误差,但是对于基于分子系统发育重建结果的分歧时间推断而言,也只能这样,因为把化石类群和现生类群做到一棵进化树里的情况只在对于个别类群的研究中有条件做到。在这种情况下,应该考虑把化石类群2和3的信息作为独立证据加以利用。 也就是说,在基于分子系统发育的研究结果进行分歧时间标定时,应该区分基干类群化石和非基干类群化石,并且对于两者的信息分别加以利用。Wangetal.(2016)对昆虫纲分子系统发育案例中的基干类群化石信息进行了梳理 ,更多内容可见 http://www.nature.com/articles/srep38939 。 参考文献 1.WangY-H,EngelMS,RafaelJA,WuH-Y,RedeiD,XieQ,WangG,LiuX-G,BuW-J.2016.Fossilrecordofstemgroupsemployedinevaluatingthechronogramofinsects(Arthropoda:Hexapoda).ScientificReports6:38939.
13504 次阅读|1 个评论
影响系统发育重建和分歧时间推断的可能因素
热度 1 hypermarket 2016-3-25 16:46
在引入系统发育系统学的思想与概念体系之后,在引入分子序列信息之后,系统发育重建在量化分析和可重复性方面都有了很大进步,但是在很大程度上仍然常给人以黑箱子的感觉。这在研究实践中一般会表现为,对于基于不同基因得到的不同结果,甚至基于相同基因得到的不同结果,常常很难确切地对原因进行溯源。表1中列出了在进行分子系统发育推断和分歧时间推断过程中,在各个步骤和环节可能造成影响的一些因素。在以前,尤其是5-6年以前,研究者侧重于重视分析层面的因素,但实际上数据层面的影响因素是更多的。近年来越来越多期刊强制要求上传最终的矩阵文件,体现了研究者对于数据本身的重视程度的提高。 表1. 影响系统发育重建和分歧时间推断的可能因素 数据层面 标本阶段:内群选取、外群选取、样品污染、鉴定错误 实验阶段:序列总长、扩增错误、样品数量、样品质量 测序阶段:基因及位点的覆盖度、测序错误、拼接错误 比对阶段:碱基或氨基酸的位置同源性受长度变异影响 基因属性:碱基或氨基酸的组成、替换类型、替换速率 分析层面 算法选择、软件选择 进化模型检测软件与系统发育重建软件之间的衔接 参数设定 时间标定过程中的化石选择(分歧时间推断) 系统发育分析中常说的随机误差(stochastic error)和系统误差(systematic error),其实都主要在数据层面。随机误差主要是说分子标记的序列总长较短,到底能否代表物种间的遗传分异,这个问题有一些计算机模拟分析给出过答案,当序列总长在3-10kb时,随机误差已经不大,10kb以上时则很小 。系统误差主要是说各种方向的偏异(bias),常被提及的是内群选取的完整性和外群选取的合理性,以及碱基和氨基酸组成的偏异。以线粒体基因组为例,其实单其中的蛋白质编码基因总长已经不低,但是由于线粒体基因组碱基偏异的普遍较重,因而越来越少单独使用,而是和核基因联用,并且越来越多使用氨基酸序列。 对于内群选取、外群选取、序列比对等因素的影响,可以设计单因素对照分析。准确的物种鉴定要依靠分类学家 J 。数据层面的其它因素一般通过在实验或分析过程中进行质量控制来提高质量。 在分析层面,参数设定没有展开,其中大多是可以进行单因素对照分析的。化石类群的选取虽然已经有比较丰富的数据库信息可以利用,但在标定时的选用仍然有待进一步标准化。 更多系统发育相关内容可以阅读之前的日志 1996-2015的20年间主要序列分子标记在系统发育重建中的使用简况 http://blog.sciencenet.cn/blog-1292052-963321.html rRNA二级结构中的分子独征在系统发育重建中的应用--澳丝蝽科案例 http://blog.sciencenet.cn/blog-1292052-954459.html 系统发育重建中主流算法的未来走向 http://blog.sciencenet.cn/blog-1292052-943070.html 分歧时间研究中用作标定的化石所处的层位时间 http://blog.sciencenet.cn/blog-1292052-935151.html 目前分子系统发育研究中的两点局限性 http://blog.sciencenet.cn/blog-1292052-923288.html 互相独立多证据的一致指向在分歧时间推断中的应用--蝽类昆虫案例 http://blog.sciencenet.cn/blog-1292052-922084.html 高级阶元昆虫转录组研究中的标本问题 http://blog.sciencenet.cn/blog-1292052-905190.html 参考文献 Delsuc F, Brinkmann H, Philippe H. 2005. Phylogenomics and the reconstruction of the tree of life. Nat. Rev. Genet. 6:361-375.
5969 次阅读|1 个评论
分歧时间研究中用作标定的化石所处的层位时间
hypermarket 2015-11-14 12:10
随着越来越多较为可靠的系统发育框架的出现,很多研究者都在进行分歧时间推断的分析,这其中需要对某些节点进行分歧时间标定,基于已知推断未知。在大多数情况下,时间标定还是以化石为主,尤其是对高级阶元系统发育而言。在Paleobiology Database中( https://paleobiodb.org/cgi-bin/bridge.pl?a=displayDownloadGenerator ),研究者们可以很方便地找到目标化石所处的层位时间。 这些层位时间信息可以直接使用么?事实上,数据库并不保证所列时间的客观性,而是多来自于原始文献。这里就会存在一个问题,其实化石能被比较有把握确定的是层位信息,而与层位相对应的时间界限是在持续修订的。如果持续关注不定期更新的国际地质年表International Chronostratigraphic Chart( http://www.stratigraphy.org/index.php/ics-chart-timescale ),就会发现有些层位时间界限存在不同幅度的修订。因此,最妥善的处理方式是,在选定化石之后,基于最新的国际地质年表中的层位时间信息在BEAST等分歧时间推断软件中进行时间标定的设置。当然,考虑到国际地质年表中层位时间的修订幅度一般都不是很大,所以如果直接使用Paleobiology Database中所显示的层位时间信息的话,应该对于分歧时间推断结果影响非常有限。
7694 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-5 17:13

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部