科学网

 找回密码
  注册
科学网 标签 系统发育树 相关日志

tag 标签: 系统发育树

相关日志

每日翻译20190801
Bearjazz 2019-8-1 13:53
# 编者信息 熊荣川 明湖实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz Schematic illustration of the waiting times in a calibrated tree and the numbers of lineages present for each type of diversification process (interspecies diversification and within-species coalescence) during each waiting interval. Branches are categorized as either between species (thin lines) or within species branching (bold lines) according to the procedures described in Material and Methods. 校准树中种间、种内分化持续时间的示意图,以及在每个分化等待间隔期间,不同分化过程中出现的谱系数量。根据材料与方法中描述的程序,分支可分为种间(细线)或种内分支(粗线)。 Pons J, Barraclough T G, Gomez-Zurita J, et al. Sequence-based species delimitation for the DNA taxonomy of undescribed insects . Systematic biology, 2006, 55(4): 595-609.
个人分类: 翻译作品|4021 次阅读|0 个评论
每日翻译20190731
Bearjazz 2019-7-31 08:05
# 编者信息 熊荣川 明湖实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz Analyses of mtDNA Branching Times A statistical model was developed to test for the predicted change in branching rates at the species boundary. The overall aim of the procedure is to classify the observed branching time intervals defined by the nodes in a clock-constrained phylogram to either being the result of inter-specific (“diversification”) or intraspecific (“coalescent”) processes of lineage branching (Fig. 2). A full description of the model and its performance on simulated trees will be provided elsewhere (Barraclough, unpublished). 线粒体 DNA 分支时间分析 建立了一个统计模型来检验物种边界处分枝速率的预期变化。该程序的总体目的是将观察到的分支时间间隔(由时钟约束的系统树图中的节点界定)分类为种间分支过程(“多样化”)或种内分支过程(“溯祖”)(图 2 )。模型及其在模拟树上的性能的完整描述将在其他地方提供( Barraclough ,未发表)。 Pons J, Barraclough T G, Gomez-Zurita J, et al. Sequence-based species delimitation for the DNA taxonomy of undescribed insects . Systematic biology, 2006, 55(4): 595-609.
个人分类: 翻译作品|3083 次阅读|0 个评论
每日翻译20190603
Bearjazz 2019-6-3 07:12
# 编者信息 熊荣川 明湖实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz Extant ancestral nodes In natural populations, most haplotypes in the gene pool exist as sets of multiple, identical copies that originated by DNA replication. When one of these copies mutates to a new haplotype, it is extremely unlikely that other copies of the ancestral haplotype also mutate or that all copies of the ancestral haplotype rapidly become extinct. Thus, the ancestral haplotypes are expected to persist in the population and to be sampled together with their descendants. Traditional phylogenetic methods, based on a bifurcating TREE, can detect and artificially represent persistent ancestral haplotypes as occupying a branch of zero length at the basal node of a cluster. However, this approach relies on modifying (e.g. by estimation of branch lengths) an inappropriate model – a bifurcating tree with all haplotypes occupying tips or terminal branches. 现存的祖先节点 在自然种群中,基因库中的大多数单倍型以多组拷贝形式存在,这些拷贝由 DNA 复制而来。当这些拷贝中的一个突变为一个新的单倍型时,祖先单倍型的其他拷贝极不可能也跟着突变,或者祖先单倍型的所有拷贝都很快灭绝。因此,祖先的单倍型将在种群中持续存在,并与后代一起被取样。传统的系统发育方法基于一个分叉树,可以检测并人工表示持续的祖先单倍型,即在一个簇的基部节点上占据一个零长度的分支。然而,这种方法依赖于设置(例如,通过估计分支长度)一个不合适的模型,在这一分叉树模型中,所有单倍型都占据末梢或末端分支。 Posada D , Crandall K A . Intraspecific gene genealogies: trees grafting into networks . Trends in Ecology and Evolution, 2001, 16(1):0-45.
个人分类: 翻译作品|1136 次阅读|0 个评论
每日翻译20190430
Bearjazz 2019-4-30 07:19
# 编者信息 熊荣川 明湖实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz Polytomies can represent two different cases. First, they can represent the literal hypothesis that a common ancestral population split through cladogenesis (i.e., speciation) into multiple lineages. Under this interpretation, such an internal node is referred to as a hard polytomy (below left). Alternatively, someone who depicts a polytomy in a cladogram is not really expecting that the same ancestor gave rise to all daughter taxa, but is uncertain which resolved pattern is the best hypothesis. Under these circumstances, such a node is referred to as a soft polytomy (below right). This is actually the more common intended meaning of a polytomy. 多岐树可以表示两种不同的情况:一种是它们可以代表这样一个理论上的假设,即一个共同的祖先群体通过分枝进化(即物种形成)分裂成多个支系。基于这种解释下,这样的一个内部节点被称为硬多岐(左下)。另一种说法是,用分支图描述多分支的人并不是真的期望同一祖先产生所有子分类群,而是不确定哪一种解决模式是最好的假设。在这种情况下,这种结节被称为软多岐(右下)。这实际上是多岐的更普遍的本义。 Introduction to Phylogeny: Hard or Soft Polytomies? http://biology.fullerton.edu/biol404/phylo/polytomies.html
个人分类: 翻译作品|1479 次阅读|0 个评论
每日翻译20190429
Bearjazz 2019-4-29 07:14
# 编者信息 熊荣川 明湖实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz More often than not, when a phylogenetic dataset is divided into smaller partitions, each one gives rise to trees that have different topologies. One can draw two conclusions from this result: (1) one, some or all of the trees are wrong and the partitions share the same history, (2) or the trees are correct and the different partitions have experienced distinct evolutionary histories. Distinguishing between these options requires statistical testing to determine if the differences in topology are likely to have been observed simply by chance. There are many different tests of incongruence available in the field of systematic biology that all use comparable measurements and ideas. However, tests differ, sometimes subtly and sometimes drastically, in their assumptions, implementation, and interpretation. These details can be difficult to discern in the disjointed literature and controversies surrounding these tests. Incongruence tests may be broadly classified into tests that consider character information (character incongruence) and those that only consider tree shape or topology (topological incongruence). Character congruence analyses are particularly useful and powerful because they take both the tree topology and the underlying support for the tree topology into account. Topological congruence techniques have the advantage of being able to compare trees derived from data that may not be strictly comparable or easy to include in the same analysis. 通常情况下,当一个系统发育数据集被划分成更小的分区时,每个分区都会产生具有不同拓扑结构的树。从这个结果可以得出两个结论:( 1 )部分或全部的树是错误的,而各分区具有相同的历史;( 2 )或者树都是正确的,不同的分区经历了不同的进化历史。区分这些选项需要进行统计检验,以确定拓扑结构的差异是否可能只是偶然观察到的。 在系统生物学领域有许多不同的差异检验,都使用可比较的测量和想法。然而,检验在假设、实现和解释方面有时有微妙的,有时是显著的不同。在杂乱无章的文献和围绕这些检验的争论中,很难辨别出这些细节。 不一致性检验可以大致分为基础特征不一致的检验和只考虑树形状或拓扑(拓扑不一致)的检验。特征一致性分析特别有用和强大,因为它们同时考虑了树拓扑和对树拓扑的底层支持(数据来源)。拓扑同余技术的优点是能够比较来自数据的树,这些数据可能不具有严格的可比性,也不容易包含在同一分析中。 Planet P J . Tree disagreement: Measuring and testing incongruence in phylogenies . Journal of Biomedical Informatics, 2006, 39(1):86-102.
个人分类: 翻译作品|1335 次阅读|0 个评论
每日翻译20190425
Bearjazz 2019-4-25 07:09
# 编者信息 熊荣川 明湖实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz Here we present PhySortR, a fast, flexible R package for screening and sorting phylogenetic trees. The command-line package provides the quick and highly flexible sortTrees function, allowing for screening (within a tree) for “Exclusive” clades that contain only the target leaves and/or “Non-Exclusive” clades that include a defined portion of non-target leaves. Using simulated data, we assess the runtime of PhySortR based on the number of trees and the number of leaves within a tree, and demonstrate the potential of PhySortR in the analysis of multiple, large-scale empirical datasets. 在这里,我们介绍了 PhySortR ,一个快速,灵活的 R 包,用于筛选和分类系统发育树。该 R 语言包提供快速和高度灵活的树排序功能,允许筛选出(在树中)只包含目标末梢分类单元支系和 / 或包含所定义的非目标单元支系。利用模拟数据,我们根据树的数量和树内分类单元的数量评估了 PhySortR 的运行时间,并证明了包提供快速在复合大规模实际数据集分析中的潜力。 Stephens T G , Bhattacharya D , Ragan M A , et al. PhySortR: A fast, flexible tool for sorting phylogenetic trees in R . PeerJ, 2016, 4(5):e2038.
个人分类: 翻译作品|1487 次阅读|0 个评论
每日翻译20190419
Bearjazz 2019-4-19 07:13
# 编者信息 熊荣川 明湖实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz Getting trees into R : Trees in R are usually stored in the S3 phylo class (implemented in ape ), though the S4 phylo4 class (implemented in phylobase ) is also available. ape can read trees from external files in newick format (sometimes popularly known as phylip format) or NEXUS format. It can also read trees input by hand as a newick string (i.e., (human,(chimp,bonobo));). phylobase and its lighter weight sibling rncl can use the Nexus Class Library to read NEXUS, Newick, and other tree formats. treebase can search for and load trees from the online tree repository TreeBASE, rdryad can pull data from the online data repository Dryad. RNeXML can read, write, and process metadata for the NeXML format. PHYLOCH can load trees from BEAST, MrBayes, and other phylogenetics programs (PHYLOCH is only available from the author's website ). phyext2 can read and write various tree formats, including simmap formats. rotl can pull in a synthetic tree and individual study trees from the Open Tree of Life project. The treeio package can read trees in Newick, Nexus, New Hampshire eXtended format (NHX), jplace and Phylip formats and data output from BEAST, EPA, HyPhy, MrBayes, PAML, PHYLDOG, pplacer, r8s, RAxML and RevBayes. phylogram can convert Newick files into dendrogram objects. brranching can fetch phylogenies from online repositories, including phylomatic . 将系统发育树输入 R 中: R 中的树通常存储在 S3 类数据 Phylon 类(在 ape 包中实现)中,而 S4 类数据 Phylon4 类(在 phylobase 包中实现)也可用。 ape 可读取 newick 格式(有时被普遍称为 phylip 格式)或 nexus 格式的外部文件树。它还可以将手工输入的 newick 格式字符串读取为树(如 (human,(chimp,bonobo)); )。 phylobase 及其重量较轻的兄弟 rncl 可以使用 Nexus 类库读取 Nexus 、 Newick 和其他格式树文件。 treebase 可以从在线树存储库 TreeBASE 中搜索和加载树, rdryad 可以从在线数据库 Dryad 中提取数据。 RNeXML 可以读取、输出和处理 NeXML 格式的大数据。 PHYLOCH 可以从 BEAST 、 MrBayes 和其他系统发育学程序加载树( PHYLOCH 只能从作者的网站上获得)。 phyext2 可以读写各种格式树文件,包括 simmap 格式。 rotl 可以从生命之树开放项目中引入合成树和单独研究树。 treeio 包可以读取 Newick , Nexus , New Hampshire eXtended ( NHX )、 jplace 和 Phylip 等格式的树文件,以及由 BEAST, EPA, HyPhy, MrBayes, PAML, PHYLDOG, pplacer, r8s, RAxML and RevBayes 等程序输出的数据。 phylogram 可以将 Newick 文件转换成 dendrogram 对象。 brranching 可以从在线数据库中获取系统发育树,包括 phylomatic 。 https://cran.r-project.org/web/views/Phylogenetics.html
个人分类: 翻译作品|1857 次阅读|0 个评论
每日翻译20190416
Bearjazz 2019-4-16 07:15
# 编者信息 熊荣川 明湖实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz Adaptive radiations such as the Darwin’s finches on the Galapagos archipelago, the Hawaiian silver swords, the Caribbean anoles lizards, and the cichlid fish of the East African Great Lakes provide opportunities for studying the processes underlying rapid speciation (Schluter, 2000; Brakefield, 2006; Salzburger, 2009). Yet, resolving the phylogeny of adaptive radiations still remains a challenge. Due to the extreme rapidity of the radiations, lineage sorting often lags behind cladogenesis, complicating phylogenetic inference based on single or a few molecular markers (Pamilo and Nei, 1988; Maddison and Knowles, 2006). Furthermore, the short basal branches typical for rapid radiations can make the phylogenetic reconstructions sensitive to the choice of outgroup taxa. In particular if the phylogenetic distance between outgroup and ingroup taxa is large, t here is a high likelihood of homoplasy between ingroup and outgroup taxa. Consequently, the outgroup may attach randomly to the ingroup and bias the inferred ingroup tree topology (Wheeler, 1990; Huelsenbeck et al., 2002; Rota-Stabelli and Telford, 2008; Rosenfeld et al., 2012). 适应辐射,如加拉帕戈斯群岛上的达尔文雀、夏威夷银剑菊、加勒比安乐蜥和东非五大湖中的慈鲷鱼,为研究快速物种形成过程提供了机会( Schluter, 2000; Brakefield, 2006; Salzburger, 2009 )。然而,解决适应性辐射的系统发育仍然是一个挑战。由于辐射速度极快,谱系分类往往落后于枝状进化,使得基于单个或几个分子标记的系统发育推断复杂化变得复杂( Pamilo and Nei, 1988; Maddison and Knowles, 2006 )。此外,以快速辐射为代表的短基枝可以使系统发育重建对外群的选择敏感。尤其是当外群与内群之间的系统发育距离较大时,内外群分来单元之间很可能存在趋同现象。因此,外群可能被随机附加到内群,并导致内群系统发育树的拓扑结构推断出现偏差( Wheeler, 1990; Huelsenbeck et al., 2002; Rota-Stabelli and Telford, 2008; Rosenfeld et al., 2012 )。 Kirchberger P C , Sefc K M , Sturmbauer C , et al. Outgroup effects on root position and tree topology in the AFLP phylogeny of a rapidly radiating lineage of cichlid fish . Molecular Phylogenetics Evolution, 2014, 70(1):57-62.
个人分类: 翻译作品|1314 次阅读|0 个评论
每日翻译20190412
Bearjazz 2019-4-12 07:09
# 编者信息 熊荣川 明湖实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz Several methods have been developed to construct phylogenetic trees. In general these methods can be divided into two distinct classes: methods which use an optimality criterion to choose a tree or trees, and methods that use an algorithm to choose a tree. Optimality criterion: Accomplishes the goal of estimating a phylogeny by defining criteria for comparing alternative phylogenies to one another and deciding which tree is better, or that more than one are equally good. Ideally, the simplest approach to find the best tree(s) would be to evaluate every possible tree and choose the best one based on your criterion. Felsentstein (1978) calculated the number of possible rooted, bifurcating trees for specific numbers of terminal taxa. Based on these calculations it can be seen that the number of possible trees for a fairly low number of taxa soon becomes quite large. 目前,已发展出几种构建系统发生树的方法。一般来说,这些方法可以分为两类:使用最优性准则筛选树的方法和使用算法筛选树的方法。 最优性标准:通过定义比较不同系统发育树的标准,并决定哪一棵树(或哪些树)更好,从而实现估计系统发育的目标。理想情况下,找到最佳树的最简单方法是评估每个可能的树,并根据既定标准选择最优树。 Felsentstein ( 1978 )计算了特定数量终端分类群下可能的有根分叉树的数量。根据这些计算,可以看出,即使基于相当低数量的分类群,可能的系统发育树很快就会变得相当大。 http://bio.slu.edu/mayden/systematics/bsc420520lect12.html Tree Building Techniques 建树方法
个人分类: 翻译作品|1142 次阅读|0 个评论
Mrbayes出错原因
Bearjazz 2017-7-22 14:38
# 编者信息 熊荣川 明湖实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz 有段时间没用Mrbayes建树了,最近再使用时老是出现一个问题: Could not open file DatasetA03.nex.run1.p 使用时老是说无法打开这个文件,我以为是系统问题,便重新安装了好几回Mrbayes,没有解决; 后来读屏幕上的信息发现,这个打不开的文件应该是 Mrbayes自己生成的,可是在文件夹里没有看到呀。 又用英文搜索了错误情况,读到了老外的原因分析,……,简单的说可能就是权限问题,这下才恍然醒悟,我的 Mrbayes是安装在C盘的(C:\Program Files (x86)\mrbayes32),每次往C盘粘贴个什么文件都会跳出一个对话框要求我提供权限…… 于是我重新找到了,我以前安装在D盘的 Mrbayes目录,在其中运行了,成功了。
个人分类: 我的研究|7545 次阅读|0 个评论
TreeGraph使用技巧
keifei 2017-1-26 00:14
TreeGraph使用技巧 by keifei 2017-1-26 凌晨 前言: 把一个软件使用熟练,使其发挥大功能满足自己所需,这就需要多多尝试,逐渐积累经验。 记性差,一段时间没有使用该软件,再次要实现某一功能时,脑子里只有了一点点模糊的印象,结果又费了你,又把原来走的弯路重走了一遍。 将一些使用经验记录下来,好让自己以后记不得时可以来复习复习。 若也他人使用这一软件,也希望拙笔记可以让你少走些弯路。 看与编辑系统发育树的软件很多,我使用过的有MEGA、FigTree与这里要详谈的TreeGraph。 个人觉得MEGA适用于小树(不超过一页纸的树,一般不超过100个taxa)。它的一大绝技是可以拷贝到PPT上进行编辑。缺点是taxa不能按某一规则排序,几乎要手动地一个节点一个节点调整次序。另外在树上添加与编辑注释性信息比较费劲。 FigTree功能比较齐全,使用起来也还蛮方便。不过我觉得TreeGraph更好用,这也就是这几日被逼出来摸索所得。之前只是把这个软件当做看图与导出自己看的图的一个小工具而已,还嫌弃它自动导出的pdf图难看,不仅显示出来的线条粗细不等、树的二叉分支折线还多余地带个圆角,而且更要民的是导出的pdf是图片形式,不能再编辑。 最近要编辑很多树图用于文章中,首先自然尝试使用MEGA,但动辄几百个物种的树,光在MEGA里调整顺序就费老劲了。Mac版本的MEGA还不能将树图拷贝到PPT里,得转到windows电脑里弄。终于弄到PPT里了,几百个物种、几百个支持率,得把PPT超级放大,稍一动就到下一张PPT了。。。。总之,太费劲了。 回到TreeGraph: 首先发现TreeGraph导出的pdf并不是完全不能编辑,用acobat打开后使用编辑图像与文字是可以进行编辑的,不过在一般模式下还是不能直接选中、复制其中的文字,而若要在Adobe Illustator里继续编辑pdf也几乎不可能,因为文字都被“分解”为一个个点了。 (摸索过程省略) 我的编辑大树详细参数: 1. 批量选择竖线,也选中了taxa names,按F5快捷键编辑 设置 线:粗1.298pt,corner由1改为0 (改弧角为直角) 设置字体:斜体、 8pt (输出到pdf显示为6pt,100%打印出来还可以看清) 尤其是设置leaf margin的上、下宽度,这实际上是调节相邻两个taxa之间的距离。我在此设置了 -1.5 pt ,效果是taxa names相互之间几乎是紧贴的,这样一页就可以显示尽量多的行。 在设置Branch formats: minimal length仍使用系统默认的6 pt,选中下面的constant line。 每次设置都可以按applicate看效果。 2、再设置横线:线的粗度同上,branch formats中要将 minimal length改为 6 pt ( 与竖线一样),也选中 constant line,上下的空间为0(不改系统默认值) 。 3、再设置支持率:字体改为 4 pt (尽量小),避免taxa上下距离不均等,label margin都改为0. 4、添加taxa group信息:选中顶上1个,按住command键,再选中底部的1个,再按commd+L(小写即可)快捷键。 5、导出为 svg格式 ,注意不是pdf格式。 7、AI打开svg文件,自由编辑。 缺点:枝长不能正常显示,每次要显示枝长总是报错。有待再摸索解决。 该软件另一强大功能: 在一棵树上显示多种支持率 。 比如你用三个基因建树,你想在一棵树上显示各自单基因以及三个基因联合在一起的支持率,可以用File---Add support values这一功能实现: Tip 1: 标准的参考树 首先导入。后面新导入的树,支持率默认在第2位。 但若之前导入某个树在某一节点有冲突,那么显示的是用括号括起来的支持率。 Tip 2:导入新树时,给新树上的支持率新起一个标签名,比如gene2,其他设置不用管。软件默认将支持率都label为support,若不更改,则无法导入新额支持率。最好在 第一个打开的树时,批量选中支持率,用右键 change label ID, 将默认的support名字更改为你便于识别的名字。我也因为忘了这个小tip,这次又折腾了一番。 这样就在几分钟内就统计了11棵树在各节点的支持率,是不是很强大? Tip 3:各支持率可以在倒进去后,在树上调整顺序。 默认是后加的支持率总是排在第2位 。若要调位置, 先批量选中支持率:select labels with this ID,然后按F5,修改line postion的值(甚至可以改为负值放在最前面)。 先记到此。 p.s. 小搜了一下,中文网里还没有介绍TreeGraph的使用技巧。
个人分类: 软件|8584 次阅读|0 个评论
系统发育树模板一
tongwenjun 2016-3-24 15:41
1. Cytochrome P450 function and evolution 2.Myosin Unrooted Tree 3. Phylogenetic tree of env-V1/V2 nucleotide sequences 4. Phylogenetic tree of NAC proteins of potato, Arabidopsis and rice
个人分类: 系统发育树图片|6 次阅读|0 个评论
R语言批量替换系统发育树上序列名称_树文件专用_非平台版
热度 1 Bearjazz 2015-3-30 17:02
#R 语言批量替换系统发育树上序列名称 _ 树文件专 _ 非平台版 # 作者信息 熊荣川 六盘水师范学院生物信息学实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz # 预装函数 (此函数代码将在发布 24 小时之后删除) TreeNtrans - function(tree.pre,tree.pos,oldname, newname) { …… } # 使用方法 path = …… setwd(path) tree.pre = B_2.nwk # 替换前的树文件 tree.pos = B_2_name2.nwk # 替换后的树文件 oldname = oldname.txt # 旧的序列名称 newname = newname.txt # 新的序列名称 TreeNtrans(tree.pre,tree.pos,oldname, newname) 注意:序列名称不能重复,不能带冒号,逗号等
个人分类: 我的研究|9784 次阅读|1 个评论
使用FigTree制作环形系统发育树
热度 2 Bearjazz 2015-2-4 17:20
使用 FigTree 制作环形系统发育树 # 作者信息 熊荣川 六盘水师范学院生物信息学实验室 六盘水市生物研究所 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz 系统树的形态有多种,当末端节点较多时,我们通常选用环形系统发育树 ,已达到节省版面的目的(如下图)。 其制作可以很方便的使用 FigTree 软件实现,过程如下: 1 、打开软件 2 、使用 file - open 功能打开树文件,出现以下对话, 3 、选择“确定” 4 、可以看出需要对数的末端字体进行设置,在左边选择 tip labels - Font 进行设置 5 、设置字体,大小,是否斜体加粗 6 、选择左上角 polartree layout 按钮 7 、初步设置环形系统发育树 8 、为了美观我们需要对齐末端,选择 Align tip labels 9, 、如果对其中的某个支系感兴趣,可以对其进行阴影标记,选择好感兴趣的支系 10 、选择顶端 Highlight 按钮,选择颜色 11 、初步效果 12 、如果要调整阴影部分的位置,可以使用 root angle 的大小,作用拖动调整 13 、最终效果如下 好了,就这么简单,祝您科研愉快! 参考文献 . 熊荣川 , 田应洲 , 李松 , 陈红 , 于振 . 2014. 威宁中华蟾蜍的分子鉴定 . 贵州农业科学 , 42 (12): 32-36.
个人分类: 我的研究|35463 次阅读|4 个评论
R语言去掉系统发育树的特定类群tip
Bearjazz 2014-5-2 19:48
R 语言去掉系统发育树的特定类群 tip # 作者信息 熊荣川 六盘水师范学院生物信息学实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz 生物信息学上构建系统发育树通常分析多个类群的关系。而当辛辛苦苦把系统发育树建好之后,我们往往在特定的研究中想知道去掉某些特定的类群( Tip )之后,系统发育树会发生什么样的变化。下面是 R 语言 ape 包中的一个简单例子 library(ape) intree = exampleTree2.nwk Otr - read.tree(intree) # 读入系统发育树 plot(Otr,show.node.label = T,use.edge.length = F) Otr = drop.tip(Otr,sp5) # 去掉 sp5 plot(Otr,show.node.label = T,use.edge.length = F)
个人分类: 我的研究|6485 次阅读|0 个评论
R语言设定系统发育树外群
Bearjazz 2014-5-2 16:49
R 语言设定系统发育树外群 # 作者信息 熊荣川 六盘水师范学院生物信息学实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz 生物信息学上构建系统发育树通常需要使用外群以确定“进化方向”或是给系统发育树定个根。下面是 R 语言 ape 包中一个简单的例子 library(ape) intree = exampleTree2.nwk Otr - read.tree(intree) # 读入系统发育树 plot(Otr,show.node.label = T,use.edge.length = F) plot(root(Otr, sp1)) # 设定 sp1 为外群
个人分类: 我的研究|7373 次阅读|0 个评论
R语言设置系统发育树节点支持率的位置
Bearjazz 2014-5-2 16:32
R 语言设置系统发育树节点支持率的位置 # 作者信息 熊荣川 六盘水师范学院生物信息学实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz 生物信息学上构建系统发育树的方法有很多,如邻接法、最大简约法、最大似然法、贝叶斯法等等。在相当多的案例里面,针对同一个数据集而使用不同方法构建的系统发育树的拓扑结构通常大致一致。于是在发表结果时,为了节约篇幅或是更直观的对比不同方法得到的支持率差异,常常只展现某一个方法构建的系统树,而在节点处同时列出各种方法得到的支持率。其中一种方法就是,将不同的支持率展现在节点(或支 branch )的不同位置,下面是来自 R 语言 ape 包的例子。 intree = exampleTree.nwk Otr - read.tree(intree) # 读入系统发育树 plot(Otr,show.node.label = T,use.edge.length = F) bs.pars = c(NA,72,86,91) nodelabels(bs.pars, adj = c(-0.2, -0.1), frame = n, + cex = 0.8, font = 2) # 标在后 bs.nj = c(NA,81,87,91) nodelabels(bs.nj, adj = c(1.2, -0.5), frame = n, + cex = 0.8, font = 3) # 标在上 bs.ml = c(NA,77,86,90) nodelabels(bs.ml, adj = c(1.2, 1.5), frame = n, cex = 0.8) # 标在下
个人分类: 我的研究|6377 次阅读|0 个评论
在R语言中使用遗传距离矩阵构建简单的系统发育树
热度 2 Bearjazz 2013-9-11 20:56
熊荣川 xiong rongchuan 六盘水师范学院生物信息学实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz 一般的遗传距离矩阵如下图 对这样的矩阵稍作修改,删除标题行列,保存为“Fst.csv” library(ape) #需要用到ape程序包 M2 = read.csv(Fst.csv,head = F) #输入表格 dimnames(M2) - list(1:8, 1:8) #为表格设置行列名称 M2-as.matrix(M2) #将表格转化成矩阵格式 tr2 - bionj(M2) #构建NJ树 pl树ot(tr2, u) #输出系统发育
个人分类: 我的研究|19028 次阅读|4 个评论
Raxml 可视化软件raxmlGUI
热度 1 Bearjazz 2013-4-16 10:34
熊荣川 xiong rongchuan 六盘水师范学院生物信息学实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz Raxml在处理大数据,构建基于ML方法的发育树方面具有快速准确的有点。然而繁琐的命令总让人头痛。Silvestro, D. and I. Michalak (2012). 开发的可视化软件成功的解决了这一难题。 在官网上下载程序包,解压后可以双击“raxmlGUI.py”直接使用。 有两点值得注意: 1、你的系统必须安装有 Python, 而且不支持phthon 3.0以上的版本,我下载使用2.6.6版本亲测可用。 http://www.python.org/download/releases/2.6.6/ 2、比对好的序列文件须是phy格式,且放在非中文路径上。 3、可用clustalX把fasta格式文件转换为phy格式文件。 4、加载的序列存在路劲上不能有中文。 5、phython和raxmlgui必须安装在同一路径下。
个人分类: 我的研究|14554 次阅读|1 个评论
在R语言中有选择性地显示系统发育树的节点支持率
Bearjazz 2013-3-23 15:01
在 R 语言中有选择性地显示系统发育树的节点支持率 熊荣川 xiongrongchuan 六盘水师范学院生物信息学实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz 使用生物信息学构建的系统发育树通常应用节点支持率来讨论一定的生物学问题,然而支持率太低,其生物学意义就不到了。所以很多科学文献中通常会有选择性的在系统发育树上显示节点支持率——显示较高的,省去较低的。许多软件里面通常有这样的功能,如 mega5 之类,下面讲讲如何在 R 语言中如何实现 library(ape) Otr-read.tree(chou.nwk)# 读入系统发育树 plot(Otr,show.node.label=T)# 输出系统发育树,并显示节点信息 # 如上图,我们希望小于 0.5 的节点支持率不被显示 Otr$node.label# 查看中间节点信息 1.00000.41101.00000.7520 index=Otr$node.label0.5# 找到支持率小于 0.5 的节点位置 Otr$node.label =# 节点支持率小于 0.5 ,则直接复制为空 plot(Otr,show.node.label=T)# 输出系统发育树,并显示重新配置后的节点信息
个人分类: 我的研究|5969 次阅读|0 个评论
R语言中提取系统发育树的各种信息
Bearjazz 2013-3-23 14:42
R 语言中提取系统发育树的各种信息 熊荣川 xiongrongchuan 六盘水师范学院生物信息学实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz library(ape) Otr-read.tree(chou.nwk)# 读入系统发育树 plot(Otr,show.node.label=T)# 输出系统发育树,并显示节点信息 Otr$tip.label# 末梢信息 DQ650503DQ650501DQ650500DQ650545DQ650547DQ650546 Otr$edge# 支系节点信息 78 89 91 92 83 710 104 1011 115 116 Otr$edge.length# 支长 0.076593150.000000000.001899570.000000000.000000000.07660045 0.000000000.000946960.000945320.00094532 Otr$node.label# 中间节点信息 1.00000.41101.00000.7520 Otr$root.edge# 根部支系长度,这里是无根树,所以结果 NULL NULL
个人分类: 我的研究|9366 次阅读|0 个评论
R语言中系统发育树方向的设置、更改
Bearjazz 2013-3-20 09:18
R 语言中系统发育树方向的设置、更改 熊荣川 xiongrongchuan 六盘水师范学院生物信息学实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz 通常的系统发育树方向是朝右的,即根在左,末梢在右。在 R 语言中可以进行方向的修改。 library(ape) tr-read.tree(text=((a:1,b:1):1,(c:1,d:1):1);)# 直接在屏幕上输入树文件 plot(tr,direction=rightwards)# 朝右,这也是默认的方向 plot(tr,direction=leftwards)# 朝左 plot(tr,direction=upwards)# 朝上 plot(tr,direction=downwards)# 朝下 就这么简单,祝您科研愉快!
个人分类: 我的研究|5610 次阅读|0 个评论
R语言中系统发育树的输出类型
Bearjazz 2013-3-19 16:10
R 语言中系统发育树的输出类型 熊荣川 xiongrongchuan 六盘水师范学院生物信息学实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz library(ape) tr-read.tree(text=((a:1,b:1):1,(c:1,d:1):1);)# 直接在屏幕上输入树文件 plot(tr,type=p)#phylogram 类型,也是默认类型 plot(tr,type=c)#cladogram 类型 plot(tr,type=u)#unrooted 类型 plot(tr,type=r)#radial 类型 plot(tr,type=f)#fan 类型 注意,本文中类型用了手写小字母作为简称,也可以使用全称 如 plot(tr,type=fan)#fan 类型
个人分类: 我的研究|6084 次阅读|0 个评论
R语言中系统发育树的输入输出
热度 4 Bearjazz 2013-3-18 14:07
R语言中系统发育树的输入输出
R 语言中系统发育树的输入输出 熊荣川 xiong rongchuan 六盘水师范学院生物信息学实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz R 语言可用于系统发育与进化分析,其中一个基本的操作就是系统发育树输入与输出。 下面是一个实例,示范如何用 R 语言进行系统发育树的输入与输出。 提示:在进行以下操作之前需要安装 ape 包。 实例一 直接在屏幕上输入树文件 library(ape) tr - read.tree(text = ((a:1,b:1):1,(c:1,d:1):1);) # 直接在屏幕上输入树文件 write.tree(tr,file = tr.nwk) # 输出系统树,可以使用 mega 查看 plot(tr) # 输出树图,效果如下图 实例二 从硬盘读入树文件 tr1 -read.tree(tr.nwk) # 读入树文件 plot(tr1) # 输出树图,效果如上图 如果是nexus格式的系统发育树,使用read.nexus()读入,使用write.nexus()
个人分类: 我的研究|20660 次阅读|8 个评论
系统发育树节点名字批量替换
Bearjazz 2012-5-10 10:50
提供系统发育树节点名字批量替换服务(免费) 熊荣川 六盘水师范学院生物信息学实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz 通常我们在构建系统发育树时,除了自己通过测序得到的序列外,常常需要在 genbank 中下载同源序列进行补充、比较分析。但是下载下来的序列名称特别长,无论是查看和后续分析都不是很方便(例如以下的序列名称)。 gi|380854473|gb|JN227420.1| Rana palustris voucher YPM A9399 12S ribosomal RNA gene, partial sequence; tRNA-Val gene, complete sequence; and 16S ribosomal RNA gene, partial sequence; mitochondrial GGGAATTACGAGCAATGCTTAAAACCCAAAGGATTTGACGGTGTC …… 另外,一些序列格式对序列名称的长度也作了限制要求,如 phy 格式要求序列名称须少于 10 个字符。 通常我们实验室会通过一个 Excel 表格建立一列简短名称和原来的冗长的名称一一对应,迅速的跳过名称的纠结进入后续的分析阶段。 然后问题是,系统发育树建立后,结果理想的话,我们通常要把这些简称替换成全称,如拉丁学名。你可能会说使用一些文件的替换功能能把它们替换过来,然后对于数据量越来越大的生物信息学时代,这未免让人有所不甘心。最近我们实验室写了一段程序代码,可以批量的进行树文件中序列名称的批量替换,由于代码写作不易加上尚未封装,所以不便分享。如果有相关需要的朋友可以把相关树文件及新旧名录发到我们的邮箱,我们提供免费的替换帮助。 提交文件主要有两个,首先是一个树文件,只要能用记事本打开就 Ok ,如常见的 newic k 格式( .nwk ) 另一个就是 excel 表格,表格包含两行数据,第一列为旧名字,第二列为新名字(如下图)。 提供系统发育树节点名字批量替换服务.pdf 祝您科研愉快!
个人分类: 我的研究|4823 次阅读|0 个评论
如何使用PhyloBayes快速构建系统发育树
热度 7 Bearjazz 2012-5-6 10:43
如何使用 PhyloBayes 快速构建系统发育树 熊荣川 六盘水师范学院生物信息学实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz PhyloBayes 算是贝叶斯方法软件的后起之秀,替代模型更为丰富,主要用于基于氨基酸序列的系统发育树构建。 下载地址 www.phylobayes.org 下载之后,解压即可,不需安装,里面有适合各种系统平台的程序包,如 windows 平台的程序包在文件夹… \phylobayes3.3b\exe_win 中。程序包中有11不同的程序,功能有所不同,其中pb.exe是主要的马尔科夫蒙地卡罗(MCMC)抽样程序。 输入格式为 .phy 格式 如何开始建树 将下面的代码复制到纯文本文件中保存为 bat 文件“ bear.bat ” pb -d sequence.phy -nchain 2 100 0.3 50 rnapo4 其中, sequence.phy 为比对好的氨基酸序列, rnapo4 为输出文件名 sequence.phy 、 bear.bat 和 pb.exe 放同一文件夹,双击 bear.bat 及开始运算。结果中“ rnapo4.con.tre ”就是最终树文件,带有支持率。
个人分类: 我的研究|17465 次阅读|14 个评论
使用phyloxml修饰系统发育树
Bearjazz 2011-12-16 11:19
使用 phyloxml 修饰系统发育树 熊荣川 中国科学院成都生物研究所 xiongrongchuan@126.com 系统发育树在许多生物学研究中具有重要的作用,在这些研究中,节点和分支和各种各样的生物学特征密切相关。我们常常需要把这些特征标注到系统发育树上,例如不同方法提供的节点支持率。现在很多交互式的编程语言提供了这种功能,如 phyloxml 。下面就如何使用 phyloxml 在系统发育树上标注节点多重支持率做一个简单介绍。 为了图文并貌,请下载pdf文件观看 使用phyloxml修饰系统发育树.pdf
个人分类: 我的研究|4635 次阅读|0 个评论
用RAxML构建系统发育树并计算节点支持率
热度 2 Bearjazz 2011-12-12 16:57
用 RAxML 构建系统发育树并计算节点支持率 熊荣川 中国科学院成都生物研究所 xiongrongchuan@126.com 刘国华 中国农业科学院兰州兽医研究所 RAxML 是用极大似然法建立进化树的软件之一,可以处理超大规模的序列数据,包括上千至上万个物种,几百至上万个已经比对好的碱基序列。作者是德国慕尼黑大学的 A.Stamatak 博士。 关于如何开始用 RAxML 构建系统发育树之前已有博文提及“ 最大似然法建立进化树的软件之一 RAxML ” http://bbs.sciencenet.cn/home.php?mod=spaceuid=508298do=blogid=467160 该博文为转载,内容翔实但没有明确如何构建带有节点支持率的系统发育树 笔者总结 bat 文件指令如下 raxmlHPC -f a -s sequence.phy -n boot2 -m GTRGAMMA -x 1234 -# 50 -n outname.trees 将以上指令复制到 txt 文件中,另存为 bat 格式,和 phy 格式的序列文件 sequence.phy 一起保存于 RAxML 程序所在的文件夹中,点击运行 bat 文件及开始运行。outname.trees表示所有输出的后缀名。以“.trees”结尾便于结果的查看。 -m GTRGAMMA 表示使用 GTRGAMMA 模型 -# 50 表示 bootstrap 50 次 生成文件中 RAxML_bipartitions.boot2 即位带节点支持率的系统发育树,可以把它改成 trees 格式即可用 treeview 等软件查看该系统发育树。 以上为适用 DNA 序列的指令 如果是氨基酸序列, bat 文件指令如下 raxmlHPC -f a -s sequence.phy -n boot2 -m PROTCATJTT -x 1234 -# 50 -m PROTCATJTT 为氨基酸替换模型 -# 50 表示 bootstrap 50 次 生成文件中 RAxML_bipartitions.boot2 即位带节点支持率的系统发育树,可以把它改成 trees 格式即可用 treeview 等软件查看该系统发育树。 另外,鉴于手工输入各种命令较为繁杂,且容易出错,笔者推荐一个服务器地址 http://phylobench.vital-it.ch/raxml-bb/index.php 可以方便的使用 RAxML 构建系统发育树。 附连续无间断构建两棵系统发育树 raxmlHPC -f a -s sequence1.phy -n boot2 -m GTRGAMMA -x 1234 -# 50 -n outname2.trees raxmlHPC -f a -s sequence2.phy -n boot2 -m GTRGAMMA -x 1234 -# 50 -n outname2.trees
个人分类: 我的研究|16675 次阅读|4 个评论
[转载]使用编码基因和非编码基因重建系统发育树的基本方法
Bearjazz 2011-12-6 10:05
使用编码基因和非编码基因重建系统发育树的基本方法 以线粒体基因组为例 All sequences from the L-strand – encoded genes (ND6 and 8 tRNA genes) were converted into complementary strand sequences. We dealt with the protein-coding gene sequences as follows to construct 3 different data sets (all including rRNA and tRNA gene sequences): (1) all positions included (designated as 123 n RT n ; subscript ‘ n ’ denotes nucleotides). (2) third codon positions converted into purine (R) and pyrimidine (Y) (RY-coding; designated as 12 n 3 r RT n ; subscript ‘ r ’ denotes RY-coding; Phillips and Penny 2003; Harrison et al. 2004). (3) third codon positions excluded (designated as 12 n RT n ). 参考文献 ( Saitoh et al., 2006 ) Saitoh K., Sado T., Mayden RL, Hanzawa N., Nakamura K., Nishida M., Miya M. 2006. Mitogenomic evolution and interrelationships of the Cypriniformes (Actinopterygii: Ostariophysi): The first evidence toward resolution of higher-level relationships of the world’s largest freshwater fish clade based on 59 whole mitogenome sequences. Journal of Molecular Evolution, 63: 826-841.
个人分类: 我的研究|2341 次阅读|0 个评论
使用PhyML构建系统发育树
Bearjazz 2011-7-17 17:05
使用 PhyML 构建系统发育树 熊荣川 六盘水师范学院生物系 xiongrongchuan@126.com 序列经比对后转化为 phy 格式(可以使用软件 clustalx )。这里我们使用一个现成的序列文件来自 jModetest 软件包中的 example.phy (D:\download\Bio tools softwares\jmodeltest0.1\jModelTest 0.1 package\examples) 复制文件 example.phy 到 PhyML 程序所在的文件夹中 D:\download\Bio tools softwares\PhyML_3.0 使用PhyML构建系统发育树.pdf
个人分类: 我的研究|18266 次阅读|0 个评论
如何拼接12Sr rRNA、16S rRNA序列进行系统发育树构建
热度 1 Bearjazz 2011-5-4 11:22
如何拼接 12Sr rRNA 、 16S rRNA 序列进行系统发育树构建 熊荣川 分子系统学经常使用 12Sr rRNA 、 16S rRNA 进行物种系统发育树的构建,分别使用任何一个,信息量都显得较小。因此,在两序列的具有的情况下,最好将两序列拼接然后进行系统发育树构建。 通常, 12Sr rRNA 、 16S rRNA 在线粒体上位置较为接近,但却并非首尾相连,中间隔着一些转运 RNA 基因,加之基因重排因素,导致这些间断序列有较大的差异,尤其是在大尺度的系统发育分析案例中。因此较为科学的方法是,对 12Sr rRNA 、 16S rRNA 分别比对,将比对后的序列进行拼接。拼接方法如下(前提条件是两组序列的物种组成一致) 将 12S 、 16S 序列分别导入 BioEdit ( ) ,使用同样的方法进行序列排序(序列 - 分类 - 按标题),保存序列。 图 1 使用 meg4.0 打开 16S ,在序列第一行顶上第一格点选(图 2 A ),从而选中第一列,按住 shift 键选择最后一列,复制。 A 图 2 然后使用 meg4.0 打开 12S ,在序列第一行最后一个无碱基空白处单击鼠标(图 3 B ),粘贴,拼接就完成了。 B 图 3 由于博客排版问题请下载pdf版本阅读 如何拼接12Sr rRNA、16S rRNA序列进行系统发育树构建.pdf
个人分类: 我的研究|9310 次阅读|2 个评论
系统发育树构建软件Mega5支持最大似然法(Maximum likelihood)算法了
热度 5 陈文峰 2010-5-28 11:22
今天本来在试用PHYML中的最大似然法来构建系统发育树,后来与人交流,他要对一些序列进行比对,我推荐他用Mega软件,就让它从网上下载,他下载后,我发现Mega4已升级到5.0版本了。再一看,发现它居然支持最大似然法来构建系统发育树了,而以前的4.0版是不支持的。我赶紧自己也下载了一个,安装运行后,发现确实能用。不过美中不足的是,在该软件的主界面上有一个提示,说:This is a beta test release. Please do not use results generated in publications。哎,不管怎么说,以前大家都用装在苹果机上的PAUP中的ML法来构建系统发育树,而操作起来十分困难,现在好了,有MEGA5了。我试着用自己的16S序列数据,用ML法建了个树,发现所需时间不是很长,我在写帖子的时候,运行了17分钟了,完成了69%的任务。看来速度不会象苹果机上运行PAUP那么长的时间了。喜欢尝鲜的人赶紧下载下来试试。 除了这个ML法的大改进外,Mega5还有其它方面的改进,看起来和使用起来都比以前的mega4要好用。期待正式版的早日诞生! Mega5的下载地址为: http://www.megasoftware.net/beta/index.php ,需要填上姓名和email地址,然后从email中确认一下即可以下载了。
个人分类: 根瘤菌进化、发育与系统学|27556 次阅读|16 个评论
5A级男人系统发育树
peinancai 2010-4-13 16:57
在新版5A级男人系统发育树中,看看你身居何位。 解读:在钱,权,体力,脑力和想象力五种资源,如果你不幸有一种没有,那么你就得到一个A,以此类推; 反正,咋现在还是4A-5A的过度状态呢,哈哈。 你呢?跟大伙一起分享分享 PS:纯属娱乐,千万莫对号入座,也绝无取笑之意。
个人分类: 小小心得|4015 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-12 13:13

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部