科学网

 找回密码
  注册

tag 标签: 系统发育树

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

R语言去掉系统发育树的特定类群tip
Bearjazz 2014-5-2 19:48
R 语言去掉系统发育树的特定类群 tip # 作者信息 熊荣川 六盘水师范学院生物信息学实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz 生物信息学上构建系统发育树通常分析多个类群的关系。而当辛辛苦苦把系统发育树建好之后,我们往往在特定的研究中想知道去掉某些特定的类群( Tip )之后,系统发育树会发生什么样的变化。下面是 R 语言 ape 包中的一个简单例子 library(ape) intree = exampleTree2.nwk Otr - read.tree(intree) # 读入系统发育树 plot(Otr,show.node.label = T,use.edge.length = F) Otr = drop.tip(Otr,sp5) # 去掉 sp5 plot(Otr,show.node.label = T,use.edge.length = F)
个人分类: 我的研究|6447 次阅读|0 个评论
R语言设定系统发育树外群
Bearjazz 2014-5-2 16:49
R 语言设定系统发育树外群 # 作者信息 熊荣川 六盘水师范学院生物信息学实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz 生物信息学上构建系统发育树通常需要使用外群以确定“进化方向”或是给系统发育树定个根。下面是 R 语言 ape 包中一个简单的例子 library(ape) intree = exampleTree2.nwk Otr - read.tree(intree) # 读入系统发育树 plot(Otr,show.node.label = T,use.edge.length = F) plot(root(Otr, sp1)) # 设定 sp1 为外群
个人分类: 我的研究|7339 次阅读|0 个评论
R语言设置系统发育树节点支持率的位置
Bearjazz 2014-5-2 16:32
R 语言设置系统发育树节点支持率的位置 # 作者信息 熊荣川 六盘水师范学院生物信息学实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz 生物信息学上构建系统发育树的方法有很多,如邻接法、最大简约法、最大似然法、贝叶斯法等等。在相当多的案例里面,针对同一个数据集而使用不同方法构建的系统发育树的拓扑结构通常大致一致。于是在发表结果时,为了节约篇幅或是更直观的对比不同方法得到的支持率差异,常常只展现某一个方法构建的系统树,而在节点处同时列出各种方法得到的支持率。其中一种方法就是,将不同的支持率展现在节点(或支 branch )的不同位置,下面是来自 R 语言 ape 包的例子。 intree = exampleTree.nwk Otr - read.tree(intree) # 读入系统发育树 plot(Otr,show.node.label = T,use.edge.length = F) bs.pars = c(NA,72,86,91) nodelabels(bs.pars, adj = c(-0.2, -0.1), frame = n, + cex = 0.8, font = 2) # 标在后 bs.nj = c(NA,81,87,91) nodelabels(bs.nj, adj = c(1.2, -0.5), frame = n, + cex = 0.8, font = 3) # 标在上 bs.ml = c(NA,77,86,90) nodelabels(bs.ml, adj = c(1.2, 1.5), frame = n, cex = 0.8) # 标在下
个人分类: 我的研究|6349 次阅读|0 个评论
在R语言中使用遗传距离矩阵构建简单的系统发育树
热度 2 Bearjazz 2013-9-11 20:56
熊荣川 xiong rongchuan 六盘水师范学院生物信息学实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz 一般的遗传距离矩阵如下图 对这样的矩阵稍作修改,删除标题行列,保存为“Fst.csv” library(ape) #需要用到ape程序包 M2 = read.csv(Fst.csv,head = F) #输入表格 dimnames(M2) - list(1:8, 1:8) #为表格设置行列名称 M2-as.matrix(M2) #将表格转化成矩阵格式 tr2 - bionj(M2) #构建NJ树 pl树ot(tr2, u) #输出系统发育
个人分类: 我的研究|18966 次阅读|4 个评论
Raxml 可视化软件raxmlGUI
热度 1 Bearjazz 2013-4-16 10:34
熊荣川 xiong rongchuan 六盘水师范学院生物信息学实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz Raxml在处理大数据,构建基于ML方法的发育树方面具有快速准确的有点。然而繁琐的命令总让人头痛。Silvestro, D. and I. Michalak (2012). 开发的可视化软件成功的解决了这一难题。 在官网上下载程序包,解压后可以双击“raxmlGUI.py”直接使用。 有两点值得注意: 1、你的系统必须安装有 Python, 而且不支持phthon 3.0以上的版本,我下载使用2.6.6版本亲测可用。 http://www.python.org/download/releases/2.6.6/ 2、比对好的序列文件须是phy格式,且放在非中文路径上。 3、可用clustalX把fasta格式文件转换为phy格式文件。 4、加载的序列存在路劲上不能有中文。 5、phython和raxmlgui必须安装在同一路径下。
个人分类: 我的研究|14522 次阅读|1 个评论
在R语言中有选择性地显示系统发育树的节点支持率
Bearjazz 2013-3-23 15:01
在 R 语言中有选择性地显示系统发育树的节点支持率 熊荣川 xiongrongchuan 六盘水师范学院生物信息学实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz 使用生物信息学构建的系统发育树通常应用节点支持率来讨论一定的生物学问题,然而支持率太低,其生物学意义就不到了。所以很多科学文献中通常会有选择性的在系统发育树上显示节点支持率——显示较高的,省去较低的。许多软件里面通常有这样的功能,如 mega5 之类,下面讲讲如何在 R 语言中如何实现 library(ape) Otr-read.tree(chou.nwk)# 读入系统发育树 plot(Otr,show.node.label=T)# 输出系统发育树,并显示节点信息 # 如上图,我们希望小于 0.5 的节点支持率不被显示 Otr$node.label# 查看中间节点信息 1.00000.41101.00000.7520 index=Otr$node.label0.5# 找到支持率小于 0.5 的节点位置 Otr$node.label =# 节点支持率小于 0.5 ,则直接复制为空 plot(Otr,show.node.label=T)# 输出系统发育树,并显示重新配置后的节点信息
个人分类: 我的研究|5926 次阅读|0 个评论
R语言中提取系统发育树的各种信息
Bearjazz 2013-3-23 14:42
R 语言中提取系统发育树的各种信息 熊荣川 xiongrongchuan 六盘水师范学院生物信息学实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz library(ape) Otr-read.tree(chou.nwk)# 读入系统发育树 plot(Otr,show.node.label=T)# 输出系统发育树,并显示节点信息 Otr$tip.label# 末梢信息 DQ650503DQ650501DQ650500DQ650545DQ650547DQ650546 Otr$edge# 支系节点信息 78 89 91 92 83 710 104 1011 115 116 Otr$edge.length# 支长 0.076593150.000000000.001899570.000000000.000000000.07660045 0.000000000.000946960.000945320.00094532 Otr$node.label# 中间节点信息 1.00000.41101.00000.7520 Otr$root.edge# 根部支系长度,这里是无根树,所以结果 NULL NULL
个人分类: 我的研究|9324 次阅读|0 个评论
R语言中系统发育树方向的设置、更改
Bearjazz 2013-3-20 09:18
R 语言中系统发育树方向的设置、更改 熊荣川 xiongrongchuan 六盘水师范学院生物信息学实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz 通常的系统发育树方向是朝右的,即根在左,末梢在右。在 R 语言中可以进行方向的修改。 library(ape) tr-read.tree(text=((a:1,b:1):1,(c:1,d:1):1);)# 直接在屏幕上输入树文件 plot(tr,direction=rightwards)# 朝右,这也是默认的方向 plot(tr,direction=leftwards)# 朝左 plot(tr,direction=upwards)# 朝上 plot(tr,direction=downwards)# 朝下 就这么简单,祝您科研愉快!
个人分类: 我的研究|5588 次阅读|0 个评论
R语言中系统发育树的输出类型
Bearjazz 2013-3-19 16:10
R 语言中系统发育树的输出类型 熊荣川 xiongrongchuan 六盘水师范学院生物信息学实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz library(ape) tr-read.tree(text=((a:1,b:1):1,(c:1,d:1):1);)# 直接在屏幕上输入树文件 plot(tr,type=p)#phylogram 类型,也是默认类型 plot(tr,type=c)#cladogram 类型 plot(tr,type=u)#unrooted 类型 plot(tr,type=r)#radial 类型 plot(tr,type=f)#fan 类型 注意,本文中类型用了手写小字母作为简称,也可以使用全称 如 plot(tr,type=fan)#fan 类型
个人分类: 我的研究|6054 次阅读|0 个评论
R语言中系统发育树的输入输出
热度 4 Bearjazz 2013-3-18 14:07
R语言中系统发育树的输入输出
R 语言中系统发育树的输入输出 熊荣川 xiong rongchuan 六盘水师范学院生物信息学实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz R 语言可用于系统发育与进化分析,其中一个基本的操作就是系统发育树输入与输出。 下面是一个实例,示范如何用 R 语言进行系统发育树的输入与输出。 提示:在进行以下操作之前需要安装 ape 包。 实例一 直接在屏幕上输入树文件 library(ape) tr - read.tree(text = ((a:1,b:1):1,(c:1,d:1):1);) # 直接在屏幕上输入树文件 write.tree(tr,file = tr.nwk) # 输出系统树,可以使用 mega 查看 plot(tr) # 输出树图,效果如下图 实例二 从硬盘读入树文件 tr1 -read.tree(tr.nwk) # 读入树文件 plot(tr1) # 输出树图,效果如上图 如果是nexus格式的系统发育树,使用read.nexus()读入,使用write.nexus()
个人分类: 我的研究|20565 次阅读|8 个评论
系统发育树节点名字批量替换
Bearjazz 2012-5-10 10:50
提供系统发育树节点名字批量替换服务(免费) 熊荣川 六盘水师范学院生物信息学实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz 通常我们在构建系统发育树时,除了自己通过测序得到的序列外,常常需要在 genbank 中下载同源序列进行补充、比较分析。但是下载下来的序列名称特别长,无论是查看和后续分析都不是很方便(例如以下的序列名称)。 gi|380854473|gb|JN227420.1| Rana palustris voucher YPM A9399 12S ribosomal RNA gene, partial sequence; tRNA-Val gene, complete sequence; and 16S ribosomal RNA gene, partial sequence; mitochondrial GGGAATTACGAGCAATGCTTAAAACCCAAAGGATTTGACGGTGTC …… 另外,一些序列格式对序列名称的长度也作了限制要求,如 phy 格式要求序列名称须少于 10 个字符。 通常我们实验室会通过一个 Excel 表格建立一列简短名称和原来的冗长的名称一一对应,迅速的跳过名称的纠结进入后续的分析阶段。 然后问题是,系统发育树建立后,结果理想的话,我们通常要把这些简称替换成全称,如拉丁学名。你可能会说使用一些文件的替换功能能把它们替换过来,然后对于数据量越来越大的生物信息学时代,这未免让人有所不甘心。最近我们实验室写了一段程序代码,可以批量的进行树文件中序列名称的批量替换,由于代码写作不易加上尚未封装,所以不便分享。如果有相关需要的朋友可以把相关树文件及新旧名录发到我们的邮箱,我们提供免费的替换帮助。 提交文件主要有两个,首先是一个树文件,只要能用记事本打开就 Ok ,如常见的 newic k 格式( .nwk ) 另一个就是 excel 表格,表格包含两行数据,第一列为旧名字,第二列为新名字(如下图)。 提供系统发育树节点名字批量替换服务.pdf 祝您科研愉快!
个人分类: 我的研究|4799 次阅读|0 个评论
如何使用PhyloBayes快速构建系统发育树
热度 7 Bearjazz 2012-5-6 10:43
如何使用 PhyloBayes 快速构建系统发育树 熊荣川 六盘水师范学院生物信息学实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz PhyloBayes 算是贝叶斯方法软件的后起之秀,替代模型更为丰富,主要用于基于氨基酸序列的系统发育树构建。 下载地址 www.phylobayes.org 下载之后,解压即可,不需安装,里面有适合各种系统平台的程序包,如 windows 平台的程序包在文件夹… \phylobayes3.3b\exe_win 中。程序包中有11不同的程序,功能有所不同,其中pb.exe是主要的马尔科夫蒙地卡罗(MCMC)抽样程序。 输入格式为 .phy 格式 如何开始建树 将下面的代码复制到纯文本文件中保存为 bat 文件“ bear.bat ” pb -d sequence.phy -nchain 2 100 0.3 50 rnapo4 其中, sequence.phy 为比对好的氨基酸序列, rnapo4 为输出文件名 sequence.phy 、 bear.bat 和 pb.exe 放同一文件夹,双击 bear.bat 及开始运算。结果中“ rnapo4.con.tre ”就是最终树文件,带有支持率。
个人分类: 我的研究|17406 次阅读|14 个评论
使用phyloxml修饰系统发育树
Bearjazz 2011-12-16 11:19
使用 phyloxml 修饰系统发育树 熊荣川 中国科学院成都生物研究所 xiongrongchuan@126.com 系统发育树在许多生物学研究中具有重要的作用,在这些研究中,节点和分支和各种各样的生物学特征密切相关。我们常常需要把这些特征标注到系统发育树上,例如不同方法提供的节点支持率。现在很多交互式的编程语言提供了这种功能,如 phyloxml 。下面就如何使用 phyloxml 在系统发育树上标注节点多重支持率做一个简单介绍。 为了图文并貌,请下载pdf文件观看 使用phyloxml修饰系统发育树.pdf
个人分类: 我的研究|4610 次阅读|0 个评论
用RAxML构建系统发育树并计算节点支持率
热度 2 Bearjazz 2011-12-12 16:57
用 RAxML 构建系统发育树并计算节点支持率 熊荣川 中国科学院成都生物研究所 xiongrongchuan@126.com 刘国华 中国农业科学院兰州兽医研究所 RAxML 是用极大似然法建立进化树的软件之一,可以处理超大规模的序列数据,包括上千至上万个物种,几百至上万个已经比对好的碱基序列。作者是德国慕尼黑大学的 A.Stamatak 博士。 关于如何开始用 RAxML 构建系统发育树之前已有博文提及“ 最大似然法建立进化树的软件之一 RAxML ” http://bbs.sciencenet.cn/home.php?mod=spaceuid=508298do=blogid=467160 该博文为转载,内容翔实但没有明确如何构建带有节点支持率的系统发育树 笔者总结 bat 文件指令如下 raxmlHPC -f a -s sequence.phy -n boot2 -m GTRGAMMA -x 1234 -# 50 -n outname.trees 将以上指令复制到 txt 文件中,另存为 bat 格式,和 phy 格式的序列文件 sequence.phy 一起保存于 RAxML 程序所在的文件夹中,点击运行 bat 文件及开始运行。outname.trees表示所有输出的后缀名。以“.trees”结尾便于结果的查看。 -m GTRGAMMA 表示使用 GTRGAMMA 模型 -# 50 表示 bootstrap 50 次 生成文件中 RAxML_bipartitions.boot2 即位带节点支持率的系统发育树,可以把它改成 trees 格式即可用 treeview 等软件查看该系统发育树。 以上为适用 DNA 序列的指令 如果是氨基酸序列, bat 文件指令如下 raxmlHPC -f a -s sequence.phy -n boot2 -m PROTCATJTT -x 1234 -# 50 -m PROTCATJTT 为氨基酸替换模型 -# 50 表示 bootstrap 50 次 生成文件中 RAxML_bipartitions.boot2 即位带节点支持率的系统发育树,可以把它改成 trees 格式即可用 treeview 等软件查看该系统发育树。 另外,鉴于手工输入各种命令较为繁杂,且容易出错,笔者推荐一个服务器地址 http://phylobench.vital-it.ch/raxml-bb/index.php 可以方便的使用 RAxML 构建系统发育树。 附连续无间断构建两棵系统发育树 raxmlHPC -f a -s sequence1.phy -n boot2 -m GTRGAMMA -x 1234 -# 50 -n outname2.trees raxmlHPC -f a -s sequence2.phy -n boot2 -m GTRGAMMA -x 1234 -# 50 -n outname2.trees
个人分类: 我的研究|16624 次阅读|4 个评论
[转载]使用编码基因和非编码基因重建系统发育树的基本方法
Bearjazz 2011-12-6 10:05
使用编码基因和非编码基因重建系统发育树的基本方法 以线粒体基因组为例 All sequences from the L-strand – encoded genes (ND6 and 8 tRNA genes) were converted into complementary strand sequences. We dealt with the protein-coding gene sequences as follows to construct 3 different data sets (all including rRNA and tRNA gene sequences): (1) all positions included (designated as 123 n RT n ; subscript ‘ n ’ denotes nucleotides). (2) third codon positions converted into purine (R) and pyrimidine (Y) (RY-coding; designated as 12 n 3 r RT n ; subscript ‘ r ’ denotes RY-coding; Phillips and Penny 2003; Harrison et al. 2004). (3) third codon positions excluded (designated as 12 n RT n ). 参考文献 ( Saitoh et al., 2006 ) Saitoh K., Sado T., Mayden RL, Hanzawa N., Nakamura K., Nishida M., Miya M. 2006. Mitogenomic evolution and interrelationships of the Cypriniformes (Actinopterygii: Ostariophysi): The first evidence toward resolution of higher-level relationships of the world’s largest freshwater fish clade based on 59 whole mitogenome sequences. Journal of Molecular Evolution, 63: 826-841.
个人分类: 我的研究|2341 次阅读|0 个评论
使用PhyML构建系统发育树
Bearjazz 2011-7-17 17:05
使用 PhyML 构建系统发育树 熊荣川 六盘水师范学院生物系 xiongrongchuan@126.com 序列经比对后转化为 phy 格式(可以使用软件 clustalx )。这里我们使用一个现成的序列文件来自 jModetest 软件包中的 example.phy (D:\download\Bio tools softwares\jmodeltest0.1\jModelTest 0.1 package\examples) 复制文件 example.phy 到 PhyML 程序所在的文件夹中 D:\download\Bio tools softwares\PhyML_3.0 使用PhyML构建系统发育树.pdf
个人分类: 我的研究|18222 次阅读|0 个评论
如何拼接12Sr rRNA、16S rRNA序列进行系统发育树构建
热度 1 Bearjazz 2011-5-4 11:22
如何拼接 12Sr rRNA 、 16S rRNA 序列进行系统发育树构建 熊荣川 分子系统学经常使用 12Sr rRNA 、 16S rRNA 进行物种系统发育树的构建,分别使用任何一个,信息量都显得较小。因此,在两序列的具有的情况下,最好将两序列拼接然后进行系统发育树构建。 通常, 12Sr rRNA 、 16S rRNA 在线粒体上位置较为接近,但却并非首尾相连,中间隔着一些转运 RNA 基因,加之基因重排因素,导致这些间断序列有较大的差异,尤其是在大尺度的系统发育分析案例中。因此较为科学的方法是,对 12Sr rRNA 、 16S rRNA 分别比对,将比对后的序列进行拼接。拼接方法如下(前提条件是两组序列的物种组成一致) 将 12S 、 16S 序列分别导入 BioEdit ( ) ,使用同样的方法进行序列排序(序列 - 分类 - 按标题),保存序列。 图 1 使用 meg4.0 打开 16S ,在序列第一行顶上第一格点选(图 2 A ),从而选中第一列,按住 shift 键选择最后一列,复制。 A 图 2 然后使用 meg4.0 打开 12S ,在序列第一行最后一个无碱基空白处单击鼠标(图 3 B ),粘贴,拼接就完成了。 B 图 3 由于博客排版问题请下载pdf版本阅读 如何拼接12Sr rRNA、16S rRNA序列进行系统发育树构建.pdf
个人分类: 我的研究|9278 次阅读|2 个评论
系统发育树构建软件Mega5支持最大似然法(Maximum likelihood)算法了
热度 5 陈文峰 2010-5-28 11:22
今天本来在试用PHYML中的最大似然法来构建系统发育树,后来与人交流,他要对一些序列进行比对,我推荐他用Mega软件,就让它从网上下载,他下载后,我发现Mega4已升级到5.0版本了。再一看,发现它居然支持最大似然法来构建系统发育树了,而以前的4.0版是不支持的。我赶紧自己也下载了一个,安装运行后,发现确实能用。不过美中不足的是,在该软件的主界面上有一个提示,说:This is a beta test release. Please do not use results generated in publications。哎,不管怎么说,以前大家都用装在苹果机上的PAUP中的ML法来构建系统发育树,而操作起来十分困难,现在好了,有MEGA5了。我试着用自己的16S序列数据,用ML法建了个树,发现所需时间不是很长,我在写帖子的时候,运行了17分钟了,完成了69%的任务。看来速度不会象苹果机上运行PAUP那么长的时间了。喜欢尝鲜的人赶紧下载下来试试。 除了这个ML法的大改进外,Mega5还有其它方面的改进,看起来和使用起来都比以前的mega4要好用。期待正式版的早日诞生! Mega5的下载地址为: http://www.megasoftware.net/beta/index.php ,需要填上姓名和email地址,然后从email中确认一下即可以下载了。
个人分类: 根瘤菌进化、发育与系统学|27507 次阅读|16 个评论
5A级男人系统发育树
peinancai 2010-4-13 16:57
在新版5A级男人系统发育树中,看看你身居何位。 解读:在钱,权,体力,脑力和想象力五种资源,如果你不幸有一种没有,那么你就得到一个A,以此类推; 反正,咋现在还是4A-5A的过度状态呢,哈哈。 你呢?跟大伙一起分享分享 PS:纯属娱乐,千万莫对号入座,也绝无取笑之意。
个人分类: 小小心得|4000 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-28 11:34

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部