科学网

 找回密码
  注册

tag 标签: EasyCodeML

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

EasyCodeML 使用指南
热度 2 raindyok 2016-5-3 17:44
一. EasyCodeML 的主要功能有哪些? (1)预置模式让用户彻底告别原CodeML晦涩高深的操作,只是轻松点击即可完成,尤其适合新手使用; (2)自定义模式让用户根据需要随时调整或修改相关参数,适合于CodeML老手使用; (3)可视化标记树的分支,所见即所得,具有高效、准确等特点,还可以避免由手动修改造成误标问题; (4)自动完成LRT分析,让用户省去繁琐处理过程,生成的结果还可以直接导出Excel文档,可直接用于发表; (5)支持文件或文件夹拖曳功能,工作目录、序列文件和树文件,可以直接拖入对应的输入框内; (6)支持多线程操作,主要应用于Site model, 多线程运行可以 充分利用计算机资源; (7)支持跨平台功能,可以运行于Windows、Mac OS和Linux三大操作系统。 二、EasyCodeML工作流 : (1) 数据准备 :PAML格式的多重比对序列和Newick格式的树文件;除了Site model外,其他模型还需要标记兴趣的分支,可以先行用第三方软件标记,也可以用EasyCodeML的 Label 功能进行可视化标记。 (2) 模式选择 :支持Preset 和Custom模式可供用户选择,前者内置四种模型,包括Branch model、Branch-site model、Site model和Clade model,每个模型至少都有一组成对模型:零假设模型(Null model )和备选假设模型(Alternative model),其中Site model还内置三组成对模型(M0 vs. M3,M1a vs. M2a, M7 vs. M8);后者类似PamlX功能,单一模型运行,主要便于提供用户自定义修改相关参数。 (3) 保存配置 :保存设置参数后,即可按下Run CodeML按钮自动开始分析。 (4) LRT分析: 在Preset 模式下,当成对模型运算结束后,EasyCodeML自动LRT分析,并将结果直接呈现出来;在Custom模式下,运行结束后,用户可以点击菜单栏“Tools”下的“LRT Calculator”,分别输入对应选项的数值进行LRT分析。 (5) 结果输出 :Preset 模式下的LRT结果,可以主要参数及数值导出到Excel,便于用户整理; 三、问题答疑 : 1. EasyCodeML 对系统有哪些要求? 答: EasyCodeML是由Java编译的, 该软件同时支持Mac OS和Linux系统,已经预编译好对应操作系统的版本,不需要用户进行复杂的编译操作,只需点击EasyCodeML.jar,系统后台自动完成对应操作系统版本的替换后即可使用。 为保证该程序的所有功能正常使用,系统中的JAVA必须要求 1.8 或更高版本。可以通过命令行查看系统Java版,如下图所示: 2. Preset 模式很方便,但预置的参数还能修改么? 答:虽然EasyCodeML预置了参数,但还是 可以修改,在该模式下选择四个模型之一后,比如:SM, 可以通过用菜单栏上的“Control File Editor”工具载入、修改并保存EasyCodeML/Preset/SM/下M0、M1a等6个子目录内的codml.ctl文件,此时返回主界面,点击Run CodelML按钮即可… Raindy 注:此法永久性修改预置模式参数,需慎重!!! 3. 如何使用EasyCodeML 可视化标记分支? 答:载入Newick格式的树文件后,点击“Label”按钮,自动弹出操作窗口,Branch model和Branch-site model直接选择一个分支后,该分支将红色显示,并自动标记上#1符号,点击“Finished”返回即可;Clade model下,选择一个分支后, 该分支及其子分支也以红色显示,并自动标记上$1符号,Clade model最多支持标记五个Clade,并以$1,$2,...$5顺序标记。 4. 如何使用EasyCodeML进行LRT分析 ? 答: (1) 自动方式 :预置模式下,EasyCodeML在CodeML分析结束后,自动进行LRT分析,在主界面显示LRT结果;用户还可以通过前一次保存的结果,只需要先选择之前保存的工作目录,然后 通过预置模式下的“Run LRT ”即可查看结果, 如下图所示: (2) 手动方式 :由自定义模式或原始CodeML运算的结果,也可以借助EasyCodeML的菜单栏上的“LRT Calculator”进行分析,只需要输入相关的参数,如两个成对模型的Ln和df值,然后点击“Run”即可查看结果,如下图所示: 5. 正式文章如何引用EasyCodeML ? 答:由于手稿正在准备,如果您发表文章引用我们的EasyCodeML,我们建议这样引用文献: Gao F and Chen J, 2016. EasyCodeML: an interactive visual tool for CodeML analysis. 还有问题等您的反馈...
个人分类: 软件教程|26208 次阅读|6 个评论
正选择分析之 Branch site model 篇(By Raindy)
热度 2 raindyok 2015-9-23 10:01
絮语:    关于 CodeML中的几种模型, 这里就不科普了, 推荐研读2015 年 Nature Reviews Genetics 的 这篇综述:    Sironi M, Cagliani R, Forni D, Clerici M. Evolutionary insights into host-pathogen interactions from mammalian sequence data. Nature Reviews Genetics, 2015, 16: 224-236.   当然也可以参阅这篇日志:PAML FAQ ( http://user.qzone.qq.com/58001704/blog/1434533530 )    本例示范操作如何应用我们开发的EasyCodeML软件进行Branch site model 分析 准备工作 : (1)计算机环境: Java 运行环境(JRE) (2)相关 工具 :EasyCodeML 、 谷歌浏览器Chrome、DAMBE (3)必备文件 :比对文件(基于密码子比对,并删除终止密码子)、树文件(Newick格式,可以用Figtree导入导出进行格式化) 操作流程:    1. 将比对后的序列进行转化,通过DAMBE打开,选择序列类型为编码蛋白质的核苷酸序列,如下图所示: 识别序列后,返回菜单栏选择“Sava or Convert Sequence Format”, 如下图所示: 文件类型选择为PAML,扩展为PML(如下图所示),保存后将扩展名改为nuc(当然这个非必须,不改也可以的)。 2. 标记前景枝    打开EasyCodeML,分别定义工作目录(即:程序在哪个文件夹中运行)、选择已比对的序列文件(即:前一步得到的比对文件)、选择树文件。    如果前景枝已经标记, 可以忽略下面这一步。    本示例数据的树文件未标记前景枝,这里演示一下如何用EasyCodeML可视化标记前景枝。    选择Newick的树文件后,点击“Label”标签(下图),程序会调用Chrome等插件来操作。 在待分析的分支上,点击一下,出现红色时,即表明前景枝已选定,此时只需要点击上方的“Finished”按钮完成前景枝标记。    Raindy注:可视化标记是我们这款EasyCodeML的亮点之一。 完成后前景枝标记后,返回程序时,树文件已自动变更为标记好的Tree文件。    此时可以开始后续操作,这里先选择Branch site model,然后“Save Current Profile”保存界面参数设置,最后“Run CodeML”分析,如下图所示: 在运行Codeml分析,程序会提示是否自动开始,“确定“之后就是细心的等待.... 3. 似然率检验(LRTs)    程序运行的时间取决于所分析的数据和计算机硬件配置。当完成后,会弹出完成的提示框。 ”确定“后,程序自动将LRTs结果显示在主界面上,这里主要看P值,必须低于0.05,如下图所示: 4.结果整理    当然,在LRT的P值显著情况下,您可以选择将运算结果以Excel 电子表格的形式呈现,相关参数直观显示在表格中。表格数据只需要简单整理即可用于发表用。 本示例结果显示,定义的前景枝中第100位氨基酸位点受到显著的正选择作用(后验概率PPs大于0.95)。 下图为部分SCI 文章的结果表格(红色虚线框内),详见原文: Lan T, Wang X R, Zeng Q Y. Structural and functional evolution of positively selected sites in pine glutathione S-transferase enzyme family. J Biol Chem, 2013, 288: 24441-24451 . 注意事项: 为什么找到的正选择位点在原始比对序列中找不到? 答:最主要原因可能是比对序列中带有gap,codeml默认忽略gap所带的一列数据 ,从而导致位置发生偏移。因此, 分析前最好将带gap的同一列序列全部 手工删除,找到正选择位点的氨基酸位置后,再还原对应到原始比对序列上。
个人分类: 软件教程|28860 次阅读|2 个评论
EasyCodeML开放测试,欢迎试用!
热度 1 raindyok 2015-7-7 19:53
******************************************************************* EasyCodeML: an interactive visual tool for CodeML analysis *******************************************************************   对于基因或基因组的进化分析,特别是正选择的检测以及不同分支的选择约束,PAML是最常用的工具包,而CodeML是其中最核心的一个程序,但晦涩的参数设置,着实让不少初学者望而却步。    我们新开发的EasyCodeML让新手也可以进行CodeML分析,只需要输入比对好的序列文件和对应的树文件即可运行。    程序提供两种模式供用户选择:   (1)预置模式(Preset):即目前开放测试的主界面,内置了4种模型,特别适合于新手使用,以成对模型运行;   (2)自定义模式(Custom):类似于pamlX版,适合熟悉CodeML的老手手动配置参数,以单个模型运行。   程序主界面如下图所示: 简要操作图解:   × 红色 标记为完整的一轮分析操作流程   × 蓝色 标记为对前一轮的运行数据进行LRTs分析   ×虚线部分的功能暂未启用,完整版可用 ××××××××××××××××××××××××××××××××××××××××××× 欢迎试用,联系邮箱:raindyok@qq.com ×××××××××××××××××××××××××××××××××××××××××××
个人分类: 软件教程|16656 次阅读|1 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-17 09:25

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部