科学网

 找回密码
  注册

tag 标签: 群体动态

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

群体历史动态推断之Mismatch distribution篇
热度 2 raindyok 2015-6-23 15:54
引言:   当群体处于扩张时,理论上我们可以计算出扩张前或扩张后的群体大小以及发生扩张的时间。 错配分布(Mismatch distribution)是以 可视化方式 体现 群体 历史动态的一种方式。 一般群体在过去经受扩张或持续增长,其错配分布 曲线 会呈现单峰泊松分布,且Tajima's D 和Fu's F s等中性检验显著偏离中性突变;而群体大小保持稳定时,错配分布曲线则呈现多峰曲线分布, 中性检验不显著。   绘制 错配分布曲线可以使用DNAsp和 Arlequin, 但两者的表现方式略有不同:   (1) DNAsp 期望值的假定模型有两种:一种是假定恒定群体大小(Constant population size),另一种是假定群体大小下降(Populattion growth-decline)。如果实际观察结果与期望值的某个假定模型相吻合,则说明群体状态与期望的假定模型一致(恒定或收缩),反之,则说明背离期望值的假定模型,群体处于扩张状态(曲线为单峰)。   (2)与 DNAsp 不同的是, Arlequin 则是采用曲线拟合的方式,即可期望值和观察值的曲线是否拟合,并通过两个参数评估扩张的可靠性: SSD ( Sum of square deviations )和 r ( Harpending's raggedness index),这两个参数的统计检验不显著(即:P值均大于0.05)时,表明 不能拒绝群体扩张的假说,即符合原来群体扩张的假说。 BY DNAsp 1. 用DNAsP打开目的序列,依次点击菜单栏的“Analysis”-“Population Size Changes”,如图: 2. 在 “Data Set“下拉菜单方式选择待分析的数据集,本示例数据未分组,仅一组数据(n=95),”Analysis“选择错配分布(即Pairwise Differences),期望值模型根据需要选择,默认为恒定群体大小,如下图所示: 3. 参数设置完成,按下”OK“按钮,然后依次点击“DNAsp Graph”-“Select Graph”-“Pairwise Differences” 即可出来彩色的曲线图。 当然,也可以选择黑白方式显示,如下图所示: 4. 由于默认生成的图形样式固定,为满足高IF期刊的要求,可将原始数据导出到Excel中美化。选定“Output.Grid”标题栏后,在菜单栏“File”下“Save Current Output”,如下图,此时会 生成一下*.out文件。 用记事本类工具打开生成的*.out 文件,将原始数据复制到出来,如下图: 在Excel中处理,选择数据后“插入”-“折线图”,如下图所示: Excel大家肯定比我熟悉,这里就不再赘述,最终效果图大致如下图所示: BY Arlequin 1. 在DNAsp中导出用 用于Arlequin分析的 Haplotype数据文件, 如下图所示: 2. 数据类型为Arlequin Haplotype List,如下图: 此时提示保存两个类型的文件,一个是Haplotype数据文件(*.Hap),一个Arlequin方案文件(*.Arp): 3. 将上一步生成的两个文件复制到Arlequin的根目录下,即与WinArl35.exe路径一样,然后在程序界面的“Open Project”选择选择分析的“*.arp”方案文件,如下图: 切换到“Structure Editor”进行分析,示例文件只有一组序列,故Group编号为1,完成后“Update Project”更新一下。 切换到“Seting”标签,设置分析的选项及参数,选择“Mismatch Mistmatch”,在右边分析选择勾选“Estimate Parameters of demographic expansion”。 完成后,按下右上角的“Start”即可开始分析。完成会弹出一个网页,找到“Mismatch distribution”所在位置,把数据复制出来,整理后放在Excel中处理,方便同前,此处不再赘述。 数据美化处理后,预期效果图下图所示: SCI美图欣赏: 出自:Hu ZM et. al. Phylogeographic heterogeneity of the brown macroalga Sargassum horneri (Fucaceae) in the northwestern Pacific in relation to late Pleistocene glaciation and tectonic configurations. MOLECULAR ECOLOGY, 2011; 20 (18): 3894 ---------------------------------------------------------------------------- Raindy 注: 欢迎转载,但请保留作者信息。严禁用于商业目的,谢谢支持!
个人分类: 软件教程|33162 次阅读|3 个评论
群体历史动态推断之Bayesian Skyline Plot篇
热度 10 raindyok 2015-6-23 12:34
引言:   对于群体历史动态的推断,常常通过中性检验并结合错配分布(Mistmatch distibution)进行分析。当中性检验 ( Tajima'D and Fu's Fs ) 的值 为负值,统计显著时,且错配分布呈单峰分布时,说明所研究的群体可能在历史上经历过突然扩张的事件。实际上,群体历史动态往往比这些方法中所涉及的参数模型更加复杂。而 Bayesian Skyline Plot (BSP)方法是基于溯祖理论(Coalescent theory)量化基因序列的谱系与群体地理历史的关系。本篇日志为本人现学过程整理为图解教程,以飨初学者。在学习BSP过程得到 @郭向召 @病毒所-李兴广 @岳亮 的帮助,在此特别致谢! 前提 :   应用BSP需要遵循几个基本原则:(1) 个体 :随机交配的群体的随机样品;(2) 序列 : 同源、非重组、中性进化 ;(3) 数据集 :单基因适合个别群体,但作谱系地理分析时,最好考虑使用多基因分析(位点是Unlinked的)。 流程:   1. 配置BEAST运行所需的XML文件 使用BeauTi 导入比对的序列,分别配置分区、采样时间、位点模型、分子钟模型、先验和MCMC参数,如下图所示:   1.1 分区   1.2 采样时间   ucldStdev 模型选择: 如果 是非化石校准( calibration) ,可以选用正态模型(N ormal),即S ampling会偏倚峰值区域;但一致模型(Uniform)倾向于平均用力。 对于病毒 这里 使用Normal,且平均值可以设置为0.1。
34369 次阅读|20 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-17 11:45

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部