请问 如何得到MEGA中的dn值和ds值? 先将序列分组,即点set/select taxa or groups,进入分组程序,点中间的“+”,为分组的序列命名,将右栏中属于这个组的序列选中,单击中间的向左箭,然后用相同的方法建立下一组。close the window.在distance 命令中单击compute distance beteen groups,即可计算得到. dn/ds分析的对象是基因的蛋白质编码区,所以你用MEGA打开序列时要确认 作为蛋白质编码序列打开。打开后在distances菜单中单击compute pairwise...(F7),然后选择model:syn-nonsynonymous菜单(如果你没有作为编码序列打开,这个菜单将不可用),并选择合适的method(一般是Nei-Gojobori method (Jukes-Cantor))。这时,substitutions to include项就会让你选择求ds或dn。 最近在一篇文献上看到 evidence suggests that positive selection may account for the extent of amino acid variability observed within the G-protein.请问各位高手,这句话中 positive selection 该怎么解释呀?谢谢! 对应于purify selection, positive selection就是正向选择,也就是达尔文的提出的进化假说。也叫达尔文选择。 哦?先讨论一个基本的问题。自从kimura的中性理论被广泛接受之后,遭遇到的挑战就很多,比如Nei就认为存在positive selection/adaptive selection,而其他人则认为存在negative selection/purifying selection.这两种现象目前都还是比较普遍的存在的。 我的问题是:如果检测到一个gene family存在positive selection的作用的时候,与这个gene family的功能的进化适应有什么关系?purifying呢? 有的文章指出的是,出现adaptive selection是因为gene的功能存在冗余,也就是功能不怎么重要,所以进化的速率相对于中性进化的gene来说,就显得较快。 但是我觉得,一个gene正因为功能重要,而生物体的功能变化剧烈,为了适应功能的改变,而加速进化,那么,出现positive selection,应该是说明gene的功能重要啊! 这个方向你可以多看看ziheng Yang的文章正向选择不仅局限于gene,正选择位点positive selection sites 的确定也是关注的热点。ziheng yang的基于bayes的 ML方法可以说是这方面做的比较好的nei,fitch 他们也做 你如果只是要翻译的话,就象你自己说的,翻译成正向选择就差不多了。 如果你认为大部分不同的sequence因为各种原因(比如说环境),它们的fitness会不同,那么你就会认为natural selection是进化的主要动力。Neutral theory认为大部分的sequence variation对fitness没什么影响,也就是说它们多为“中性”,这种情况下进化的主要动力就是random drift了。其实现在已经没什么人相信strict的Neutral theory了,但是因为基于它很容易构建hypothesis test,所以它经常被用来作为null hypothesis。 如果是做实验的话,正向选择的确定还是比较难确定的, Yang的一篇review也说过,不仅仅是通过paml作出w1就可以了。确定的时候往往需要有生物学的意义,或者需要通过实验来验证。看你想做什么了。。。。。 谢谢各位,如果我的实验目的是想看一个病毒的基因是不是在进化过程中存在positive selection ,在实验方面,我首先要得到连续多年的此病毒的基因,这对我来说是不存在问题的,但对于以后对基因是否存在 positive selection 我不知怎么来分析,分析时需要多少基因序列,结果才是可靠的呀? 这个取决于你的序列的分歧度,如果合适的话4,5条就够了。 别的软件我用没用过,paml frequent ask questions 里边有吴俊义问杨子恒的几个问题: 1) How many species are needed? I suppose the absolute minimum is 4 or 5 if the sequence divergence is optimal. 10 would be good, while 20 would be much better. This will depend on how divergent the sequences are. 2) How far should the total distance among these species be? For example, dS should be 0.5 in total? The optimum sequence divergence depends on the number of sequences, and a big tree with many sequences can tolerate more changes. I think the method will be reasonable if dS summed over all branches on the tree is 0.5 dn 就是非同义突变。指的是突变的产生会对改变基因编码的蛋白。 ds同义突变,和非同义突变相反不会改变。 dn/ds 是判断positive selection的一个重要指标。 if dn/ds1then positive selection. elseif dn/ds=1 then neutral seletion else purify selection 但是由于dn/ds往往是=1的,这是由于dn/ds这种计算方法是从整体水平上描述计算的量,这种方法会掩盖少量的positive selected sites。 不过positive selecion sites 可以通过Yang的paml计算出来。nei的adaptsite也可以做。 用得最多的方法就是Yang Ziheng的PAML,因为里面有很多模型可以使用。文献无数。网上的介绍也无数。 还有sliding windows的方法。这种方法我看到的软件是SWAPSC1.0,但总共就有十几篇文献引用这种方法。Yang Ziheng对这种方法似乎不感冒,但他在论坛上只是说可以查查有多少文献引用sliding windows方法的。并没有说这种方法不好的原因。 还有一种CDM方法,软件就叫CDM,文献也不多。 如果序列差异太大或太小,赶快放弃此方法。 计算dn/ds对序列差异过大的不适合(出现saturation,ds不准),但对序列差异太小的同样不适合的(dn又无意义)。 还有一种Treesaap这个软件,似乎可以用于差异过大的序列,但是目前我还没尝试。因为它是基于氨基酸的分析。它同CDM是同一个研究组开发。 补充一下 HYPHY的软件里边集合了许多功能,里边就有计算positive selection的。还有一个在线计算的,datamonkey。http://www.datamonkey.org/ alicewang wrote: 用得最多的方法就是Yang Ziheng的PAML,因为里面有很多模型可以使用。文献无数。网上的介绍也无数。 还有sliding windows的方法。这种方法我看到的软件是SWAPSC1.0,但总共就有十几篇文献引用这种方法。Yang Ziheng对这种方法似乎不感冒,但他在论坛上只是说可以查查有多少文献引用sliding windows方法的。并没有说这种方法不好的原因。 还有一种CDM方法,软件就叫CDM,文献也不多。 如果序列差异太大或太小,赶快放弃此方法。 计算dn/ds对序列差异过大的不适合(出现saturation,ds不准),但对序列差异太小的同样不适合的(dn又无意义)。 还有一种Treesaap这个软件,似乎可以用于差异过大的序列,但是目前我还没尝试。因为它是基于氨基酸的分析。它同CDM是同一个研究组开发。 最近做序列分析,有以下一些问题想请教: 1、用MEGA做dS/dN时,一般是选用Nei-Gojobori (Jukes-Cantor)还是Modified Nei-Gojobori (Jukes-Cantor)啊?后者是什么情况下用呢? 做变异分析,一般是做水平比较(即比较国内的序列与国外的某些地方的序列比较)还是纵向比较(即国内以前的与现在的序列比较)呢?比较分析不同基因型的dS/dN有没有意义啊? 2、做进化树分析,选取的outgroup是不是还是跟其他的序列放在一起分析啊?还是有另外的做法?因为我想分别构建一条序列的两个部分进化树,得到的两个树中,有一个outgroup跑到中间去了。怎么办啊? 3、MEGA能不能做identity啊?我好像只看到no of difference,这是说两两之间不同碱基的数目吧?如果该数字是10,而全长最长的为100,同源性就是90%啊?是不是这样算的啊??? S.O.S急!谢谢! 1 Modified Nei-Gojobori 是对转换变化率比颠换变化率高的情况所做的纠正,因为原NG法是认为四种核苷酸的替代是随机的。当转颠比很高的时候,采用Modified Nei-Gojobori 理论上要比原版好。但一般操作为了防止错误估计,在检测的时候两种方法同时使用。 不知道你为什么把序列分成国内国外,所谓变异分析,自然是拿你自己得到的序列和已知序列的比较,已知序列当然要可靠。 2 outgroup是你已知跟分析的序列关系较远但又有一定的关系的序列,如果跑到里面只能说明至少在这段部分中,他们的关系是紧密的,所以你选的outgroup不典型,当然也许是什么新的发现 3 同源性90%的说法不够准确,在相似性大于50%的时候,某些情况下可以适当调整,我们认为两个物种是同源的,一般认为小于20%则没有关系。相似性是将检测序列和目标序列间的相同的碱基,或者是氨基酸残基,按照一级结构的顺序,进行序列比对得到的比例。 插入缺失不单单存在检测序列,所以分母也可能比目标序列长。 建议你看看几本生信的书,应该都有吧这些问题 首先真诚感谢!!!强烈要求版主加分! 本人就是用Nei-Gojobori (Jukes-Cantor)和Modified Nei-Gojobori (Jukes-Cantor)算出来的值不一样,所以无从选择。
To demonstrate, using a window size of three with one entry immediately preceding and following each entry, a median filter will be applied to the following simple 1D signal: x = So, the median filtered output signal y will be: y = Median = 2 y = Median = Median = 6 y = Median = Median = 6 y = Median = Median = 3 i.e. y = .
http://scientific.thomsonreuters.com/cgi-bin/jrnlst/jlchange.cgi?Full=ANATOMICAL+RECORD Open in Google Docs Viewer Open link in new tab Open link in new window Open link in new incognito window Download file Copy link address Edit PDF File on PDFescape.com JOURNAL CHANGE ANATOMICAL RECORD Dropped 这本刊还不错的,可能自引太高了。