2030 菜单 -- 人类的火星之旅 鲍海飞 编译 2012-8-14 人类登陆火星似乎已经不是一个遥远的问题了,但还有一个最关键的问题!由于我们的地球距离火星太遥远了,有 3.22 亿公里之遥,双向通信就需要约 40 分钟完成一个来回。这意味着人类的火星之旅是一个漫长的过程!在这漫长的过程中,最大的问题是饮食问题!到底需要准备多少东西才够吃? 美国 NASA 宇航局正在为 2030 年人类登陆火星之旅定制饮食菜单( create a menu for a planned journey to Mars in the 2030s )。 预计一艘搭载 6 到 8 名宇航员的航天器,将花上 6 个月的时间飞到火星,然后在那里工作 18 个月,然后再花 6 个月返回地球,总共需要两年半的时间。 NASA 航天厨师设计师们正在研究制定了一个菜单 — 包括一百多种食物的菜单,航天用的食物均是预先准备好而且是冷冻的食物,保质期至少要达到 2 年。想想看,这就好像一下子就给一个家庭提前准备好三年的食物一样!( Imagine having to shop for a family’s three year supply of groceries all at once and having enough meals planned in advance for that length of time )。实验人员对研制的饮食要进行系列的测试和品尝,以决定飞船一旦离开地球后,食物安全可靠。在没有重力的情况下,食物的味道和可品尝性是要打折扣的 (the lack of gravity means smell--and taste--impaired) 。火星上的重力加速度约为地球的 0.4 倍 , 即为 0.4g( 地球上为 1g , g=9.8m/s 2 ) 。 设计人员为宇航员准备了可以自己加工、甚至烹饪的食物,这样,在漫长的旅途中就可以自己烧菜做饭了。由于火星上的空气压力比地球小,因此,还可以尝试使用压力锅来烧开水。研究人员在飞船上设计了一种 ‘ 大棚温室 ’ ( Martian Green House ) , 宇航员在里面能够进行无土栽培种植水果和蔬菜,即在含有矿物质的水中种植生物,比如:胡萝卜,辣椒之类。这样,宇航员就有一个 ‘ 绿色的活生生的菜园啦! ’ 由此,航天员便可以自己优化营养配餐,自己加工烹饪食物了。 对于漫长的太空之旅,最优先考虑的是宇航员要获取正常的营养,包括卡路里和矿物质,以保持宇航员身体健康并顺利完成任务。同时,所食之食物也要保证宇航员的心理健康。研究表明,某些食物如肉面包、土豆泥、或者感恩节的火腿,会明显改善人们的心情和满意度。这会让在火星之旅中的宇航员不感觉孤单、寂寞,有一种 ‘ 家的感觉 ’(this ‘link to home’will be key to astronauts on the Mars mission) 。食物和心情的关系则成为两个部门的一项研究课题。食物中如果缺少维生素和矿物质也会损伤大脑。 最重要的是在这近一百种食物配料中,所有的都是素食( vegetarian ),所以宇航员将没有牛奶和肉类食物。主要是因为这两类食物不能保存足够长的时间以到达火星。一位研究员开玩笑说: ‘ 考虑过随机带一头奶牛来着,但似乎不是明智的选择。 ’(It isn’t possible to preseve those products long enough to take to Mars- and bringing a cow on the mission is not an option, Cooper jokes.) 设计师们为了保证素食食物足够的蛋白质数量,专门准备了多种多样的食品,如豆腐、硬果、泰国披萨,但披萨上没有奶酪,而是覆盖了更多的类似胡萝卜、红辣椒、大葱、蘑菇、花生、以及调料之类的东西。 为了保证食物的可持续性( food sustainability ), NASA 或许会专门让一个宇航员来为大家准备食物。 (it is possible NASA will choose to have one astronaut solely dedicated to preparing the food). 编译自: Ramit Plushnick-masti, NASA creates menu for Mars mission in 2030s. China Daily, Wednesday, July 18,2012.
请问 如何得到MEGA中的dn值和ds值? 先将序列分组,即点set/select taxa or groups,进入分组程序,点中间的“+”,为分组的序列命名,将右栏中属于这个组的序列选中,单击中间的向左箭,然后用相同的方法建立下一组。close the window.在distance 命令中单击compute distance beteen groups,即可计算得到. dn/ds分析的对象是基因的蛋白质编码区,所以你用MEGA打开序列时要确认 作为蛋白质编码序列打开。打开后在distances菜单中单击compute pairwise...(F7),然后选择model:syn-nonsynonymous菜单(如果你没有作为编码序列打开,这个菜单将不可用),并选择合适的method(一般是Nei-Gojobori method (Jukes-Cantor))。这时,substitutions to include项就会让你选择求ds或dn。 最近在一篇文献上看到 evidence suggests that positive selection may account for the extent of amino acid variability observed within the G-protein.请问各位高手,这句话中 positive selection 该怎么解释呀?谢谢! 对应于purify selection, positive selection就是正向选择,也就是达尔文的提出的进化假说。也叫达尔文选择。 哦?先讨论一个基本的问题。自从kimura的中性理论被广泛接受之后,遭遇到的挑战就很多,比如Nei就认为存在positive selection/adaptive selection,而其他人则认为存在negative selection/purifying selection.这两种现象目前都还是比较普遍的存在的。 我的问题是:如果检测到一个gene family存在positive selection的作用的时候,与这个gene family的功能的进化适应有什么关系?purifying呢? 有的文章指出的是,出现adaptive selection是因为gene的功能存在冗余,也就是功能不怎么重要,所以进化的速率相对于中性进化的gene来说,就显得较快。 但是我觉得,一个gene正因为功能重要,而生物体的功能变化剧烈,为了适应功能的改变,而加速进化,那么,出现positive selection,应该是说明gene的功能重要啊! 这个方向你可以多看看ziheng Yang的文章正向选择不仅局限于gene,正选择位点positive selection sites 的确定也是关注的热点。ziheng yang的基于bayes的 ML方法可以说是这方面做的比较好的nei,fitch 他们也做 你如果只是要翻译的话,就象你自己说的,翻译成正向选择就差不多了。 如果你认为大部分不同的sequence因为各种原因(比如说环境),它们的fitness会不同,那么你就会认为natural selection是进化的主要动力。Neutral theory认为大部分的sequence variation对fitness没什么影响,也就是说它们多为“中性”,这种情况下进化的主要动力就是random drift了。其实现在已经没什么人相信strict的Neutral theory了,但是因为基于它很容易构建hypothesis test,所以它经常被用来作为null hypothesis。 如果是做实验的话,正向选择的确定还是比较难确定的, Yang的一篇review也说过,不仅仅是通过paml作出w1就可以了。确定的时候往往需要有生物学的意义,或者需要通过实验来验证。看你想做什么了。。。。。 谢谢各位,如果我的实验目的是想看一个病毒的基因是不是在进化过程中存在positive selection ,在实验方面,我首先要得到连续多年的此病毒的基因,这对我来说是不存在问题的,但对于以后对基因是否存在 positive selection 我不知怎么来分析,分析时需要多少基因序列,结果才是可靠的呀? 这个取决于你的序列的分歧度,如果合适的话4,5条就够了。 别的软件我用没用过,paml frequent ask questions 里边有吴俊义问杨子恒的几个问题: 1) How many species are needed? I suppose the absolute minimum is 4 or 5 if the sequence divergence is optimal. 10 would be good, while 20 would be much better. This will depend on how divergent the sequences are. 2) How far should the total distance among these species be? For example, dS should be 0.5 in total? The optimum sequence divergence depends on the number of sequences, and a big tree with many sequences can tolerate more changes. I think the method will be reasonable if dS summed over all branches on the tree is 0.5 dn 就是非同义突变。指的是突变的产生会对改变基因编码的蛋白。 ds同义突变,和非同义突变相反不会改变。 dn/ds 是判断positive selection的一个重要指标。 if dn/ds1then positive selection. elseif dn/ds=1 then neutral seletion else purify selection 但是由于dn/ds往往是=1的,这是由于dn/ds这种计算方法是从整体水平上描述计算的量,这种方法会掩盖少量的positive selected sites。 不过positive selecion sites 可以通过Yang的paml计算出来。nei的adaptsite也可以做。 用得最多的方法就是Yang Ziheng的PAML,因为里面有很多模型可以使用。文献无数。网上的介绍也无数。 还有sliding windows的方法。这种方法我看到的软件是SWAPSC1.0,但总共就有十几篇文献引用这种方法。Yang Ziheng对这种方法似乎不感冒,但他在论坛上只是说可以查查有多少文献引用sliding windows方法的。并没有说这种方法不好的原因。 还有一种CDM方法,软件就叫CDM,文献也不多。 如果序列差异太大或太小,赶快放弃此方法。 计算dn/ds对序列差异过大的不适合(出现saturation,ds不准),但对序列差异太小的同样不适合的(dn又无意义)。 还有一种Treesaap这个软件,似乎可以用于差异过大的序列,但是目前我还没尝试。因为它是基于氨基酸的分析。它同CDM是同一个研究组开发。 补充一下 HYPHY的软件里边集合了许多功能,里边就有计算positive selection的。还有一个在线计算的,datamonkey。http://www.datamonkey.org/ alicewang wrote: 用得最多的方法就是Yang Ziheng的PAML,因为里面有很多模型可以使用。文献无数。网上的介绍也无数。 还有sliding windows的方法。这种方法我看到的软件是SWAPSC1.0,但总共就有十几篇文献引用这种方法。Yang Ziheng对这种方法似乎不感冒,但他在论坛上只是说可以查查有多少文献引用sliding windows方法的。并没有说这种方法不好的原因。 还有一种CDM方法,软件就叫CDM,文献也不多。 如果序列差异太大或太小,赶快放弃此方法。 计算dn/ds对序列差异过大的不适合(出现saturation,ds不准),但对序列差异太小的同样不适合的(dn又无意义)。 还有一种Treesaap这个软件,似乎可以用于差异过大的序列,但是目前我还没尝试。因为它是基于氨基酸的分析。它同CDM是同一个研究组开发。 最近做序列分析,有以下一些问题想请教: 1、用MEGA做dS/dN时,一般是选用Nei-Gojobori (Jukes-Cantor)还是Modified Nei-Gojobori (Jukes-Cantor)啊?后者是什么情况下用呢? 做变异分析,一般是做水平比较(即比较国内的序列与国外的某些地方的序列比较)还是纵向比较(即国内以前的与现在的序列比较)呢?比较分析不同基因型的dS/dN有没有意义啊? 2、做进化树分析,选取的outgroup是不是还是跟其他的序列放在一起分析啊?还是有另外的做法?因为我想分别构建一条序列的两个部分进化树,得到的两个树中,有一个outgroup跑到中间去了。怎么办啊? 3、MEGA能不能做identity啊?我好像只看到no of difference,这是说两两之间不同碱基的数目吧?如果该数字是10,而全长最长的为100,同源性就是90%啊?是不是这样算的啊??? S.O.S急!谢谢! 1 Modified Nei-Gojobori 是对转换变化率比颠换变化率高的情况所做的纠正,因为原NG法是认为四种核苷酸的替代是随机的。当转颠比很高的时候,采用Modified Nei-Gojobori 理论上要比原版好。但一般操作为了防止错误估计,在检测的时候两种方法同时使用。 不知道你为什么把序列分成国内国外,所谓变异分析,自然是拿你自己得到的序列和已知序列的比较,已知序列当然要可靠。 2 outgroup是你已知跟分析的序列关系较远但又有一定的关系的序列,如果跑到里面只能说明至少在这段部分中,他们的关系是紧密的,所以你选的outgroup不典型,当然也许是什么新的发现 3 同源性90%的说法不够准确,在相似性大于50%的时候,某些情况下可以适当调整,我们认为两个物种是同源的,一般认为小于20%则没有关系。相似性是将检测序列和目标序列间的相同的碱基,或者是氨基酸残基,按照一级结构的顺序,进行序列比对得到的比例。 插入缺失不单单存在检测序列,所以分母也可能比目标序列长。 建议你看看几本生信的书,应该都有吧这些问题 首先真诚感谢!!!强烈要求版主加分! 本人就是用Nei-Gojobori (Jukes-Cantor)和Modified Nei-Gojobori (Jukes-Cantor)算出来的值不一样,所以无从选择。
修正一下:在Win7中还有更简单的办法能在当前文件夹中打开CMD命令窗口。 在文件浏览器中,按住shift,然后单击右键,会出现"在此处打开命令窗口"。这个方法可行,无需修改注册表。 下述转载的方法貌似有一些问题,在第一次正常进入命令窗口之后,貌似就不能在进入了,总是提示命令错误,费解。 ============================= 多人都很喜欢在CMD命令行下来操作计算机,我也是其中之一。 如何快速打开CMD并且定位到指定的路径呢?很多优化软件(比如优化大师)都提供了往右键菜单中加入“CMD快速通道”的功能,当右键点击文件夹时,就打开CMD并定位到该文件夹。网上也有修改注册表来实现的,其实根本不用这么麻烦。 PS:其实所有的实现方法都是对注册表做了同样的修改:在HKEY_CLASSES_ROOT\Folder\shell下增加一个“CMD”子键,将该子键的“(默认)”键值修改为“CMD快速通道”,然后在该子键下再建立一个子键“command”,将“command”的“(默认)”键值修改为“cmd.exe /k cd %1”。用注册表文件表示就是(这段代码直接保存为.reg文件双击导入即可): Windows Registry Editor Version 5.00 @="CMD快速通道" @="cmd.exe /k cd %1"