DNAgene分享 http://blog.sciencenet.cn/u/DNAgene 我的博客都是随兴而发,随便写点感想。随便收录、修改完善。写不写我的名字怎么写,都没关系。如果改了,还写我的名字,请通知我一下。

博文

已见树木,又见树林 --- Nature上拟南芥多个体基因组测序简评

已有 7276 次阅读 2011-9-1 15:05 |系统分类:论文交流|关键词:学者

我们中国有句古话,“只见树木,不见森林”,是说有人看事物只能看到局部,看不到整体。

套用这句古话,稍微修改一下,“已见树木,又见树林”,用来评价今天Nature上刚刚在线发表的一篇论文。

大肠杆菌基因组测序完成、酵母基因组测序完成、人类基因组测序完成 。。。 基因组测序领域捷报频传。以至于很多学者都耐不住寂寞,纷纷投入基因组测序大业中。

测了一个物种又一个物种。有人还不满足,发起了人类1000个基因组计划、拟南芥1001基因组计划。。。一个物种要测多个个体的基因组。当时看到他们的新闻论文(在学术刊物上发表的科研计划,广告性很强),内心中想起两个字“有钱”。我确实没有被他们的广告论文吸引,数据多了肯定是有用的,你们有钱就测吧。

今天,Nature在线发表了18个拟南芥个体基因组、转录组数据的分析结果。看了这篇论文才认识到,同一物种的多个体基因组测序不仅仅是“数据多了还是有用的”的数据积累,而是人类对生物体的认识有局部到整体的飞跃。在只有单个基因组序列的时候,我们对生物体遗传、进化、代谢等很多方面的认识就是“只见树木,不见森林”。

我简单介绍这篇论文的一些重要发现。

1、与过去完成的拟南芥参考基因组相比,大约1/3的基因在一个或多个个体中发生了基因片段缺失、终止密码子前移(premature termination codon)等破坏性变异。他们的研究还发现,通过补偿性变异(compensating changes),这些变异的基因还是可以编码有功能的蛋白质。2572个基因中内含子剪接位点失灵(splice site disruptions),其中64%发现了补偿性的新剪接位点。另外,核苷酸序列及其编码的氨基酸序列也发生很大比例的变异(这倒是之前的一些研究发现过的)。
2、基因表达在不同个体间差异很大。他们研究的苗期的基因表达发现,19%的基因个体间表达差异达到十倍以上,142个(1.5%)基因个体间表达差异达到100倍。如果只要有个体间变异就算数,那有变异的基因比例就特别大了。

才18个个体就有这么大比例的变异,提醒我们参考基因组的可参考性并不太强。尤其是在进化研究工作中,拿拟南芥和其他物种比较,参考序列的代表性尤其重要。用于多物种比较的个体/基因组应该能够反映本物种的基本特征。此研究还发现,管家基因的表达水平虽然在不同个体间有差异,但差异相对较小。说明,跨物种的基因表达的比较分析还是可以做的。如果不是基于很多个体的数据,就不应该用全基因组所有基因一起分析,而是应该用管家基因等种内变化相对小的基因。

目前是18个基因组,我们对拟南芥的认识可以说,由一颗树木到了一片小树林。等那1001个基因组测完了,我们对拟南芥的认识大概就可以说“已见树木,又见森林”。

说实话,这篇论文读起来很累(boring)。也许是由于要在Nature上发表语言描述要求过于简炼的原因,一些句子挺费解。不管什么原因,论文的发现重要了,枯燥也得读。

Gan et al. 2011. Multiple reference genomes and transcriptomes for Arabidopsis thaliana. Nature. http://www.nature.com/doifinder/10.1038/nature10414


https://m.sciencenet.cn/blog-61772-481885.html

上一篇:为什么原核生物转录和翻译要偶联在一起?
下一篇:小病毒,稳坐中军帐

3 郑祺 龚勇 韩志国

发表评论 评论 (7 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-20 07:23

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部