科学网

 找回密码
  注册

tag 标签: 人类基因组计划

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

先读后写,基因学3R理论中的编写技能被提上议程!
热度 3 brianring 2016-10-17 16:26
基因学上的3R分别指阅读(Reading)、编写(Writing)(即编辑)和计算 ( Arithmetic ) 。乍一看 , 这三个词中好像只有一个词以R 开头 ,但是因为基因学的计算部分通常会用到一种统计软件,这一软件恰巧被称为“R”,所以只有“编写”才是真正的例外。虽然 名称拼写上有一点问题,但是编写也十分突出,引人注目。 我们阅读了大量的基因序列(到目前为止,已经阅读了整个基因组中大约1.5万亿个碱基),为了 弄清楚这1.5万亿个碱基有哪些作用,我们会进行大量的计算。虽然我们编写了遗传基因,但是我们至今还没有翻译出一个完整的动物基因组,也还没有掌握编写的技能。 不过,这种局面很快就会被打破。 一般而言,先写然后才能读。即便是世界通用的经文也是如此,虽然有些人可能会认为经文是通过超自然的命令自发生成的,但其实它是人为写出来的。上帝用手指在石碑上写下了十诫(笔在石头上写得不顺畅,用蜡笔则会入手即化),摩西写了前五卷(可能得排除最后一点,因为他死了),吠陀在口头传诵,《古兰经》由默罕默德的门徒转录,整个星球大战前传系列也是即兴创作的。常规的写-读顺序最早出现在约翰的书里,其中他如此说道:“一切由词始”。 然而 , 人类基因组是个例外,我们首先阅读了它(即人类基因组计划,于2003年4月完成),现在才开始讨论编写的问题。 准确地说,人类基因组早就被转录过很多次了。因为人体内的每一个细胞都存在基因组的一个拷贝(红细胞除外),而每个人拥有大概10万亿个细胞(不包括那些红细胞),据估计大概有1000亿人曾生活在地球之上,所以从整体上我们可以估计人类基因组已经被复制了一万亿次。但是从来 没有人想过写点什么相关的东西,不管是 基因、编辑,还是跟基因有关的奇幻 故事 。可能从遗传学的角度来看,编写并不是遗传学者 们 必须要做的工作。 编写人类基因的故事需要大量的时间,而且其中涉及大量的复制和失误 人类基因组有一个起点,但并不是我们创造的。如果我们相信“上帝创造了亚当的基因组”的 假说 ,那么现在 流行 的圣经就没有讲清楚创世故事中跟基因组有关的那部分,我们也就不太清楚一切是怎么开始的了。地球上的第一个生命始于大约40亿年前,时隔已久,所以我 们肯定没法获得全面系统的了解。 幸运地是,我们找到了一块完整的恐龙化石,其中保留了大量关于三十亿年前生活环境的化学证据,那个时候连雷龙都还没有出现呢。 我们现在所知道的是一个人的基因由父母双方的基因混合而成,其他人的基因也来自于他们的父母双方等诸如此类的信息。在由基因组追溯生命起源的过程中存在一条完整的路径,这就使得确定由谁(或者原始的动物)来承担基因中的失误或者缺陷很困难。关于基因组(和生命)的起源存在一个观点,即历史早期出现了一个可以自我复制的短RNA聚合物。RNA与组成基因组的DNA在化学性质方面非常相似,还具有一个独特的功能,即可以自我折叠成为一个复杂的形式,其中有一些被发现具备了酶的功能属性。一些催化RNA甚至可以复制其他的RNA。 第一个生命、第一个基因组有可能是同一个相对较短的、可以自我复制的RNA。 诚然,虽然这是一个至关重要的起点,但是一个短片段的RNA恰好能够自我复制,这并不足以解释人体的复杂性。而且人类如何将这一除了自我复制无其他功能的早期RNA链弄到自己身上,难道都靠日益复杂的生物链吗?通过数十亿年的转录错误、重复、自然抉择和干预,我们相信终究会轮到自己的,也会轮到地球上的所有其他生物的。复制中出现的一些错误可能影响很大,但是四十亿年的时间足以积聚大量的变化,而且编写时 出错也是在所难免的 。 再次以圣经为例。许多人认为圣经是绝对正确的,他们声称圣经的确受到了神的启发,方方面面都是正确的。换句话说就是没有错误。但是也有许多教徒认为只有最初的版本才是完全 正确的 ,现在的圣经经文里肯定存在人为的 错误 。 这种错误显然应该避免, 不然 就亵渎了圣经,会受到上帝的惩罚。 实际上,现代的希伯来语把元音和发音标准归功于努力减少圣经抄写员犯错误的举措。6-10世纪,有一群希伯来学者被称为马所拉学士,编辑了一个希伯来圣经的权威版本,后来 不少基督教分支在翻译旧约全书的时候还把这个作为源头之作。 一千多年的时间里,书面希伯来语都 是没有元音的, 主要通过字词中的辅音来推断意思。元音 的缺失使得字词的意思模棱两可,特别是当其中的辅音意思也模糊不清时。 添加元音可以减少复制中的错误,所以抄写员们发明了元音,其他的一些转录和编辑手段也确保了复制过程中尽可能少地犯错。然而,尽管有了这些举措,马所拉学士们还是犯了错误。 有一篇对犹大王约雅斤的简短注释就是非常好的例子。在《历代记·下》的第36章第9节中写道: 约雅斤登基的时候年方八岁,在耶路撒冷当了三个月又十天的王,而且他做了一些在上帝看来非常邪恶的事情。 但是《列王记·下》第24章第8节中说: 约雅斤登基的时候已年满十八,在耶路撒冷当了三个月的王。他母亲名叫尼护施,是耶路撒冷以利拿单的女儿。 在《列王记·下》中,约雅斤十八岁,而在《历代记·下》中 他只有八岁。 要么复制的 时候出现了错误 ,一个版本中的“十”被遗漏了;要么约雅斤在八岁和十八岁的时候各登基了一次,每次为期三个月。还有,根据《历代记·下》中的描述,他八岁登基,“做了在上帝看来非常邪恶的事情。”作为一个父亲,我可以证明一个八岁的孩子绝对可以 做出那种事情来 。但是这种行为要想引起旧约中神的注意,估计 那孩子还得等到十八岁。 这都是比较极端的情况,最可能的解释就出现了简单的复制错误。在其他情况下,距离或者其他解释都跟我们所知的实际情况不符,一个简单的转录错误似乎可以解释这种对比差异。 DNA中也会出现相似的错误,阳光是主要的罪魁祸首,因为紫外线辐射可以使DNA碱基发生化学变化,从而无法复制。这些受损的碱基会被细胞机制裁剪掉,虽然通常可以得到合适的修复,但是错误还是会发生,其他机制也会导致DNA出现不明显的替换和删除。虽然这些变化比较罕见,但是在数十亿年的时间里其产生的影响是可以相加的。 当然不仅仅是简单的替换和删除需要更为复杂详细的信息,因为它只是更改了信息,并不增加其数量。在这方面比较重要的是对基因组的补充。随着基因组的进化,主要采取重复DNA片段的方式,重复DNA片段相对来说是比较简单的。 回到圣经,我们在圣经中也可以发现复制的错误。《创世纪》的第一本书中包含了两种创造人类的描述,第一种在第一章,另一种在第二章。虽然主题是相似的,但是在关键性的细节上还是存在差异的,所以给那些坚持按照严格的语法来解释圣经中的事件的人造成了一些麻烦。与任性的约雅斤的情况不同,这两种创造人类的描述的差异肯定不是转录错误。 相反,是因为每个故事的侧重点不同:第一个创世故事描述了地球是如何形成的,而第二个创世故事更关注我们与身处的世界还有上帝的联系。这两个相似的创世故事可能源于同一个故事,即美索不达米亚平原流传的创造世界的故事。然而,出于第一本圣经的叙事需要,早期的牧师对每种描述都进行了修改。换句话说,一个故事被复制了,然后修改了故事的所有副本,从而使得创世故事的叙事风格能够尽可能地复杂。当然这种方法并不只适用于圣经。莎士比亚大约一半的作品都不过是单一故事线的不同演变。“某人的身份被弄错了,然后悲喜随之而来”。他不过是在玩帽子戏法。 在我们的基因组中也存在类似的方式。单个基因只能有某些功能。然而如果一个基因被复制,每个副本都以不同的方式发展,具备不同的功能。这就产生了所谓的基因家族,一系列非常相似但角色不同的基因。例如,人体内(所有动物体内)有一个非常重要的基因家族,即Hox基因家族,在胚胎发展的早期对其施加控制。我们大概有40组不同的Hox基因,在发育的过程中各自扮演着不同的角色,但是都是在动物进化的早期由单个Hox基因演化而来的。 显然进化是强有力的,但是速度很慢。大多数生物技术公司的投资者都希望能在几年内获得收益,要是告诉他们大概要等一万年才能有成果,这样买卖就很难做了。因此现在正在努力进行基因组计划的第二阶段,从阅读过渡到编写。与依靠突变和选择相反,我们只是简单写下我们想要的基因组。 现在回头看最初的人类基因组计划是“HGP:阅读”。第二阶段可以是“HGP:编写” 这是本月初在哈佛医学院召开的一次会议上讨论的根本问题。最初的人类基因组计划跟阅读基因组有关。此次会议讨论的则是在该计划的 基础上进行合乎逻辑的延伸。 题为“HGP-编写:测试细胞中的大型合成基因组”,此次会议的目标在于讨论改写大部分基因组甚至从头制作整个基因组所需的概念和技术。这样的技术目前还不存在。然而,我们根据特定的序列来合成长片段DNA的能力发展迅速,而且这样做的成本也有所降低。所以可以合理推测我们很快就能够编写基因组了。 编写基因组的能力存在多种可能的应用。之前也讨论过,新的基因技术使我们能够相对轻松地对基因组做出小的修改,而现在讨论的是随心所欲、完全自由地编写基因组任何部分的能力。起点可能会包含基础科学,编写个基因组可能比探索基因组中的零散部分更为快捷。工业应用也很容易想象,因为可以通过对整个代谢过程进行再造从而实现一系列不同的化合物的制造。 当然,这也会涉及到几个伦理上的问题。首先,这项技术将强化我们克隆人的能力。目前克隆人的工作尚未完成,因为需要从被克隆的人身上提取细胞。有了编写基因组的能力之后,我们只需要知道那个人的基因编码,那些编码数量大概等于一个1GB的文档,然后我们就可以在其基础上进行重建了。 编写基因组与改写圣经中的部分内容相似吗?还是这更像是在网络上发布一篇哈利波特粉丝小说 在对基因组做出细微的修改时,我们不仅会面临伦理问题,同时还会面临编写整个染色体的可能性问题。对细胞代谢及其调控机制的理解意味着我们真的对于如何利用这种基因不够了解,但是这一点很快就会被改变。如果我们能够在孩子体内添加全新的生化路径,这将意味着什么?我们的基因组类似于一个绝对正确的神圣经文,容不得一丝一毫的修改吗?还是更像一个国家的宪法,需要在得到同意之后才能改写? 还是我们会像人类基因组粉丝小说中所说的那样实现HGP:编写计划,每一个科学家或者每一位父母都可以编写他们觉得合适的东西?例如,在皮肤中添加叶绿体可以节省日常开支并且保证我们拥有健康自然的肤色,但是常年多云的城市房价可能因此下降。那么由谁来决定这是否可以作为人类多样性的一项补充呢?因此有人担心此次会议只对一百位与会者开放,而且不允许媒体报道会议所做的相关讨论。这可能不是因为对正在讨论的技术要绝对保密,会议上绝对不会讨论联合国资助克隆人军队这种事情。 与之相反,颁布这样的禁止令似乎是因为该会议的报道权限已经被授予了一家科学杂志公司,与会者默认了其对数据专卖权的要求。科学成果的产生往往得益于公共资金,现在却实际成为了科学出版商的有效财产,这就是个问题,但是这个问题需要单独讨论才可能解释清楚。不管怎样,会议不应该以这种方式来保密。 不管编写基因组的技术发展速度是快是慢,我们学习处理基因组所需基本技能的速度还是非常迅速的。阅读和计算在遗传学领域已经得到了很好的应用,而编写很快也会被纳入遗传学领域之中。至少有一点非常明确,我们不用担心因为使用何种字体而引发争论。在遗传学领域,没有无衬线字体或者新罗马字体,甚至连斜体或者加粗都没有。在可预见的未来里,我们在编写基因组的过程中只会使用A、C、G、T四个字符。 (本文为Dr.Brain Ring 原创,小编编译,点击http://charter-of-the-genome.org/2016/05/30/the-three-rs-of-genetics/即可阅读原文。如有转载需求,请联系yangqiao@idna.com.cn。)
5970 次阅读|6 个评论
“脑计划”项目介绍
Enago 2016-1-14 15:01
2013年4月,美国总统奥巴马在白宫公布了投资一亿美元研究人脑活动图工程计划的细节,旨在探索人类 大脑 工作机制、绘制出人脑活动图谱,了解人脑的运行机理,从而读出人们的思维活动,检测脑部疾病,并最终开发出针对大脑疾病的疗法 。 --- 阅读原文请 点击链接造访 【英论阁学术院】 “脑计划”项目介绍 --- 该计划的全名是“使用先进革新型神经技术的人脑研究(Brain Research through Advancing Innovative Neurotechnologies,BRAIN)”,由国立卫生研究院(NIH)、美国国家科学基金会(NSF)和美国国防部高级研究计划局(DARPA)的共同支持,同时还得到了其他私人基金会,比如艾伦脑科学研究所和索尔克生物研究所的支持。该项目的预算也非常庞大,2014年项目开始时的财政预算是1亿美元,同时计划在将来十年内为项目筹集到高达45亿美元的资金。 在这个项目里面,最重要的一个环节是绘制出人脑活动图谱(Brain Activity Map, BAM)。人脑看上去并不起眼,但是里头差不多有1000亿个神经元,形成100万亿个突触。神经科学家将尝试捕捉和测量的“动态神经突触和活动”需要庞大的计算能力和强大的技术支持,也就意味着需要巨大的投资。NIH院长弗朗西斯柯林斯估计需要处理的数据在yottabytes量级。如果用现在最先进的200 GB 的 microSDXC 存储卡保存的话,堆起来的体积将是1/3座 胡夫金字塔 的大小。 当然,如果计划可以成功的话,它将是人类历史上最伟大的成就之一,可以与人类基因计划相媲美。这项计划可以更进一步了解阿尔茨海默氏症和帕金森氏病的原因并且找到治疗方式,同时也可以为各种精神疾病带来新的思路,现在炒得火热的人工智能技术也会受益良多。而且不管在哪个方向上带来突破都将极大地推动技术的发展,带来巨大的经济效应。 http://www.baike.com/wiki/%E8%84%91%E8%AE%A1%E5%88%92 § 博客内容皆由 英论阁 资深学术专家团队撰写提供 § ------------------------------------------------------------------------------------------------------------------------------------ 您可能感兴趣的博文: 1. 《拜杜法案》对大学科研的影响 2. 美国基础研究的“创新赤字” 3. 科研人员的另外选择:DIY实验室 ------------------------------------------------------------------------------------------------------------------------------------
3498 次阅读|0 个评论
[转载]“人类基因组计划”回顾与展望:从基因组生物学到精准医学
热度 2 renlufeng 2013-12-9 03:05
“人类基因组计划”回顾与展望:从基因组生物学到精准医学 作者:于军 研究员   关键词:人类基因组计划 基因 基因组 精准医学 疾病分类学   摘要:“人类基因组计划”这个具有划时代意义的大科学计划已经完成整整十年了。十年来,基因组科学的发展逐渐形成了一个新的明确目标:精准医学。未来生物医学基础和临床科学的发展就是要整合基因组生物学新的学科前沿,运用新的概念和技术,不断整合和积累临床资源,凝练大的科学问题,规划和启动大科学项目,及时地、有效地为全社会提供“从实验室到病床”、“从实验室到家庭和个人”的卫生与健康保障。社会必须要迅速认识和接受新知识、开拓新的机制、给科学界以有效的反馈,充分地利用这些前沿研究成果。    1. “人类基因组计划”是具有划时代意义的大科学计划   今年,是“人类基因组计划”(The Human Genome Project,HGP)宣布完成十周年。选择2003年结束这个计划其实既不是因为这一年第一个人类基因组的测序工作确实到达了“终点”,也不是人类基因组序列“完成版”的实际结束时间。这个日子的选择首先是为了纪念沃森(James Watson)和克里克(Francis Crick)在《自然》(Nature)上发表了他们的著名科学论文,发现DNA双螺旋结构五十周年。其次也是感谢沃森博士这位推动这一宏大计划实施的早期领导者和持续支持者。他曾在1989~1992年担任国家人类基因组研究中心(National Center for Human Genome Research at the National Institutes of Health)的主任,也就是现在NIH国家基因组研究所(NHGRI)的前身。最后才是这一计划就完成全基因组测序而言确实已近尾声,剩下的有限信息也不足以改变已有的科学结论。   一次性解读人类基因组全部DNA序列是在80年代初由一些有远见卓识的科学家们集体提出的。虽然其原因是多方面的,但是基本上可以归纳为以下三点。第一是DNA测序技术和相关分子生物学技术日趋成熟。随着DNA双螺旋结构的解析,自七十年代起,生物化学家们发明了一系列的重要分子生物学技术,包括DNA测序、寡聚核苷酸合成、DNA杂交、分子克隆、聚合酶链式反应(PCR)等。尤其是80年代初荧光标记法DNA测序仪的研发和接近问世。第二是生物医学发展的迫切需求。未知基因序列的不断解读,遗传疾病相关变异的定位克隆(Positional cloning),新转录因子和信号传导通路的不断发现,都使DNA测序技术和需求被推到了科学界关注的焦点。当大家都在争取基金,计划测定自己感兴趣的基因时,一个重要观点的提出赢得了广泛的支持:与其说各测个的基因,不如集中攻关测定全基因组的序列。集中攻关的特点就是可以使操作专业化和规模化。尤其是在技术飞速发展的情况下,非专业的技术操作不仅浪费资源,在落后平台被迅速淘汰时,非专业的操作也一定会被迅速淘汰。这个原则在DNA测序领域一直适用至今。另外,当时遗传学和基因组学等学科的发展也遇到了新的瓶颈。比如对全基因组遗传图谱和物理图谱的迫切需求,对打片段DNA克隆的迫切需求等。第三是启动国际合作,调动全球各方资源的必要性。比如,人类基因组研究会涉及到世界各国的人类遗传资源,与其说在美国集中收集(虽然美国是个移民国家,但是就人类学的标准而言,异地取样往往是不被接受的),不如让这些国家直接参加一个共同的合作项目,同时他们所代表的国家还可以给与资金的支持。   1983年和1984年美国DOE(能源部)和NIH(卫生总署)分别组织了相关领域科学家,进行了启动大规模人类基因组测序计划可能性的研讨,这就是HGP的酝酿阶段 。有几位科学家这两个会议都参加了,比如目前仍是美国系统生物学研究所所长的胡德博士(Leroy E. Hood)和华盛顿大学退休教授欧森博士(Maynard V. Olson)。胡德博士领导的团队后来成功研发并商业化了荧光DNA自动测序仪 ,欧森提出了STS(Sequence tagged site)的概念 并领导他的团队用新发明的酵母人工染色体(Yeast artificial chromosomes)为材料开启人类基因组精细物理图谱制作的先河。1987年HGP的智库发表了《测定和绘制人类基因组图谱》的报告,宣布HGP进入具体实施阶段。1988年美国国会通过了DOE和NIH关于启动HGP的申请,两家主要资助者也协议共同支持HGP。五年后,人类基因组遗传图谱制作完成,第一代荧光自动测序仪顺利问世,HGP则进入真正的规模化数据获取阶段。国际“人类基因组计划”联合体最终由美、英、法、德、日、中六国逾千名科学家的实际参与,用时十五年,耗资十数亿美元共同完成。    HGP的成功并不是偶然的。它不仅是科学发展的必然,也是科学要素具备和时机逐渐成熟的体现。科学发展至少要具备四个基本要素:人才与科学思想、技术与实验方法、资源与素材组织、管理与项目实施。虽然成功与这四个要素都系息息相关,但是各自的权重却有所不同。人才与科学思想的提出无疑是首要的。大科学项目尤其需要有威望、有能力的领导者,和一代既能脚踏实地地工作,又能协调共进的坚定支持者 。此外,基因组学应属于分子生物学范畴,其学科的真正起点,是1953年DNA双螺旋结构的发现和70年代初期DNA序列解读技术的发明。因此,也可以说HGP是五十年来生命科学与技术发展的最重要结晶。实践还证明这一计划实现了“以大科学计划带动学科发展”的新策略,也宣布了科学发展“以科学假说为基础和以自由探索为形式”科研原则“一枝独秀”时代的终结。一种新的形式——“发现导向的科学研究”从此诞生,而生命科学的复杂性恰恰为这条新思路提供了最有力的脚注。各类“组学”(Omics)研究的兴起就是这一形式的有力证据。如果能将这些组学技术与以科学问题为目标的大科学项目结合起来那就更是“借助东风了”。   HGP的成功还在于充分调动和利用了政府、社会、企业的力量。由于政府主导和支持了这一计划,科研成果和技术研发又为企业注入了新的知识产权,也为企业发展提供了明确的方向。因此,据有关统计和评估,十几年来,HGP为美国社会创造了超过200倍的经济回报,超过30万个工作机会。同时也实现了在相关高科技领域的持续性主导。比如DNA测序领域、高端分子检测领域、生物信息领域、生物制药领域等等。美国的民营企业(比如Celara Genomics)也曾经与HGP成功竞争,不仅测定了果蝇基因组,也测定了小鼠和人的全基因组序列,取得很好的科学、经济与社会效果。尽管这两方面的努力似乎有些浪费资源,但最终“官”和“民”的竞争还是达到了和解。这一竞争归根结底对科学、社会和企业的蓬勃发展还都产生了正能量。    2. 基因组生物学的路线图:从基因组到精准医学   HGP是一个预计斥资30亿美元的大科学项目(实际花销很难估计,但因该只是预期的1/3左右),在三十年后的今天来看也是个不小的数字。不仅可以与1939年美国斥资20亿美元(相当于260亿2013年美元的价值)制造原子弹的“曼哈顿计划”媲美,也可以与斥资254亿美元(1973年美元价值)的“阿波罗登月计划”争艳。据最新的估计,HGP为美国所创造的经济效益已经达到一万亿(1trillion)美元 。更重要的是这一计划未来的价值体现还在不断继续。   那么,这样一个大型科学研究计划是如何得到政府的支持并真正产生了这样大的社会效益呢?究其原因是它不仅满足了科研界的普遍需求,同时也顾及到全社会的共同利益。首先,大型科学计划必须具有普遍的引领性,亦即可行、可控、可实现的科学性。HGP正是这样一个计划,以高质量测定一个人的基因组为具体目标,以发展DNA测序技术和规模化操作为手段,以国际合作为成功保障。这样的计划和管理模式显然也适用于其它物种的基因组计划和人类基因组多态性的深入研究。其次,大型科学计划要具有可计划性,计划的主体是人才与技术。HGP的实际领导者很多是来自于其他领域,他们的可信任度来自于做事情有始有终的历史纪录。比如英国的苏斯顿博士(John Sulston,获2002年度诺贝尔生理或医学奖)和美国的瓦特斯顿博士(Robert Waterston)被选为HGP基因组测序的主要领导者,分别领导了英国和美国最大的测序中心,他们早年其实是研究线虫生物学的专家。其三是大科学项目要有始有终,亦即具有阶段性和可操作性的目标,不能是开放式的(Open-ended)或结果无法量化的。当然,所谓的量化不是用文章和专利的多少,培养学生的多少来衡量,而是用社会效益来衡量,由独立咨询机构来调研和报告的。最后是统理和实施的艺术。HGP不仅要有一个清楚的路线图——科学领域发展的路线图往往是指研究活动的终极目标和操作过程——而且还要有共同的原则和实施方案。比如,HGP著名的“百慕大原则”(Bermuda Principles)要求所有测序数据必须在产出的24小时之内投放到公共数据库里,使珍贵的数据得到实际和及时的共享。   建立HGP科研成果与社会利益的关系,以及为保护和弘扬这些成果和利益所建立起来的法律保障体系都至关重要。没有这些利益的保障,利益也就不存在。在美国,科研成果和社会利益保障关系的建立可以追溯到著名的Bayh-Dole Act,亦即1980年美国通过的知识产权法( P.L. 96-517, Amendments to the Patent and Trademark Act) 。这项法律旨在保护来自于政府研究或研发基金资助下非赢利组织和小型企业产出的发明专利权,来鼓励发生在研究领域、小企业和成熟企业之间的知识产权转让、合作与合资。中国科学家虽然参与了HGP,承担了1%的任务,但是HGP在中国社会所产生的实际效益也非常有限,比如技术研发成果不多,专业性企业寥寥等。除了华大基因研究院和中国科学院北京基因组研究所还在不同的管理框架下(民营与地方政府支持vs. 国家基金与科学院的常规支持)寻求不断发展外,国家南、北基因组中心的发展皆面临谁来“再输血”(持续支持)的问题。就一个寻求对人类科学进步和社会发展有所贡献的大国而言,如何利用科研基础和实力,为技术密集型企业提供实用技术和知识产权,值得国人深入思考和实践。   无论如何,HGP的传奇还在以惊人的气势和速度继续着。早在HGP完成之前,时任NIH基因组研究所所长的考林斯博士(Francis Collins)就提出了“从基因组结构到基因组生物学,再到疾病生物学和医学科学”的路线图,意在以最快的速度将这一计划所产生的成果转移到产生经济和社会效益上。发明第一代荧光自动测序仪的著名科学家胡德博士也曾提出4P(Predictive预测, Preventive预防, Personalized个性化 Participatory参享)医学的思想,旨在指引基因组学成果的具体应用。2011年美国基因组学与生物医学界的智库又发表了《迈向精准医学:建立生物医学与疾病新分类学的知识网络》,宣示基因组学的研究成果和手段如何可以促成生物医学和临床医学研究的交汇,从而编织新的知识网络。现已退休的华盛顿大学欧森博士是唯一一位既参加了起草1987年“人类基因组计划”宣言性报告,也参加了这个精准医学报告撰写的科学家。他对精准医学的解释是:“个性化”其实就是医学实践的正常形式,而分子水平信息的正确使用则会使医学更精准,因而成为恰如其分的目的性描述。他学医出身的博士后,也是目前NIH基因组研究所所长的格润博士(Eric Green),正在坚决地实践着欧森三十年以来的一贯思想:大科学项目一定要有始有终、要有直接造福于社会的目的性。只有这样,主流科学家、政府、社会和民众才能坚定地支持这样耗时十数年、耗资几十亿、集科学思想与技术集成为一体的大科学项目。   实现精准医学需要在两个大领域——基础生物医学与临床医学——建立实际的转化研究和紧密的接轨机制。我们已经看到了诸多“转化中心”的成立,我们也看到了各类“转化研究”的启动。尽管目前精准医学还不是一个具体的学科和大项目,但是在这个科学思维框架下的蓝图已经规划好了。《迈向精准医学:建立生物医学与疾病新分类学的知识网络》的报告已直接建议了几个可实施大项目,比如“百万人美国人基因组计划”、“糖尿病代谢组计划”、“暴露组研究(Exposome)计划”等。就百万人基因组测序而言,其单纯的DNA测序价格就应该在10亿美元以上。鉴于英国的医学临床资源规范而且丰富,首相卡梅伦去年斥资一亿英镑率先就启动了“十万人基因组测序计划”。可见,只要是可以直接造福国民的科学计划,对谁来讲都是“乐而为之”。   然而,尽管精准医学的提出同时给基础研究和临床研究指出了共同发展之路,但是他们面临的挑战和问题却各有不同。    3. 基础生物学的发展与基因组生物学的新境界   基于基因结构和序列变化的基因组学研究无疑必须转入到以生物学和医学核心命题为目标的研究。基因组学技术和规模化的特征将会延续并发扬,大数据、复杂信息、新概念和新知识等等,都在不断地催生新的科研思路和新的思维境界。从“DNA到RNA再到蛋白质”和各类“组学”研究,最终将汇集在一个或者数个生物学命题下(比如癌症、代谢疾病、脑发育与认知、生殖力的可塑性等),形成一种整合性、更高层次的“数据—信息—知识”消化和理解过程。二十多年前胡德博士提出的“多系统生物学”开辟了新的思维和方法,但是他并没有将其研究内容具体化、思维框架化。尽管他思想的追随者们开发了很多高通量技术,产生了很多蛋白质-蛋白质相互作用的数据,基因表达关联数据,还开发了网络分析方法等,但是一个既宽容,又有序的思维框架还是呼之欲出,或隐或现。   首先,基因组学在新形势下已经完成了从基因组学(以DNA序列为研究主体)到基因组生物学(以生物学命题为研究主体)再到基于谱系的基因组生物学(以生物谱系,如哺乳动物为研究主体)的“凤凰涅磐”。目前已经没有人再会来批评基因组学就是“测测DNA序列”了。近几年来,基因组学研究的功能和视野都有了长足的拓展,DNA测序技术已经到达了一个新的平台:应用基本成熟,通量和价格基本平稳。未来会有诸多的基因组序列在名目繁多的理由下,被不断测定,大数据的迅速积累也成为必然。不过,地球上物种之多,科学发展之不断,DNA测序项目还会层出不穷,技术的研发和革新还会继续。那么基因组学领域本身的革命性变化会在哪里呢?答案是多方面的,比如人类基因组在过去500代(假设20年为一代人)里积累的群体多态性会在未来的五年内全部找出来,这些多态性与人类疾病的关系也会在未来的十年里基本搞清楚,模型哺乳动物(比如小鼠和大鼠)基因组的相关信息也会被逐渐全部获取。又比如,DNA测序可以用来确定DNA分子上的种种化学修饰,这些化学修饰可以用来评价基因表达调控机制;DNA测序可以用来评估染色体的构象,而染色体构象与个体发育和细胞分化都密切相关;DNA测序可以用来研究单个细胞的基因表达,而单细胞里单个基因的表达是基因功能调控的最基本信息;DNA测序可以用来评价染色体的物理状态,比如核小体的定位和组分(如组蛋白)蛋白质的化学修饰等,这些信息与基因在高层次的调控有关。可见,DNA测序将不再停留在测定基因组本身的序列和多态性,会延伸到其它相关“组学”领域的研究。   其次,我们至少要在五个分子和细胞生物学层面上考虑基因组生物学的发展和研究内容。第一是“信息流”(Informational Track),它延续“中心法则”的思维框架,主要研究对象是DNA、RNA和蛋白质序列信息,由遗传密码来解读。它的相关研究领域包括分子遗传学、分子进化和基因组结构等。尽管基因型与表型的关系从传承来讲是遗传学的研究内容,但是越来越多的表型被分到可塑性的研究范畴。大样本量的研究也必然要与生态学结合在一起。简单地将基因变异(编码部分)与复杂的生物学现象相关联是不能够真正解决重要生物学问题的,其实质更不是金-威尔森(King-Wilson)在1975年提出的“两个调控水平”假说(简单的基因调控区假说,认为基因调控序列决定基因调控的不同,从而导致近缘物种间的表型不同) 。信息流的研究素材主要是基因组DNA序列和基因组的群体多态性,这些多态性的特点是它们的相对有限性和稳定性。比如,人类基因组间的序列差异大约是1/500,而这些不同常常是以不同的频率被同一个群体来共享的。换句话讲,如果我们测定了一个群体中一万个个体的基因组,这个群体的未知多态性就会所剩无几了。第二是“操作流”(Operational Track),它的研究对象包括生理学、细胞生物学和分子生物学研究的主要实验内容和生物学命题。操作流是个比较复杂的体系,它包括了以DNA(Epigenomic,表观基因组学)、RNA(Ribogenomic,RNA组学)、蛋白质(Proteomic,蛋白质组学)为主体的各种穿插交错的调控机制,对应的是这三个已经建立起来,但是信息流以外的“组学”。第三是“平衡流”(Homeostatic Track),主要是药理学和生物化学等学科的研究精华。平衡流包括三个基本部分:物质(Material)流、能量(Energy)流和信导(Signaling)流。重要的物质流研究对象包括血红素(比如,血红素与生物节律的关系)、生物激素(比如,生长激素与发育的关系)、神经递质(比如,生物递质与神经发育的关系)等等。重要的能量流物质研究对象包括dNTP、NTP、多聚磷酸、各类单糖、各类多糖等。DNA、RNA和蛋白质等作为主要细胞组分也会与能量流和物质流密切相关。我们对能量流的了解其实还是非常有限的,但是从另一个角度来说,其发展潜力也是非常巨大的。比如,人类的生命周期(发育、更年、衰老等)和生殖周期的生理学就是这个“流”所要研究的部分基本内容。病理状态,比如人群中高发的代谢和神经退行性疾病等也在其中。信导流,也就是信号传导,显然已经是分子生物学家几十年来的研究对象,勿须赘述。第四是“分室流”(Compartmental Track),它涵盖发育生物学、解剖学、生命起源等领域所涉及的核心科学问题。分室流将以单细胞和细胞群为研究对象,揭示细胞分化、个体发生和发育、组织形成等分子机制。由于生命起源是由简单到复杂,由单细胞到多细胞,所以分室流也将揭示生命起源和细胞器形成等分子机制。干细胞研究也是属于分室流研究的范畴,主要是在分子水平上解释胚胎、诱导干细胞、特定组织干细胞等的差别和如何解释干细胞的自然发生、诱导发生、定向分化和异常分化。同时,也要建立测定干细胞分化定向性和定向分化潜能的维持和诱导因素。第五是“可塑流”(Plasticity Track),主要是研究表型和行为的可塑性。前者囊括生态学与环境生物学的研究内容,后者包括神经生理和心理学等研究内容在分子水平的命题。这两个可塑流的分支有关系吗?为什么要将它们放在一起来研究?这里仅举一个例子,这就是生物节律之一的休眠,例如哺乳动物常见的冬眠(如黑熊)和夏眠(如热带蝙蝠)。冬眠其实是一个由中枢神经系统参与的主动行为,也是一个复杂的生理过程,同时又受环境因素的严格制约。动物的迁徙和休眠行为在进化的框架下,既有趋同进化也有趋异进化,也具有相当强的表型和行为可塑性以及两者的交织和重叠。揭开表型和行为的可塑性之谜显然不是简单的遗传和遗传多态性的问题,是要集成生命科学各个领域的最新成就和技术。   此外,这个“五流”是否涵盖了生命科学的全部呢?答案是肯定的,不能。因为知识在不断高速积累,科学要不断发展和提高,概念和理论必须不断更新。但是,就目前科学界能够容忍的变量和参数而言,这“五流”的关联已经足具挑战性了。生命科学研究基本上有两个极端:简单化和复杂化。简单化的研究是分子生物学家最津津乐道的:例如相互作用和信号传导的研究。复杂化呢,还没有先例。“五流合悟”可能就是一个具体尝试。我们过去对机械式的原理关注过多,对复杂而具有可塑性的生命现象的研究却非常欠缺。过去,这类现象被笼统地归为“表观遗传”和“环境因素”了。这个定义是非常不“科学”和可称经典“鸵鸟心态”。随着科学和技术的发展,我们可以逐渐来面对现实了。   再则,无论如何,生命是个整体,生命的最小单元细胞也是一个整体,就连基因这一生命编码的最小功能单元也是有不同的序列和相互作用原件组成。因此,“五流合悟”不仅势在必行,而且是唯一出路。那么,如何将不同的“流下(内)要素”关联起来呢?简单的孰重孰轻和孰本孰末,显然是不可能帮助我们解决根本问题的。至少五个基本时、空、量、域等参数要考虑,比如:(1)信息流:等位基因的主次之分和群体传递;(2)操作流:可量化的过程、结果和可传递性;(3)平衡流:量化物质的基数、噪音、阈值和能量水平;(4)分室流:量与时间、空间的关系;(5)可塑流:量、时间、空间、交流、程度和可学习性等。   最后,生命科学研究的真正挑战在于如何将这些基于不同概念界定的,由不同技术和方法获取的,被不同领域科学家们所收集的,停留在各个不同理论和信息层面上的知识编织成一个有机的网络或系统。而这恰恰是就是生命的特点,也可以说是揭示生命本质的终极途径。生物医学研究与临床医学实践的精准度也正是由这些研究学科前沿的进步来决定的。    4. 中国生命科学如何“自立于世界民族之林”   中国科学家在1999年适时参加了HGP,并承担了1%的任务。后来还参加了相关的国际性的基因组研究计划,比如“人类单倍体型图计划”和“千人基因组计划”等。但是这些科学计划地参与并没有在中国科学界和社会引起“波澜”,中国生命科学界迄今也没有启动足够规模、具有划时代科学意义的大项目,国家也没有启动能够让百姓大众振奋的大科学计划。   生命科学未来发展的基本趋势还是一目了然的。要实现应用的精准,首先是测量技术的精准。DNA测序已经精确到单个核苷酸,因此单细胞和单分子(或超微量)技术,将会引领未来体内技术的发展。DNA测序、质谱、微流控、CCD摄像、微纳加工等技术的国内空白都亟待填补。其次是数据的获取、组织和综合挖掘能力的建设。中国的超级计算机运算能曾经可以展示为领先国际水平,但是实际的领域应用程度却常常落后于国际同行水平。美国的NCBI和欧洲的EBI都是有着近30年历史的生物信息中心,我们没有;国际性大型文献收集和检索库都在不断扩张和更新,我们没有。第三是临床和自然资源的积累。我们可以从头开始。最后是大项目的策划和实施,我们正在研讨和积累经验。   值得乐观的是中国科学家发表的论文数这些年来不断攀升,显然与我国的科研投入有关。“一国之下,万国之上”的局面其实也有诸多隐情。比如,中国科学家的国际合作精神远在国际同行之下。其原因无外乎是单位和个人排名的纠结、致谢中资助单位排名的纠结、文章影响因子的纠结、无休止和无标准评审的纠结等等。挣扎在这些似乎无法摆脱的“泥潭里”,科学家们憧憬未来、策划未来和为未来而奋斗的心情是如何状态呢?    参考文献:    DELISI C. The Human Genome Project: The ambitious proposal to map and decipher the complete sequence of human DNA. American Scientist. 1988, 76: 488-493.    DULBECCO R. A turning point in cancer research: sequencing the human genome. Science, 1986, 231, 1055-1056.    SMITH L M , SANDERS J Z , KAISER R J , et al. Fluorescence detection in automated DNA sequence analysis. Nature, 1986, 321:674-679.    OLSON M V, HOOD L E, CANTOR C, et al. A common language for physical mapping of the human genome. Science, 1989, 245: 1434-1435.    COOK-DEEGAN R M. The Gene Wars: Science, Politics, and the Human Genome. W W Norton and Company, Inc., 1994.    TRIPP S, GRUEBER M. Economic impact of the Human Genome Project. Battelle Memorial Institute, 2011.    SCHACHT W H. The bayh-dole act: selected issues in patent policy and the commercialization of technology. CRS Report for Congress, 2012.    KING M C, Wilson A C. Evolution at two levels in humans and chimpanzees. Science, 1975, 188:107-116.  (转载自《自然杂志》第35卷 第5 期)
个人分类: 科普|4468 次阅读|3 个评论
大科学时代的小隐忧
热度 9 x0xu0008 2013-5-29 00:36
从秦始皇的万里长城到美国的曼哈顿计划,从瑞士群山里若隐若现的大型强子对撞机( LargeHadron Collider 1 )到中东阿拉伯湾上高耸入云的迪拜塔 2 ,人类历史上从来不缺少雄心勃勃的大项目( Magaprojects 3 )。 生物领域更是激情,梦想,气魄,以及金钱挥洒驰骋的舞台。 42 年前的 1971 年圣诞前夕( 23 号),当时的美国总统尼克松在美国国家癌症法案( NationalCancer Act )上签字,标志着美国决定倾举国之力攻克癌症的决心。这在历史上被称为 “ 癌症战争( Waron cancer 4 ) ” 。 20 年之后的九十年代,人类基因组计划( HumanGenome Project 5 )的大幕缓缓拉开。这次是总统里根向国会递交了申请。美国人计划用 15 年的时间,也就是到 2005 年,完成人类基因组的测序。这样有影响的工程,是每个总统梦寐以求的展示自己政绩的舞台。于是在 2000 年,克林顿就迫不及待地和英国首相布莱尔宣布了人类基因组计划的草图,而 3 年后人类基因组才大体完成, 6 年后的 2006 年,最后一个染色体 —— 最长的 1 号染色体的序列才最终确定。 自从人类基因组计划的提出,又是 20 年过去了,美国人又蠢蠢欲动。 2013 年 4 月 2 日,美国总统奥巴马宣布了脑计划的开启( BRAINInitiative (Brain Research through Advancing Innovative Neurotechnologies 6 )。美国人试图弄清楚人类大脑中每个神经元的活动。 这些计划的成败得失,现在还很难看清楚,评价总要在多年以后才能相对公允。但是不可否认的事实是,癌症战争中癌症越战越勇,脑计划如何还很难预测,人类基因组计划则是最成功的。这个计划不仅揭示了人类约 20500 个基因的全序列,发现了人类基因组中普遍的片段重复( SegmentalDuplications )现象,还为很多后序的工作奠定了基础。 一花多叶:人类基因组相关计划 1000 基因组计划( 1000Genomes Project ) 人类基因组计划( HumanGenome Project )虽然用不同来源的样本测序并作为参考序列( ReferenceGenome )。但是大部分序列( 70% )来自于纽约布法罗地区一个匿名的捐献者。所以很显然,这个序列不能代表所有人,因为人与人之间在 DNA 序列上是如此不同:人们之间在 0.1% 到 0.4% 左右的基因组序列上存在差异 7 ,这导致了我们彼此的千差万别。于是人们希望对更多的人进行测序,以便了解不同人在基因组上的差异。这就是诞生于 2008 年 1 月的 1000 个基因组计划( 1000Genomes Project 8 )的背景。 1000 个基因组计划最后选择了 1092 个志愿者进行 DNA 测序。为了覆盖尽可能广泛的人群,这些志愿者是被精心挑选的。他们包括来自尼日利亚南部城市伊巴丹的约鲁巴人( Yoruba ),来自东京的日本人,来自北京的中国人,美国犹他州的居民(祖先来自北欧和西欧),来自肯尼亚 Webuye 的 Luhya 人,肯尼亚 Kinyawa 的 Maasai 人,来自意大利的 Toscani 人,来自秘鲁首都利马的秘鲁人,来自休斯顿的 Gujarati 印第安人,来自丹佛地区的中国人,来自洛杉矶的墨西哥裔,以及来自美国西南部的非洲人后裔。 随着测序技术的发展,测序的时间和成本迅速下降。人类基因组计划用了 13 年,而 1000 个基因组计划尽管在工作量上大大超过前者,但是这个在 2008 年启动的项目,到了 2012 年就宣布完成 9 。 1000 个基因组计划总结了人类基因组的很多特征,比如突变频率( 10 −8 perbase pair per generation ),突变的数量等信息。这些信息的重要性,从第一篇 1000 个基因组计划文章 10 的引用次数就能看出来:发表于 2010 年的名为 Amap of human genome variation from population-scale sequencing 的文章,现在已经被引用了 1800 多次,相信多年以后,它可能成为生物领域最有影响力的文章,没有之一。 Encyclopediaof DNA Elements (ENCODE) 11 人类基因组中编码蛋白质的基因大约是 20500 个,只占基因组大小的 1-2% 12 ,其它的序列有什么样的作用?为了回答这个问题, 2003 年,就是人类基因组计划基本完成的年头,美国国立人类基因组研究所( US National Human Genome Research Institute (NHGRI) )又启动了专门针对基因组中的非编码序列的 ENCODE 项目。 从 2012 年 9 月开始, ENCODE 发表了一系列文章展示自己的成果。这个项目发现,人类基因组中大约 20% 的非编码 DNA 是有功能的,这些功能主要是涉及到基因表达的调控。 60% 的非编码 DNA 没有明确的功能。 TheCancer Genome Atlas ( TCGA ) 基因组蕴含了无数的信息,各种疾病在基因组上有什么样的改变?或者说,什么样的基因组改变造就了不同的疾病。这是个很大的问题。作为同基因组关系密切,又越来越成为人类负担的癌症,首当其冲的成为科学家研究的对象:人们希望揭示癌症的基因组构成。这样就诞生了癌症基因组研究项目 TheCancer Genome Atlas ( TCGA ) 13 。 TCGA 开始于 2005 年,由美国癌症研究所( NationalCancer Institute )发起。这个项目有几个特点:样本数量多 —— 大约 500 个病人样本;覆盖的基因组信息丰富 —— 基因表达谱,拷贝数变异谱,单核苷酸多态性, DNA 甲基化,外显子, microRNA ,甚至一定量样品的全基因组测序;最后,涉及的肿瘤类型多,几乎涵盖所有已知肿瘤。 现在,这个项目的很多研究结果已经陆续开始发表。各种癌症的基因组改变已经得到揭示。比如最近发表在新英格兰医学杂志上的关于急性骨髓白血病( AML )的癌症基因组的文章 15 。 除了美国的 TCGA 项目外,英国还有类似的项目:由 Wellcome Trust Sanger Institute 主持的 Cancer Genome Project 。 癌症基因组学最大的贡献是为所谓的个性化医疗( PersonalizedMedicine 16 )奠定了基础。 还有很多和人类基因组计划相类似的项目,比如人类微生物组计划( Human microbiome project ),黑猩猩基因组计划( Chimpanzee Genome Project )等。 隐忧 之一:科研的动力: 每个人都想在在世上留下自己走过一遭的标志:运动员用自己的成绩,政治家用自己的政绩,科学家用自己的发现。费马大定理,牛顿方程,沃森克里克 DNA 双螺旋,张益唐对孪生素数猜想的证明,带给这些人无限的荣耀。可是今天那些组学文章动辄成百上千的作者,他们的贡献,仅仅轻描淡写的 “ 某某人等 ” 就能慰藉得了么?如此打酱油般的存在,大科学时代一将功成万骨枯的现状,会给参与者带来多少科研快感呢? 之二:假设和描述的冲突与融合: 人类历史上在科学上取得的巨大成绩,常常来自于天才人物的想象力。牛顿三定律,爱因斯坦的质能方程,沃森和克里克发现的 DNA 双螺旋结构,甚至最近张益唐先生的孪生素数猜想的证明,都是来自于天才人物的巧妙心思。这些科学探索的共同特点是合理的假设和对假设的证明。 生物学一度是不依赖于假设的描述性学科:鸟飞鱼跃,花开叶落,天地悠悠,如此而已。自从孟德尔建立了遗传法则和沃森克里克发现了 DNA 双螺旋,生物学逐渐变成了由假设推动的实验学科。 大科学尤其是组学,测序,带来了新一轮的生物学大发现。 一方面,我们在历史上见证了无数的由假设推动,并且取得了广泛成功(所谓的成功并不是发表文章,而是对人类生活的影响)的科学,这导致了人们对上个世纪 50 年代绚烂的科学发展的无限怀念;另一方面,我们又面临着大科学带来的大发现。这对基于假设的科学的冲击是空前的。这些乱花渐欲迷人眼的新的科研方式和成果,到底会给我们的学术和生活带来什么样的改变,现在还很难说清楚。 去年 10 月份北大的饶毅王俊之辩,从某种意义上来讲,是传统的基于假设的科学和新兴的大科学的一次碰撞,也就是 hypothesesfirst 还是 data first 的问题。除了这次中国人相对熟悉的科学辩论,还有另一个大家不太熟悉的辩论。辩论的一方是 MIT 的 RobertWeinberg 17 ,杰出的癌症研究专家,因为发现 Ras 和 Rb 而奠定了自己的科研基础,另一方是哈佛医学院的 ToddR. Golub 18 ,组学( -omics )的倡导者和实践者。尽管 Weinberg 认同利用 RNA 干涉在全基因组水平来研究癌细胞中的关键基因,但是他对癌症基因组学的性价比还是有自己的质疑。他也表示了自己对科研人才流失的担忧:在大科学时代的风气下,政府在资金的投入上更少地顾及到以假设为基础的小的实验室,从而留不住很多优秀的科研人才 —— 大科学并不需要那么多的杰出科学家。 Golub 则推崇大科学所带来的巨大的信息,认为这些信息必将大大促进科学的进步和百姓的福祉。 碰撞并不一定意味着两败俱伤,更多的是接纳和融合。人类历史上民族国家之间的碰撞,尽管在当时造成了巨大的创伤,但是最终常常孕育了生机和活力。科学也是如此。相信由大科学带来的海量信息,必将给假设更加富有营养的土壤。 Large HadronCollider. Wikipedia. Burj KhalifaTower. Wikipedia. List ofmagaprojects. Wikipedia. War oncancer. Wikipedia. Human GenomeProject. Wikipedia. BRAINInitiative (Brain Research through Advancing Innovative Neurotechnologies).Wikipedia. HumanGenetic Variations. Wikipedia. 1000 GenomesProject. Wikipedia. Anintegrated map of genetic variation from 1,092 human genomes. Nature 2012; 491 (7422): 56-65. A map ofhuman genome variation from population-scale sequencing. Nature 2010; 467 (7319): 1061-73. ENCODE.Wikipedia. Fewergenes, more noncoding RNA. Science 2005; 309(5740): 1529-30. TheCancer Genome Atlas (TCGA). Wikipedia. CancerGenome. Wikipedia. Genomicand Epigenomic Landscapes of Adult De Novo Acute Myeloid Leukemia. May 1,2013DOI:10.1056/NEJMoa1301689. PersonalizedMedicine. Wikipedia. Point: Hypotheses first. Nature 464 , 678 (1 April 2010). Counterpoint:Data first . Nature 464 , 679 (1 April 2010) .
个人分类: 科研 产业|11505 次阅读|10 个评论
人类基因组计划十周岁:纳税人看到希望了吗?
热度 18 KONGX 2011-2-12 09:37
最近的日子过得很鳖,很闷,因为觉得自己是台机器,或者说是一个具有高学历的技术员,日复一日的重复着枯燥的工作,扩增和测序。尽管很多人跟我做着一样的事,而且被认为很有价值。 这一期的 science 发表了一大堆的文章,庆祝人类基因组计划十岁生日 ,庆祝 Next Generation Sequencing (新生代测序)技术的成功和带来的种种机遇。 NGS 被评为 2008 年十大创新技术之首,这一技术很快风靡了, RNA-seq , Exomic 和 whole genome 成为海量数据获取的源泉。利用 RNA-seq 、 CHIP-seq 等研究生物学机制成为一鼓鼓流行风,研究表观遗传学的利用两种核心的优势,定量和定位,研究蛋白与 DNA 间的结合作用,当然科学网上有韩健老师鼓动他在 TCR 、 BCR 上的研发工作,我核心关注的依然是人类基因组计划和 NGS 怎样改变现代医学。 十年前,我从一个刚刚学完阑尾切除术的实习医生过渡到一个研究生, 老板给我的课题就研究基因与疾病的关系 。捧着一本遗传学书,开始学习。以当时国内名气最响亮的几个著名研究者的工作来说,夏家辉、贺林、沈岩等等,他们手头上首先有多个非常好的家系,采用为数不多的染色体上的几个标志物,寻找疾病关联基因的染色体区域,一个名词困扰了多年,称为 Mapping (到现在我都不知道该怎么翻译)。 Mapping 到一个区域之后就是开始寻找致病变异的过程,运气好一点能 mapping 到几个 MB 的区域, 这个区域就是说只有几百万个碱基对,而当时在全自动测序仪出来以前,一个测序反应只能测 100 左右个碱基对 , 可想而知以 100bp/day 的速度完成 100 万的未知领域需要多长时间。运气成为很大的变数,他们都是幸运者,都“发”了。不过还有“发”的比这几位更牛的,去年的 Lasker 奖获得者 兼现在的校友 Jeff ,在更早的时候用八年的时间 Mapping 到一个与肥胖、与食欲密切相关的基因,瘦素。 实验室的一个女孩,一个漂亮、乐观的女孩, Mapping 到一个 100Mb 的区域,里面一共有 52 个基因。四年、整整的四年、日复一日,做着同样的工作,她变了,变得不安、变得焦躁,她不知道何时才能结束她的博士,直到二年前的圣诞节,火箭升天了,原子弹爆炸了,她终于找到了,等待她的是“ science ”,大基因、大 Paper 。 可是她花了整整的四年,如果现在的话,她只要二个星期。同样,如果现在每个 sample 都能 whole genome 一下的话,我至少前面的半年还有今后的几个月(希望不要几年)可以做其他事情。可惜每个标本需要 2000 美金,人力的价格还是要节约很多。唯一让我很不爽的是,读 ATCG ,尽管 bioinformatics 发展到现在,但是面对测序中的 background 也只有人能判断准确。 曾经有位遗传学家说,将来医生看病,看到的首先是一个人基因构成。不管当时、还是现在,我认为都是 bullshit , 做为一个医生,主诉必须能够直接推断主要诊断,这跟基因是毫无关联的 。未来遗传学怎样改变现代医学是一个非常非常重要的方向,遗传学可能是联系临床医学与基础研究之间的必要桥梁。医生需要的三个大工具: 诊断 , 所有现病史、鉴别诊断、体格检查、实验室检查的目的都是为了诊断; 治疗 , 无论借助于药物还是借助于手术,或者其他都是基于明确诊断的基础; 预防 , 是基于对致病原因的理解。三大支柱中,诊断是核心和基础,没有诊断就没有治疗,没有诊断就没有预防。 未来遗传学的方向是其必须成为很多疾病诊断上的金标准 , 其应用的价值必须能与病理检查、微生物培养、生化代谢检测、心脏血管造影等等相提并论。 临床上更需要的是一元论,也就是说一种病因说明一组症状。目前遗传学能够直接指导临床的例子不少 , 经典的染色体分析能看到染色体的大问题,比如 Downs 综合征,慢粒中费城染色体,还有性染色体异常导致的雌雄同体等等,遗传学方法经历了长时间的演化,核型分析演化出很多不同类型, FISH 也变了很多花样,直到 PCR ,成为现代临床中不可或缺的方法。 十年前,大多数医院对于慢性乙型肝炎病人往往采用血清学的方法分析,也就是通常可以听到的“大三阳、小三阳”,这两个词也成为街头巷角广告的大客户。十余年前一种药物突然涌起,拉米夫丁,这个药物改变了慢乙肝治疗的规则,这个药物更很快站在中国药物消费排行榜的首位。可是,病毒绝对不会袖手被灭,他们很快发现怎样抵抗药物,“耐药”一时间成为时髦字语。病毒遗传学研究也随着拉米夫定的应用不断升温,而分子诊断也逐渐成为主流,现在卫生部认证的 PCR 实验室遍地开花。 事实上除了微生物学以外,在肿瘤治疗上,遗传学的威力已经开始显现。比如在白血病治疗过程中,融合基因表达的检测不仅能明确诊断,指导临床采用靶向治疗,而蓬勃涌现的靶向治疗方案,更需要临床上有更多的设施能够快速明确遗传诊断。 再回到测序,回到遗传, 2010 年 NGS 开始给力,新的疾病和致病基因一个个被发现,基本上每期 Nature 、 Science 、 New England Journal of Medicine 都有 , 包括最近一期 Science 遗传性高血压新基因的发现。不谈基层医院,在超大规模的医院里,医生对遗传的理解个人感觉非常弱, 很多医生能随口说出这个人基因不行,但是却说不出这个人到底是什么基因不行,更不用说想法设法去了解这个病人到底哪个基因不行 。 在超大规模的医院,有的教授已经具备基因研究的条件、设备和经费,他们也发表一些某某单个核苷酸多态性( SNP )与疾病密切相关的文章,超级有钱的老板会做 GWAS 的研究,而目前 SNPs 除了超级震撼的 P 值以外,他们在临床上不具备直接指导价值,因为独立甚至联合 SNPs 的危险度依然很低。 在“一元论”为主的临床世界、在一个需要与时间赛跑的临床医学世界,人类基因组学如何接轨需要更多实践性的思考, 而思考的根源与孟德尔的豌豆实验一样,选择合适的表型 , 即选择合适临床表现的患者。
个人分类: 科学杂谈|5594 次阅读|28 个评论
人类基因组计划:新老大牛的交锋
热度 1 songshuhui 2010-12-21 20:24
科学松鼠会 发表于 2010-12-18 11:19 作者:萧汲(见习松鼠) 虽然早在1953年,Watson Crick就发现了不朽的DNA(脱氧核糖核酸)双螺旋结构,但是长久以来,人们始终都找不到很好的办法测定DNA中四种碱基A(腺嘌呤)、T(胸腺嘧啶)、G(鸟嘌呤)、C(胞嘧啶)的排列顺序。如果说DNA是藏有生命遗传密码的天书的话,那么若是连构成密码的这4个基本字母都不能识别,人们就永远没有机会破解生命的遗传密码、解读生命的奥秘。 这种窘境直到一位名叫Frederick Sanger的大牛发力才得以打破。 DNA测序时代开始 Sanger头像 说起这个Sanger君,早就是牛的不得了的人物了。早在1955年,他就发明了一种通过电泳鉴定蛋白质结构的方法,并且因此单独获得了1958年的诺贝尔化学奖。 到了1975年,双螺旋结构发现20余年后,Sanger君又发明了一种称为链终止法的方法来测定DNA的序列。 测量DNA的序列,就像搞清楚一条铁链每一环的顺序一样,我们可以先将铁链按照1节、3节、5节。。。。。。13节、15节。。。。。。。167节、 169节等等不等长的顺序截断,这样我们根据断链的长度就可以知道断链的先后顺序,然后用同样的方法把较长的断链的顺序搞明白。可是打断铁链容易,准确截断DNA则不是那么容易的事情。而链终止法,又叫Sanger法,就是一种通过准确的截断铁链上某种特定类型的环来测量DNA序列的方法。 我们知道DNA的信息是由ATCG四种碱基书写的,由于DNA的双链结构,每个碱基都以A-T、G-C的配对方式和对应的碱基形成一个碱基对,即1个 bp(base pair),1bp可以理解为DNA天书上的一个字节。在DNA复制的过程中,原来的DNA链作为模板,通过A-T、G-C的碱基配对方式合成新的 DNA单链。而合成新DNA的原料就是dNTP(N代表A、T、G、C),称为脱氧三磷酸X苷(X代表与A、T、G、C相对应的腺、胸腺、鸟、胞)。 Sanger通过在dNTP身上做手脚,使得DNA复制时,做过手脚的dNTP(ddNTP,双脱氧三磷酸X苷)和模板的碱基配对以后,复制即停止。如此一来,新合成的DNA单链即变成在不同位置终止的残缺片段。这些片段因为长度不同而拥有不同的分子量,通过电泳的方法即可轻易的被分开。 DNA复制 例如,假设有一段20个碱基(bp)的DNA片段,科学家想要测定这段DNA的序列。那么,在复制这一段DNA的时候,加入正常dNTP作为原料的同时,再加入一些做过手脚的ddTTP。如果ddTTP和第二个位点的腺嘌呤(A)结合,那么合成过程就会在这个位点终止,新合成的DNA链只有2个bp,相对分子量就是2。如果ddTTP和第八个位点的腺嘌呤(A)结合,那么新合成的DNA有8个bp,相对分子量就是8。随后通过化学方法将这些完整的、不完整的DNA链解开,用电泳的方法把这些DNA链按不同的分子量分开,我们就能看到,最后产生了一些相对分子量分别为2(在第二个位点和模板结合的 ddTTP)、8(在第八个位点和模板结合的ddTTP)以及20(完整的DNA片段)的DNA单链。由于DNA的复制只能按由5端到3端的方向进行,那么通过这种方法,我们就能推测出,这段DNA从5端开始的第一位和第八位的碱基都是腺嘌呤(A)。 DNA电泳 如此再根据互补原则,分别加入动过手脚的ddATP、ddCTP、ddGTP,即可依次测出这段DNA的T、G、C碱基的位置。如此就能测出这段DNA完整的碱基序列。Sanger成功的用这种方法测出了一些碱基对数目很小的病毒DNA的。他也凭此项发明获得了1980年的诺贝尔化学奖,至此,Sanger君成为目前世界上唯一一位获得过两次诺贝尔化学奖的科学家。 但即使是如Frederick Sanger这般独此一家,别无分号的大牛人也有解决不了的问题。 Sanger法的缺陷在于: 1.只能测定病毒等碱基数目较小的DNA,无法应付如人类这般成千上百万碱基对构成的DNA。 2.测定碱基序列需要大量完全相同的DNA拷贝,即必须将要测定的DNA复制很多倍以后才能进行测定。一般的样本很难满足其DNA数量上的要求。 因此,科学家们能测定的DNA碱基(300~500bp)序列的长度非常有限,对稍大的DNA完全束手无策。好在不久之后,科学家们即在大肠杆菌(E. coli)中发现的一种特殊的限制性内切酶,具有能将特定序列的DNA切成小片段的特性。这种叫做EcoRI(英文全称)的酶,帮科学家们解决了 Sanger法的第一个难题,即使再大的DNA分子,也能通过限制性内切酶切割成小片段进行测序。 EcoRI切断部 同样,EcoRI对于解决第二个难题,即DNA数量上的不足,也有很大的帮助。EcoRI切下的DNA小片段的断端具有粘性,如果用同样的酶把酵母菌(或细菌)的DNA也切开,这些需要研究的小片段就能与酵母菌DNA的断端粘在一起,然后重新闭合。如此,被切开的DNA片段就被插入到酵母的DNA中去了。这个就叫做基因重组。由于酵母DNA分裂复制的速度非常快,这些被插入的片段也能一起被快速的复制。这个过程称为克隆扩增。当达到需要的拷贝数时,研究者则通过EcoRI再把需要的片段切下来用。 由于EcoRI的发现,解决了基因测序上的多个难题,限制性内切酶的发现者,Werner Arber, Daniel Nathans, 和Hamilton Smith共同获得了1978年的诺贝尔医学和生理学奖的殊荣。 Werner Arber Daniel Nathans Hamilton Smith 同样是诺贝尔奖,有些人要3个才能合拿一个,有的一个人就能拿两个奖,可见大牛们也是分等级的。 于是通过Sanger等人(此后Maxam、Gilbert等人又改进了Sanger的方法)发明的DNA测序技术和EcoRI等限制性内切酶的结合,科学家们很快就开始在生物基因组这片从未被开垦过的处女地上疯狂的耕耘起来。到了上世纪80年代末,人们已经能够测定高达100,000bp的完整病毒基因组。 随着基因组研究的飞速发展,一个以前人们连想都不敢想的计划逐渐在科学家们的脑海中盘旋他们想要测定人类整个基因组的碱基序列,把人类基因组的30亿个碱基一个一个的检测出来。他们想要破解上帝留给人类的基因天书。 人类基因组计划 The nations of the world must see that the human genome belongs to the worlds people, as opposed to its nations. 世界上的国家都必须意识到,人类基因组属于全人类,而非属于某些国家。 James D. Watson 分子生物学家,DNA双螺旋结构发现者之一,1962年诺贝尔医学和生理学奖获得者 二十世纪80年代,随着基因测序技术的发展,以及计算机技术的介入,DNA的测序工作变得越来越易于操作,越来越多生物的基因组被辨识,人们不禁畅想:什么时候我们可以把人类基因组的30亿个碱基对的序列统统辨识出来呢? 1984年,美国能源部(United States Department of Energy)首次将旨在对人类基因组测序的人类基因组计划摆上议事日程。虽然此前科学家们已经断断续续测出总计约3700万个碱基对的人类基因序列,但这仅占整个人类基因组的1%多一点。显然,任何个人或团体要想在有生之年达成测序30亿个碱基对的目标,光靠愚公移山的精神是不够的。这不只涉及到大量人力、物力的投入,还要求大量的资金支持。根据当时的技术水平,平均每测量一个碱基对需要的成本约3~5$,而一共有30亿个碱基对需要测定。这样庞大的投资,不是单独的个人或者团体能够负担的,甚至单个的国家都不一定有如此雄厚的财力支持这个计划。因此美国能源部的人类基因组计划一直难以有什么实质性的进展。 直到1988年,美国国家卫生研究院(National Institutes of Health,NIH)来了一个人,这个人的出现使得人类基因组计划真正的开动起来。这个人,就是我们DNA研究者中的战斗机牛逼小分队的核心人物,DNA双螺旋结构的发现者之一,牛人中的牛魔王,James D. Watson君。 晚年的Watson,真是岁月不饶人 人类基因组计划徽章 Watson君的加入不啻为人类基因组计划的一记强心针。1990年,NIH和美国能源部为他争取到30亿美元的巨额预算用于测序工作,人类基因组计划正式启动。随后,在各国科学家的努力下,英国、法国、德国、日本、中国和印度先后加入了这个庞大的计划。人类基因组计划终于成为一个国际性的科研计划。 当然了,给人类的基因组测序并非如给只有区区100kbp的病毒基因组测序那么简单。人类的基因组共有30亿多个碱基对,通过限制性内切酶可以把它们切成 1mbp(一百万个碱基对)大小的片段,再转到酵母上进行克隆扩增。为了搞清楚放到酵母菌里克隆扩增的到底是哪一段DNA片段,科学家需要一种名为序列位置标签(Sequence Tagged Site, STS)的基因片段来定位。 如果把人类基因组视为一片广阔的土地的话,那人类基因组计划无疑就是为这片土地测绘地图的工作。为了更好的描绘地图,避免在测绘的时候迷路,科学家们需要先在地图上标记一些独特的、整片土地上只有一个的标志物来作为地标,然后在地标之间详细地描绘地图上的细节。而STS,作为一段200~500bp的 DNA片段,每一段STS都只能在人类基因组中找到一次,而且这段STS在哪条染色体的哪个位点的哪个具体位置上,科学家们都已经通过PCR的方法确定了。因此,给一段DNA测序完以后,只要再找到这段DNA上STS的位置,就能推知测出的是哪个位置的DNA序列了。 人类基因组 虽然电子计算机的应用大大减少了科学家们的工作量,但为基因组测序仍然是漫长而枯燥的工作。Watson原本预计花费15年完成人类基因组的测序工作。可惜的是,Watson没能亲手完成这个伟大的任务。人类基因组计划开始没多久,在1992年,Watson即因为反对给人类基因申请专利而被NIH炒了鱿鱼,灰头土脸的离开了这个项目。当时NIH的研究人员通过一项技术辨识出了一段cDNA片段。NIH试图为这段cDNA申请专利,因为为基因申请专利所带来的利润可以刺激相关学科的发展。但Watson却认为所有与人类基因有关的知识都应该免费与全人类共享。由于和领导意见的巨大分歧,Watson不得不卷铺盖走人。当时的人们以为Watson是廉颇老矣,可后来事件的发展却证明姜还是老的辣。那些新生的小牛犊们固然有十八般武艺,也不及老牛的高瞻远瞩,远见卓识。 且说一代大牛渐渐淡出人们的视野,新的时代属于那些年轻的牛犊们,人类基因组测序的伟大事业,将要在这些新兴的大牛们手中完成。 1993年,时年43岁的Francis Collins接替了Watson的工作,开始领导国际基因组计划。此前Collins的成就主要是发现了包括亨廷顿舞蹈病、M4型急性淋巴细胞白血病在内的多种疾病相关的基因,人送外号基因猎手(很威风的外号)。不过,Collins固然牛,但大牛们的光环不再,人类基因组计划这艘大船在 Collins这头小牛犊的带领下,战战兢兢的往前行,即将迎来狂烈的风暴,差点面临翻船的危险。 小牛犊Collins 这暴风的源头,源于在人类基因组计划进行到第八年,1998年,一个新时代的大牛横空出世。这位大牛甫一发力,即在学界搅起一阵轩然大波(或者说是一阵妖风),经历诸多坎坷,倒反使得人类基因组计划较预期提前了好几年即告完成。 学界对此大牛议论纷纷,有说他对人类基因组研究做出巨大贡献的,有说他是搅屎棍的,还有人说他是弗兰肯斯坦一般的科学怪人,这个人就是Craig Venter。 Craig Venter富有争议的科学家 江山如此多娇,引无数英雄竞折腰。 惜秦皇汉武,略输文采; 唐宗宋祖,稍逊风骚。 一代天骄,成吉思汗,只识弯弓射大雕。 俱往矣,数风流人物,还看今朝。 毛主席《沁园春雪》 俗话说江山代有才人出,一代更比一代强。到了二十世纪末,在人类的DNA探索史上留下里程碑的牛逼小分队的老一辈队员们老的老、死的死。而新时代的弄潮儿,牛人中的牛魔王则非Craig Venter君莫属。是的,你没看错,这位Craig Venter正是最近风头正劲,制造出首个的人工合成基因组支配的细胞的那个科学家Venter。 这张肖像正好反映出Venter在世人眼中亦正亦邪的形象 Venter君是个怪才。高中时,他无心学习,却迷恋于水上运动以及泡妞,差点因为成绩太差而退学。后来Venter应征入伍。越战期间,他在越南的美军野战医院服役。这段经历想必给了Venter君相当强烈的刺激。回国以后,Venter君开始发奋图强,拼命考证。在风景如画的加州大学圣地亚哥分校,他获得了生化学学士(1972年)、生理学和药学博士(1975年)一共三个学位。 随后,Venter君到纽约州立大学水牛城分校担任教授。在这个地方,Venter君抛弃了他的前妻,与自己的学生,美貌(?)的Claire M. Fraser结为连理。1984年,Venter来到了NIH(就是老牛Watson领导人类基因组的那个地方)。 Claire M. Fraser 在NIH,发生了两件事情,对Venter君造成了很大的影响。一件事情,是Venter所在的研究院通过一项技术辨识出了一段cDNA片段。NIH试图为这段cDNA申请专利(还记得老牛Watson吗?他就是因为这件事而被NIH炒了鱿鱼。),结果败诉,法院认为这段DNA不具备申请专利的条件。而这项申请案正是Venter负责的。 另一件事情,Venter发现用之前提到的Sanger君发明的链中止法给基因一个一个的测序效率实在太差,由此导致整个人类基因组计划的进度严重落后。于是他建议使用速度更快的鸟枪法测序。但是此提议遭到NIH的科学家们的一致反对。因为这件事情,Venter君心灰意懒,决定把上司炒了自己单干。 1998年,Venter筹集资金,建立了塞雷拉基因组(Celera Genomics)公司,开展自己的人类基因组计划。 鸟枪法 塞雷拉公司所采用技术,就是俗称鸟枪法的全基因组霰弹枪定序法(Shotgun sequencing)。这种方法通过把整个人类基因组样本随机断裂成上百万个小碎片,然后用链中止法给这些碎片测序。通过计算机辨识碎片中重叠的部分,再把这些碎片拼接起来,形成完整的DNA序列。 这种方法不需要预先检测出测序的小片段的具体位置,只需要将打碎的片段统统测序完,再送到电脑里运算就行了。由于是一口气把整个基因组打碎了来测量,相比传统一条一条染色体测绘的方法,鸟枪法要快很多。然而,由于人类的染色体在某些部位(端粒和着丝点)有着大量重复的序列,用鸟枪法检测这些序列的时候,计算机正是靠不同片段之间重复的部分来判断序列的位置,这些高度重复的序列会导致计算机算出错误的结果,也就是说,鸟枪法处理这些有着重复序列的部分并不十分精确。这也是国际基因组计划的科学家不认可这种方法的原因,他们更倾向于速度慢,但是准确性更高的链终止法。 不认可归不认可,Venter用这种方法获得了成功。塞雷拉公司很快就赶上并且超过了国际基因组计划的进度。本来大家以为这也就算科学家的意气之争,但公众绝对料想不到,接下来事情的发展大大超出世人的想象。塞雷拉公司刚开始测序计划的时候,同意将得到的数据和国际基因组计划分享。然而,他们拒绝像国际计划一样,把得到的数据放到网上和全人类共享,也禁止他人自由发布或无偿使用他们得到的基因数据。也就是说,别人想用他们的数据,必须花钱。 到1999年,塞雷拉公司更是作出惊人之举,他们为人类的6500个基因申请专利保护。一旦他们得逞,今后每个地球人体内都将有6500条基因归塞雷拉公司所有,任何人想要检测自己体内的这些基因,或者医药公司想要研发和这些基因有关疾病的新药,抑或科学家想研究这些基因都要给塞雷拉公司交钱。 可以想象,塞雷拉公司和Venter的举动成了众矢之的,人们纷纷指责他们的自私自利会严重妨碍遗传学的发展。这事越搞越大,最后惊动了中央。。。额不。。。美国政府,2000年3月14日,时任美国总统,比尔克林顿和英国首相布莱尔联合发表声明称人类基因组数据不允许专利保护,且必须对所有研究者公开。如今,任何人都能轻易的在GenBank网站(http://www.ncbi.nlm.nih.gov/sites/entrez?db=nucleotide)上查到人类基因组的信息。 于是Venter和他的塞雷拉公司受到严重的打击。克林顿发表声明的当天,塞雷拉公司的股票就暴跌。他们今后不仅不能通过申请专利赚钱,还不得不把所有的数据都向公众公开。此时,人们不得不佩服老Watson当年的远见卓识,人类基因组计划是为了整个人类谋福利的,任何想将这一成果据为己有的企图都会受到各方面的阻挠。Venter虽牛,却远远没认清这一点。 不过,挫折归挫折,塞雷拉公司仍然保持着基因组测序方面的优势,只要能抢先完成人类基因组测序,Venter他们至少能够获得首个完成人类基因组测序工作的研究者的殊荣。即使赚不到钱,至少也要拿到这个对科学家来说至高无上的荣誉。 Collins的压力很大。他的前任是老一辈牛魔王Watson,他的竞争对手是新一辈牛魔王Venter,而他不过是一头小牛犊而已。他从大名鼎鼎的 Watson那里接过衣钵,带领由各国政府资助、全世界科学家共同参与的基因组计划,现在已经落后于Venter组建的小小的民间机构。更糟糕的是,他的竞争对手声称要把这个成果据为己有,以此向全世界人民收钱。如果让Venter率先完成基因组的测序,这无论如何是难以令人接受的,届时光媒体的口水都能淹死他。 为了能赶上进度,Collins一方面部分的引进了鸟枪法,另一方面他开始秘密接触Venter。即使不能抢在他前面,至少要争取到和他共同完成基因组计划的结果。私下的接触自然没有得到什么结果,甚至演变成了激烈的争论,后来又惊动了克林顿。好在总统的面子够大,双方终于妥协,塞雷拉放弃对人类基因的专利要求,而完成人类基因组计划的殊荣将由双方共同获得。 2000年6月26日,伟大的时刻终于来临,美国总统克林顿等六国领导人共同宣布人类基因组计划的草图完成。(附带说明一下,之所以说完成的是草图,正是因为鸟枪法无法准确的测序那些高度重复的序列。因此当时公布的草图并不包括这些部分。) 从左至右依次为Venter、Clinton、Collins 当天,Collins和Venter共同出席了新闻发布会。此后,这两个人还共同出现在《时代》杂志的封面上。作为一个民间团体,并且是一个饱受争议的民间团体的领导人,Venter能够获得和政府资助的Collins平起平坐的机会。而且不管人们多么讨厌他,正是由于他的贡献,使Watson原本预计 15年才能完成的计划,整整提前3年即告完成。可以说,Venter已经赢了。他确实是我们现在这个时代当之无愧的牛逼小分队队长。 此外,人类基因组草图的完成,也有中国人的一份贡献。早在1993年,中国就启动了自己的人类基因组测序计划,并且先后在上海、北京成立了南方、北方两个基因组中心,积累了很多基因组测序的经验。1999年9月,中国加入国际基因组计划,负责人类3号染色体上的3000万个碱基对的测序工作,占人类基因组碱基对总数的1%。2000年4月,中国的科学家们顺利的完成了这3000万个碱基对的测序任务,为人类基因组计划贡献了一份力量。 邪恶的《时代》把Venter摆在了Collins前面 2001年2月,Venter和Collins分别发表了各自的基因组研究成果。有趣的是,即使是发文章,这两个人还闹别扭,Venter把文章发到了《Science》,而Collins则发到了《Nature》。 可惜的是,荣誉不能当饭吃,由于不能为人类基因申请专利,不能给公司带来利润,尽管Venter推出了$1,000的私人基因组测序套餐(听起来还是挺诱人的),但是应者寥寥,公司的业绩始终没有起色。终于,塞雷拉公司的股东们忍无可忍,炒了Venter的鱿鱼。 失业的Venter带着在塞雷拉赚到的10亿美金回到了老家以后,把自己的游艇改造成了研究船,跑到百慕大三角去研究海洋生物去了。看起来,这只是个不起眼的研究,但是这个浑身上下散发着非主流气息的科学怪杰难道会甘心做一些无关紧要的研究工作吗?在Venter那神秘的研究船上,这个颇受争议的科学家难道是在酝酿什么骇人的邪恶计划,还是在为人类的未来谋福利呢? 人类基因组计划的故事到此暂告一段落,但是牛逼小分队的故事看来还将继续其实,如果你还记得前阵子合成生命的传奇,你就知道Venter这些年确实没闲着。 (本文完) 关于研究DNA的传奇人物 牛逼小分队系列 暂时告一段落。其他几篇按历史时间顺序分别是 游识猷的《 第一个发现DNA的地球人 》 游识猷的《 当DNA还叫转化因子时 》 以及 seren的《 传奇的一小步合成生命十五年 》 如果愿意投稿参与这个系列,欢迎发到论坛的松鼠学堂版面。
个人分类: 八卦|2789 次阅读|1 个评论
华大基因为什么大发?
热度 3 xupeiyang 2010-11-1 08:13
华大基因的吸引力 韩健的博客 http://www.sciencenet.cn/m/user_content.aspx?id=379172 1999年9月9日,随着国际人类基因组计划 1% 项目的正式启动,北京华大基因研究中心在北京正式成立。华大基因坚持以任务带学科、带产业、带人才,先后完成了国际人类基因组计划中国部分(1%)、国际人类单体型图计划(10%)、水稻基因组计划、家蚕基因组计划、家鸡基因组计划、抗SARS研究、炎黄一号等多项具有国际先进水平的科研工作,在《Nature》和《Science》等国际一流的杂志上发表多篇论文,为中国和世界基因组科学的发展做出了突出贡献,奠定了中国基因组科学在国际上的领先地位。 前沿科学研究是否只有研究生才能担此重任? http://www.sciencenet.cn/m/user_content.aspx?id=303876 深圳的华大基因(前身北京华大基因研究中心)在 学术培训 领域作出了大胆的创新。传统观点中,要成为前沿科学的主力研究成员,研究生甚至是博士后学历是必需的。华大基因正在尝试聘用本科生并就全球最先进的基因组测序技术对其加以培训,力图把他们打造成生物信息领域的高级研究人员。与其他研究人员一样,他们也会以第一作者的身份发表论文,与其他一流的国际机构共同合作,参加学术会议并接受采访。行业内部培训的优势是否会超越研究生教育?华大基因的举措是否是预示着一个新时代的到来? 2010年的科研进展:   2010年1月,华大基因购买了Illumina公司的128台HiSeq 2000测序仪   2010年1月21日,由深圳华大基因研究院发起,中国科学院昆明动物研究所,中国科学院动物研究所,成都大熊猫繁育研究基地和中国保护大熊猫研究中心参与的合作研究成果《大熊猫基因组》于以封面故事发表于《自然》杂志。   2010年1月,华大基因启动1000种动植物基因组计划,计划在未来2年内为1千种重要动植物进行测序,并从科学界征集测序物种的提案。   2010年1月22日至23日,国家863重大专项癌症基因组研究项目启动实施及工作研讨会在深圳华大基因研究院召开。   2010年1月28日,由深圳华大基因研究院等多家单位承担并完成的三篇论文《Complete resequencing of 40 genomes reveals domestication events and genes in silkworm (Bombyx)》、《The genome of the cucumber, Cucumis sativus L》、《The sequence and de novo assembly of the giant panda genome》近期被《自然中国》选为来自中国大陆和香港的突出科学研究成果。   2010年2月11日,由中国深圳华大基因研究院和丹麦哥本哈根大学联合创建的中丹基因组联合中心近日完成了世界首例古人类全基因组的深度序列测定和解读工作。这一历史性成果以封面故事发表在2月11日出版的国际顶尖科学期刊《自然》上。   2010年3月4日,国际顶尖科学期刊《自然》以封面故事着重介绍了由中国深圳华大基因研究院主要承担的人体肠道菌群元基因组参考基因集的构建工作。   2010年3月5日上午,全国人大原副委员长邹家华,原商务部部长助理徐秉金,深圳市市委常委、常务副市长许勤一行参观华大基因。   2010年3月18日,深圳华大基因研究院基因组技术平台获得SGS签发的ISO9001认证证书。   2010年3月19日,深圳华大基因研究院和美国科学家共同发起共生体基因组计划,该计划将对海蛤蝓(又称绿叶海蜗牛)Elysia chlorotica及藻类饵料Vaucheria litorea进行基因组测序。
个人分类: 生物科学|6288 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-2 21:40

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部