也说说“精准医学” 吕健 自 2015 年 1 月美国总统 Obama 在国情咨文演讲中宣布启动“精准医学计划( Precision Medicine Initiative , PMI )”以来,“精准医学”一词大热。 Obama 的演讲原文如下: Twenty-first century businesses will rely on American science and technology, research and development. I want the country that eliminated polio and mapped the human genome to lead a new era of medicine --one that delivers the right treatment at the right time. In some patients with cystic fibrosis, this approach has reversed a disease once thought unstoppable. So tonight, I'm launching a new Precision Medicine Initiative to bring us closer to curing diseases like cancer and diabetes, and to give all of us access to the personalized information we need to keepourselves and our families healthier (译: 21 世纪的经济有赖于美国科学和技术的研究和发展。我希望我们这个曾经消灭了小儿麻痹症、完成人类基因组计划的国家引领医学进入一个新时代:能够在正确的时机对疾病进行正确的治疗。在这方面,我们已经做到能够使某些囊泡纤维化病人的病情得到逆转,而这种疾病原先被认为是无法治愈的。因此,今晚,我宣布启动一个新的“精准医学计划”,使我们距离治愈癌症、糖尿病这类疾病更近一步,并能使我们获得所需的个体化信息从而使我们自己和我们的家人更加健康)。 从 Obama 的演讲原文以及 时任 NIH (美国国立卫生研究院)主任 Francis Collins 和 NCI (美国国家癌症研究所)所长 Harold Varmus 在 NEJM 上对 PMI 的阐述 来看, Obama 关于“精准医疗”的讲话其实包含了两层意思。第一层意思是在正确的时机对疾病进行正确的治疗( the right treatment at the right time ),也是 Obama 所期许的“医学新时代”的特征,这一说法并不新鲜, Collins 也承认这并不是新的理念, 其实就是“个体化医疗”,我们姑且称之为广义的精准医学。第二层意思则是第一层意思的具体实现,即基于大规模生物信息库( large-scale biologic databases )、各种组学技术、大数据分析技术的个体化医疗,也被称作“ Obama 版精准医学”或“美版精准医学”,这大概可视为狭义的精准医学。基因测序技术和组学技术以及计算机大数据分析技术是美版精准医学最基本的技术支撑。狭义的精准医学也并非 Obama 首倡。 2011 年,美国 National Research Council 就发表了题为 “Toward Precision Medicine: Building a Knowledge Network for Biomedical Research and a New Taxonomy of Disease” 的报告。精准医学(狭义)概念的提出,是分子生物学发展促使人类对疾病的认识更新的必然结果。当然,精准医学(狭义)也有其局限性,至少, 并非所有的疾病都起源于基因突变。 “精准”二字容易让外科医生联想到手术的 “ 精细 ” 和“准确”。事实上,早在 Obama 宣布 PMI 之前,就已经有“精准外科”、“精准肝脏外科”、“精准神经外科”等概念,但这些名词中的“精准”最初主要强调手术技术的精准化 ,仍属于基于解剖学的“微创外科 ” 范畴,也属于广义的精准医学。而 “ Obama 版精准医学”(狭义精准医学)是指建立在大规模生物信息库、强大的个体化分析技术(如蛋白质组学、代谢组学、基因组学、各种细胞分析技术、移动健康技术等)、计算机大数据分析技术的基础上的个体化医疗,是针对分子水平病因学的更高端的个体化医疗。因此,虽同为“精准”二字,却有着不尽相同的含义。但二者并不矛盾,狭义精准医学将使上述“精准外科”、“精准肝脏外科”、“精准神经外科”的内涵更加丰富,也将推动目前仍基于解剖学和影像学的外科学迈向基于分子水平病因学和病理学的外科学。 要想实现治疗上的精准,首先要达到诊断上的精准,尤其病因学诊断。目前全球通用的国际疾病分类( International Classification of Diseases , ICD )无法反映疾病的分子生物学信息,因此,精准医学需要新的疾病分类。早在 2011 年 11 月,美国 National Research Council 在题为 “Toward Precision Medicine: Building a Knowledge Network for Biomedical Research and a New Taxonomy of Disease” 的报告中就指出,需要建立新的疾病分类和生物医学知识网络。这需要整合各类疾病的分子生物学研究成果和临床数据,是一项浩瀚的工程。令人鼓舞的是,许多学科已经在这方面迈出了第一步,比如神经外科,已有学者根据基因表达谱的差异性,将原发性胶质母细胞瘤分为神经元前体型( proneural )、神经元型( neural )、经典型( classical )、间叶型( mesenchymal );中国脑胶质瘤基因组图谱计划将脑胶质瘤分为 G1 、 G2 、 G3 等 3 个亚型, G1 亚型包含极度高发的 IDH 突变, G3 亚型包含非常低的 IDH 突变, G2 亚型则以 1p/19q 缺失为特征 。更加令人瞩目的是,在 2016 年版的 WHO 中枢神经系统肿瘤分类中,已经增加了多种肿瘤的分子分型,如胶质母细胞瘤 -IDH 突变型和胶质母细胞瘤 -IDH 野生型、髓母细胞瘤 -WNT 激活型和髓母细胞瘤 -SHH 激活型。 无论广义还是狭义,精准医学首先是一种理念,与“循证医学 ” 、“转化医学”、“整合医学”等理念一样。我们在面对这些理念的时候,首先应摒弃二元对立、非此即彼的简单、极端的思维方式,更没必要去比较这些理念孰优孰劣,应建立多元化的思维模式。这些理念都是在医学发展过程中不同时期从不同角度对现代医学内涵的补充和修正,反映了人类在医学发展过程中的探索和思考,这些理念之间并非非此即彼的关系,而是相互补充、相互支撑、可以共存。循证医学( evidence-based medicine )的概念诞生于 1992 年。从经验医学迈入基于基础与临床证据的循证医学是一大进步,但随着循证医学的广泛应用和认识积累,循证医学的局限性也有所显现。 根据临床证据,制定指南和共识,指导临床实践,是循证医学的主要特点和基本方法,因此,对证据的评价和认识至关重要。循证医学之证据来自对全球各地大样本临床试验的总结与分析。然而,循证医学的缺陷恰恰出现在证据上。循证医学以统计学方法为基础,如随机对照试验( RCT ),然而,正是严格的设计和纳入标准将不少患者排除在了研究对象之外。于是,我们所能获得的所谓最佳证据其实只是来自整个患者群体的某一部分,许多不符合纳入标准的患者被排除在外了,而纳入标准是人为设定的。同时,循证医学对证据的分级低估了个案的价值,事实上,疾病的发现和治疗都是始于个案的,何况,证据是变化的、不断更新和扩大的。由于个体差异,每个新病例都可能构成新的证据。对研究对象的严格筛选和对个案的忽视实际上已成为循证医学的一个重要缺陷。制定专家共识和指南是循证医学的一个重要特征和指导临床实践的方法,由于证据是不断地变化、更新着的,再加上人为设计和病例选择所带来的证据的局限性,指南和共识很难适用于全部患者或者疾病的全部可能,换句话说,也就是很难达到“精准”的要求。何况,我们对很多疾病的病因、机制并不完全了解,我们对疾病的认识也是处在不断变化中,换言之,我们的共识和指南实际上都是建立在我们对疾病的不完全了解的基础上。因此,共识和指南的应用必须与患者的实际情况、医生的个人经验以及那些未纳入指南或共识的个案资料相结合。精准医学(狭义)所带来的对疾病的认识和分类的改变以及大数据分析技术必将使循证医学发生深刻的变化,从疾病的诊断和分类到证据的评价和处理。转化医学( translational research ) 的概念是 1994 年 Morro 提出的,针对的是基础研究与临床实践之间的严重脱节。“转化医学”强调基础研究成果与临床实践之间的双向转化,即“ bench to bedside ”和“ bedside to bench ”。在一定程度上,美版精准医学(狭义精准医学)就属于转化医学的范畴,其基础就是分子生物学和大数据分析技术的临床转化(疾病的诊断、治疗和预防)。如果说循证医学侧重于临床,那么转化医学则是在临床与基础研究之间建起了一座桥梁,殊途同归,最终的目的都是为了能够为患者提供更准确的、更有效的治疗(更精准的治疗)。现代临床医学发展过程中有一个重要现象,就是专科和专业的划分越来越细。专科和专业的细化的确极大地推动了现代医学的发展,但也加剧了专科医生知识结构的局限性。人们认识到了专科和专业过度细化给临床医学带来的不利影响,于是,整合医学( integrated medicine )的概念应运而生。整合医学最初是指将一些非主流医学整合到现代主流医学体系中,后来,这一概念演变为强调医生从整体上认识病人和疾病,从而克服专科和专业细化带来的医生诊治知识结构的局限性,使患者得到正确的诊治。说了这么多,其实就想表达一个意思,也就是,无论循证医学、转化医学,还是整合医学、精准医学,这些理念都是针对现代医学发展过程中出现的问题予以修正和完善,彼此之间并不对立,而是各有侧重、互补互促、互相结合,共同构成了现代医学的认识论和方法论基础。随着科技进步,这些理念会演变、或被否定或扬弃、或被新的理念代替,还会有新的理念加入,这恰恰也是符合事物发展规律的。 这里涉及到一个小问题,就是在循证医学乃至精准医学模式中,如何安放医生的个人经验?从基于医生个人经验和直觉的经验医学进入循证医学是进步,但并不意味着医生的个人经验被否定。经验是认识的开端,循证医学之“证 ” 不就是来自对全球各地医生经验的统计学分析结果吗?就精准医学(狭义)而言,基因测序技术、各种组学技术最终揭示的其实还是健康或病理机体的微观结构,距离揭示其相互关系和作用机制尚有距离。面对一个具体的病人,即便得到足够的个体化信息,如何做出正确的诊断,选择正确的干预时机和措施,仍然有赖于医生个人的经验和判断,因此,即便是精准医学,也不能否定或忽略个体经验的价值。换言之,恰恰是病人和疾病的“个体化”,决定了医生的个人经验和认识在临床医学中永远不容忽视的位置,无论任何医学模式。 Obama 在 2015 年 1 月 30 日接受访谈时提到“ one study found that every dollar we spent to map the human genome has already returned $140 to our economy ”。 Illumina 公司的数据显示,全球 NGS (二代基因测序)的应用市场规模预计为 200 亿美元,肿瘤诊断和个性化用药是最有应用前景的领域,市场规模约 120 亿美元 。不难看出, Obama 把“精准医学”提到国家战略高度,无疑是适时而且富有远见的,但除了强调和强化美国在现代医学的引领地位外,恐怕更多地是瞄向了“精准医学”蕴含的巨大的市场前景,这应该也是美国国家经济战略的一部分。 近来常可看到有作者宣告“精准医学时代即将来临”或“已经来临 ” ,其实,这样的论断可以说言之尚早,也可以说没有意义。“精”、“准”本来就是、一直都是医学发展的方向和要求,比如神经外科,从裸眼手术到显微神经外科,再到影像学引导的微创神经外科,人 类在这个方向上的尝试和努力从未停歇过。至于狭义精准医学(美版),则任重而道远,不仅涉及医学领域,还牵涉信息共享、法律法规、伦理、政策、评价标准、监管体系、政府、企业、社会等各方面。 就当下而言,怀揣“精准”理念,准确把握每个病人的具体情况,努力做到正确诊断、合理治疗,大概就是我们能够做到也应该努力做到的“精准医学”吧。 参考文献: 1 Collins FS , Varmus H . A new initiative on precision medicin e. N Engl J Med. 2 015 , 372 ( 9 ): 793-795 2 许百男,陈晓雷 . 精准神经外科:高科技时代的神经外科新理念 . 中华神经外科疾病研究杂志, 2010 , 9 ( 6 ): 481-483 3 董家鸿 . 精准肝脏外科 . 中华消化外科杂志, 2014 , 13 ( 6 ): 405-411 4 《中国中枢神经系统胶质瘤诊断和治疗指南》编写组 . 中国中枢神经系统胶质瘤诊断与治疗指南( 2015 ) . 中华医学杂志, 2016 , 96 ( 7 ): 485-509 5 精准医疗——中国肿瘤市场的庞大需求 . 中国肿瘤临床与康复, 2016 ; 23 ( 1 ): 84
一、精准医学时代已经到来 去年伊始,美国总统奥巴马启动“精准医疗计划”,推动个体化基因组学研究,掀起了全球精准医学的热潮。随后,国家卫计委和科技部先后召开精准医学战略研讨会,对精准医学列为“十三五”健康保障发展问题研究的重大专项进行论证。这标志着精准医学时代已经到来! 精准医学时代真的来了吗?奥巴马说,来了!科学大咖们说,确实来了!风险投资家说,真的来了,我们也来了! 我想说的是,在基因组的临床应用方面,“精准医学时代”似乎是来了,但是严格意义上的“精准医学时代”远远没有到来,例如,普通感冒是最常见的疾病了,我们现在能够精准预测它的发生发展了吗? 二、普通感冒引发的思考 普通感冒的医学名称是上呼吸道感染,包括鼻腔、咽或喉部急性炎症的总称。 70% ~ 80% 的上呼吸道感染是由病毒引起的,包括鼻病毒、冠状病毒、腺病毒、流感和副流感病毒、呼吸道合胞病毒、埃可病毒、柯萨奇病毒等。感冒诱发的过程是,受凉、淋雨、气候突变、过度疲劳等导致全身或呼吸道局部防御功能降低,使得原已存在于上呼吸道的或从外界侵入的病毒或细菌迅速繁殖。 简单的说,感冒是由病毒或细菌引起的,但是我们不可忽视的细节是:在正常情况下,病毒与机体是处于一种平衡的共存状态。 这是一种怎样的共存状态呢?这不禁让我想起了一部 BBC 纪录片: The Hidden Life of theCell 。智人的历史大概十几万年,而病毒在地球上已存活了三十亿年。每时每刻,你的身体中正进行着一场大战,这是起源于几十亿年前的战斗—— 病毒入侵细胞的生死之战 。 三、病毒入侵细胞的“精准”研究 严格来讲,病毒入侵细胞的过程是一个动力学过程。如果要 精准预测 病毒与细胞生死之战的胜负,就得把这个动力学过程搞清楚。下面粗略介绍下病毒入侵细胞的动力学研究进展(摘自 博士学位论文,王开发,病毒感染动力学模型分析,2007年,西南大学 )。 第一阶段,病毒在宿主内增殖。增殖过程通常会受到宿主理化屏障或捕食者和竞争者的限制和约束,比如皮肤粘膜机械屏障、补体、粘膜表面分泌型抗体( slgA )、吞噬细胞、 T 细胞、其他微生物的存在等。 第二阶段,病毒和宿主免疫系统均发生进化:一方面,病毒介导的自然选择使宿主特异性捕食者(如 B 细胞, T 细胞)增殖;另一方面,在宿主免疫压力下,病毒种群也发生选择,导致变异株的不断涌现。病毒与宿主各种因素之间相互作用的力量偏向,决定病毒种群是受到控制还是被清除;是停留于一定水平(宿主发病),还是大量繁殖导致免疫防御失败(宿主死亡)。 在 病毒感染的基础数学模型 中,设 x 代表未感染目标细胞数量, y 代表被感染细胞数量, v 代表游离病毒数量, N 代表一个被感染细胞在它的生命周期内产生的游离病毒平均数,参数 d , a , u 分别为未感染细胞、感染细胞和游离病毒颗粒的死亡率:β是未感染细胞和游离病毒颗粒的接触率。它们之间的关系为: 在 免疫调节的数学模型 中,增加以下几个变量: z 代表细胞毒性 T 淋巴细胞反应的强度,参数 p 则代表细胞毒性 T 淋巴细胞杀伤感染细胞的速率,数学模型调整为: 在 免疫调节滞后的数学模型 下,在 药物治疗的数学模型 下,需要不断增加变量。而人体本身是个非常复杂的系统,如果把机体内各种因素综合考虑在一起,病毒感染细胞的动力学模型将会 无限复杂 。 这样类型的“精准”研究什么时候才能计算出普通感冒的发生发展呢? 10 年后? 20 年后?不知道,笔者只能长叹一声:吾生也有涯,而知也无涯(当然还有 keng die 的后半句), 精准无止境也 。 后话:为什么要讲这个故事呢?在上述博士论文的结论中提到:病毒感染后,病毒和细胞数量的平衡点和周期波动都可能出现。同时随着时间滞后效应的增加,稳定点被突破,并最终导致 混沌模式 的出现。( 是否也存在蝴蝶效应呢? ) 敬请持续关注我的博客和微信公众号:“非线性科学与医学沙龙”。
精准医学的内涵演化、重点领域与我国发展对策 精准医学已受到我国政府、科学界和企业界的高度重视。本文从政策分析和数据分析的角度,阐述精准医学的内涵演化与重点领域,提出我国发展对策。基因测序技术与靶向药物研发及其相关的监管政策与数据标准成为英美精准医学的部署重点;美欧日含基因信息的上市药物发展迅速,我国基于药物基因组学的新药创制发展滞后;国际上药物基因组学生物标记物试验与患者结局的关联性证据研究仍需加强。建议根据我国的疾病谱特征加强分子标记物基础研究、加强药物遗传学及基因组学标记物临床转化研究、加强基因分子诊断技术研发与临床检测能力建设、加强精准医学专门人才培养和加强监管与政策研究作为我国发展精准医学的战略重点。 精准医学;政策建议;科学计量学;中国 精准医学的概念源于个体化医学 2011 年,美国国家研究委员会在 《迈向精准医学:构建生物医学研究知识网络和新的疾病分类体系》 报告中首次提出精准医学的概念,即根据每一位患者的特点调整医学治疗措施,但并不意味着为每一位患者生产独特的药物或医疗设备,而是能够根据患者的特定疾病易感性不同、所患疾病生物学基础和预后不同,以及对某种特定治疗的反应不同,而将患者分为不同亚群。使得预防或治疗性的干预措施能集中于确定会受益的人群,从而为那些不会受益的人群节省医疗开支并减少药物的不良反应 ] 。可见,精准医学的定义与 2008 年美国总统科技顾问委员会在《个体化医学的优先领域》报告中对个体化医学的定义几乎完全一致 ] 。美国国家研究委员会认为,由于个体化医学这一概念被商业炒作,被人误以为是能够为每一个人设计独特的治疗,故而更名精准医学。 在 PubMed 中检索精准医学或个体化医学相关的文献发现 ,早在 1940s-1960s 就有学者开始探讨针对宫颈癌 ] , ] 、长骨复合骨折 ] 、乳腺癌 ] 的个体化( Individualized treatment )治疗策略以及个体化治疗降低精神病患者医疗费用的相关研究 ] ,但这里的个体化治疗均指治疗应随个体体征不同而变化。 1971 年,“ Personalized Medicine ”一词首次出现在 Gibson 的“ Canpersonalized medicine survive? ”文章中,但指的是家庭医生独立行医(私人医生) ] 。 1979 年,“ PrecisionMedicine ”这一术语首次出现在发表于 American Journal of Chinese Medicine 的“针灸医学的研究进展”的文章中,认为针灸医学的技术进步为医学向预防医学、精准医学、大众医学( people medicine )三个方向发展带来了希望,但这里“精准”的含义是指病变穴位针刺疗法要求针刺位置必须精准 ] 。 1990s ,随着人类基因组计划的启动和实施,基因组学的信息开始引入到个体化医学中。 1997 年, Wasi 在探讨人类基因组计划的重要意义时,首次提出会将医学带入预测医学、预防医学和精准医学时代 ] 。 1999 年, Langreth 与 Waldholz 首次提出现代意义上的个体化医学的概念( New Era of Personalized Medicine ),前瞻性地建议制药企业要基于个体患者的基因特征开展靶向药物研发,这是人类基因组时代首次使用“ Personalized Medicine ”这一术语的文章。该文首发于《华尔街日报》,又被 Oncologist 杂志迅速再次刊登 ] 。 2009 年,为纪念这一概念提出 10 周年, Oncologist 杂志专门发表纪念文章,高度评价 10 年前将基因组信息与新药研发结合起的前瞻与远见,认为这开启了一个新的时代 ] 。 2010 年,“ IndividualizedMedicine ”一词被收录到美国国立医学图书馆的医学主题词表( MeSH )中,其含义是指基于患者遗传与环境特征的个体差异,实现最佳的疾病诊断与治疗。 2003 年人类基因组计划的完成,后基因组时代功能基因组的迅速发展,加之药学、分子生物学技术和生物信息学的快速进步,大大推动了个体化医学和精准医学的发展。可见, IndividualizedMedicine 、 Personalized Medicine 、 Precision Medicine 这些术语的含义随着时代的发展经历了演化。但从现在来看,其表达的内涵是基本一致的。精准医学的概念并不是新的,而是与之前个体化医学一脉相承。 ] National ResearchCouncil (US) Committee on A Framework for Developing a New Taxonomy of Disease.Toward precision medicine: Building a knowledge network for biomedical researchand a new taxonomy of disease . National Academies Press (US), 2011. ] President’s Councilof Advisors on Science and Technology. Priorities for Personalized Medicine .2008. https://www.whitehouse.gov/files/documents/ostp/PCAST/pcast_report_v2.pdf ] Glucksmann A, Way S,Cherry CP. The ten - year results ofindividualized treatment of carcinoma of the cervix based on the analysis ofserial biopsies . BJOG: An International Journal of Obstetrics Gynaecology, 1964, 71(2): 198-201. ] Scott RB. Accuratecervical diagnostic studies: a necessity for individualized treatment of cancerof the uterine cervix . Obstetrical gynecological survey, 1969, 24(7):985-992. ] Holstad HA. Primaryosteosynthesis versus conservative treatment of compound fractures of longtubular bones. A review of 202 cases with individualized treatment . Journalof the Oslo city hospitals, 1962, 12: 225. ] Delarue NC, AndersonWD, Starr J. Modified radical mastectomy in the individualized treatment ofbreast carcinoma . Surgery, gynecology obstetrics, 1969, 129(1): 79-88. ] Kalmans ET. Low-CostIndividualized Treatment in a Day Center . Psychiatric Services, 1970,21(12): 394-397. ] Gibson WM. Canpersonalized medicine survive? . Canadian Family Physician, 1971, 17(8): 29. ] Wei L. Scientificadvance in acupuncture . The American journal of Chinese medicine, 1979, 7(1):53-75. ] Wasi P. Humangenomics: implications for health . The Southeast Asian journal of tropicalmedicine and public health, 1997, 28: 19-24. ] Langreth R, WaldholzM. New Era of Personalized Medicine Targeting Drugs For Each Unique GeneticProfile . The Oncologist, 1999, 4(5): 426-427. ] Jørgensen JT. New eraof personalized medicine: a 10-year anniversary . The Oncologist, 2009,14(5): 557-558. 杜建,唐小利. 精准医学的内涵演化、重点领域与我国发展对策. 中国科学基金,2016(1):20-26. http://www.nsfc.gov.cn/nsfc/cen/kxjj/jzzw/20160205_02_01.html
“人类基因组计划”回顾与展望:从基因组生物学到精准医学 作者:于军 研究员 关键词:人类基因组计划 基因 基因组 精准医学 疾病分类学 摘要:“人类基因组计划”这个具有划时代意义的大科学计划已经完成整整十年了。十年来,基因组科学的发展逐渐形成了一个新的明确目标:精准医学。未来生物医学基础和临床科学的发展就是要整合基因组生物学新的学科前沿,运用新的概念和技术,不断整合和积累临床资源,凝练大的科学问题,规划和启动大科学项目,及时地、有效地为全社会提供“从实验室到病床”、“从实验室到家庭和个人”的卫生与健康保障。社会必须要迅速认识和接受新知识、开拓新的机制、给科学界以有效的反馈,充分地利用这些前沿研究成果。 1. “人类基因组计划”是具有划时代意义的大科学计划 今年,是“人类基因组计划”(The Human Genome Project,HGP)宣布完成十周年。选择2003年结束这个计划其实既不是因为这一年第一个人类基因组的测序工作确实到达了“终点”,也不是人类基因组序列“完成版”的实际结束时间。这个日子的选择首先是为了纪念沃森(James Watson)和克里克(Francis Crick)在《自然》(Nature)上发表了他们的著名科学论文,发现DNA双螺旋结构五十周年。其次也是感谢沃森博士这位推动这一宏大计划实施的早期领导者和持续支持者。他曾在1989~1992年担任国家人类基因组研究中心(National Center for Human Genome Research at the National Institutes of Health)的主任,也就是现在NIH国家基因组研究所(NHGRI)的前身。最后才是这一计划就完成全基因组测序而言确实已近尾声,剩下的有限信息也不足以改变已有的科学结论。 一次性解读人类基因组全部DNA序列是在80年代初由一些有远见卓识的科学家们集体提出的。虽然其原因是多方面的,但是基本上可以归纳为以下三点。第一是DNA测序技术和相关分子生物学技术日趋成熟。随着DNA双螺旋结构的解析,自七十年代起,生物化学家们发明了一系列的重要分子生物学技术,包括DNA测序、寡聚核苷酸合成、DNA杂交、分子克隆、聚合酶链式反应(PCR)等。尤其是80年代初荧光标记法DNA测序仪的研发和接近问世。第二是生物医学发展的迫切需求。未知基因序列的不断解读,遗传疾病相关变异的定位克隆(Positional cloning),新转录因子和信号传导通路的不断发现,都使DNA测序技术和需求被推到了科学界关注的焦点。当大家都在争取基金,计划测定自己感兴趣的基因时,一个重要观点的提出赢得了广泛的支持:与其说各测个的基因,不如集中攻关测定全基因组的序列。集中攻关的特点就是可以使操作专业化和规模化。尤其是在技术飞速发展的情况下,非专业的技术操作不仅浪费资源,在落后平台被迅速淘汰时,非专业的操作也一定会被迅速淘汰。这个原则在DNA测序领域一直适用至今。另外,当时遗传学和基因组学等学科的发展也遇到了新的瓶颈。比如对全基因组遗传图谱和物理图谱的迫切需求,对打片段DNA克隆的迫切需求等。第三是启动国际合作,调动全球各方资源的必要性。比如,人类基因组研究会涉及到世界各国的人类遗传资源,与其说在美国集中收集(虽然美国是个移民国家,但是就人类学的标准而言,异地取样往往是不被接受的),不如让这些国家直接参加一个共同的合作项目,同时他们所代表的国家还可以给与资金的支持。 1983年和1984年美国DOE(能源部)和NIH(卫生总署)分别组织了相关领域科学家,进行了启动大规模人类基因组测序计划可能性的研讨,这就是HGP的酝酿阶段 。有几位科学家这两个会议都参加了,比如目前仍是美国系统生物学研究所所长的胡德博士(Leroy E. Hood)和华盛顿大学退休教授欧森博士(Maynard V. Olson)。胡德博士领导的团队后来成功研发并商业化了荧光DNA自动测序仪 ,欧森提出了STS(Sequence tagged site)的概念 并领导他的团队用新发明的酵母人工染色体(Yeast artificial chromosomes)为材料开启人类基因组精细物理图谱制作的先河。1987年HGP的智库发表了《测定和绘制人类基因组图谱》的报告,宣布HGP进入具体实施阶段。1988年美国国会通过了DOE和NIH关于启动HGP的申请,两家主要资助者也协议共同支持HGP。五年后,人类基因组遗传图谱制作完成,第一代荧光自动测序仪顺利问世,HGP则进入真正的规模化数据获取阶段。国际“人类基因组计划”联合体最终由美、英、法、德、日、中六国逾千名科学家的实际参与,用时十五年,耗资十数亿美元共同完成。 HGP的成功并不是偶然的。它不仅是科学发展的必然,也是科学要素具备和时机逐渐成熟的体现。科学发展至少要具备四个基本要素:人才与科学思想、技术与实验方法、资源与素材组织、管理与项目实施。虽然成功与这四个要素都系息息相关,但是各自的权重却有所不同。人才与科学思想的提出无疑是首要的。大科学项目尤其需要有威望、有能力的领导者,和一代既能脚踏实地地工作,又能协调共进的坚定支持者 。此外,基因组学应属于分子生物学范畴,其学科的真正起点,是1953年DNA双螺旋结构的发现和70年代初期DNA序列解读技术的发明。因此,也可以说HGP是五十年来生命科学与技术发展的最重要结晶。实践还证明这一计划实现了“以大科学计划带动学科发展”的新策略,也宣布了科学发展“以科学假说为基础和以自由探索为形式”科研原则“一枝独秀”时代的终结。一种新的形式——“发现导向的科学研究”从此诞生,而生命科学的复杂性恰恰为这条新思路提供了最有力的脚注。各类“组学”(Omics)研究的兴起就是这一形式的有力证据。如果能将这些组学技术与以科学问题为目标的大科学项目结合起来那就更是“借助东风了”。 HGP的成功还在于充分调动和利用了政府、社会、企业的力量。由于政府主导和支持了这一计划,科研成果和技术研发又为企业注入了新的知识产权,也为企业发展提供了明确的方向。因此,据有关统计和评估,十几年来,HGP为美国社会创造了超过200倍的经济回报,超过30万个工作机会。同时也实现了在相关高科技领域的持续性主导。比如DNA测序领域、高端分子检测领域、生物信息领域、生物制药领域等等。美国的民营企业(比如Celara Genomics)也曾经与HGP成功竞争,不仅测定了果蝇基因组,也测定了小鼠和人的全基因组序列,取得很好的科学、经济与社会效果。尽管这两方面的努力似乎有些浪费资源,但最终“官”和“民”的竞争还是达到了和解。这一竞争归根结底对科学、社会和企业的蓬勃发展还都产生了正能量。 2. 基因组生物学的路线图:从基因组到精准医学 HGP是一个预计斥资30亿美元的大科学项目(实际花销很难估计,但因该只是预期的1/3左右),在三十年后的今天来看也是个不小的数字。不仅可以与1939年美国斥资20亿美元(相当于260亿2013年美元的价值)制造原子弹的“曼哈顿计划”媲美,也可以与斥资254亿美元(1973年美元价值)的“阿波罗登月计划”争艳。据最新的估计,HGP为美国所创造的经济效益已经达到一万亿(1trillion)美元 。更重要的是这一计划未来的价值体现还在不断继续。 那么,这样一个大型科学研究计划是如何得到政府的支持并真正产生了这样大的社会效益呢?究其原因是它不仅满足了科研界的普遍需求,同时也顾及到全社会的共同利益。首先,大型科学计划必须具有普遍的引领性,亦即可行、可控、可实现的科学性。HGP正是这样一个计划,以高质量测定一个人的基因组为具体目标,以发展DNA测序技术和规模化操作为手段,以国际合作为成功保障。这样的计划和管理模式显然也适用于其它物种的基因组计划和人类基因组多态性的深入研究。其次,大型科学计划要具有可计划性,计划的主体是人才与技术。HGP的实际领导者很多是来自于其他领域,他们的可信任度来自于做事情有始有终的历史纪录。比如英国的苏斯顿博士(John Sulston,获2002年度诺贝尔生理或医学奖)和美国的瓦特斯顿博士(Robert Waterston)被选为HGP基因组测序的主要领导者,分别领导了英国和美国最大的测序中心,他们早年其实是研究线虫生物学的专家。其三是大科学项目要有始有终,亦即具有阶段性和可操作性的目标,不能是开放式的(Open-ended)或结果无法量化的。当然,所谓的量化不是用文章和专利的多少,培养学生的多少来衡量,而是用社会效益来衡量,由独立咨询机构来调研和报告的。最后是统理和实施的艺术。HGP不仅要有一个清楚的路线图——科学领域发展的路线图往往是指研究活动的终极目标和操作过程——而且还要有共同的原则和实施方案。比如,HGP著名的“百慕大原则”(Bermuda Principles)要求所有测序数据必须在产出的24小时之内投放到公共数据库里,使珍贵的数据得到实际和及时的共享。 建立HGP科研成果与社会利益的关系,以及为保护和弘扬这些成果和利益所建立起来的法律保障体系都至关重要。没有这些利益的保障,利益也就不存在。在美国,科研成果和社会利益保障关系的建立可以追溯到著名的Bayh-Dole Act,亦即1980年美国通过的知识产权法( P.L. 96-517, Amendments to the Patent and Trademark Act) 。这项法律旨在保护来自于政府研究或研发基金资助下非赢利组织和小型企业产出的发明专利权,来鼓励发生在研究领域、小企业和成熟企业之间的知识产权转让、合作与合资。中国科学家虽然参与了HGP,承担了1%的任务,但是HGP在中国社会所产生的实际效益也非常有限,比如技术研发成果不多,专业性企业寥寥等。除了华大基因研究院和中国科学院北京基因组研究所还在不同的管理框架下(民营与地方政府支持vs. 国家基金与科学院的常规支持)寻求不断发展外,国家南、北基因组中心的发展皆面临谁来“再输血”(持续支持)的问题。就一个寻求对人类科学进步和社会发展有所贡献的大国而言,如何利用科研基础和实力,为技术密集型企业提供实用技术和知识产权,值得国人深入思考和实践。 无论如何,HGP的传奇还在以惊人的气势和速度继续着。早在HGP完成之前,时任NIH基因组研究所所长的考林斯博士(Francis Collins)就提出了“从基因组结构到基因组生物学,再到疾病生物学和医学科学”的路线图,意在以最快的速度将这一计划所产生的成果转移到产生经济和社会效益上。发明第一代荧光自动测序仪的著名科学家胡德博士也曾提出4P(Predictive预测, Preventive预防, Personalized个性化 Participatory参享)医学的思想,旨在指引基因组学成果的具体应用。2011年美国基因组学与生物医学界的智库又发表了《迈向精准医学:建立生物医学与疾病新分类学的知识网络》,宣示基因组学的研究成果和手段如何可以促成生物医学和临床医学研究的交汇,从而编织新的知识网络。现已退休的华盛顿大学欧森博士是唯一一位既参加了起草1987年“人类基因组计划”宣言性报告,也参加了这个精准医学报告撰写的科学家。他对精准医学的解释是:“个性化”其实就是医学实践的正常形式,而分子水平信息的正确使用则会使医学更精准,因而成为恰如其分的目的性描述。他学医出身的博士后,也是目前NIH基因组研究所所长的格润博士(Eric Green),正在坚决地实践着欧森三十年以来的一贯思想:大科学项目一定要有始有终、要有直接造福于社会的目的性。只有这样,主流科学家、政府、社会和民众才能坚定地支持这样耗时十数年、耗资几十亿、集科学思想与技术集成为一体的大科学项目。 实现精准医学需要在两个大领域——基础生物医学与临床医学——建立实际的转化研究和紧密的接轨机制。我们已经看到了诸多“转化中心”的成立,我们也看到了各类“转化研究”的启动。尽管目前精准医学还不是一个具体的学科和大项目,但是在这个科学思维框架下的蓝图已经规划好了。《迈向精准医学:建立生物医学与疾病新分类学的知识网络》的报告已直接建议了几个可实施大项目,比如“百万人美国人基因组计划”、“糖尿病代谢组计划”、“暴露组研究(Exposome)计划”等。就百万人基因组测序而言,其单纯的DNA测序价格就应该在10亿美元以上。鉴于英国的医学临床资源规范而且丰富,首相卡梅伦去年斥资一亿英镑率先就启动了“十万人基因组测序计划”。可见,只要是可以直接造福国民的科学计划,对谁来讲都是“乐而为之”。 然而,尽管精准医学的提出同时给基础研究和临床研究指出了共同发展之路,但是他们面临的挑战和问题却各有不同。 3. 基础生物学的发展与基因组生物学的新境界 基于基因结构和序列变化的基因组学研究无疑必须转入到以生物学和医学核心命题为目标的研究。基因组学技术和规模化的特征将会延续并发扬,大数据、复杂信息、新概念和新知识等等,都在不断地催生新的科研思路和新的思维境界。从“DNA到RNA再到蛋白质”和各类“组学”研究,最终将汇集在一个或者数个生物学命题下(比如癌症、代谢疾病、脑发育与认知、生殖力的可塑性等),形成一种整合性、更高层次的“数据—信息—知识”消化和理解过程。二十多年前胡德博士提出的“多系统生物学”开辟了新的思维和方法,但是他并没有将其研究内容具体化、思维框架化。尽管他思想的追随者们开发了很多高通量技术,产生了很多蛋白质-蛋白质相互作用的数据,基因表达关联数据,还开发了网络分析方法等,但是一个既宽容,又有序的思维框架还是呼之欲出,或隐或现。 首先,基因组学在新形势下已经完成了从基因组学(以DNA序列为研究主体)到基因组生物学(以生物学命题为研究主体)再到基于谱系的基因组生物学(以生物谱系,如哺乳动物为研究主体)的“凤凰涅磐”。目前已经没有人再会来批评基因组学就是“测测DNA序列”了。近几年来,基因组学研究的功能和视野都有了长足的拓展,DNA测序技术已经到达了一个新的平台:应用基本成熟,通量和价格基本平稳。未来会有诸多的基因组序列在名目繁多的理由下,被不断测定,大数据的迅速积累也成为必然。不过,地球上物种之多,科学发展之不断,DNA测序项目还会层出不穷,技术的研发和革新还会继续。那么基因组学领域本身的革命性变化会在哪里呢?答案是多方面的,比如人类基因组在过去500代(假设20年为一代人)里积累的群体多态性会在未来的五年内全部找出来,这些多态性与人类疾病的关系也会在未来的十年里基本搞清楚,模型哺乳动物(比如小鼠和大鼠)基因组的相关信息也会被逐渐全部获取。又比如,DNA测序可以用来确定DNA分子上的种种化学修饰,这些化学修饰可以用来评价基因表达调控机制;DNA测序可以用来评估染色体的构象,而染色体构象与个体发育和细胞分化都密切相关;DNA测序可以用来研究单个细胞的基因表达,而单细胞里单个基因的表达是基因功能调控的最基本信息;DNA测序可以用来评价染色体的物理状态,比如核小体的定位和组分(如组蛋白)蛋白质的化学修饰等,这些信息与基因在高层次的调控有关。可见,DNA测序将不再停留在测定基因组本身的序列和多态性,会延伸到其它相关“组学”领域的研究。 其次,我们至少要在五个分子和细胞生物学层面上考虑基因组生物学的发展和研究内容。第一是“信息流”(Informational Track),它延续“中心法则”的思维框架,主要研究对象是DNA、RNA和蛋白质序列信息,由遗传密码来解读。它的相关研究领域包括分子遗传学、分子进化和基因组结构等。尽管基因型与表型的关系从传承来讲是遗传学的研究内容,但是越来越多的表型被分到可塑性的研究范畴。大样本量的研究也必然要与生态学结合在一起。简单地将基因变异(编码部分)与复杂的生物学现象相关联是不能够真正解决重要生物学问题的,其实质更不是金-威尔森(King-Wilson)在1975年提出的“两个调控水平”假说(简单的基因调控区假说,认为基因调控序列决定基因调控的不同,从而导致近缘物种间的表型不同) 。信息流的研究素材主要是基因组DNA序列和基因组的群体多态性,这些多态性的特点是它们的相对有限性和稳定性。比如,人类基因组间的序列差异大约是1/500,而这些不同常常是以不同的频率被同一个群体来共享的。换句话讲,如果我们测定了一个群体中一万个个体的基因组,这个群体的未知多态性就会所剩无几了。第二是“操作流”(Operational Track),它的研究对象包括生理学、细胞生物学和分子生物学研究的主要实验内容和生物学命题。操作流是个比较复杂的体系,它包括了以DNA(Epigenomic,表观基因组学)、RNA(Ribogenomic,RNA组学)、蛋白质(Proteomic,蛋白质组学)为主体的各种穿插交错的调控机制,对应的是这三个已经建立起来,但是信息流以外的“组学”。第三是“平衡流”(Homeostatic Track),主要是药理学和生物化学等学科的研究精华。平衡流包括三个基本部分:物质(Material)流、能量(Energy)流和信导(Signaling)流。重要的物质流研究对象包括血红素(比如,血红素与生物节律的关系)、生物激素(比如,生长激素与发育的关系)、神经递质(比如,生物递质与神经发育的关系)等等。重要的能量流物质研究对象包括dNTP、NTP、多聚磷酸、各类单糖、各类多糖等。DNA、RNA和蛋白质等作为主要细胞组分也会与能量流和物质流密切相关。我们对能量流的了解其实还是非常有限的,但是从另一个角度来说,其发展潜力也是非常巨大的。比如,人类的生命周期(发育、更年、衰老等)和生殖周期的生理学就是这个“流”所要研究的部分基本内容。病理状态,比如人群中高发的代谢和神经退行性疾病等也在其中。信导流,也就是信号传导,显然已经是分子生物学家几十年来的研究对象,勿须赘述。第四是“分室流”(Compartmental Track),它涵盖发育生物学、解剖学、生命起源等领域所涉及的核心科学问题。分室流将以单细胞和细胞群为研究对象,揭示细胞分化、个体发生和发育、组织形成等分子机制。由于生命起源是由简单到复杂,由单细胞到多细胞,所以分室流也将揭示生命起源和细胞器形成等分子机制。干细胞研究也是属于分室流研究的范畴,主要是在分子水平上解释胚胎、诱导干细胞、特定组织干细胞等的差别和如何解释干细胞的自然发生、诱导发生、定向分化和异常分化。同时,也要建立测定干细胞分化定向性和定向分化潜能的维持和诱导因素。第五是“可塑流”(Plasticity Track),主要是研究表型和行为的可塑性。前者囊括生态学与环境生物学的研究内容,后者包括神经生理和心理学等研究内容在分子水平的命题。这两个可塑流的分支有关系吗?为什么要将它们放在一起来研究?这里仅举一个例子,这就是生物节律之一的休眠,例如哺乳动物常见的冬眠(如黑熊)和夏眠(如热带蝙蝠)。冬眠其实是一个由中枢神经系统参与的主动行为,也是一个复杂的生理过程,同时又受环境因素的严格制约。动物的迁徙和休眠行为在进化的框架下,既有趋同进化也有趋异进化,也具有相当强的表型和行为可塑性以及两者的交织和重叠。揭开表型和行为的可塑性之谜显然不是简单的遗传和遗传多态性的问题,是要集成生命科学各个领域的最新成就和技术。 此外,这个“五流”是否涵盖了生命科学的全部呢?答案是肯定的,不能。因为知识在不断高速积累,科学要不断发展和提高,概念和理论必须不断更新。但是,就目前科学界能够容忍的变量和参数而言,这“五流”的关联已经足具挑战性了。生命科学研究基本上有两个极端:简单化和复杂化。简单化的研究是分子生物学家最津津乐道的:例如相互作用和信号传导的研究。复杂化呢,还没有先例。“五流合悟”可能就是一个具体尝试。我们过去对机械式的原理关注过多,对复杂而具有可塑性的生命现象的研究却非常欠缺。过去,这类现象被笼统地归为“表观遗传”和“环境因素”了。这个定义是非常不“科学”和可称经典“鸵鸟心态”。随着科学和技术的发展,我们可以逐渐来面对现实了。 再则,无论如何,生命是个整体,生命的最小单元细胞也是一个整体,就连基因这一生命编码的最小功能单元也是有不同的序列和相互作用原件组成。因此,“五流合悟”不仅势在必行,而且是唯一出路。那么,如何将不同的“流下(内)要素”关联起来呢?简单的孰重孰轻和孰本孰末,显然是不可能帮助我们解决根本问题的。至少五个基本时、空、量、域等参数要考虑,比如:(1)信息流:等位基因的主次之分和群体传递;(2)操作流:可量化的过程、结果和可传递性;(3)平衡流:量化物质的基数、噪音、阈值和能量水平;(4)分室流:量与时间、空间的关系;(5)可塑流:量、时间、空间、交流、程度和可学习性等。 最后,生命科学研究的真正挑战在于如何将这些基于不同概念界定的,由不同技术和方法获取的,被不同领域科学家们所收集的,停留在各个不同理论和信息层面上的知识编织成一个有机的网络或系统。而这恰恰是就是生命的特点,也可以说是揭示生命本质的终极途径。生物医学研究与临床医学实践的精准度也正是由这些研究学科前沿的进步来决定的。 4. 中国生命科学如何“自立于世界民族之林” 中国科学家在1999年适时参加了HGP,并承担了1%的任务。后来还参加了相关的国际性的基因组研究计划,比如“人类单倍体型图计划”和“千人基因组计划”等。但是这些科学计划地参与并没有在中国科学界和社会引起“波澜”,中国生命科学界迄今也没有启动足够规模、具有划时代科学意义的大项目,国家也没有启动能够让百姓大众振奋的大科学计划。 生命科学未来发展的基本趋势还是一目了然的。要实现应用的精准,首先是测量技术的精准。DNA测序已经精确到单个核苷酸,因此单细胞和单分子(或超微量)技术,将会引领未来体内技术的发展。DNA测序、质谱、微流控、CCD摄像、微纳加工等技术的国内空白都亟待填补。其次是数据的获取、组织和综合挖掘能力的建设。中国的超级计算机运算能曾经可以展示为领先国际水平,但是实际的领域应用程度却常常落后于国际同行水平。美国的NCBI和欧洲的EBI都是有着近30年历史的生物信息中心,我们没有;国际性大型文献收集和检索库都在不断扩张和更新,我们没有。第三是临床和自然资源的积累。我们可以从头开始。最后是大项目的策划和实施,我们正在研讨和积累经验。 值得乐观的是中国科学家发表的论文数这些年来不断攀升,显然与我国的科研投入有关。“一国之下,万国之上”的局面其实也有诸多隐情。比如,中国科学家的国际合作精神远在国际同行之下。其原因无外乎是单位和个人排名的纠结、致谢中资助单位排名的纠结、文章影响因子的纠结、无休止和无标准评审的纠结等等。挣扎在这些似乎无法摆脱的“泥潭里”,科学家们憧憬未来、策划未来和为未来而奋斗的心情是如何状态呢? 参考文献: DELISI C. The Human Genome Project: The ambitious proposal to map and decipher the complete sequence of human DNA. American Scientist. 1988, 76: 488-493. DULBECCO R. A turning point in cancer research: sequencing the human genome. Science, 1986, 231, 1055-1056. SMITH L M , SANDERS J Z , KAISER R J , et al. Fluorescence detection in automated DNA sequence analysis. Nature, 1986, 321:674-679. OLSON M V, HOOD L E, CANTOR C, et al. A common language for physical mapping of the human genome. Science, 1989, 245: 1434-1435. COOK-DEEGAN R M. The Gene Wars: Science, Politics, and the Human Genome. W W Norton and Company, Inc., 1994. TRIPP S, GRUEBER M. Economic impact of the Human Genome Project. Battelle Memorial Institute, 2011. SCHACHT W H. The bayh-dole act: selected issues in patent policy and the commercialization of technology. CRS Report for Congress, 2012. KING M C, Wilson A C. Evolution at two levels in humans and chimpanzees. Science, 1975, 188:107-116. (转载自《自然杂志》第35卷 第5 期)