科学网

 找回密码
  注册

tag 标签: 组学

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

【科普】从疾病的发生、研究、到治疗
dancingion 2019-9-23 09:15
首先,需要问一个问题:What is the truth of life? (生命的本质是什么?) 这是一个带有哲学色彩的问题。不同的人会有不同的理解。有人会简单直白地告诉你“生命的本质在于金钱和名利”,也有人会郑重其事地告诉你“生命的本质在于对社会的贡献”。 电影《阿甘正传》 里阿甘会意味深长地告诉你:“life is like a box of chocolate, you willnever know what you are gonna get(生命就像一盒巧克力糖,你永远不知道你将拿到什么口味)”。 作为生命科学领域的研究者,我们则会从其物质本质角度来回答:生命的本质就是几百上千亿的分子。 生命的物质本质 大到基因、蛋白质,小到葡萄糖、氨基酸、水和二氧化碳。你的每一个动作、状态都是分子活动的结果。你的开心与不开心,取决于大脑里产生多巴胺的多少;你的胖与不胖取决于身体里脂肪分子的多少。 01 — 疾病发生与原因筛查 生命可以看做是一场关于分子们的电视剧:基因是编剧组,负责写剧本;蛋白质是导演组,负责剧情的执行;小分子代谢物们是演员组,负责将剧情呈现出来(所谓的表现型,phenotype)。我们科学家们作为监制来监督整个电视剧的质量。如果某一剧集开始变得不好(疾病发生),那么一定是其中的某个或某些成员们出了问题。 生命是一场分子们的电视剧 为了找出问题出在哪儿,我们需要对各个组都进行筛查:对编剧组的筛查叫做基因组学,对导演组的筛查叫做蛋白组学,对演员组的筛查叫做代谢组学。 这就是各种组学概念的形象理解。 筛查方法 这些筛查虽然针对的是不同的组,但过程基本类似: 将问题剧集时的状态与正常剧集时的状态进行对比,找出其中有哪些个体体现出了显著差异。 由于我们筛查的对象数量非常庞大,我们需要借助大数据处理方法来帮助我们完成这一数据分析过程(常用工具有常规统计计量学方法、生物信息学方法、以及近年来发展出的机器学习和深度学习方法)。 数据处理过程之后,我们就拿到了非常关键的、跟问题密切相关的个体名单(生物标志物) 。 比如糖尿病里,名单上就会有葡萄糖升高和胰岛素降低。 糖尿病生物标志物 从筛查过程到最终拿到名单,这个过程的工作就是我们生物分析化学家们结合生物学家们来完成的。 (对演员们的筛查——代谢组学就是我所研究的领域) 02 — 治疗方法的研究 有了名单,我们就可以着手研究问题的解决方案了。 针对不同组的个体,采取的方法也不一样。如果只是导演们(蛋白质)或演员们(小分子代谢物)的问题,那么根据他们出问题时的运作方式,科学家们会发展出特定的靶向处理方法;如果是编剧们(基因)的问题,就有点复杂了。因为生命的剧本(基因序列)是从生命一开始就已经写好的,曾一度认为没有办法修改。近几十年来,随着基因技术的发展,这一认识被改观。尤其是最新的CRISPR(基因编辑婴儿时间中用到的技术),更是可以做到“哪里不对就改哪里”的状态。 然而,这里涉及太多伦理方面的问题,因而目前还仅仅停留在实验室动物研究阶段。 基因编辑技术CRISPR (此图来源于网络,如有版权问题请告知) 以上过程是由生物医学工程领域的科学家们来完成的。 为了方便以后相同问题的快速诊断(不用每次都做组学筛查和大数据分析),科学家们还努力发展针对名单上个体的快速准确诊断方法。 比如血糖的检测从早期需要抽血花几天时间化验到现在简单方便的血糖试纸,就是一个很好的科学家们的成果改善医疗的例子。 这一部分工作是由部分生物分析化学家和生物医学工程领域的科学家们和工程师们完成的。 03 — 临床治疗 有了方法,那么接下来的就是应用这些方法方法去解决问题了。这一部分工作是由医生以及其他医务工作者们共同完成的。 由于医生是与疾病距离最近的人,掌握有很多宝贵样品和信息。因而如果有机会他们也会积极参与到上诉两个过程中。 04 — 通力合作 这就是疾病的研究到治疗的过程。可见, 抗击疾病是一个需要多领域科学家、工程师、和医务工作者通力合作的事业。 为了解决问题,他们之间有时条件允许的话会有直接的联系和合作;很多情况下,并没有直接合作的条件,他们之间的交流和进展沟通都是通过学术论文(Paper)进行的。因而Paper在学术研究中起着重要的作用。 疾病从研究到治疗 (上部实线箭头表示直接合作,虚线箭头代表通过论文进行的隐形合作) *此文章最先发表于个人微信公众号“思想行囊“中。欢迎关注交流。
个人分类: 科普系列|2645 次阅读|0 个评论
HCCDB--打造一站式检索的肝癌基因表达图谱
jgu 2018-7-24 09:39
HCCDB--打造一站式检索的肝癌基因表达图谱 1、大规模肝细胞癌(HCC)基因表达图谱发布,包含近四千例临床样本基因表达数据。 2、克服可重复性难题,建立HCC一致差异表达图谱。分析表明,在HCC中发生一致下调的基因集中在代谢通路、脂肪酸降解等通路,一致高表达的集中在细胞周期相关的通路。 3、整合TCGA和GTEx数据构建全新4D指标,全面描述基因在HCC中的表达模式。分析该指标发现,肝癌常用标志物AFP、GPC3表现突出,另外两个表现突出的基因SPINK1和AKR1B10也具有潜在的标志物价值。 数据库网址: http://lifeome.net/database/hccdb ——————————————————————————————————————— 肝细胞癌是一种常见且死亡率很高的癌症。高通量生物技术的发展使得人们可以从不同的分子水平对HCC进行描述。目前,表达谱数据已经大量积累并广泛应用于分子分型和肿瘤标志物的研究中。然而,对于HCC这样一种高度异质的疾病,只从一个样本量有限的表达谱数据集中做出的推断,很容易出现可重复性差和假阳性高的问题。为了找到一致的HCC异常表达模式、全面注释HCC中的基因表达情况,我们收集了15个公共的表达谱数据集,总共近四千个临床样本,并开发了数据库HCCDB,提供用户友好的一站式在线检索服务。 HCCDB有以下功能与特点: 15个数据集、近四千个临床样本,保证HCC差异表达模式的一致性和可重复性 建立了HCC一致差异表达基因图谱 单基因搜索功能--全面注释单基因在HCC中的表达谱: 多数据集中的差异情况 提出基因表达4D指标,系统刻画其在肝中的特异性、在HCC中的异常程度、肿瘤特异性以及HCC特异性 在正常组织(GTEx)和多种癌症(TCGA)中的表达情况 预后性能 共表达 药靶、蛋白等外部链接 文献挖掘 多基因搜索功能--总结多基因在HCC中的表达情况 采用“总结性的描述指标 + 具体结果展示”的形式,便于用户快速掌握基因在HCC中的表达模式 便捷、美观的图形界面,所有中间计算结果和原始数据都可下载,提供详细的网站使用教程 数据库的整体设计和主要页面之间的跳转关系如下图所示。通过综合分析12个有癌旁的数据集得到一致差异基因,并映射到染色体上,得到如图2A所示的一致差异图谱。 通过分析4D指标的前两维(肝特异性logFC1和HCC中的异常程度logFC2)之间的关系,如图2B所示。结果显示,整个图中明显游离在外的三个基因都与HCC息息相关。其中,GPC3已被证实可通过激活Wnt和其他信号通路来促进HCC生长和转移;SPINK1被发现在分化良好的HCC和高度发育不良结节中差异表达;有研究表明AKR1B10可能在肝癌发生中有着关键作用。 以GPC3为例,来展示单基因搜索的结果,具体如图3所示。返回的结果中,总结性描述包括:是否为一致差异表达基因、预后性能、4D指标雷达图、基因基本信息等;外部链接包括HPA、TTD、NCBI、GeneCards,以及文献挖掘的结果。在基因的表达模式版块,HCC中的表达模式采用“表格 + 散点图/直方图”两种形式互为补充;多种癌症和正常组织中的表达模式采用“散点图/直方图”的形式进行展示。此外,还有生存期分析和HCC/癌旁/正常肝中的共表达结果展示。 此项工作主要由清华大学古槿课题组与上海东方肝胆医院陈磊课题组联合完成,数据库论文已被Genomics, Proteomics Bioinformatics (GPB)杂志接收(2018年影响因子6.615),清华大学博士生连秋宇、硕士生王事成是论文主要作者。 HCCDB: a database of hepatocellular carcinoma expression atlas. Genomics, Proteomics Bioinformatics 2018, Accepted. Qiuyu Lian*, Shicheng Wang*, Guchao Zhang, Dongfang Wang, Guijuan Luo, Jing Tang, Lei Chen#, Jin Gu #.
11976 次阅读|0 个评论
当肿瘤遭遇“信息泄露”
热度 3 jgu 2016-12-23 10:57
“外”如探测浩瀚的宇宙,“内”如揭示人体细胞的奥秘,海量的信息必将改变人类社会、改变人类自己。 人类已经逐步进入信息爆炸的时代,各种个人信息、网络行为、生活习惯,甚至各种所谓的隐私、银行账号密码等“机密”信息均无法避免遭遇各种泄露门、监控门事件。肿瘤这个邪恶的幽灵隐藏在体内,时刻准备攫取资源来扩张自己的军队。而我们却对之毫无察觉。 但随着以新一代测序技术为代表的高通量生物检测技术的发展,肿瘤的机密信息也无处遁形,遭遇着前所未有的“信息泄露”,肿瘤的DNA、RNA、蛋白质、代谢物等生物信息都暴露于人类的检测之下。这些海量信息被称为组学信息(omics),如:DNA序列信息是基因组(genomics)、染色质结构和各种基因组修饰是表观遗传组(epigenomics),另外还有转录组、蛋白质组、代谢组等等。从这些泄漏的信息,我们该如何来窥探肿瘤的“隐私”?如何推出更好的对付“肿瘤”的办法? 拿到海量的肿瘤组学数据我们能做什么?首要任务是建立肿瘤的信息档案。就像是地理测绘测绘,首先要用测到的数据把地图绘制出来。目前,几个国际癌症基因组计划,如ICGC(International Cancer Genome Consortium)、TCGA(The Cancer Genome Atlas),都致力于推动肿瘤分子图谱的构建。利用TCGA的数据,可以识别在肿瘤细胞中发生的体突变,并从中识别出影响蛋白质结构与功能的突变位点(Niu et al., Nat Genet 2015),另一项类似的研究从超过7000余对肿瘤/癌旁配对样本中识别出超过47000个非同义突变位点,极大的提高了人们对肿瘤突变谱的认识(Shen et al., Am J Human Genet 2016)。基于突变谱,可以更好的估计靶向药物的潜在应用比例,经计算估计约40%的病人可能会受益于靶向药物(Rubio-Perez et al., Cancer Cell 2015)。 但由于肿瘤的高度异质性以及不同中心采样和检测手段的差异,单个项目所纳入的样本量仍然远远不够,以肝癌为例,在TCGA中有约400例样本,已经是目前公开数据集里样本数最多的了。为了更好的绘制“肿瘤的地图”,必须建立跨更多数据源的大规模图谱。比如本课题组构建的肝细胞肝癌(Hepatocellular Carcinoma,HCC)组学图谱 HCCDB ,已经收录了约3500例临床样本的基因/miRNA表达数据、约800例DNA甲基化数据、约600例CNV数据(来源于17组研究),目前可提供表达谱的网页浏览服务。多来源/多中心、大规模的组学数据是建立肿瘤信息档案的基础,基于这些收录的数据,我们已经开展了HCC的DNA甲基化图谱分析(Zheng et al. Brief Bioinform 2016 ),正在进行基于表达谱的HCC分型研究。同时,HCC相关研究人员可以方便的查询分析结果,指导相关的实验设计,提出更加合理的假设。比如某研究人员正在关注HCC肿瘤干细胞的调控机制,他可以用EPCAM、AFP、SPP1等候选基因来查询相关的通路或基因。信息爆炸的时代或者说大数据时代,绘制各种“地图”是实现数据价值的第一步,从多个维度、多个层次构建“肿瘤地图”是以信息技术攻克癌症的基础和关键。类似的,大肠癌也建立了超过4000例样本(来源于18组研究)的大规模数据集,并基于该数据集分析出大肠癌的四个分子亚型,并得到了每个分子亚型所特有的分子和表型特征(Guinney et al. Nat Med 2015)。 有了基础地图之后,我们当然需要将其绘制得更加精细,并利用“先人的知识”对其进行仔细的标注,比如在军事地图上需要标注出关键的制高点、隘口等。这个时候人工智能技术就非常重要了,针对癌症组学数据高维、异质等特性,需要更好机器学习方法对数据进行挖掘和建模,比如聚类(分子分型,如多组学整合聚类方法 LRAcluster )(Wu et al. BMC Genomics 2015)、预测(分子标志物),核心调控网络识别(分子机理)(Gu et al. Mol BioSyst 2014))及其可能的调控策略(药物干预)等。由于生命系统高度复杂,组学数据并不能很好的完成“地图标注”的任务,必须要跟专家知识、文献信息有机的结合起来。这对传统基于采样数据的机器学习方法无疑是新的挑战。可以预见,要更好的解读肿瘤的信息,必须建立可融合采样数据和知识数据的新的人工智能方法。深度学习(deep learing)(LeCun et al. Nature 2015)与层级贝叶斯学习(hierarchical Bayesian learning)(Ghahramani. Nature 2015; Lake et al. Science 2015)的结合是否是可行的路径?这些都还有待进一步的研究。 随着生物医学检测技术与人工智能的发展,肿瘤的“机密信息”将不断的被披露,人们将拥有更多肿瘤诊疗的新手段。 参考文献: Ghahramani. Probabilistic machine learning and artificial intelligence. Nature 2015, 421:452-459. Gu et al. Gene module based regulator inference identifying miR-139 as a tumor suppressor in colorectal cancer. Molecular BioSystems 2014, 10(12):3249-3254. Guinney et al. The consensus molecular subtypes of colorectal cancer. Nat Med 2015, 21(11):1350-1362. Lake et al. Human-level concept learning through probabilistic program induction. Science 2015, 350(6266):1332-1339. LeCun et al. Deep Learning. Nature 2015, 521:436-444. Niu et al. Protein-structure-guided discovery of functional mutations across 19 cancer types. Nat Genet 2016, 48(8):827-837. Rubio-Perez, et al. In Silico Prescription of Anticancer Drugs to Cohorts of 28 Tumor Types Reveals Targeting Opportunities. Cancer Cell 2015, 27:382-396. Shen et al. Proteome-Scale Investigation of Protein Allosteric Regulation Perturbed by Somatic Mutations in 7,000 Cancer Genomes. Am J Hum Genet 2016, EPub. Wu et al. Fast dimension reduction and integrative clustering of large-scale multi-omics data using low-rank approximation: application to cancer molecular classification. BMC Genomics 2015, 16:1022. Zheng et al. Genome-wide DNA methylation analysis identifies candidate epigenetic markers and drivers of hepatocellular carcinoma. Brief Bioinform 2016, Epub. 2016年12月23日
个人分类: 科研笔记|6347 次阅读|4 个评论
精准医学与个体化医学的那些事
热度 8 jgu 2016-8-12 17:08
放假前跟人聊天,说起最近时髦的精准医学和前些年火爆的个体化医学是啥关系?是不是老概念又拿出来重新炒作?让我们来了解下两者的异同: 精准医学(Precision Medicine) 自从奥巴马做为国家战略提出后,不断在全球刷屏,各国政府纷纷部署跟进。“精准”医学精准在哪?是相对目前医学的主要的诊断和治疗基础——组织器官层次的异常变化:病人在医院做的大多数检查是在组织器官层面的,仅有少数血液指标是在分子水平。精准医学则希望更进一步,从分子层次或者通常所说“基因”层次实现疾病的分类诊断、根据分子特征进行治疗。一项基于大规模组学数据的计算分析表明,利用分子分型,可以将已通过临床实验的靶向药物的潜在受益人群从5.9%扩展到40.2%( Rubio-Perez et al., Cancer Cell 2015 )。我们的研究表明除了靶向药物,基因数据对常用化疗药也有一定的预测作用( Ding, et al. Bioinformatics 2016 )。 个体化医学(Personalized Medicine) 的概念很早就提出了,其要点在于根据患者的基础体质、家族病史、生活习惯等大量个人信息有针对性的设计治疗方案,包括药物组合、剂量等。个体化医学与中医的辩证论治的很多理念相通,广受国内学者和民众的关注。个体化医疗更关注的是“前后的变化”和“系统初值”,打个比方,如果某个人出生时血压就偏低,某段时间血压突然升高还在正常值范围内,但这个突然的升高就必须要高度关注了。 ================================================== 目前,精准医学更多是基于群体的基因数据:即收集大量患者的横断面数据,一方面试图将疾病(主要指非传染性疾病)按照分子变异来进行划分,比如各种癌症亚型的划分,然后搞清楚每个亚型的分子变异、临床特性和发病机制,选择最合适的治疗方案;另一方面,对同样的治疗方案(或某一种药物,特别是靶向药)搞清楚具有哪些分子和临床特征的病人可能有效且副作用小(注:副作用非常重要不能只关注药效)。两方面往中间靠拢(一边是把病细分,另一方面把药明确)找到最“精准”的治疗方案。随着基因检测技术和各种可穿戴健康设备的进展,精准医学会进一步朝着个体化的方向发展,即 Personalized Precision Medicine(2PM) :每个人在一生中会进行多次基因检测,并与日常的健康信息整合起来,实现个体化的精准医疗。前几天Michael Snyder来清华做的报告里介绍了他们2012年发表的个人集成组学谱的研究(iPOP,integrative personal omics profile)( Chen et al. Cell 2012 )就是这个趋势的代表。 无论是精准医学还是个体化医学,其核心都在于基因数据、健康信息的采集和挖掘,随着数据的积累,数据分析与挖掘、机器学习将逐渐成为两个PM以及2PM的核心技术 。
8460 次阅读|15 个评论
DNA修复机制是癌症治疗的双刃剑:TCGA临床药物响应分析的启示
热度 4 jgu 2016-5-27 12:15
基因组坏了,修还是不修?这是个问题。 顺铂( cisplatin )是常用化疗药,会进入细胞核与DNA结合,导致基因组损伤,进而引起细胞死亡。DNA修复通路是维持基因组稳定性的重要机制,但这套机制对顺铂引起的基因组损伤也可以进行修复,减少因基因组破坏导致的癌细胞死亡;同时顺铂引起的基因组变化被修复成了新的“突变”,增加了癌细胞进化出抗药性的可能性。我们的分析发现,在膀胱癌(BLCA)中, DDB1 (损伤特异的DNA结合蛋白)的高表达预示着顺铂药物无效,从整体生存期来看DDB1的高表达也也预示着较差的预后。可以说DNA修复通路是癌症发生发展的双刃剑,DNA修复基因与顺铂药物响应的复杂关系有待深入研究。 ============================== 判断化疗药物临床响应的好坏是癌症治疗的重要问题,从药物成本和总体疗效来看,化疗药仍是一线治疗方案的首选。但并不是所有病人对化疗的响应一致。除了传统的临床检查指标外,从分子层次建立化疗药物临床响应的预测模型、阐明抗药机制对癌症的治疗具有重要意义。我们系统整理了TCGA的药物临床响应和多模态组学数据,建立了一套严格的机器学习分析框架对基于组学数据的预测模型的性能进行了系统的评价,结果表明: 1)截止2015年年底数据,同一种药物的药物响应与组学数据都比较完整的记录仍不多,最多的几种化疗药cisplatin、5-fu等也仅有100多个样本,在单个癌症类型中样本数仅有数十个;另外,“无响应”与“响应”组的样本数很不平衡,有数倍的差异。数据集的这些特点给构建预测模型带来了很大的难度; 2)针对数据的特点,我们设计了基于系数回归(elastic net)和重采样(bootstrapping)的计算评价框架,尽可能避免过学习,相对客观的评价预测的性能; 3)从预测结果来看,总体预测性能并不理想,仅有膀胱癌-顺铂-基因表达、乳腺癌-紫杉醇-miRNA表达等几个数据集可以达到较好的预测性能; 4)利用elastic net进行特征选择,可以选出若干与药物临床响应相关的重要基因,比如DDB1(DNA repair pathway)高表达预示着响应差,从生存分析的结果来看,DDB1高表达与预后差相关,顺铂对基因组具有破坏性,DDB1基础表达水平高可能通过削弱顺柏的基因组破坏作用进而产生药物抗性;另外还发现DLL4、INST5、HNRNPA3-HNRNPA3P1等很有意思的特征基因; 5)借鉴pan-cancer分析的思路,我们也对单种药物也进行了跨癌症类型的分析,对预测性能会有影响,但未能得出有规律的变化。 Evaluating the molecule based prediction of clincial drug responses in cancer Zijian Ding, Songpeng Zu, Jin Gu Dataset: http://bioinfo.au.tsinghua.edu.cn/member/jgu/drug_response Molecule-based prediction of drug response is one major task of precision oncology. Recently, large-scale cancer genomic studies, such as The Cancer Genome Atlas (TCGA), provide the opportunity to evaluate the predictive utility of molecular data for clinical drug responses in multiple cancer types. Here, we firstly curated the drug treatment information from TCGA. Four chemotherapeutic drugs had more than 180 clinical response records. Then, we developed a computational framework to evaluate the molecule based predictions of clinical responses of the four drugs and identify the corresponding molecular signatures. Results show that mRNA or miRNA expressions can predict drug responses significantly better than random classifiers in specific cancer types. A few signature genes are involved in drug response related pathways, such as DDB1 in DNA repair pathway and DLL4 in Notch signaling pathway. Finally, we applied the framework to predict responses across multiple cancer types and found that the prediction performances get improved for cisplatin based on miRNA expressions. Integrative analysis of clinical drug response data and molecular data offers opportunities for discovering predictive markers in cancer. This study provides a starting point to objectively evaluate the molecule-based predictions of clinical drug responses. ========================= 附:投稿过程 这次可以说是最近第一次写非方法类的研究论文,主要研究用组学数据预测化疗药物临床响应。 从投稿过程来看,没有新的组学数据或者功能性验证实验,计算发现很难得到基础医学类杂志的杂志,几个好一点的杂志都没有送审。 第一个期刊是生物综合类杂志核酸研究NAR,编辑部未送审,主要理由是缺乏general interests,2016/01/28 While your study is very interesting, the editors believe that this paper is most appropriate for a journal more specifically focused on cancer therapeutics and drug validation. Therefore, we are returning this decision to you so that you may proceed with submission to a different journal. This decision does not reflect our assessment of the quality of this work but rather the belief that it is more appropriate for a different publication venue. 第二个期刊是癌症类专业期刊Cancer Research,1月28日投稿,因为格式问题来回了几次,2月4日进入Under Review(应该是在编辑手里),2月16日中午Decision Pending,稍后收到编辑部未送审通知。 第三个期刊是Nature Communications,2月17日投稿,2月29日收到编辑部未送审通知。 第四个期刊投Bioinformatics,格式改成了Discovery Notes,3月1日投出,3月6日通过编辑部进入Awaiting Reviewer Assignment,3月14日Under Review,3月28日Awaiting Decision;4月3日Major Decision,4月28日修回,5月4日编辑部审查后进入Under Review,5月23日Awaiting Decision,5月27日Accepted
个人分类: 科研笔记|10244 次阅读|7 个评论
[转载]代谢组学:未来新方向
freeedu 2015-3-10 09:28
代谢组学:未来新方向 http://news.sciencenet.cn/htmlnews/2015/3/314633.shtm 加拿大阿伯特大学生命科学与计算科学教授David Wishart说,我们自身其实就是一大组生化反应,“因此,基因组和蛋白质组不断进化来支持代谢组,而不是相反的路径。” Wishart说,有别于其他组学方法,代谢组学提供了一种更加直接的生理状态检测方式。代谢组反应营养、胁迫或者疾病状态的速度比转录组或者蛋白质组要快得多。这使得代谢组在许多领域都非常吃香,如环境毒理学、进化和发育、疾病诊断与治疗反馈、以及药物、杀虫剂和除草剂的研发等。代谢组流动检测帮助合成生物学家揭示遗传改变如何影响通路和产物。 作为组学家族最年轻的成员,代谢组学发展势头正劲。2014年,国际代谢组学学会主办了他们的第10次年会,与首次会议是同一座城市:日本鹤岗市。“第一年,我们有大约150人参会。”墨尔本大学助理教授、该校的澳大利亚代谢组分站负责人Ute Roessner说,“今年我们有超过500名注册参会人。而且代谢组学已经成为了每位研究者研究工具的一部分。现在,年轻的研究者定期开展代谢组学工作,作为他们博士工作的一部分。” 代谢组学最主要的挑战根植于它的优点。代谢组数据很强大,因为生物体具有许多的代谢物,包括相关的前体、衍生物和具有一定浓度的降解产物,它们都极具多样性且变化迅速。这种复杂性需要精妙的分离和检测方法。代谢组学包括了脂类分析,这是一个极具潜力的发展领域,赛默飞世尔科技公司策略市场部经理黄盈盈(音译)说:“脂质组学与心血管疾病、癌症、糖尿病和肥胖症直接相关。然而脂质在体内的结构和浓度极具多样性,能达到10倍的变异。”许多生理脂类和其他代谢物共享一种化学组成,仅仅在排列上具有差别。因此,加州大学戴维斯分校教授、西海岸代谢组学中心主任Oliver Fiehn将代谢组学称为“异构体科学”。 仪器的决策树 人们对代谢组学的兴趣不断增长,促使分子分离和检测仪器的制造商研发出各种针对代谢组学的硬件、软件和技术支撑。当研究人员需要将这些技术带进实验室时,他们面临着复杂的决策树。第一个分支就是非靶向还是靶向的分析。非靶向方法在所有可能的组分上聚集数据。靶向分析则聚焦于已知的组分,经常是数量上的变化,例如在胁迫和疾病的反应过程中。 核磁共振光谱学(NMR)对于靶向分析来说尤为强大,因为它可定量、可重复,适合于检测复杂样品如血液、尿液或仅需少量或不经过处理的少量组织提取物。芬兰奥卢大学分子流行病学负责人Peter Würtz最近作为共同作者发表了一篇文章,该项工作利用布鲁克公司的仪器,将NMR代谢组学应用于数千个爱沙尼亚和芬兰的生物银行样品中。研究团队找到了四种生物标记,当组合在一起时,与各种情况的猝死风险的提高显著相关。Würtz指出,这一研究是观测性的,并没有探究其机制,但却展示了NMR在生物标记分析中的能力。然而,使用NMR的代谢组学分析也存在局限,因为它的灵敏性比更加流行的代谢组学方法“质谱分析法(MS)”要低好几个数量级。 质谱需要样品处理。组分通常需要离子化并经过分离,最常用的方法是气相色谱(GC)和液相色谱(LC)法。毛细管电泳(CE)能很好地分离极性代谢物,能够用到与单细胞一般大小的样品中。毛细管电泳—质谱联用是人类代谢组技术公司(HMT)的特色产品,而像安捷伦和爱博才思等企业也提供该产品。但是,毛细管电泳技术需要专业的操作者和强大的软件来分析迁移时间中的漂动,安捷伦代谢组项目经理Theodore Sana说。 毛细管电泳—质谱联用技术的强大之处在于解析那些易于挥发或者能够通过衍生物挥发出来的物质,例如原初中心代谢的小分子。而液质联用技术则特别适用于大的、热不稳定的有机分子,包括许多次生代谢产物、较大的碳水化合物和脂类。一些诸如超高效液相色谱(UPLC,最初由Waters公司研发)、超临界流体色谱和离子迁移分离法的新进展,提高了速度和分离能力,囊括了非极性分子和具有多种异构体或异位体的组分(例如脂类)。分离方法与质谱分析器偶联起来,例如飞行时间(TOF)质量分析器,能够快速、高分辨率地解析大质量范围的分子。加入四级或线性离子捕获器可以选择在离子化过程中产生的特定成分或组分片段。一旦研究者完成了代谢组特性的分类,他们就可以决定是购买仪器还是将样品送往服务机构。 供应和服务商的选择 安捷伦提供有气质联用、液质联用、毛细管质谱联用和NMR等仪器。Sana 说:“作为单个供应商能提供所有这些技术,包括了硬件、软件和技术支持,我们具有不可替代的位置。”(岛津公司也提供被研究人员推荐为廉价的原初装置的多种系统。)用户对安捷伦提供的直观软件给予了好评,Sana证实这确实是公司优先考虑的事情。举例来说,安捷伦的GeneSpring —质模专业版软件用于多重组学数据的整合分析。Sana 说,“GeneSpring可以使你采用来源于RNA、蛋白质和代谢物完全不同的数据,并将它们动态地映射在生物通路上,就像KEGG(一种代谢通路工具)那样。” GeneSpring也支持预处理来自其他厂商平台的数据,例如作为一个电子表格。使用一个通路工具对来源于大量实验的结果进行可视化,这对于搜集生物学洞察力、计划接下来的实验来说十分有用,Sana说。 爱博才思专注于液质联用质谱仪,研究人员高度评价了该仪器快速的数据获取,卓越的动态范围,以及定量化和准确的质量能力(通常定义为百万分之五或更低的精度)。该公司也提供毛细管电泳和离子迁移的选择。对于代谢组学来说,爱博才思推荐三联TOF和QTrap系统。公司高级市场经理Fadi Abdi说,“我们的三联TOF是进行定性定量分析的高分辨率、精确质谱仪,适合于代谢组学的发展。Qtrap是为要求灵敏性、靶向性和定量性的工作流程所设计的。”Abdi这样解释,为了鉴定、确认和定量产物,三联TOF系列的高获取速度可以在一个液相时间段的单次进样中同时完成质谱和串联质谱分析。Qtrap的多重反应检测器提供父本化合物的数据和由质谱随后产生的片段,简化数据处理流程并使研究者对他们的数据具有信心,爱博才思代谢组和脂质组学应用部门研究员Baljit Ubhi说。 那些寻找广泛代谢物覆盖的研究者可以考虑爱博才思的组合包,融入了爱博才思的高分辨率液质联用系统和力可公司的高分辨率气质联用系统。这一合作为客户提供了“两种技术的精华”,力可市场技术部主任 Jeff Patrick说。组合包中包括了来源于Genedata公司的软件,能够将来源于两个平台的数据整合以提供可靠的代谢组学分析。 另一种流行的多功能液质联用质谱选择是赛默飞世尔科技公司基于轨道阱(Orbitrap)技术的仪器。轨道阱质谱分析仪通常用于蛋白质组,但是在整合了一个高级分离系统(如UPLC)时,它的高分辨率能力尤其适用于代谢组学的分析,黄盈盈说。平行检测消除了为了加速样品分析所需的多重运行。赛默飞世尔科技公司产品线上的最新系统是具有三个质谱分析仪的轨道阱融合三杂交系统。液相分离以后,通过四极孔样品过滤,并在随后的轨道阱和线性离子捕获中进行可能的平行分析。黄盈盈说,三杂交系统的设计初衷是为研究人员提供灵活性与精确的质谱性能。 赛默飞世尔科技、爱博才思和布鲁克也提供质谱成像的仪器,这也被称为MALDI成像法。Roessner解释,这种方法克服了代谢组学的一个局限:代谢物分析通常只能在均一化的样品或提取物中进行,但是那些特定的细胞和组织却具有不同的代谢物特征。质谱成像技术为一个纤薄的组织切片(例如,来源于一个器官或植物组织中)提供了代谢物空间分布的图像。这一过程是使用激光解吸将矩阵处理的样品进行组分离子化,然后再使用质谱进行分析。对组分进行二维图像的重建提供了组织间代谢物的定位。 Roessner在该项技术中使用了布鲁克系统,他说:“尽管仍在初级阶段,但这是一种令人兴奋的方法。它可以用于观察肺部样品中药物相关代谢物的分布,或者去追踪环境刺激后,组织中代谢物分布的改变。”赛默飞世尔科技的轨道阱系统在此方法上具有优势,黄盈盈说:“因为离子是来源于组织的,没有经过液相分离,你需要一种超高分辨率的仪器,就像轨道阱。” 对于不打算购买系统或者倾向于服务所带来的便捷性的研究者来说,他们也有很多选择。Biocrates公司和Metabolon公司都面向全球提供质谱代谢组学分析服务。Metabolon公司也涉猎大型、长期的合作,例如Craig Venter的人类寿命项目,Metabolon 公司销售市场高级副总裁Chris Bernard说,在代谢组学如何付诸实践、如何用于一系列项目中的问题上,合作对于Metabolon公司而言很重要。 NMR代谢组学所具备的优势在于不通过标准曲线的真正定量,样品可保留,可实现最少样品的操作,单次反应就能检测到所有带有结构信息的代谢物。但是科学家对于它的兴趣可能会受到装机成本的阻碍。研究人员可以通过服务商来获取这种方法,例如Chenomx公司。Würtz和他的同事也通过Brainshake公司提供NMR代谢组学的服务与合作。这是建立在他们使用NMR进行生物标记研究的经验,并将代谢组学数据与全基因组关联研究联系起来,该研究将遗传变异和疾病风险联系在一起。 代谢组学服务机构正在通过国家和学术中心设施快速增长。在澳大利亚,Roessner属于第一批建立政府资助的国家代谢组服务平台。加拿大也资助国家代谢组的项目,其他国家也在这个领域跟进。在美国,国立卫生研究院(NIH)共同基金早在2012年就开始建立代谢组学的区域中心。负责西海岸项目的Fiehn说:“这些中心提高了代谢组学的能力,能够为学术界和产业界服务,而且他们有不同的特色,例如肯塔基中心的代谢流平台和北卡罗来纳的核磁共振平台。”国立卫生研究院的中心平台也为初次接触代谢组学的科学家提供短期课程。 下一步挑战 当被问到代谢组学面临的重大挑战时,研究人员和供应商一致认为有三点:对未知物的鉴定;研发出可供查询的标准数据集,就像GenBank的基因组资源;代谢组学与其他全系统数据的整合。 “质谱太过于敏感,因此我们得到了大量物质,却不知道它们是什么。”Wishart说。为了帮助研究者进行代谢物鉴定,安捷伦研发了气质和液质联用质谱的数据库,专供基于质谱技术的代谢物鉴定。力可公司提供了一个GC-TOF的数据库,据Patrick表示可用于任何气相色谱的数据,尽管该数据库是为力可公司的仪器而进行的优化。力可公司目前正在探索与高分辨率精确质谱库进行合作的机会。 Wishart意识到,最未知的是代谢物中的代谢物:“分解产物和由酶转换而来的或者具有微生物活性的分子。”这种分子的相似性是鉴定它们的关键因素。Fiehn团队研发了一些商业化的质谱文库,也在开发虚拟文库。研究人员可以从物质已知的谱图数据出发,来预测相似的或修饰变异物的谱图。LipidBlast是Fiehn团队开发的串联质谱虚拟谱库,超过20万种脂类可供免费下载。 为了面对数据整合和可搜索性所带来的挑战,代谢组界采取了一些举措,推动数据存储库的建立。例如位于英国的Metabolights是由欧洲代谢组学标准协调委员会(COSMOS)联盟所支持的,该联盟制定了代谢组学的数据标准。还有代谢组学工作平台(Metabolomics Workbench),该平台旨在建立国立卫生研究院资助下的代谢组项目的数据库。赛默飞世尔科技与Fiehn合作推出了mzcloud.org网站提供免费的社区数据库,数据库包括在鉴定时有待注释的未知组分的真实和虚拟谱图。 即便是在代谢组学界有了存储数据的数据库之后,Patrick仍意识到,鉴于大量数据的背景和意义,“系统生物学的首要挑战是生物学干扰”。他认为解决的方案是软件,这“驱动着代谢组学的发展方向。” Bernard也有同感,他表示Metabolon公司客户首要的需求是帮助他们理解结果的生物学意义,“质谱对于产生数据来说很不错,挑战在于从噪音中分离出信号:85%的质谱数据点都是噪音”。Metabolon公司的客户可以使用MetaboLync的门户网站,其中包含了他们样品中的一系列代谢物,对比拥有超过1.4万种组分的本地文库,用于自动认证代谢物的鉴定,Bernard补充道,另外该门户最强大的特性在于,它具有在通路水平可视化并探索数据的能力。 随着该领域的不断发展,仪器供应商和服务提供商都迫切地期待与用户在他们的代谢组学研究上展开合作和讨论,不仅是买卖关系,而且可以掌握当前动态。“我们正与一些科研人员开展密切合作。”Sana 说,“在推进代谢组学领域的发展中,研究人员往往是新点子的来源。”■ (译者之一高大海系中国科学院海洋研究所助理研究员) Chris Tachibana 是美国西雅图和丹麦哥本哈根的科学作家。 鸣谢:“原文由美国科学促进会( www.aaas.org )发布在2014 年9 月19 日《科学》杂志”。官方英文版请见 www.sciencemag.org/site/products/lst_20140919 .xhtml。 《科学新闻》 (科学新闻2015年2月刊 科学·生命)
个人分类: 组学|0 个评论
近期肝癌大规模组学研究进展
jgu 2014-12-3 14:55
近期肝癌大规模组学研究进展 测序技术、芯片技术已成为癌症研究的利器,各大药厂、医学院纷纷投入大笔经费期望能从大规模组学数据中挖到金子,最“好挖”的矿无非是在多个病人中能反复观测到的基因组相关的变异(如SNV,indels、染色体拷贝数变化)、表观基因组变异(DNA甲基化、组蛋白修饰和染色体结构等)、以及基因产物的差异变化(如mRNA、lncRNA、miRNA、蛋白质、代谢物等),研究人员希望通过高通量技术系统的发现癌组织与正常组织的差异。近期围绕肝癌(主要是肝细胞癌)开展了一系列组学研究,发现了很多与肝癌相关的变异: Sawey, E.T., et al., Identification of a therapeutic strategy targeting amplified FGF19 in liver cancer by Oncogenomic screening. Cancer Cell, 2011. 19(3): p. 347-58. 早期的全基因组拷贝数研究,发现了chr11q13的一个焦点扩增区(focal amplification)CCND1、FGF19处于该区域。 Lamb, J.R., et al., Predictive genes in adjacent normal tissue are preferentially altered by sCNV during tumorigenesis in liver cancer and may rate limiting. PLoS One, 2011. 6(7): p. e20090. 这个研究很有意思,发现癌旁的基因sCNV在癌症发生发展过程中起到很关键的作用,这与2008年发表在新英格兰医学上一篇用癌旁基因表达谱预测肝癌复发的研究有类似的发现。 在2012年Nature Genetics发表了多篇基于全基因测序或外显子组测序的研究 Huang, J., et al., Exome sequencing of hepatitis B virus-associated hepatocellular carcinoma. Nat Genet, 2012. 44(10): p. 1117-21. Fujimoto, A., et al., Whole-genome sequencing of liver cancers identifies etiological influences on mutation patterns and recurrent mutations in chromatin regulators. Nat Genet, 2012. 44(7): p. 760-4. Sung, W.K., et al., Genome-wide survey of recurrent HBV integration in hepatocellular carcinoma. Nat Genet, 2012. 44(7): p. 765-9. Kan, Z., et al., Whole-genome sequencing identifies recurrent mutations in hepatocellular carcinoma. Genome Res, 2013. 23(9): p. 1422-33. (这篇用的是 的全因组测序数据) 今年在Genome Biology上新发表了一篇HBV HCC的全基因测序的研究 Jhunjhunwala, S., et al., Diverse modes of genomic alterations in hepatocellular carcinoma. Genome Biol, 2014. 15(8): p. 436. 在这些研究中大多只分析了点突变(SNV)或者小的插入缺失(indels),从测序数据估计CNV仍然存在一定的问题,值得进一步深入的研究。 用基因芯片研究CNV在数据分析上有一定的优势,质量相对稳定,费用也比较低,在Hepatology杂志上发表了两篇用芯片分析CNV的研究: Ahn, S.M., et al., Genomic portrait of resectable hepatocellular carcinomas: Implications of RB1 and FGF19 aberrations for patient stratification. Hepatology, 2014.(同时做了Exome-seq) Wang, K., et al., Genomic landscape of copy number aberrations enables the identification of oncogenic drivers in hepatocellular carcinoma. Hepatology, 2013. 58(2): p. 706-17. 两篇文章得到的大片段的CNV比较一致,比如1q、8q的扩增,4q的缺失等 Yi Zhao Haitao Zhao小组针对两个典型的肝癌病人的样本进行了多组学检测,发现有多个原发灶的肝癌相互之间有较大区别,而只有一个原发灶的转移部位与原发部位无明显区别: Miao, R., et al., Identification of prognostic biomarkers in hepatitis B virus-related hepatocellular carcinoma and stratification by integrative multi-omics analysis. J Hepatol, 2014. 61(4): p. 840-9. 综述 中对2014年以前的相关研究进展进行了系统整理和评述,但主要是从结果和生物学方面进行了总结,未从“数据”的角度来评述相关的研究进展。肝癌组学研究已经积累了一定量的数据,其中的价值还有待于进一步挖掘。 Shibata, T. and H. Aburatani, Exploration of liver cancer genomes. Nat Rev Gastroenterol Hepatol, 2014. 11(6): p. 340-9.
3714 次阅读|0 个评论
使人迷惑的“组学”(The 'Ome Puzzle)
richwindow 2013-3-27 15:16
使人迷惑的“组学”(The 'Ome Puzzle) 推荐一篇来自nature杂志的新闻The 'Ome Puzzle BY MONYA BAKER ( http://www.nature.com/news/big-biology-the-omes-puzzle-1.12484 ) “ Where once there was the genome, now there are thousands of ’omes. Nature goes in search of the ones that matter. ” 过去10年中”组omes”和“组学omics”成了科学界的流行语。 组学omics”和“组ome”的增长趋势图 涓涓细流也能演变成泛滥洪水,组学概念越来越多,有点乱花渐欲迷人眼的局面。 纽约时报和华尔街杂志开始发文 调侃日益增多的以 ome 结尾的科学词汇。 美国加州大学戴维斯分校的进化生物学家乔纳森·艾森曾称它为语言的寄生虫“language parasite”。一个科学家可以成为一个糟糕的“ omics ”制造者,通过向生物学词汇随意添加后缀来派生出貌似合理的词汇,并写入论文题目。最近被点名的题目: Sequencing the bacteriostaticome reveals insights into evolution and the environment 。 当然,反对者也制造了一个“antiome”,用以表示他们的反感。 上面这幅“连连看”包括了很多元素,佩服作者的抽象概念形象化的思路! 游戏“连连看”顾名思 义就是找出相关联的东西,这个连连看在网上基本是用在小游戏 中,就是找出相同的东西,在一 定的规则之内可以做为相关联处理 。 来看看的图中包括:染色体、核酸、蛋白质、生殖细胞、小分子等等,目的还是要建立联系。总之,在不同的生物学层面或者词汇后面,加一个后缀ome就可以衍生出一个“某某组学”。 作者还设计了一个crossdown英文纵横字谜,答案如下,看看了解哪几个: ACROSS: 2 Integrome 3 Trialome 5 Kinome 7 Connectome 9 Metabolome 13 Drugome 16 Pharmacogenome 18 Exome 19 Regulome 21 Membranome 22 Phenome 23 Metagenome 24 Histome 25 Speechome DOWN: 1 Biome 2 Interactome 3 Transcriptome 4 Incidentalome 6 Nascentome 8 Nutriome 10 Moleculome 11 Proteome 12 Toxome 14 Metallome 15 Mechanome 17 Exposome 20 Genome 本人在进行转录组研究的时候,发现phenome这个词汇,但文中不是“ 非增殖部(染色体以外的部分)”这个含义,显然是“表型组”的意思,科学家们也正在鼠类、酵母、斑马鱼、拟南芥等模式物种上通过对基因逐一敲除,认真评价基因是如何塑造生物体的外形、代谢与行为等。这种思路对于某些关键基因可能有用,但是对于某些基因可能没有显著效果,例如某些表型如代谢,是由一个基因家族协作完成,某一基因功能缺失可能由其他基因补偿。 自基因组(genome)和基因组学(genomics)两个名词诞生至今,现在已有成千上万的“组(omes)”和“组学(omics)”出现。它们中的一部分已经被牢固地确立为一个重要的知识体系和研究领域。但有些却并非如此,并且招来各种各样的谴责,被认为是多余的、琐碎的、不实的、不合语法的甚至于更糟 。 看来,科学词汇同样存在不合理、不科学的地方,一个新词从新生到经典,需要经历广大学者的推敲与认同。切忌一些形式大于内容的称谓或词汇吧,过去我们一听到组学,可能联想到人类基因组计划的提出,而现在应该是回归理性,依据科学问题来提出方法、思路、计划,合理归纳总结出新的学术名词。 Reference: 1 组学, http://baike.baidu.com/view/7587442.htm 2 组学:一个疯狂“寄生”的故事 .生物360 .2013-03-1.
8920 次阅读|0 个评论
组学的未来
热度 22 weijia2009 2012-3-25 05:35
组学的未来 贾伟 2011 年 10 月 1 日出版的 The Scientist 刊出了 Stephen Friend ( 曾经是 Merck 的 Sr. VP 现在是 Sage 总裁)的一篇短文, Opinion: Thinking Outside the Genome 。文章的第一段对组学的未来作了极具煽情的展望。 Today, we’ve gotten to the point where almost no biological phenomenon can escape omics-ization, and within the next 25 years, omics will be the biggest, if not the only, game in town. Why? Because we are about to undergo what experts call a phase shift, where a technology drives a fundamental change not just in what is known, but, more importantly, in how we think of ourselves. Put another way: omics is destined to change our patterns of living in ways that only technological revolutionscan deliver. (今天,组学在我们的生物学中已经到了无处不在的地步,而在未来的 25 年内,它们将在生物学中占据老大的地位-如果还不是垄断地位的话。为什么这么说呢?因为我们正在经历着一种专家们称之为相位移动式的技术进步,这种新的科学技术将不仅动摇我们知识大厦的根基,而且会改变我们对自身(生命)的看法。换句话说,如同一场技术革命的东风,组学注定将吹遍并改变我们生存社会的每一个角落。) 作为组学研究队伍中的一个成员,我不确定是否完全赞同 Friend 对组学技术的这种 more than friendly 、准确地说是抬到了至高无上的极至地位的评价。但这几年来我的确能感受到西方科学从点到面到系统的思维认识上的相位移动,而组学技术无疑是实现这种相位移动的最为有效的科学工具。 这里说的组学( Omics )包含了很多个具体的组学技术,英文词根 -ome 表示一类个体的系统集合。基因组学( Genomics )主要研究生物系统的基因结构组成,即 DNA 的序列和表达;转录组学( Transcriptomics )是在整体水平上研究细胞中基因转录的情况及转录调控规律的一门学科;蛋白组学 (Proteomics) 主要研究由生物系统表达的蛋白质及其由外部刺激引起的差异;代谢组学 (Metabolomics) 则研究生物体(包括细胞、组织或个体)在不同条件下所产生的代谢产物的变化。 我们实验室从事代谢组学的研究。什么是代谢组学呢?我们知道生物体由基因调控下的生化反应以及与环境相互作用所形成的所有的生命活动几乎都发生在代谢层面,都会在代谢物的范围内留下变化印迹。我们称细胞内的代谢物变化为代谢指纹 (Metabolic Fingerprints) ,细胞外的代谢物变化为代谢足迹 (Metabolic Footprints) ,生物体的代谢组实质上最接近于其生理表型,在这个角度下,也可以说我们的生物世界其实是由各种代谢组组成的,也正是这些不同的代谢组让我们生物界呈现出五彩缤纷、气象万千的表型。我们地球上的各种植物含有几十万种(大约 25 - 50 万种植物化学分子)代谢物,微生物界包含几万种代谢物,而我们哺乳动物体内拥有 5 - 7 千种小分子代谢物(分子量小于 1500 )。这三类代谢组互相渗透,循环往复,植物和微生物的代谢物通过食物、营养补充、药物等形式进入我们人体的代谢网络,也使我们每一个人的代谢表型呈现出各自的特征。 由于一次分析能够观察到成百上千的生化指标的变化,组学技术在疾病诊断和生物标志物的发现方面已经登堂入室,开始强势进入主流的研究领域。以药物基因组为例,一个病人的独特的 DNA 序列对单个药物反应的相互关系可以用来判断其治疗效果和副作用,从而找到与该病人个体基因组或单核苷酸多态性( SNP )相契合的最佳疗法。目前药物基因组学已经进入临床,开始扮演起支撑临床个体化医学发展的转化医学技术体系的核心角色,我相信药物基因组技术最终将成为医生为病人选择最佳疗法的常规手段之一。国际上正在广泛开展的肿瘤代谢研究就是一个新兴的传统分子生物学结合代谢组学的研究方向,该方向积聚了大量的来自于医药企业和高校研究机构的研究人员,他们通过代谢组学的手段探测肿瘤分子内的特征性代谢异常,然后采用其他手段如蛋白质分析或分子药理学等方法对关键代谢酶和调控基因进行表征并施加影响,以寻找新型的肿瘤治疗药物靶点。 Friend 在这篇短文中展望:在不久的将来……研究人员、患者和医生之间的关系就好比人人皆可编辑的维基百科中词条编辑者、审核者和登录维基获取知识的大众读者一样。人们会发现运用组学信息,他们也可以成为疾病模型的搭建者,像飞行中的副驾驶员一样跟医生一起决定什么情况下用什么药物,或制订和实施新的治疗方案。 组学的发展现状有君临天下的态势,其应用前景是辉煌灿烂的。但需要认识到的是,它的实质也就是一种科研工具,并不能包打天下!作为一个从事或即将从事组学研究的实验室应该头脑清醒,把握好趋势,寻找好自己的位置和发展契机。以我不成熟的观点来看,未来几年组学技术将以前所未有的速度商品化,我们日常科研工作中需要的绝大多数组学工具将成为一种服务可以按较低廉的价格从专业公司购买到,因此对于尚未搭建组学平台的许多科研实体,需要详细的调研和冷静地思考是否有必要化巨资(一哄而上)进行这样的重复性(甚至是低水平)建设。另外,组学技术将进一步自动化和规模化。从代谢组学的领域来看,我个人预计未来 3 - 5 年将有一系列简便实用的新技术问世,它们包括( 1 )高通量、全定量代谢组学技术 (highthroughput quantitative metabolomics) ,针对大批量生物样本尤其是临床样本进行全谱分析;( 2 )采用同位素标记物质的代谢通量分析技术 (FluxMetabolomics) ,针对性地研究某一关键代谢通路中的代谢物流量的动态变化和代谢节点(代谢酶)的功能;( 3 )代谢组试剂盒 (Metabolomicskits) ,市场将推出针对某一类代谢物进行定量的代谢组试剂盒,如胆碱类代谢物、脂肪酸类代谢物等。因此,从事组学技术研究的实验室需要寻找该技术领域内的不足之处,通过错位竞争建立自己的技术优势和平台特点,避免旷日持久的全面铺开建设或依样画葫芦式的跟踪性研究。 不同组学技术之间的交叉使用和数据关联、组学技术和传统的分子生物学手段有机结合都将是未来转化医学研究的重要手段。前两周我和上海交大 Bio-X 研究中心的万春玲博士对一篇最近发表的精神分裂研究论文写了一个同行(网上)评论,这类评论比较简单随意,类似于写博客,我把其中一段贴到这里,反映一下我们对组学和多指标手段进行生物标志物发现 (Biomarker Discovery) 的粗浅看法: In the old days, scientists used to measure a single molecule or a small set of targeted molecules and extrapolate from these data to predict what was changing in biology in neurological conditions. We often looked at what we knew best to find only what we expected to find; akin to looking under the streetlamp for lost keys. Modern technology makes it possible to use multiple platforms and measure a large panel of molecules in a single biological sample. An unbiased profiling strategy to measure protein or metabolite molecules involved in glucose/lipid metabolism will provide profuse information in uncovering the potential biomarkers of this disease. Recently, we conducted a global metabolite profiling study to identify metabolite markers of schizophrenia ( Yang et al, 2011 ), which revealed characteristic changes of multiple fatty acids and ketone bodies in both sera and urine of schizophrenia patients, suggesting an up-regulated fatty acid catabolism. Fatty acid-binding protein was also observed to associate with T0PANSS score in schizophrenia subjects in Schwarz's study. Therefore, a broad spectrum analysis on key metabolic pathways deserves more attention in discovering and developing clinical molecular tools for schizophrenia. With multiplat form assays employed in the future clinical studies, we will be able to reduce the fuzziness associated with human studies and identify new biomarkers and mechanistic pathways because we are looking beyond the light shed by the streetlamp we were trained under. 说到 streetlamp (街灯),不知怎么就想到了八十年代(我们学生时代)的一首流行歌,齐秦的《狂流》。 北风在吹着清冷的街道 , 街灯在拉开长长的影子 , 走过的路,想过的事 , 仿佛愈来愈远愈来愈长愈来愈多愈难以抛开…… 没有人能挽回时间的狂流 , 没有人能誓言相许永不分离 , 是我的错是你错过,喔 ...... 我喜欢这句没有人能挽回时间的狂流,时间能改变一切,时间也的确改变了一切,也包括我们的科学世界。就像每个时代都有流行曲,我们科学界昨天时兴的是基因,今天是组学,明天又会是什么呢?我想这些恐怕都不重要,都会改变的,新技术你方唱罢我登场,还会有比组学更新的技术问世的。在时间的狂流里,改变的是技术工具,不变的,是我们心里的 Science 。
25674 次阅读|39 个评论
大趋势-数据集成比数据采集需要更多的投入资源(人力、经费)
phenome 2011-1-10 22:13
最新一期Nature Chemical Biology发表了系列Commentary文章,其中The challenges of integrating multi-omic data sets 一文明确指出:多组学数据的集成、挖掘所需投入的资源可能高于数据的采集,这对从事计算生物学建模的学者无疑是极大地鼓励: The capability to generate multi-omic data sets raises the issue of resource allocation for data generation versus data curation and integration. The initial experience of researchers shows that the effort required for the latter can be much greater than that for the former. 当组学数据的类型增加,例如mRNAs数据与microRNAs的集成分析时,上述趋势更加明显。 上述资源的理解,似可包括人力、物力、经费。 作者还指出: (1) 之所以上述情况现在还没有发生,部分因为人们发现难于找到合适的人从事多种组学数据的处理和集成,因为 这项工作需要对数据产生的过程有深入的技术知识; (2) 同时,实验设计时的预谋预筹很重要,组学数据往往由于技术背景的人掌管,而试图测试一切(参数)。此时,深厚的生命科学背景显得尤为重要。总之,生物医学、信息科学的多学科背景是解决多组学数据集成的重要素质,因为任何一个数据集成方案的背后,都实际上代表了你对这个问题的理解,即modeling。 原文链接: http://www.nature.com/nchembio/journal/v6/n11/full/nchembio.462.html
个人分类: 生物信息学|4168 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-3 19:10

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部