ZMCheng的个人博客分享 http://blog.sciencenet.cn/u/ZMCheng

博文

文献大数据时代,你准备好了吗? 精选

已有 9532 次阅读 2016-9-22 13:08 |个人分类:科研笔记|系统分类:科研笔记|关键词:学者

随着时间的推移和现代科研工具的更新,科技数据和科技文献量近些年成爆发性增长,让无论是科研老手还是青椒都显得有些跟不上、老鼠盘西瓜-无从下手的感觉。在海量文献面前,特别是这些文献又不尽一致时,如何选一个新颖,至少不是完全跟风的研究题目,能在前人的研究基础上更深入一步地研究和探索(跟进研究),就成为一个棘手的问题。Meta分析, 这个闻起来臭”“吃起来香臭豆腐”分析工具,也许可以帮你解决这个问题。

meta分析,中文有译成“荟萃分析”的。它是对具备在特定条件的同类所有相关研究结果(文献)进行分析的一种统计学方法。通过客观分析和概括,得出量化的平均效果。归纳和总结已发表研究成果:如所有相关研究的共性结果是什么,某些处理是否有效果。分析和解释已发表研究结果之间的异质性生物学的意义。在这些研究中,有哪些问题已形成共性结论,那些问题尚未解决,这就为下一步研究提供了新的研究课题。这些新课题是基于数据事实得出的,不带主观偏见。

根据维基百科,meta分析最早源于1920年Fisher提出的合并P的概念1976年由Glass进一步发展为合并统计量,称之为Meta分析1979年英国Archie Cochrane将这种方法称为对文献的系统评价Systematic Review)。虽然meta分析从1980开始应用,到1980代中期已广泛应用于医学,后来扩展到其他领域。但我一直没有关注过它。直到约3年前,我的同事,Robert Auge 教授从我们系的系主任位置上退下来,开始做学术休假。我问他在做什么,他说,在学meta分析方法。后来还专门开了一门课。因为我们都是做植物科学的,对这个广泛应用于医学领域的分析方法,不太关注。我让他给我做了半小时的科普和他在做的题目。我就隐隐约约觉得它对我们生物技术领域很有用途。

不太了解meta分析的人会简单认为“不就是一个系统文献综述嘛”。所以通常这样的文章是以综述形式的文章发表的,不是原创性论文。最近被国外期刊撤销的国内论文中相当一部分都是和meta分析相关。因为meta分析不需要做wet lab的实验,只要分析文献,容易代写。其实,那些被撤销的meta分析论文,并不是因为用了meta分析方法,而是其他学术不断行为,但却玷污了meta的名声。所以meta给人的感觉是个“闻起来臭”的“南京臭豆腐”。就好像是在青楼喝的酒也是被“piao”过的。用好meta分析,还是可以发好的原创性文章的,最关键的是可以为下一步的研究提供非偏见的、以数据为基础的思路。最典型的一个例子就是2014年6月发在Nature上的二氧化碳的飙升威胁人类营养和2015年1月15号发表在Nature上的关于农作物免耕和非免耕的meta分析文章。关键是会不会“煎”,煎得好,这个“闻起来臭”的“臭豆腐”也是“吃起来香”的。所以我给她取个名叫“么她”(直接打字就出现的第一个选择)。最近我们第一次“么”了“她”一下,一篇论文,以原创性论文形式被PlantBiotechnology Journal(IF6.09,俗气吧?!)杂志接受。

分子生物学进展到今天,各种基因被克隆,被转化到动植物中,但具有应用价值的转基因植物还是极少数的。为什么在做功能验证时,很多都觉得很有价值的基因(功能-如抗旱-很明显),但就是形不成产品?不同的人用不同的基因来源,转到不同物种的受体,实验的处理和指标评价又有很大差别。对这么大的文献数据,多的有几百篇文献,除非用统计的方法,否则几乎不可能得出非偏见的客观结论。而没有这个结论,又怎么能设计不带偏见的,不跟风的研究题目?用meta分析,应该可以解决这个问题。从海量的文献数据中,可以找到潜藏的,有价值的信息。这也是大数据文献时代应该采用的科研方法。我觉得应该归为大数据分析的一种。

我实验室的一个研究课题就是如何培育超耐盐的园艺植物,可以在江苏省东部沿海滩涂上生长。但那儿围垦的滩涂含盐量会在0.3-2.0%,而正常的土壤的含盐量在0.1-0.25%。我们想用研究最详细的、最重要的“抗盐”基因,cation/proton antiporter 1(CAP1)基因家族,但文献很多,结果很不一致,所以到底有没有抗盐功能不好定论。所以我们以CPA1基因的过量表达效果为题,系统分析了已发表的文献,试图弄清为什么这么多年来,有那么多过量表达的转基因文章,但至今没有成功的抗盐植物的产品。那么到底转这些基因有没有效果?“大效果”没有,“小效果”有没有?效果在哪儿?造成这些结果的系统原因是什么?下一步应该怎样设计实验?我们得出一些有意思的发现,为我们设计下一步研究提供了很好的思路。

做好一篇好的meta分析文章,其实也是不容易的。也是要从头学起的。我2014年秋天派了我的博士生马媛春去田纳西大学跟着Robert Auge教授上课并学习meta分析,同时在她的研究方向内做一个实例分析。也是要经过选题、提出假设,做实验、分析数据、写文章、投稿、修改,到最终发表的艰苦过程。做“实验”,花了三个多月时间。但写这种文章其实也很不好写,特别是要发一篇有一定影响的好文章,而写手又是新手时。其后我们折腾了一年半(中间有半年没管它),十易其稿,投稿两次,第一次被拒稿。重投后大修一次,小修两次。最近才最终被接受,在线发表。

做完这篇文章后,我们对meta类文章进行了历史统计分析,见下图。绝大多数文章是在医学领域,而且还在迅猛扩大。国内是这5、6年才开始的,但势头如山洪暴发。在医学界恐怕有些“泛滥成灾”了,成了“过街老鼠”了—是说文章数已经很多了。但从全世界的角度看,meta分析在农业领域还是刚刚开始,国内四所主要农业大学(中国农大、南京农大、华中农大和西北农林大)至2016年6月底总共才发了26篇使用meta分析的文章。在生物技术领域此类文章也极少。我们细查了一下,我们的这篇文章似乎还是植物生物技术方面的第一篇meta分析文章。虽然不是撼动地球(earth-shaking)的文章,我们还是很开心的。最主要的是通过非主观分析,以数据为依据,为我们下一步的研究提供了新的思路。

相信“么她”分析会在未来文献大数据时代有更多的应用。特别是研究生开题前都应该用这个方法做文献系统分析,然后再做开题报告和实验设计。这样的研究和文章都会在“巨人”的肩膀上攀上一步。属于“跟进”,而不是“跟风”(金拓语)。

这篇博文早就写得差不多了,一直没有时间做最后修改。看到孙学军老师的博文 《自然》:中国的荟萃分析文章太多了!)(http://blog.sciencenet.cn/blog-41174-1004329.html),“趁势”  发了吧。 总之一个好的研究方法,应该用对,用得得当。不能滥用。Nature这么一发,meta这个臭豆腐就变得更臭了。


程宗明 2016年7月8日星期日 初稿于南京,9月22修改于Knoxville,TN




https://m.sciencenet.cn/blog-1140979-1004383.html

上一篇:用引用次数衡量,Nature也有“看走眼”的时候!
下一篇:为什么中国作者的摘要和发表的文章常常用私人邮箱做通讯邮箱?

14 孙学军 靳少非 蔡小宁 武夷山 黄永义 孙颉 徐绍辉 张光明 梅志平 李卓亭 王启云 guhanxian xlianggg yunmu

该博文允许注册用户评论 请点击登录 评论 (11 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-29 14:08

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部