科学网

 找回密码
  注册

tag 标签: 睡美人文献

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

一项变革性研究如果遭遇延迟承认,如何寻找唤醒她的王子文献?
adully2010 2016-5-29 14:40
一项变革性研究如果遭遇延迟承认,如何寻找唤醒她的王子文献? 根据我们前期的相关工作:①应用引文速率相关指标验证了 2014 年诺贝尔化学奖得主 Stefan W. Hell 的代表作( Hell, 1994 )是一篇典型的睡美人文献,初步提出结合被引速率和延迟承认指数,可较快识别出文献集合中的睡美人文献;②针对在睡美人文献的被引次数突增过程中起到关键促进作用的文献分析表明,在睡美人文献第一代施引文献的参考文献中,发表于睡美人文献引用突增年,同被引速率、共同延迟承认指数分别与睡美人文献的被引速率、延迟承认指数越接近,越有可能是王子文献 。 但上述关于王子文献的识别方法较繁琐,且透明度低,基于该科学发现是一项变革性研究(颠覆了 Ernst Abbe 的经典衍射极限理论)的特征,作者进而对识别方法进行简化,提出了一个适用于变革性研究的文献计量学框架,用于识别唤醒睡美人文献的王子文献:①发表于被引突增的附近年份;②本身被引次数较高;③与睡美人文献的同被引次数高;④在年度被引次数曲线上,王子文献对睡美人文献的“牵引或拉动”作用应非常显著,即至少在临近睡美人文献引用突增的年份,王子的年度被引次数应高于睡美人。作者也基于这四点标准尝试识别并分析了临床医学四大高声望期刊上发表的睡美人文献的王子文献 。 但,科学发现分不同类型,如托马斯•库恩根据范式不同将创新性研究分为渐进性创新和变革性创新,Science杂志前主编Koshland Jr将科学发现分为攻关型、挑战型和机遇型三类,作者通过进一步思考后认为,第四点并非普适于不同科学发现类型的睡美人文献,而仅适用于变革性创新或挑战型发现。由于变革性研究或超前于现有认知领域,或颠覆了已被公认或形成共识的理论,学术共同体或不知道其存在而忽视,或由于对此保持较大的心理距离而不相信其价值而抵制。王子文献出现后,才促使人们了解到睡美人文献的创新思想;有了王子文献率先施引或作为线索,才促使人们开始频频引用睡美人文献,或将王子文献和睡美人文献同时引用。当时,相比睡美人文献,人们对王子文献更熟悉,所以王子文献的年度被引次数应高于睡美人文献。案例研究显示,采用该框架识别出的王子文献与该领域科学史评论事实相一致。但上述框架仅从一个典型的变革性研究案例分析得出,是否广泛适用仍需进一步研究与实证检验。文章发表于 Journal of Data and Information Science。 见:Du, J., Wu, Y.S. (2016). A bibliometric framework for identifying “princes” who wake up the “sleeping beauty” in challenge-type scientific discoveries. Journal of Data and Information Science , 1(1): 50-68. http://ir.las.ac.cn/handle/12502/8478?mode=fullsubmit_simple=Show+full+item+record 前期相关工作: 杜建, 武夷山. 基于被引速率指标识别睡美人文献及其“王子”——以2014 年诺贝尔化学奖得主Stefan Hell 的睡美人文献为例. 情报学报, 2015,34(5): 508-521. 杜建, 武夷山. 睡美人与王子文献的识别方法研究. 图书情报工作, 2015, 59(19): 84-92.
个人分类: 科学计量学|4138 次阅读|0 个评论
医学四大名刊上的睡美人文献
热度 5 adully2010 2016-3-12 13:48
医学四大名刊上的睡美人文献 临床医学四大名刊:包括《新英格兰医学杂志》( New England Journal of Medicine )、《柳叶刀》( Lancet )、美国医学会杂志( JAMA-Journal of the American MedicalAssociation )和英国医学杂志( BMJ-BritishMedical Journal )是四种医学领域公认的高声望期刊,一般情况下认为这上面发表的论文很容易或很快会被引用,应该不会有睡美人文献。但事实上有! 1970-2014 年医学四大名刊上共发表原始论文 192,958 篇(被引次数统计截至 2015 年 5 月 7 日),我们初步进行了挖掘分析。 一、相关背景 1960-1970 年代,学者们注意到一种现象, 一些重大的科学发现和成果没有被当时科学共同体的其他成员所及时接受而受到忽视,多年后才被人们发现,这类发现被称为“抵制发现”、 “ 早熟性的科学发现” 或 “ 延迟承认” 。这些早期研究多为从科学史角度开展的案例研究,未建立系统的方法论用于识别这类现象。 2004 年,荷兰科学计量学家 Van Raan 将记载这类成果的文献称为科学中的 “ 睡美人” ( Sleeping Beauties ):一篇论文如果在发表后的相当长一段时期内处于零被引或低被引状态,仿佛睡美人在沉睡,而在之后一段时间几乎是非常突然地高被引,就像睡美人被唤醒了一样。唤醒睡美人 的文献称为“王子”文献( Princes ) 。之后,睡美人现象受到广泛关注,开启了基于科学计量学的定量研究。 目前,睡美人文献主要采用三种方法进行识别。一是曲线拟合。通过数学表达式或适当的曲线类型拟合单篇文献被引次数的年度分布 ,但对于大样本文献 ,需人工观察曲线并分类,效率较低。 二是人为参数设定。 van Raan 定义的睡美人文献标准为:①沉睡期内年均被引不超过 2 次;②沉睡期至少 5 年;③唤醒期 4 年内被引次数超过 20 。 根据 Glänzel 等人对文献首次被引时间的统计结论——“整体上超过 80% 的文献发表 3 年内首次被引,超过 90% 的文献发表后 5 年内首次被引” ,多数学者将“发表之初”界定为 3-5 年,“发表之初低被引”界定为 1-2 次,但对“突然高被引”的程度界定差别较大,如超过 50 次,超过 100 次,超过期刊累计影响因子的 10 倍等 。这类定义较为主观 ,而且很严格,也未考虑到学科领域之间的差异。识别出的睡美人文献数量多少很大程度上取决于所设定的规则,在这一严格规则下,睡美人文献的出现几率很低。三是不作人为参数设定的客观指标法。 2013 年, Wang 提出“被引速率”( CitationSpeed )指标,用来测度论文在所考察的引文窗内被引次数累积的快慢 。我们认为,被引速率越小,论文被引次数累积地越慢,说明论文在引文窗后段的年度被引次数越高于前段,因此可用来初步筛选睡美人文献 。 2015 年, Ke 等提出“睡美人指数”指标( Beauty Coefficient ,简称 B ),当一篇文献睡眠时间越长,睡眠深度越深,而后又突然获得越多的引用量时,相应的 B 值就会越高 。 目前睡美人文献的上述各种量化定义中,关于时间窗长短、发表之初低被引但后来突然高被引之现象如何量化等问题上尚无共识。本文进一步分析被引速率和睡美人指数这两种客观方法用来识别睡美人文献的优缺点,尝试从中找到一种较优方案。 二、方法 采用被引速率和睡美人指数两个指标分别筛选 Top10 文献: 1. 被引速率( CS )最低的 10 篇文献: 2. 睡美人指数( B )最高的 10 篇文献: 通过被引速率指标得到的 Top10 论文的引文曲线均为直线增长型或指数增长型,这类论文至今仍被大量引用,且引用影响力持续上升。而通过睡美人指数筛选出的 Top10 论文的引文曲线均存在“突增”( 10 号文献除外),是典型的睡美人文献。但该指标无法反映论文达到被引峰值以后的情形。用两个指标筛选的 Top10 文献中,只有 1 篇重复。可见,被引速率指标可反映全部引文窗内的引文曲线,但仅用被引速率指标无法直接筛选出睡美人文献,还需进行一些参数设定。仅用睡美人指数指标尽管能直接筛选出睡美人文献,但多为曲线中出现被引突增的情况,且仅考虑了论文达到被引峰值以前的引文曲线,而不是全部引文窗。 被引速率指标由于考虑了全部引文窗的引文曲线,能够识别出那些被引生命周期长,至今仍持续不断高频被引的论文;睡美人指数能够快速识别出睡美人文献,但却无法反映年度被引次数达到峰值之后的引文曲线。 既然被引速率和睡美人指数两个指标均有优缺点,考虑到本文的论文数据集为同一学科领域,我们再根据发表之初 5 年内年均被引次数(以下简称 C 5 )进行人为界定。 将被引速率 CS 小于 0.4 ,且 C 5 小于 5.6 次的论文视为睡美人论文,共 10 篇。这 10 篇中有一半在通过 B 识别的 Top10 论文列表中,有 2 篇在通过 CS 识别的 Top10 论文列表中。 表 10 篇睡美人文献 序号 标题 / 来源 C(C 5 ) CS B 图 中对应的引文曲线 1 NEJM. 1987, 317(17):1098-1098 916 (1.8) 0.192 95 左 (1) 、右 (10) 2 NEJM. 1971, 285(26):1441-1446 1490 (4) 0.297 30 左 (6) 3 LANCET. 1990, 335(8697):1078-1080 2029 (1.6) 0.336 66 4 JAMA. 1992, 268(17):2420-2425 1368 (2.8) 0.357 19 5 NEJM. 1991, 324(24):1685-1690 939 (3.8) 0.374 9 6 LANCET. 1991, 338(8760):131-137 1821 (3.4) 0.382 54 7 NEJM. 1989, 321(3):129-135 1138 (2.2) 0.382 117 右 (8) 8 JAMA. 1984, 251(3):351-364 980 (3.6) 0.385 169 右 (6) 9 NEJM. 1987, 316(23):1429-1435 2324 (0.4) 0.392 381 右 (1) 10 NEJM. 1991, 325(7):445-453 3731 (1) 0.399 325 右 (2) 注: C 是指被引次数,包括发表年至 2014 年的总被引次数和发表之初 5 年内的年均被引次数; CS 是指被引速率; B 是指睡美人指数。 对 1 、 2 、 7 、 8 、 9 、 10 号共 6 篇睡美人文献出现原因及其唤醒因素可能主要包括以下几种: ( 1 )研究类型的原因。提出新的计算公式,短时间内认可度低; 1987 年, Mosteller 提出了人体表面积的简化计算方法。但自发表后被引次数一直较少,直到 1999-2005 年间才出现显著增长趋势。但后来受到指南性文献的推荐,相当于“认可”,会引起后续的大量引用。 ( 2 )学科发展的原因。例如由于当时没有有效治疗手段,心衰治疗没有很大进展,研究比较少,引用也少。 ( 3 )新理念的接受需要过程。 1992 年,由加拿大 GordonGuyatt 所领导的循证医学工作组在 JAMA 发表了名为 Evidence-based medicine: A newapproach to teaching the practice of medicine 的文章,第一次提出了循证医学这一概念,并就如何将这一观念引入临床教学,如何在证据基础上实践循证医学进行了探讨。但这一新的理念并未立即受到广泛认可。随着循证医学的理念逐步受到承认,这篇文献也逐渐被承认。合作者之一对循证医学的概念和范畴进行界定,对该领域起到推动作用。领域首部经典著作也起到推动作用。 ( 4 )少数专家意见形成的诊断标准很难迅速得到广泛认可。 1990 年, International Study Group for Beh ç et's Disease 发布了白塞病的诊断标准。但在发表后的 6 年后,尚未引起关注。直到 1998-1999 年被引次数才出现突增。主要原因是该诊断标准仅汇总了 5 位专家意见。当时医师们倾向于使用各自定义的标准。但随着实践的发展,证明了该研究组提出的诊断标准是合适的。根据中华医学会风湿病学分会 2011 年《白塞病诊断和治疗指南》,本病诊断主要根据临床症状,应注意详尽的病史采集及典型的临床表现。目前较多采用国际白塞病研究组于 1989 年制定的诊断标准。 ( 5 )非阳性结果不易被引用,需要继续验证。 1991 年,美国退伍军人事务部喉癌研究组在 Lancet 上发表了“ Induction chemotherapy plusradiation compared with surgery plus radiation in patients with advancedlaryngeal cancer ”一文,病例随机分两组:一组诱导化疗加放疗,另一组喉全切除手术加术后放疗,均为 166 例。结果两组 2 年生存率均为 68% ,没有区别。实际上否定了诱导化疗。这是一项关于同步化疗治疗非常经典的研究,是美国针对晚期喉癌化疗的 2 篇最具影响力的临床研究之一 。但该研究是一个非阳性结果,不是一个好的结果。这类研究往往在初始不易受到关注。 1996 年,另一项更大规模的研究更加验证了这一点。促使原始研究的被引次数突增。 总之, 综述、临床指南、权威著作等 “共识型” 的文献对于引发那些提出了新思想但尚未被认可的睡美人文献的被引突增起到了关键作用。医学尊重权威, “权威” 的支持和提及,对做出创新性发现的原始研究快速得到认可会起到关键作用。 出处: 杜建, 武夷山. 睡美人与王子文献的识别方法研究. 图书情报工作, 2015, 59(19): 84-92.
个人分类: 科学计量学|7114 次阅读|10 个评论
2014年化学诺奖得主Stefan Hell的代表作是一篇典型的睡美人文献
热度 8 adully2010 2015-9-20 21:34
2014 年诺贝尔化学奖得主 Stefan Hell 的代表性论文是一篇睡美人文献 杜建 美国及德国三位科学家 Eric Betzig 、 Stefan W. Hell 和 William E. Moerner 因“研制出超分辨率荧光显微镜”获得 2014 年诺贝尔化学奖。科学网席鹏博主的一篇博文《有感于超分辨获得 2014 诺贝尔化学奖》提到“中国有句古话:十年磨一剑。这句话对于 Stefan Hell 来说,是两倍的考验。 1994 年,他发表了第一篇 STED 的文章。在接下来的 5 年里,由于方法太过于前卫,导致很难被主流学界认同。可以想象,是怎样的意志,让一名科学家在寒风中,百折不挠,终折桂枝。”这句话引起了我们的注意。科学史表明, 一些重大的科学发现和成果没有被当时科学共同体的其他成员所及时接受而受到忽视,多年后才被人们发现,这类发现被称为 “ 早熟性的科学发现” 或 “ 延迟承认” ,荷兰科学计量学家 Van Raan 将记载这类成果的文献称为科学中的 “ 睡美人” ( Sleeping Beauties ),即一篇论文如果在发表后的相当长一段时期内处于零被引或低被引状态,仿佛睡美人在沉睡,而在之后一段时间几乎是非常突然地高被引,就像睡美人被唤醒了一样。唤醒睡美人 的文献称为“王子”( Princes ) 。 Stefan Hell 关于 STED 的成果最终获得了诺贝尔奖,得到了科学界的尊重和认可。汤森路透( Thomson Reuters )每年根据文献被引量预测诺奖得主的实践表明,科学文献的被引用次数和受同行尊敬的程度之间存在密切关联,而诺贝尔奖等专业奖项是反映同行认可与尊敬的重要体现之一。那么, Stefan Hell 在 1994 年关于 STED 的研究是否超前?从该文被引次数特征可否判定其为睡美人文献?如果是,那么是什么因素唤醒了“她”?带着这些问题,我们开始了本研究。 目的: 引入时间因素,从文献引文轨迹特征和累积被引速率快慢的角度验证 Hell(1994) 是否为睡美人文献,并分析其唤醒机制。 方法: 提出被引速率和延迟承认指数识别睡美人文献;与睡美人文献的同被引速率、共同延迟承认指数识别王子文献,并应用 CitNetExporler 分析睡美人及其王子文献之间的有向引用网络。 结果: Hell(1994) 被引速率最慢、延迟承认指数最高,被引次数的年代分布特征同时证明其是睡美人。另外,不仅验证了 Nature Methods 科学史评论中提到的 Hell(2000) 是唤醒 Hell(1994) 的王子,还发现另一篇王子 Hell(2003) ,以及两篇 “ 王子的扈从 ”——Betzig(2006) 和 Rust Zhuang(2006) ,四者与 Hell(1994) 的同被引轨迹和睡美人本身的引文轨迹近乎一致。 结论: 结合被引速率和延迟承认指数,可较快识别出文献集合中的睡美人文献;在睡美人所有施引文献的参考文献中,发表于睡美人文献引用突增年,同被引速度、共同延迟承认指数分别与睡美人文献的被引速率、延迟承认指数越接近,越有可能是王子文献。王子文献可能不止一篇,它(们)本身是高被引文献且往往发表于更高影响力的期刊。在预测零被引或低被引论文未来高被引的潜力时,变革性研究类文献可作为重要线索。 综合科学史评论文章和本文的科学计量分析指标,对于 Hell(1994) 睡美人文献的唤醒起着显著作用的文献共 4 篇,其中 2 篇是 Hell 本人发表的,即 Hell(2000) 和 Hell(2003) ,前者是对睡美人文献中所提出的理论概念的成功实践,后者则对睡美人文献的内容做出充满信心的高度评价,这两篇文献是“王子”;而 Betzig(2006) 、 Rust Zhuang(2006) 对于 Hell(1994) 所提出的理论概念的成功应用和发展带来了高分辨率显微镜领域的“繁荣时代”,先是在 2006 年被世界著名《科学》期刊评为年度十大技术突破,接着被生物医学方法学最好的期刊《自然 - 方法》评为 2008 年度方法。在 2014 年 9 月诺奖公布之前《自然 - 方法》的十周年特刊评出的 10 年 10 大技术中,超高分辨率成像再次名列榜中,这些因素都诱发了 Hell(1994) 这一经典文献的被引突增。“扈从”一般指王公贵族的随从,由于 Hell 本人就是王子,而 Betzig 、 Zhuang 则一直追随“王子”( Hell )所创立的理论开展研究并将其不断发展,或可将其称为“王子的扈从”。 潜在应用价值讨论: 本研究所提出的引文速率相关指标适于从大量文献中识别出睡美人文献,但属于“事后追认”,尚无预测功能。要预测零被引或低被引论文在未来获得高被引的潜力是非常困难的。但本文对诺贝尔奖案例的上述分析为睡美人文献的早期预测提供了重要启示和线索。根据科学史家托马斯·库恩( Thomas Kuhn )提出的科学范式概念,可以将创新性研究分为两种类型,即常规科学中的创新性研究和导致科学革命的创新性研究。前者是在现有研究范式下对已有研究的补充和发展,推动科学的累积式渐进;后者通常是对原有研究范式的颠覆,属于具有革命性的科学突破,促成科学革命的发生 。从 Hell(1994) 案例来看,预测睡美人文献,要特别关注变革性研究( transformative research ),特别是那些提出可以打破某一领域经典范式的新方法或新观点的文献。对于这类文献的作者,我们要注意追踪检索其后续发表的文献,如果发现他 / 她仍然在坚持该领域的研究,而且一段时间之后能够有成功的表现(例如,提出的理论方法在实际应用中获得成功,且研究成果发表于高影响力期刊),我们就可以大胆预测,作者提出初始思路的那篇文章有可能就是睡美人文献。 以上结论是基于对一篇睡美人文献及其唤醒过程的详尽分析,所得结论是否能推广到其他睡美人文献?是否能推广到化学、物理学以外的学科?还有待更多的实证分析。 论文发表于《情报学报》。 杜建 , 武夷山 . 基于被引速率指标识别睡美人文献及其“王子”——以 2014 年诺贝尔化学奖得主 Stefan Hell 的睡美人文献为例 . 情报学报 , 2015,34(5): 508-521. 8 杜 建-基于被引速率指标识别睡美人文献及其“王子”——以2014年诺贝尔化学奖得主St.pdf
个人分类: 科学计量学|16934 次阅读|19 个评论
文献引文轨迹:分类及测度
热度 2 adully2010 2015-7-16 09:35
文献引文轨迹:分类及测度 杜建 ,武夷山 摘要: 传统引文分析有两点不足: ① 期刊影响因子、 h 指数等指标都是以静态的被引次数为基础的,未考虑引用的时间分布。 ② 被引次数是一个从零开始、随时间逐渐累积的过程,引用符合长尾分布。当前基于引文分析的学术热点分析与学术表现评价均关注高被引文献或某引文窗内的总被引次数,忽视了有潜在价值的零被引和低被引论文以及被引次数在时间上的持续程度。 本文就文献引文轨迹的类型及识别方法进行综述,分析曲线拟合和四分位数分布统计等不同方法的优缺点,梳理睡美人文献的基本理论及其测度方法,分析将 F1000 作为挖掘低被引文献潜在价值数据源的可行性。最后总结目前存在问题,提出有效地识别不同特征的引文轨迹,定量描述睡美人文献,分析有潜在价值的零被引、低被引文献的特征以及探索睡美人文献 “ 突然高被引 ” 的诱发因素的初步思路。 关键词: 引文轨迹;睡美人文献;零被引 Citation Trajectory in Scholarly Literature: Patterns andMeasures Du Jian , Wu Yishan Abstract: Traditional citation analysis has twolimitations. Firstly, Journal Impact Factor and h-index are based on cross sectional number of citations but fail to consider the citation history. Secondly, the traditionalcitation analysis ignores the fact that citations are cumulative over time and thedistribution curve has a long tail. In current research fronts analytics and research evaluations, highly-cited articles and citations in a given time window areoften used as the primary metrics, while less cited articles and the “durability”of scientific papers’ citation tend to be neglected. This paper reviews thepatterns and classifications of citation trajectory in scholarly literature, andcompares curve fitting, curve clustering with quartiles statistics in detectionand identification of citation trajectory. The measurement of Sleeping Beauties document, an importantsubgroup of papers that follow a specific citation trajectory, is investigated,and F1000 platform is suggested as apotential new data source for assessing the hidden value of less cited papers. Severalaspects remain to be explored in the future: 1) effectively identifyingdifferent type of citation trajectory; 2) quantitatively describing SleepingBeauty literature; 3) analyzing the characteristics of non-cited or less citedarticles; and 4) exploring the factors inducive to the awakening of sleepingbeauties . Keywords : Citation trajectory; Sleeping beauties; Non-citedarticles 发表于《情报理论与实践》2015年第7期: http://www.cnki.net/KCMS/detail/detail.aspx?filename=QBLL2015071500Adbname=cjfdtotaldbcode=CJFDurlid=yx=uid=WEEvREcwSlJHSldRa1FhdTRlbWplUEk2bEJhZkhnRDZXMkFoYlBybXlDNzltcXh6WHBjSXV2WUZ0SHhGOHZEMzlnPT0=$9A4hF_YAuvQ5obgVAqNKPCYcEjKensW4IQMovwHtwkF4VYPoHbKxJw!!v=MjE1MzhmbHFXTTBDTEw3UjdxZVl1Wm9GeS9rVzd6S0pWWT1OQy9IWXJHNEg5VE1xSTVBWk90K1l3OU16bVJuNmo1N1Qz
个人分类: 科学计量学|3475 次阅读|3 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-19 15:22

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部