一项变革性研究如果遭遇延迟承认,如何寻找唤醒她的王子文献? 根据我们前期的相关工作:①应用引文速率相关指标验证了 2014 年诺贝尔化学奖得主 Stefan W. Hell 的代表作( Hell, 1994 )是一篇典型的睡美人文献,初步提出结合被引速率和延迟承认指数,可较快识别出文献集合中的睡美人文献;②针对在睡美人文献的被引次数突增过程中起到关键促进作用的文献分析表明,在睡美人文献第一代施引文献的参考文献中,发表于睡美人文献引用突增年,同被引速率、共同延迟承认指数分别与睡美人文献的被引速率、延迟承认指数越接近,越有可能是王子文献 。 但上述关于王子文献的识别方法较繁琐,且透明度低,基于该科学发现是一项变革性研究(颠覆了 Ernst Abbe 的经典衍射极限理论)的特征,作者进而对识别方法进行简化,提出了一个适用于变革性研究的文献计量学框架,用于识别唤醒睡美人文献的王子文献:①发表于被引突增的附近年份;②本身被引次数较高;③与睡美人文献的同被引次数高;④在年度被引次数曲线上,王子文献对睡美人文献的“牵引或拉动”作用应非常显著,即至少在临近睡美人文献引用突增的年份,王子的年度被引次数应高于睡美人。作者也基于这四点标准尝试识别并分析了临床医学四大高声望期刊上发表的睡美人文献的王子文献 。 但,科学发现分不同类型,如托马斯•库恩根据范式不同将创新性研究分为渐进性创新和变革性创新,Science杂志前主编Koshland Jr将科学发现分为攻关型、挑战型和机遇型三类,作者通过进一步思考后认为,第四点并非普适于不同科学发现类型的睡美人文献,而仅适用于变革性创新或挑战型发现。由于变革性研究或超前于现有认知领域,或颠覆了已被公认或形成共识的理论,学术共同体或不知道其存在而忽视,或由于对此保持较大的心理距离而不相信其价值而抵制。王子文献出现后,才促使人们了解到睡美人文献的创新思想;有了王子文献率先施引或作为线索,才促使人们开始频频引用睡美人文献,或将王子文献和睡美人文献同时引用。当时,相比睡美人文献,人们对王子文献更熟悉,所以王子文献的年度被引次数应高于睡美人文献。案例研究显示,采用该框架识别出的王子文献与该领域科学史评论事实相一致。但上述框架仅从一个典型的变革性研究案例分析得出,是否广泛适用仍需进一步研究与实证检验。文章发表于 Journal of Data and Information Science。 见:Du, J., Wu, Y.S. (2016). A bibliometric framework for identifying “princes” who wake up the “sleeping beauty” in challenge-type scientific discoveries. Journal of Data and Information Science , 1(1): 50-68. http://ir.las.ac.cn/handle/12502/8478?mode=fullsubmit_simple=Show+full+item+record 前期相关工作: 杜建, 武夷山. 基于被引速率指标识别睡美人文献及其“王子”——以2014 年诺贝尔化学奖得主Stefan Hell 的睡美人文献为例. 情报学报, 2015,34(5): 508-521. 杜建, 武夷山. 睡美人与王子文献的识别方法研究. 图书情报工作, 2015, 59(19): 84-92.
文献引文轨迹:分类及测度 杜建 ,武夷山 摘要: 传统引文分析有两点不足: ① 期刊影响因子、 h 指数等指标都是以静态的被引次数为基础的,未考虑引用的时间分布。 ② 被引次数是一个从零开始、随时间逐渐累积的过程,引用符合长尾分布。当前基于引文分析的学术热点分析与学术表现评价均关注高被引文献或某引文窗内的总被引次数,忽视了有潜在价值的零被引和低被引论文以及被引次数在时间上的持续程度。 本文就文献引文轨迹的类型及识别方法进行综述,分析曲线拟合和四分位数分布统计等不同方法的优缺点,梳理睡美人文献的基本理论及其测度方法,分析将 F1000 作为挖掘低被引文献潜在价值数据源的可行性。最后总结目前存在问题,提出有效地识别不同特征的引文轨迹,定量描述睡美人文献,分析有潜在价值的零被引、低被引文献的特征以及探索睡美人文献 “ 突然高被引 ” 的诱发因素的初步思路。 关键词: 引文轨迹;睡美人文献;零被引 Citation Trajectory in Scholarly Literature: Patterns andMeasures Du Jian , Wu Yishan Abstract: Traditional citation analysis has twolimitations. Firstly, Journal Impact Factor and h-index are based on cross sectional number of citations but fail to consider the citation history. Secondly, the traditionalcitation analysis ignores the fact that citations are cumulative over time and thedistribution curve has a long tail. In current research fronts analytics and research evaluations, highly-cited articles and citations in a given time window areoften used as the primary metrics, while less cited articles and the “durability”of scientific papers’ citation tend to be neglected. This paper reviews thepatterns and classifications of citation trajectory in scholarly literature, andcompares curve fitting, curve clustering with quartiles statistics in detectionand identification of citation trajectory. The measurement of Sleeping Beauties document, an importantsubgroup of papers that follow a specific citation trajectory, is investigated,and F1000 platform is suggested as apotential new data source for assessing the hidden value of less cited papers. Severalaspects remain to be explored in the future: 1) effectively identifyingdifferent type of citation trajectory; 2) quantitatively describing SleepingBeauty literature; 3) analyzing the characteristics of non-cited or less citedarticles; and 4) exploring the factors inducive to the awakening of sleepingbeauties . Keywords : Citation trajectory; Sleeping beauties; Non-citedarticles 发表于《情报理论与实践》2015年第7期: http://www.cnki.net/KCMS/detail/detail.aspx?filename=QBLL2015071500Adbname=cjfdtotaldbcode=CJFDurlid=yx=uid=WEEvREcwSlJHSldRa1FhdTRlbWplUEk2bEJhZkhnRDZXMkFoYlBybXlDNzltcXh6WHBjSXV2WUZ0SHhGOHZEMzlnPT0=$9A4hF_YAuvQ5obgVAqNKPCYcEjKensW4IQMovwHtwkF4VYPoHbKxJw!!v=MjE1MzhmbHFXTTBDTEw3UjdxZVl1Wm9GeS9rVzd6S0pWWT1OQy9IWXJHNEg5VE1xSTVBWk90K1l3OU16bVJuNmo1N1Qz