科学网

 找回密码
  注册
科学网 标签 引文 相关日志

tag 标签: 引文

相关日志

关于个人科研成果被引情况的观察与思考
libseeker 2020-2-27 18:42
考察科研成果被引情况,是较为复杂的系统工程。科研成果被引情况在多种场合需要关注,比如申报科研项目、申报科研成果奖等等。近期稍微花点时间,以自身为例,就个人科研成果被引情况进行了观察与思考。 《中国引文数据库》(简称《引文库》, http://ref.cnki.net/ ),官方宣称为“这是目前中国最大最全的引文数据库”,是依据CNKI收录数据库及增补部分重要期刊文献的文后参考文献和文献注释为信息对象建立的、具有特殊检索功能的文献数据库。《引文库》通过揭示各种类型文献之间的相互引证关系,不仅可以为科学研究提供新的交流模式,而且也可以作为一种有效的科研管理及统计分析工具。其作用为:(1)提供客观、准确、完整的引文索引数据。(2)针对某一对象或主题提供相关统计分析数据,通过数据分析器得到的相关比较分析数据,可以供相关研究人员和科研管理部门使用。(3)为相关评价工作提供基础数据。 种种原因,中文成果不那么受重视。主要原因有两条:其一是大环境是“唯SCI”,Web of science系列数据库有着“话语霸权”;其二是中文引文数据库起步较晚,尚未形成较有份量的话语权。尤金·加菲尔德为了使引文检索法变成现实,在实践中赢得图书馆、情报界和科学界的承认,1960年创办了科技情报企业——科技信息研究所。1963年编制、出版了《科学引文索引》单卷本。1973年科技信息研究所开始正式出版发行《科学引文索引》(季刊)。1973年又继而出版了《社会科学引文索引》(SSCI),1978年又出版了《艺术和人文科学引文索引》(AHCI)。这样,引文索引这项富有创意的发明在图书馆及情报界牢固地确立了自己的地位。中国科学引文数据库(Chinese Science Citation Database,简称CSCD)创建于1989年中文引文数据库。中文社会科学引文索引(CSSCI),1998年立项开发电子版。笔者印象中,超星公司大约2010年开始做图书引用研发,曾宣传推广图书引证报告。《中国引文库》2015年3月正式对外发布,近年发展较快。 《中国引文数据库》来源文献范围分为3类:期刊库、学位论文库、会议论文库。被引文献类型划分为10大类:期刊类型、学位论文类型、会议论文类型、报纸类型、图书类型、专利类型、标准类型、年鉴类型、外文文献、其他类型。前3类做得比较成熟,其余类型有所涉及,但个人认为尚处于探索中。“其他类型”情况较为复杂,包括报纸、网络文献(博文及其他)等等。以被引作者“王启云”检索自己,“文献总数45 总被引496 总他引450 篇均被引11.02 篇均他引10.00”。以被引作者“王启云”(第一作者)则为“文献总数38 总被引385 总他引345 篇均被引10.13 篇均他引9.08”。这个结果实际被引文献类型均为“期刊类型”。学位论文类型被引10次;会议论文类型没有检索到数据;报纸类型没有检索到数据;其他类型(包括报纸、博文等):“王启云”文献总数31,总被引大约50次;“图谋”文献总数28,总被引38。图书类型:高校数字图书馆建设评估研究(中国书籍出版社,2012)总被引5次(读秀学术搜索中总被引为5次,其中被图书引1次);高校数字图书馆建设评估研究(现代教育出版社,2009)总被引7次(读秀学术搜索中总被引为11次,其中被图书引4次);图书馆学笔记——科学网图谋博客精粹(知识产权出版社,2013)总被引4次(读秀学术搜索中总被引为3次);图书馆学散论——科学网图谋博客精粹(知识产权出版社,2015)总被引1次(读秀学术搜索中总被引为1次)。《图书馆学随笔——图谋博客精粹》(国家图书馆出版社)读秀学术搜索中总被引为5次(被图书引2次),中国引文数据库中无被引数据。 我在图书、报纸、博客这三方面投入了较多时间和精力,被引情况较差,但均存在被引,而且我自身曾留意过存在重要刊物知名学者引用过。图书类型的引用情况,《中国引文数据库》及读秀学术搜索中的表现相近,由此可见,图书被引的情况不甚理想。估计还不仅仅是个人的水平问题,还有更深层的原因。笔者与学术图书出版打交道11年,颇有感触。学术图书的地位受诸多因素影响,比如出版发行与传播方面,变化很大。时下,学术图书的发行量较少,读者群也较小。我留意了吴建中先生代表作《21世纪图书馆新论》的被引情况,1998年版723次被引,2003年版438次被引,2016年版12次被引。总体来说随着网络的普及,图书的被引情况似乎一年不如一年,近几年大多数图书的被引情况不甚理想。 近年,“大数据”确实有着大发展,但仍然存在着许多细节问题(比如元数据质量、标引质量等)需要进一步精益求精。引文机理、引文作用、引文评价相关理论与实践,尚有待进一步探索与发现。 延伸阅读: 王启云.《中国引文数据库》体验有感 . http://blog.sciencenet.cn/blog-213646-1218559.html
个人分类: 圕人堂|1984 次阅读|0 个评论
不学翟天临 正确引文献
热度 5 RollerMaMing 2019-6-4 08:42
发表论文注意事项之一:引文与参考文献 (极端愚蠢案例) 拿翟天临说事,小题大做,也是为了吸引眼球。 通常,在审学生的文章时,发现一些低级错误。让他认真修改,逐字逐句。最好朗读一遍,感受一下语感——是否顺畅。论文这东西,一旦发表将无法挽回。 说到“参考文献”,也就是题目中的“引文”,翟天临犯的错误可算是大了。 有的时候,我们教学生如何“抄”文章,也就是如何“引文”。像翟天临这种“笨徒儿”,说白了就是“抄都不会抄”的这一类。 又到了毕业季,少不了熬夜看文章。 昨天夜里给学生看文章,气就不打一处来(见下面的截图,是一个极端案例)。睡不着,写下此文。 可能有很多错误我们可以追溯或“怪罪”到初中的外语学习,基础没有打好。 理由还有很多,歪果仁也经常把我的文章引成了“Ming, M. A. et al. 2019”。信件交流也是,好端端的一个“马鸣”先生,也变成了“鸣先生”或“明码先生”,干脆叫“鸟先生”算了! 所以,最近几年我的文章署名变成了 MaMing, R. et al. 2019,不伦不类。中国人是不希望将名字分开的,更不会颠倒。不然,就会变成了“明码电报”(Ming Ma),明码标价,明码科技,......, 泄露天机,自毁前程 。 实际上,这种引文上的小错误,之前在审北大清华博士之类的文章也遇见到。当时,我就“喷”起了那位熟悉的博导,什么玩意儿,这么当导师,也不怕误人子弟。 类似的情况,越来越多了。看出了学术界的浮躁,有的时候我连主编一起骂了。 现在想起来,这种错误可能与博导、研究员、教授、所谓大主编和审稿人什么的还真没有太多关系,也不是崇洋媚外。应该是一种文化差异,就像歪果仁叫我“明码”一样,应该笑对,不是什么大事。只是有的时候,引一些熟悉的同行作品,将其名字引错,像我的学生这样无知(下图),也是比较尴尬的,多少有一点不尊重人。 好在我是一个认真的人,豆腐块中挑刺没毛病大家可以帮助再把把关。 露出了马脚:问题出在第一篇外文文献,同一篇文章重复在最下面出现了。第一作者 Andrew Lowe,名与姓氏颠倒,变成了两个人。正文中也同时出现了这种错误,应该不难发现吧?作者没有意识到,审稿人也没有发现,责任编辑包括外文编审都没有发现。这是我遇见的最极端的也是最愚蠢的引文例子,竟然发生在我的学生论文里! 即将付梓,一身冷汗 。
个人分类: 引文错误|5287 次阅读|14 个评论
ReadCube文献管理器简要介绍
Enago 2017-3-1 11:13
在这个科研 信息 成 爆炸 式增长 的时代, 科学文献 每天都在剧增 。研究人员面临的问题再不是科研信息的缺乏,而是 文献存储不科学、杂乱无章 以及 利用率 低等问题。 面 对海量 的文献, 如果还是只 靠传统的手工 文献 管理 ,那必然出现管理效率低下,再次利用困难等问题。 于是各种文献管理软件 应运而生,虽然在使用界面或方便程度上各有不同,但总体来说,都能在一定程度上帮助科研人员更好地进行 文献管理 ,提高文献 利用 率。作为一名科研人员,如果注定今生都要和文献打交道,那么不如一开始就对自己需要的文献进行顶层设计,好好进行管理。总比电脑里的文献变成一团乱麻的时候,再开始整理得好。 --- 更多精彩文章 请造访 【英论阁学术院】 --- 这篇文章主要对 ReadCube 文献管理器 进行简要的介绍。 Readcube 创建于 2011 年底,是 Labtiva 公司研发的第一款软件, 现在 已经 获得 Macmillan 出版公司旗下 Digital Science 的投资。作为一个文献管理整合平台, Readcube 力求改变人们脑中固有的、传统的文献检索方式,为全球科研工作者提供更加完整统一、简洁优化的用户体验,让他们通过 Readcube 可以便利地查找、阅读和引用文献。 虽然 诞生 时间还不长 ,但 Readcube 的 全球用户 已 在不断 增长 。 Readcube 界面优美、功能较全,最重要的是,基础版本是免费的。 另外, 现有许多文献管理工具(软件)只能做到导入和分类存储,不能很好 地 提取文献(特别是 PDF 文献)元数据 。 ReadCube 找到了与众不同的切入点,开发团队 在 改善用户阅读 PDF 文件的体验 时应该是 花了大量 的 时间 和精力 。当向库中添加一篇 PDF 格式的文献时, 程序 会 自动 连接 到 网络 进行 分析,获取本篇文献的标题、作者、摘要、期刊、参考文献等相关信息, 这样就 免去了手工输入的繁琐。 除了在 nature.com 网站阅读 HTML 格式或 PDF 格式的文档之外, ReadCube 页面阅读工具还能为读者提供 PDF 文档的互动特性。 比如 允许读者标记和注释文章内容,并且将标记和注释同步到 ReadCube 的桌面客户端。 此外, ReadCube 会根据本地文献库的文献,分析用户感兴趣的科研方向,推荐最新的研究进展文章(此功能免费)。对科研人员来说这样可以省去不少查新的时间,有空的时候,点开就可以看到最近的文献更新情况。值得一提的是, Springer Nature 在 2016 年推出了与 ReadCube 的 SharedIt 协作计划 。 HighWire 出版商 以及 Taylor 和 Francis 出版社 也 允许 他们的所有 期刊 内容可以通过 ReadCube 进行 搜索 。 当然 ReadCube 也有它的缺点,有用户反映它的界面虽然看起来很漂亮,但其实略有卡顿,操作感觉不太好。另外在其网站上,哪些功能包括在免费版本里也说得不是很清楚。例如如果想要在各种客户端之间进行同步数据的话就得额外花钱,这也使得不少科研人员更加偏向于免费的文献管理软件 Mendeley 。还有客户认为该软件过于依赖网络,因为启动该软件是需要联网的,连不上网就连软件都打不开。这一点也是很多用户所不能接受的。 但是总的来说, ReadCube 还是一款挺有特色的软件,尤其是得到新投资之后,软件的开发更新很快, 基本每隔几个月看一下最新版本都会有惊喜。 另外,如果将 ReadCube 与其他老牌文献管理软件,比如 EndNote ,结合使用,也是个不错的帮手。 §博客内容皆由 英论阁 资深学术专家团队撰写提供§ --- 英论阁SCI论文润色服务及多项免费附加项目, 点击了解 --- ---------------------------------------------------------------------------------------------------------------------- 您可能感兴趣的博文: 1. 浅谈科研数据共享 2. 获取学术论文的方式 3. 获取学术论文的方式(续)
个人分类: 作者讨论|21893 次阅读|0 个评论
ReadCube文献管理器简要介绍
Enago 2017-2-28 19:23
在这个科研 信息 成 爆炸 式增长 的时代, 科学文献 每天都在剧增 。研究人员面临的问题再不是科研信息的缺乏,而是 文献存储不科学、杂乱无章 以及 利用率 低等问题。 面 对海量 的文献, 如果还是只 靠传统的手工 文献 管理 ,那必然出现管理效率低下,再次利用困难等问题。 于是各种文献管理软件 应运而生,虽然在使用界面或方便程度上各有不同,但总体来说,都能在一定程度上帮助科研人员更好地进行 文献管理 ,提高文献 利用 率。作为一名科研人员,如果注定今生都要和文献打交道,那么不如一开始就对自己需要的文献进行顶层设计,好好进行管理。总比电脑里的文献变成一团乱麻的时候,再开始整理得好。 --- 更多精彩文章 请造访 【英论阁学术院】 --- 这篇文章主要对 ReadCube 文献管理器 进行简要的介绍。 Readcube 创建于 2011 年底,是 Labtiva 公司研发的第一款软件, 现在 已经 获得 Macmillan 出版公司旗下 Digital Science 的投资。作为一个文献管理整合平台, Readcube 力求改变人们脑中固有的、传统的文献检索方式,为全球科研工作者提供更加完整统一、简洁优化的用户体验,让他们通过 Readcube 可以便利地查找、阅读和引用文献。 虽然 诞生 时间还不长 ,但 Readcube 的 全球用户 已 在不断 增长 。 Readcube 界面优美、功能较全,最重要的是,基础版本是免费的。 另外, 现有许多文献管理工具(软件)只能做到导入和分类存储,不能很好 地 提取文献(特别是 PDF 文献)元数据 。 ReadCube 找到了与众不同的切入点,开发团队 在 改善用户阅读 PDF 文件的体验 时应该是 花了大量 的 时间 和精力 。当向库中添加一篇 PDF 格式的文献时, 程序 会 自动 连接 到 网络 进行 分析,获取本篇文献的标题、作者、摘要、期刊、参考文献等相关信息, 这样就 免去了手工输入的繁琐。 除了在 nature.com 网站阅读 HTML 格式或 PDF 格式的文档之外, ReadCube 页面阅读工具还能为读者提供 PDF 文档的互动特性。 比如 允许读者标记和注释文章内容,并且将标记和注释同步到 ReadCube 的桌面客户端。 此外, ReadCube 会根据本地文献库的文献,分析用户感兴趣的科研方向,推荐最新的研究进展文章(此功能免费)。对科研人员来说这样可以省去不少查新的时间,有空的时候,点开就可以看到最近的文献更新情况。值得一提的是, Springer Nature 在 2016 年推出了与 ReadCube 的 SharedIt 协作计划 。 HighWire 出版商 以及 Taylor 和 Francis 出版社 也 允许 他们的所有 期刊 内容可以通过 ReadCube 进行 搜索 。 当然 ReadCube 也有它的缺点,有用户反映它的界面虽然看起来很漂亮,但其实略有卡顿,操作感觉不太好。另外在其网站上,哪些功能包括在免费版本里也说得不是很清楚。例如如果想要在各种客户端之间进行同步数据的话就得额外花钱,这也使得不少科研人员更加偏向于免费的文献管理软件 Mendeley 。还有客户认为该软件过于依赖网络,因为启动该软件是需要联网的,连不上网就连软件都打不开。这一点也是很多用户所不能接受的。 但是总的来说, ReadCube 还是一款挺有特色的软件,尤其是得到新投资之后,软件的开发更新很快, 基本每隔几个月看一下最新版本都会有惊喜。 另外,如果将 ReadCube 与其他老牌文献管理软件,比如 EndNote ,结合使用,也是个不错的帮手。 §博客内容皆由 英论阁 资深学术专家团队撰写提供§ --- 英论阁SCI论文润色服务及多项免费附加项目, 点击了解 --- ---------------------------------------------------------------------------------------------------------------------- 您可能感兴趣的博文: 1. 浅谈科研数据共享 2. 获取学术论文的方式 3. 获取学术论文的方式(续)
个人分类: 作者讨论|2 次阅读|0 个评论
被引文献的内在关系之美!
热度 1 xiaoyanghu 2015-12-5 21:09
得到此图,立马想到了《驯龙高手2》中的群龙飞往龙王巢穴的场景,感叹被引文献之间的内在关系真的非常神奇!
个人分类: citespace|5343 次阅读|2 个评论
CNKI、中国引文数据库:H指数=12
热度 3 zlyang 2015-10-9 22:48
CNKI、中国引文数据库: H指数=12 今天查询的结果: CNKI、中国引文数据库:H指数=12 总被引次数:447 总他引次数:394 相关链接: 2014-07-12,俺的国内论文H指数 http://blog.tech110.net/index.php?uid-11851-action-viewspace-itemid-73160
3628 次阅读|6 个评论
读《惠风词话》前两卷
Mech 2015-9-24 14:49
我手头的《惠风词话》是与《人间词话》的合订本,人民文学出版社出版。《人间词话》已经读过许多遍,但《惠风词话》还没有通读过。 这次本来准备通读,后来发现时间不够。读《词话》本身没有问题,但其中大量引文要查了全文读,就只能在假期里了。《人间词话》有注释,所引词句都给出了全文,非常方便。读过《惠风词话》第二卷,决定还是暂时放下。等以后时间充裕了再仔细读。 该书从第二卷起,主要是具体作品的品评。多数只是拈出几个词句。多数词句不熟悉,因此有些“隔”。能把提到句子的全词找来读读,更好些。 该书有些评论很精到。只举一个例子。第九十则: 词笔“丽”与“艳”不同。“艳”如芍药、牡丹,慵春媚景;丽若海棠、文杏,映烛窥帘。薛梯飙词工于刷色。当得一“丽”字。《醉落魄》云:“单衣乍着。滞寒更傍东风作。珠帘压定银钩索。雨弄初晴,轻旋玉尘落。花髻巧借妆梅约。娇羞才放三分萼。尊前不用多评泊。春浅春深,都向杏梢觉。” 写得很好。要是再给出个例子,说明“艳”的词笔就更好了。
个人分类: 休闲阅读|3556 次阅读|0 个评论
且读且议论(2):Price初识引文
zilu85 2014-5-9 15:01
De Solla Price, D. J. (1965). Networks of Scientific Papers. Science 149 (3683): 510–515 这是一篇频繁被引用的经典文献。 我们首先要注意到的是它发表的年代:1965年。也就是说,是在刚刚有了引文索引之后,借助这一工具,开始探索引用,引文等等行为的规律。 其次,不要被论文的标题所迷惑,科学论文的网络,尤其是Price自己还在论文下方写了一个题记:书目引文的模式可以表明科学研究的前沿。望文生义地以为这是一篇关于引文网络的论文。细读之下,个人感觉这里所说的“论文网络”只是个概念上的相互联系的论文群体,因为有了引文这种联系,网络才有可能得以显现;而真正意义上的论文网络在当时还是一个梦想中的乌托邦,是大师们一个美好的向往。 Price在这篇文章里都讲了些什么呢? 1.引文率。 对!就是每篇论文拥有参考文献数目的问题。 利用1961年SCI的数据,Price发现: 篇均引文 15 条 ,其中 12 条为期刊文献。 10% 的论文没有引文。 50% 的引文来自于 85% 的普通研究论文,每篇论文拥有参考文献数不超过 25 条。 引文的分布(图形)比较平坦,有 3,4,5,6,7,8,9 和 10 条引文的论文占 5% ,但是综述论文却拥有大量的引文。 全部引文的 25% 来自全部论文的 5% ,每篇论文含有 45 条以上的引文,平均每篇 75 条引文。 12% 的引文来自全部论文 1% ,最为肥胖的部分,每篇论文有 84 条以上参考文献,平均达到 179 条参考文献。有趣的是在这个最胖的 1% 类里,有 n 条引文的论文数呈现 1/n 2 的关系,每篇论文的参考文献数达到几百条。 当然这些引文覆盖了以往的全部文献。我们可以粗略的计算,既然几个世纪以来全球文献数量以指数增长,并且可能会持续每年 7% 的增长 速度,就是说在某一特定领域,过去每发表 100 篇论文就会有 7 篇新论文,而这 7 篇新论文平均 15 篇参考文献就会带来对以往发表的 100 篇论文的 105 次引用,因此被引用次数平均会略高一些。如果从长时间大范围来看,我们发现平均起来每一篇科学论文发表后每年被引用一次。 2. 被引率 在任何一年里,有约 35% 的论文一次也没被引用, 49% 的论文只被引了 1 次,剩下的 16% 里,平均每篇被引用 3.2 次,约 9% 被引用 2 次, 3% 被引用 3 次, 2% 被引 4 次, 1% 被引 5 次,剩下 1% 被引 6 次及以上。对于高被引次数(大的 n ),被引论文的数量似乎以 n 2.5 或者 n 3.0 的速度下降,这个速度要比论文拥有参考文献的数目增长的快多了,高被引论文的数量也确实比拥有大规模参考文献的论文数量少多了。这样一来,只有 1% 的论文被引 6 次及以上,平均被引次数为 12 次,一篇论文最大被引用次数要比同级别论文含有最大参考文献数要小很多。但是也有类似的发现,比如全部论文中 5% 是综述文献,有 25 篇以上的参考文献,全部论文中 4% 看着像经典文献,每年被引 4 次以上。 参考文献数量各年之间变化不大,但是单篇论文被引的次数则各年变化。一篇论文在某一年没被引用但是下一年有可能被引用很多,某一年被引较多的论文不一定后来也被引较多。高被引论文似乎反复无常,但是尽管如此我还是怀疑有统计规律在其中。我猜测目前的结果可以用每年有 10% 以上的论文死去的假说来解释,不再被引用。活下来的论文每年被引用一次的机会是 60% ,这意味着一篇论文 10 年后就完成了自己的主要使命。此类过程达到一个稳定状态,所有发表论文中有 10% 从未被引用, 10% 被引用 1 次, 9% 被引用 2 次,以此类推,百分比缓慢下降,所有论文中将要一半的论文被引用 5 次以上,四分之一被引用 10 次及以上。当前急需研究是否有概率表明一篇论文被引次数越多,以后被引的机会越大。对我来说,以后的工作就是探索快速确认经典论文,可能利用引文索引产品程序把“超经典论文”自动挑选出来并发表在《美国(或者世界)真正重要论文杂志》上。 不幸的是,我们对文章被引用次数及其参考文献数目之间的关系知道的太少了。因为初步简单的判断表明对于高被引论文来说,其参考文献的数量的分布有着相当标准的模式,我推测如果存在着相关关系的话,会是很小的。当然,对于综述文章没有强烈的趋势被引次数超出正常地高。如果我的推测有效,需要注意到:因为 10% 的论文没有参考文献,另外,假设几乎是独立的,有 10% 的论文从未被引用,遵循着:全部论文中有低到 1% 的论文在引文网 络中完全孤立,只能通过主题索引或者相似性检索的办法找到。这些是很小的类,而且也是最不重要的一类。 一年之内参考文献和引用文献之间的平衡可以说吗网络的最重要属性。尽管每年产生的大多数论文含有接近平均数的参考文献,其中的半数参考文献是指向过去年代发表的论文的一半。另一半的参考文献把这些新论文与相当少量的更早的论文联系起来,产生了多种关系的密集模式。如此一来,每一组新论文都与一小撮现有科学文献中选择出来的部分密切交织在一起,同时又与一大批文献松弛和随机地联系起来。由于只有一小部分较早的文献通过新的文献密切联系起来,我们可以将这一部分当做一类生长锥或者表皮,或曰活跃的研究前沿。我相信,正是由于科学前沿的存在,从这个意义上讲,将科学从学术的其他部分区别开来;也正是因为科学前沿,我提出统计分析的主要任务之一就是确定能让科学交流要比非科学交流要快很多的机制。 对某一年内所有被引文献的出版日期分布的分析也让我们进一步了解研究前沿的存在。利用 1961 年的数据大多数数据都在,我发现 1961 年发表的论文引用从 1961 年以往的 13.5 年区间的文献按照 2 的速度下降,这种下降速度接近于文献发表速度的指数增长。这样一来,被一篇 1961 年发表论文引用的机会几乎等同于被 1961 年以前 15 年间发表的所有论文引用的机会,被引率假设按照前面计算的每篇论文每年被引的平均值。需要注意到,随着时间的流逝,引用以往发表论文的新论文越来越多,因此,任何论文被其他后来论文引用的几率也成 -2 的指数下降,每 13.5 年。 15 岁以下的论文的被引率要比每论文每年被引一次的标准值大很多,被引率稳定增长,从 15 岁的论文被引 2 次以下到 5 岁论文被引 4 次, 2 岁半论文被引率达到最高值标准值的 6 倍。当然,对于太年轻的论文被引率又下降,因为没有时间被注意到。 顺便说一下,这个曲线让我们看到并剖析战争期间论文生产的下降。和那些人力指标以及其他文献指标一样,该曲线提供了一个绝佳的证据,表明论文的生产在第一次和第二次世界大战开始时从预期的水平上下滑,然后分别在 1918 年和 1944 年下降到正常论文水平的一半,再从 1926 和 1950 突然上升到正常水平。由于这种下降,在确定文献增长指标时应当去掉 1914-25 以及 1939-50 期间的数据。 【未完待续】
个人分类: 科研体会|3622 次阅读|0 个评论
SciELO图书引文索引(SciELO Citation Index)
wanyuehua 2014-2-13 06:37
科技电子在线图书馆( Scientific ElectronicLibrary Online ,简称 SciELO )在圣保罗研究基金会( FAPESP )的支持下, 1998 年成立, SciELO 是最早为科学文献提供开放访问的机构之一。目前 SciELO Citation Index ( 2002- 至今)可以访问 拉丁美洲、葡萄牙、西班牙及南非等国在自然科学、社会科学、艺术和人文领域的前沿公开访问期刊中发表的权威学术文献。 2013 年 10 月 汤森路透与 SciELO 合作将 SciELOCitation Index 集成到 Webof Knowledge 平台, 2014 年 1 月 13 日 Web of Knowledge 更名为 Web of Science ,目前的 Web of Science 为用户提供了更多地区的文献内容,使全文与开放获取期刊之间实现无缝链接。 自 2008 年起中国科学引文数据库( ChineseScience Citation Database )集成到 Web of Knowledge 平台,预计在 2014 年,一个韩国学术文献期刊数据库( Korean Journal Database )也会加入其中,所有这些数据库都是汤森路透不懈努力的一部分,为的是进一步整合高质量的开放访问内容到 Web of Scien ce 中,着重强调区域相关的学术文献并在快速发展的研究中心里确定有响力的作者和研究,使 Web of Scien ce 这一全球最大和最权威的引文资源能更全面地反映文献在各个地区的总体学术影响力。 SciELO 图书引文索引收录大约 650 本书以及 超过 4 百万的参考文献,这些参考文献来自阿根廷、巴西、智利、哥伦比亚、哥斯达尼加、古巴、墨西哥、葡萄牙、南非、西班牙和委内瑞拉。 目前中国学者(不包括台湾地区)有 1367 篇文献被 SciELO 收录,主要刊登在 129 种 SciELO 收录期刊上,如 《巴西医学与生物研究杂志》( BRAZILIANJOURNAL OF MEDICAL AND BIOLOGICAL RESEARCH ) 185 篇、《巴西化学会志》 ( JOURNALOF THE BRAZILIAN CHEMICAL SOCIETY ) 122 篇、《遗传学与分子生物学杂志》( GENETICS AND MOLECULARBIOLOGY ) 90 篇等期刊。
个人分类: SCI知识|20125 次阅读|0 个评论
Excel中的参考文献如何生成引文格式或如何导入endnote?
热度 1 PSLibrarian 2013-9-29 11:09
Excel中的参考文献如何导入Endnote? 最近有用户973项目结题时遇到论文成果需要提交引文格式(诸如1. Bouzas A,Aguado D,Marti N,Pastor JM,Herraez R,Campins P; Seco A, Alkylphenols and polycyclic aromatic hydrocarbons in eastern Mediterranean Spanish coastal marine bivalves. Environ Monit Assess 2011, 176 (1-4), 169-181.)的成果列表,而项目组提交的成果都放在了Excel中,那么我们如何将手中的Excel转换为引文格式呢? 第一种方法,如果不要求斜体啥的,excel连接公式可以很快搞定,如果有字体格式要求,会用vba的自然首先推荐vba啦。 第二种方法,不会用vba的,或者习惯endnote的用户,则可以用下述方法,将成果导入endnote中,然后通过修改output style,那随便想要什么样的引文格式都可以实现啦。步骤如下: 1.将自己的Excel文件转换为附件Excel中的格式,使用前请先查看附件文件中的第二个”说明”表; 示例Excel.xlsx 2.下载SCI转换工具, http://bbs.sciencenet.cn/home.php?mod=spaceuid=260374do=blogquickforward=1id=667402 ; 3.将转换后的Excel文件和SCI转换工具置于同一文件夹下面,点击第二个按钮,会生成一个txt文件; 4.将该txt文件导入endnote即可,导入设置如下图所示。 请注意,中文文献需要选择中文编码,否则会导入乱码。
个人分类: 文献管理|27725 次阅读|1 个评论
专利引文数量到底有多少?
热度 1 yngcan 2013-8-8 10:41
最近,大数据一词炒的很热,我不知道专利数据是否能算做大数据,但我认为是很接近的。 原因有几条: 1. 专利数据很复杂,远超过论文数据库的信息复杂度。 2. 上百年来积累的数据量也不小。根据PATSTAT的统计(不含全文),题录数据约包含170G(截止2013年6月)。 3. 其中,包括技术分类、法律状态、引文数据、专利权人、发明人等好多数据。 4. 就引文数据而言: USPTO 自1947年,共有665万专利具有参考引文,引用了7898万专利和1521万非专利引文; EPO 自1978年,共有178万专利具有参考引文,引用了776万专利和229万非专利引文; JPO 自1965年,共有370万专利具有参考引文,引用了1047万专利和2万非专利引文; 这个数据很有趣,值得仔细分析,近年来,相关文章也不少。推荐一篇OECD的工作报告: http://www.oecd-ilibrary.org/science-and-technology/analysing-european-and-international-patent-citations_883002633010 最近EPO有一个对全球专利引文的统计,可以作为参考。以前这方面数据公布的不多,也没有这么细致。 这里面包含了一个引文来源的统计。将引文来源分为7类: SEA:通过检索获取的引文; APP:由申请人提供的引文; EXA:由审查员提供的引文; OPP:异议过程提供的引文; 115:根据ART 115 EPC 提供的引文; ISR:来源于国际检索报告的引文; SUP:来源于补充检索报告的引文; CH2:来源于PCT第2阶段(国际阶段)的引文; PRS: 预检索引文(在官方出版之前可获得的引文) (图可以下载后观察)
个人分类: 专利|5642 次阅读|2 个评论
【感悟】社科项目因引文不规范被终止!有潜台词!
skyfruits 2013-6-9 09:19
6月5号,社科基金网站在公布2013年立项的同时,还发布了一条消息:《关于终止秦立强、瞿商、罗哲、于维民主持的国家社会科学基金项目的通报》( http://www.npopss-cn.gov.cn/n/2013/0605/c219469-21743636.html)。 仔细一想,潜台词比较丰富。 1、同一天公布,警醒其他项目负责人,别再犯相同错误。 2、引文和注释不规范,说的非常含蓄。仔细一想,不就是成果抄袭嘛,唉。 3、被通告曝光,要么是杀鸡给猴看(实践表明这句流传甚广的古话其实对猴子没用),要么表明实在是太离谱了。 4、看来,一直坚持用Endnote做文献尤其是参考文献的管理,还是有好处的。 闻者足戒吧!
1810 次阅读|0 个评论
一则与引文分析之父相关的引文悬案
热度 12 nli2233 2012-12-29 12:29
当得起“引文分析之父”大名的,最恰当的、唯一的人选,是尤金·加菲尔德( Eugene Garfield )博士,因为他是 SCI 的创始人。加菲尔德生于 1925 年,已经接近 90 岁高龄了,从年龄上看,当个“ XX 之父”,也不算占便宜。 这里不评述加菲尔德老先生的一生,而是说一则我最近发现的、很有趣的(至少我这么觉得)、跟老先生有关的引文悬案。 科学网上做文献计量学(或者科学计量学)的人很多,比如武夷山老师,刘玉仙同学,还有更年轻的陈凯华同学和赵星同学,在这个领域都做出过很不错的工作。我来说引文分析的事儿,有点儿班门弄斧了。不过,这一则小事儿的确是我刚刚注意到的,而且为了弄明白真相,我还颇为费力地在网上折腾了半天。 事情本身很小,上面提到的几位专家,还有没提到的更多的科学计量学专家们,对这个话题应该一点儿也不陌生。也许,这个我觉得是很有意思的悬案的东西,在人家那里一点儿也不“悬”,人家早就知道是怎么回事儿了,三言两语就能说清。如果真是这样的话,那么,我也不亏。至少,写这么一篇博文,可以解除我心头的一点儿疑虑。 有一个成语,叫做“三纸无驴”,相信不少人知道吧。其背后的故事,是说有人丢了一头驴,央告本村秀才帮忙写个“寻驴启示”。秀才满口答应,铺纸砚磨,洋洋洒洒,转眼间,已经写了三页纸。这人问秀才,找驴的事儿是怎么说的?秀才答:别着急呀,前面都是铺垫,我还没写到“驴”字呢。 我可不能学这个秀才,还是赶紧说“悬案”吧。 关于引文动机的研究,往最先追溯的话,一定会追到一个有 15 条的 list 上。即:最早的引文动机研究,列出了人们引用文献的时候, 15 个可能的出现的原因。这 15 条原因,译成中文是这样的: 1 、对先驱表示敬意; 2 、对相关工作表示肯定(即对同行表示敬意); 3 、指明研究方法和设备; 4 、提供背景性材料; 4 、对自己的工作的纠正; 6 、对他人工作的纠正; 7 、对前人工作的批评; 8 、用来支持自己的论点; 9 、提请关注即将发表的工作; 10 、提供线索,指向未能充分传播、恰当索引或未被引用的文献; 11 、鉴别数据和事实类别,如物理常数等; 12 、指明对某一观点或概念进行过讨论的原始文献; 13 、指明那些描述以个人名字命名的概念或术语的原始文献或其他文献; 14 、否定他人的工作或观点; 15 、对他人的优先权提出异议。 应该说,事实上也早就有人指出过,这个单子并不完整(没有穷举所有可能性),而且,整个单子的组织排序也不是特有规律。但不管怎么说,这是现有文献中研究引文动机的第一次努力,功不可没。 这才引出本文一开始提出的“悬案”——这个单子是谁提出的? 第一反应,先看别人对这个问题是怎么说的。我通过互联网查找,加上翻阅手头的资料,对此大致上有了一个了解。结论是:有关文献对此没有统一看法。 说到引文动机的时候,有相当多的文献(比如国内的文献计量学教材)说这是一个名叫马尔文·温斯托克( Melvin Weinstock )的人于 1971 年提出的,有一些国外的文献也持这一说法。还有不少文献(比如武夷山老师的文章和一些外文文献),认为这个 15 条,是尤金·加菲尔德于 1964 年提出的。有意思的是,还有一些文献(主要是中文文章)在做文献综述部门写到这个 15 条的时候,把加菲尔德和温斯托克的工作分别评述,在各自名下列出 15 条,全然忽略这俩人的 15 条说的是一回事儿的事实。这也太不应该了,如果作者读过原始文献的话,不会犯这样的错误。 下面是加菲尔德和温斯托克在各自的文献中的 15 条原文,各位看看是不是一回事儿: 加菲尔德列出的 15 条(出处: Eugene Garfield. “Can Citation Indexing Be Automated?” in Mary Elizabeth Stevens, Vincent E. Giuliano, and Laurence B. Heilprin, Eds., Statsitical Assocristiora Methods for Mechamked Documentation, Sympom”um Proceedings, W’a.rhkgton 1964. (National Bureau of Standards Miscellaneous Publication 269, December 15, 1965), pp. 189-192 . ): 1. Paying homage to pioneers 2. Giving credit for related work (homage to peers) 3. Identifying methodology, equipment, etc. 4. Providing background reading 5. Correcting one’s own work 6. Correcting the work of others 7. Criticizing previous work 8. Substantiating claims 9. Alerting to forthcoming work 10. Providing leads to p oorly disseminated, poorly indexed, or uncited work 11. Authenticating data and classes of fact—physical constants, etc. 12. Identifying original publications in which an idea or concept was discussed. 13. Identifying original publication or other work describing an eponymic concept or term as, e.g., Hodgkin’s Disease, Pareto’s Law, Friedel-Crafts Reaction, etc. 14. Disclaiming work or ideas of others (negative claims) 15. Disputing priority claims of others (negative homage) 温斯托克列出的 15 条(出处: Melvin Weinstock. "Citation Indexes" in Encyclopedia of Library and Information Science, New York: Marcel Dekker, 1971, Vol. 5, pp. 16-40 ) 1. Paying homage to pioneers 2. Giving credit for related work. 3. Identifying methodology, equipment, etc. 4. Providing background reading. 5. Correcting one’s own work 6. Correcting the work of others 7. Criticizing previous work 8. Substantiating claims 9. Alerting researchers to forthcoming work. 10. Providing leads to poorly disseminated, poorly indexed, or uncited work. 11. Authenticating data and classes of fact—physical constants, etc. 12. Identifying original publications in which an idea or concept was discussed. 13. Identifying the original publication describing an eponymic concept or term as, e.g., Hodgkin’s disease, Pereto’s Law, Friedel-Crsfts Reaction. 14. Disclaiming work or ideas of others. 15. Disputing priority Claim of Others. 第二反应,这事儿简单啊,加菲尔德文章发表在前( 1964 ),温斯托克文章发表在后( 1971 ),这个 15 条单子的 credit 应该归加菲尔德。而且,根据常识判断,温斯托克的文章(实际上是百科全书的一章),应该引用加菲尔德的文章才是,否则不就是我们常说的抄袭或者剽窃了吗? 于是,我回头认真看了一下这两篇文章的相关部分,加菲尔德 1964 年的文章说到这 15 条的时候,用了这么一句话引出:“ However, reference citations are also provided in papers for numerous reasons including, among others: ” 然后是 15 条,前后没有引用别人文献的痕迹。这说明这 15 条是加菲尔德提出的。 然后我去看了温斯托克的原文,他是这么说的: ”These references are supposed to identify those earlier researchers whose concepts, methods, apparatus, etc., inspired or were used by the author in developing his own article. Some specific reasons for using citations are as follows:” 然后就是 15 条。这里没有引用加菲尔德的文章。 本来我看好多文献把 15 条的单子归功于温斯托克,还以为这些文献的作者未必通读了温斯托克的原文,因为凭直觉,温斯托克应该引用了加菲尔德的文章。原因很简单,加氏文章在前,温氏文章在后。现在看,那些把 15 条的 credit 送给温斯托克的作者们也没有什么错,因为温斯托克没有引用加菲尔德的文章,让人误以为这是他的首创呢。 那么,是温斯托克这家伙剽窃吗? 第三反应,杀人不是割韭菜,割掉一茬,还接着长。说人剽窃这种事儿,要十分谨慎。再仔细看看,也许有新发现。结果,我还真是发现了一些线索。 线索 1 :温斯托克的这篇作为图情百科全书一章的文献,的确引用了加菲尔德的那篇列出 15 条单子的文献。这说明,温斯托克同志对于加菲尔德那篇文章的存在,是知晓的。不过,引用的地方,不是在列出 15 条单子的时候,而是在另外一个话题下。顺便说一句,无论是加菲尔德的这篇文献,还是温斯托克的这篇文献,都是主要在讲引文索引的事儿, 15 条单子的内容(即引用动机问题)都不是其主要话题。 不管怎么样,线索 1 说明,温斯托克在明知加菲尔德文献存在的情况下,没有在列出 15 条的时候引用加氏的文献,其剽窃的嫌疑更大了。 不过,同志哥还是刀下留人比较好。我们还有线索 2. 线索 2 :看温斯托克文章的作者单位,原来人家是加菲尔德创办的科学信息研究所( ISI —— Institute for Scientific Information )的资深信息科学家( Senior Information Scientist )。 60 年代的 ISI 可不是今天的 Thomson Reuters 这样的规模。我们有理由相信,加菲尔德和温斯托克是一个研究团队的,至少温氏是加氏手下的一兵。 那么,俩人都是搞引文的,应该知道该引用前人成果的时候,一定不能含糊吧。可是,为什么温氏没有引用加氏的文章呢?(注意:温斯托克在发表这篇文章后,还继续在 ISI 工作,并发表了其他文章,这说明他并没有因为在文章中没有引用加氏的文章而在工作岗位上受到什么影响。) 我觉得可能的原因有: 第一, 忘了。忘了就忘了。尽管侵犯了加菲尔德的知识产权,但加菲尔德仁德宽厚,没加怪罪。 第二, 15 条的归纳本来温斯托克就有份儿,那是集体的结晶,所以不引。 第三, 15 条的归纳是温斯托克弄出来的,结果被加菲尔德先用了,所以不引。 究竟是怎么回事儿,我说不好。不过,就算事实是这里的第二、第三的任何一种情况,现在的通行做法也是应该引用一下。 不管怎么说,这是悬案了。温斯托克不知所终,但加菲尔德老人家还活着。我想了想,还是觉得为了这点小事儿打扰老人家,也太不仁义了,再说加氏本人也未见得就记得清究竟是怎么回事儿。因此,我放弃了找当事人直接求证的想法。反正这也不算什么大事儿,悬案就悬案吧。
个人分类: 人物纪事|8971 次阅读|19 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-16 23:08

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部