科学网

 找回密码
  注册
科学网 标签 DOI

tag 标签: DOI

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

用Zotero订阅、管理文献:RSS订阅--论文选取--入库--全文...
tony8310 2020-4-2 10:30
在zotero中订阅期刊的RSS。关于水文水资源的部分期刊 http://rss.cnki.net/rss/rss.aspx?journal=ZKJJVirtual=grid20DBCode=CJFD http://rss.cnki.net/rss/rss.aspx?journal=DLXBVirtual=grid20DBCode=CJFD http://rss.cnki.net/rss/rss.aspx?journal=SKXJVirtual=grid20DBCode=CJFD http://rss.cnki.net/rss/rss.aspx?journal=HJKZVirtual=grid20DBCode=CJFD http://rss.cnki.net/rss/rss.aspx?journal=STXBVirtual=grid20DBCode=CJFD http://rss.cnki.net/rss/rss.aspx?journal=KXTBVirtual=grid20DBCode=CJFD https://www.hydrol-earth-syst-sci.net/xml/rss2_0.xml http://rss.sciencedirect.com/publication/science/00221694 http://feeds.nature.com/nature/rss/current?x=1 https://www.nature.com/subjects/earth-and-environmental-sciences.rss https://science.sciencemag.org/rss/current.xml https://www.sciencenews.org/feed http://rss.sciencedirect.com/publication/science/00431354 https://agupubs.onlinelibrary.wiley.com/feed/19447973/most-recent http://www.sciencenet.cn/xml/blog.aspx?di=20 2. 在期刊目录中,阅读论文,如果对某一篇感兴趣,可以在zotero中右边的面板中,Add to My library或其下的文件夹中。 3. 因为安装了zotero 的相关插件,这一篇文章的doi,pdf等文献信息都自动完成。Perfect! --------- 青柠学术 https://iseex.github.io/#blog 插件: https://github.org/bwiernik/zotero-shortdoi 获取doi后,与sci-hub结合,可以下载全文!
21284 次阅读|0 个评论
对“引文污染”说不
isechina 2019-11-27 10:02
由于引用 欺诈性期刊(fraudulent journals) 的文章越来越多,审稿人和编辑都很恼火。学术界需要开发一种自动化的共享服务,以有效地评估被引用的文章。 CrossRef最近取消OMICS成员资格的决定使引文污染问题得到了极大缓解。 这项决定是在美国联邦贸易委员会于今年早些时候作出的对出版商处以5000万美元罚款之后作出的。 现在,CrossRef将OMICS冻结在其生态系统之外。已注册的DOI仍将有效,但OMICS将不再能够通过CrossRef注册DOI。 CrossRef不是唯一解决此问题的组织。今年5月,The Scientist杂志报道了研究人员对欺诈性出版商通过各种途径将出版内容通过PubMed Central让PubMed索引一事感到日益担忧。一旦被PubMed检索,那些论文就会像其他论文一样,很容易被研究人员发现和引用。 尽管学术出版中期刊的欺诈和欺骗行为的程度尚不清楚,但这一问题日益严重。例如,在Cabel的黑名单上有超过10,000种期刊(https://www2.cabells.com/blacklist)。 尽管在这一万多份期刊上发表的部分文章在方法学也许合理,但还是存在大量有问题的文章,最坏的情况就是文章彻头彻尾的欺诈。将方法学合理的文章和欺诈性的文章区分开来是一项艰巨的挑战,因此,研究人员和期刊应该做些什么呢? 为避免引用欺诈性文章,作者和编辑必须追踪有欺诈行为的期刊。但这很困难,因为期刊的数量非常之多,而且许多欺诈性期刊的标题故意选择非常接近合法期刊的标题。虽然作者和期刊编辑人员可以手动检查和对照白名单和黑名单,但这种方法既费时又昂贵。也不是所有期刊都仔细审查引用情况。 显然需要一种可扩展的、易于采用的、全行业通行的方法来解决出现在作者手稿中的欺诈性期刊文章的引用问题。 可以满足这一需求的是一项叫 “元期刊查询的服务(meta journal look-up service)” 。出版商通过API接入其生产系统。这种系统叫 “ HYDRA- High-frequency Fraud Detection Reference Application ”。 HYDRA 的工作原理如下。 首先手稿将提交给出版商的编校系统。引用期刊列表将以API查询的形式发送给HYDRA。然后HYDRA会返回一个白名单期刊列表。对于每个引文,HYDRA都会返回类似“Journal X被Web of Science、Journal citation Reports、Scopus、DOAJ、MEDLINE索引”之类的内容。它还可以包括主题列表,例如EconLit、PsycINFO、MLA、GeoRef、Inspec等等。HYDRA可以允许出版商进一步维护自己的白名单,这些白名单将被合并到查询结果中;其中可能包括未出现在其他白名单上的区域性期刊。HYDRA还可以出具黑名单列表(如果文章引用欺诈性期刊文章的话)。通过查询多个列表,HYDRA将避免过度依赖于某一个权威,并允许对给定的期刊名称进行更细致的评估。 如果一份期刊没有出现在任何白名单上,或者出现在任何黑名单上,就会自动生成一个疑问发给作者,要求作者证明引用的合理性。期刊可能采用一种简单的策略,例如如果某个引用没有包含在特定的白名单中,那么作者必须证明引用的合理性,使编辑满意。就如同写这篇博客,我必须要引用某些欺诈性期刊内容。 由于操作简便,HYDRA可以嵌入学术工作的任意一个阶段,包括写作和稿件提交系统。例如说,作者可以用来验证他的预投期刊是否在著名的白名单上,或者是否在黑名单上。 HYDRA的开发和采用,可以在很大程度上防止欺诈性期刊中文章的“引用污染”。 开发和维护这样一个服务的成本应该是最小的,并且可以通过API访问的少量费用来支持。 参考文献: https://scholarlykitchen.sspnet.org/2019/09/25/fighting-citation-pollution/?tdsourcetag=s_pcqq_aiomsg
个人分类: 论文写作|5484 次阅读|0 个评论
浅谈DOI:什么是数字对象唯一识别符?
Enago 2018-3-15 14:32
\0 \0 DOI ,即 Digital object identifier ,也就是数字对象唯一标识符。在计算科学中, DOI 是一种永久标识符或句柄,用于标识唯一的对象,由国际标准化组织( ISO )标准化。 DOI 广泛用于识别学术、职业和政府信息,例如期刊论文、研究报告和数据集以及官方出版物。它们也可以被用于识别其他类型的信息资源,例如商业视频等。我们可以通过将 DOI 绑定到元数据(如 URL ,即网址)来找到对象的位置。 DOI 是一个字符串,由前缀和后缀组成,中间用“/”隔开。前缀表示标识符的注册者,后缀则是由注册者用来指定这一特定对象的字母或数字。前缀常采用“ 10.NNNN “的形式,其中 NNNN 是一系列四位及以上数字,大于或等于 1000 。前缀还可以进一步用句点隔开,例如如 10.NNNN.N 。由于它的唯一性,这对于我们的知识产权是很好的保护,所以研究者们在网上发布论文时,应该创建 DOI 。 在我们引用别人的论文时,如何引入 DOI 呢?普渡大学的写作实验室向我们举例说明了 DOI 的引用方法。文中指出,我们引用网上的期刊杂志时,应该在末尾加上 DOI 或者 URL 。以 Chicago 文献格式为例,我们分别写出页脚和参考文献中 DOI 的引用方法: 在页脚中 : Kirsi Peltonen et al. “Parental Violence and Adolescent Mental Health,”European Child Adolescent Psychiatry19, no. 11 (2010): 813-822, doi: 10.1007/s00787-010-0130-8. 在参考文献中: Peltonen, Kirsi, Noora Ellonen, Helmer B. Larsen, and Karin Helweg-Larsen. “Parental Violence and Adolescent Mental Health.”European Child Adolescent Psychiatry19, no. 11 (2010): 813-822. doi: 10.1007/s00787-010-0130-8. 我们看到引用中的 DOI 都是小写,后面接冒号,然后是 DOI 的名字。注意,这里没有“ https : // ”。论文的链接 URL 一般会有这种网页前缀,但是 DOI 没有。之前的很多文章,都没有 DOI ,但我们可以用 URL 来指向我们在网上看到的论文。然而,同一篇文章发布在不同的网页,就会有很多各 URL 。这里, DOI 的发明就给我们带来了便利和权威性,因为同一篇文章的 DOI 是唯一的。 更多精彩文章 请造访 英论阁官网 和 【英论阁学术院】 --- 或关注 【 英论阁微信公众号】 ( 搜索enagocn或扫描下方二维码) --- § 博客内容皆由 英论阁 资深学术专家团队撰写提供§
个人分类: 期刊发表|10044 次阅读|0 个评论
最熟悉的陌生人:DOI,查文献最快捷的方法!
yulingwang 2017-11-1 10:21
现在不少期刊杂志要求提供参考文献的 PMID 或 DOI 号,许多杂志投稿指南也明确指出除了正式刊发的文献外,还可以引用未出版文献,但一般需要标注 DOI 号。 我们在平时看论文的时候,也会注意到每篇论文都会有它对应的DOI号,那么DOI到底是什么呢?它又有何作用? 1 什么是DOI 国际数字对象识别号基金会(International DOI Foundation)是成立于1998年的非营利组织,它是 DOI 系统的行政主体,目的在保障与 DOI 系统相关的知识产权,推广 DOI 的运用,并确保 DOI 系统的一切改进(如创造、维护、注册、解析与相关决策)能为全体注册者使用。DOI系统于2012年正式发布为ISO国际标准,成为全球通用的数字资源标识、链接标准。 数字对象识别号(Digital Object Identifier,简称DOI)是一套识别数字资源的机制,包括的对象有视频、报告或书籍等等。它既有一套为资源命名的机制,也有一套将识别号解析为具体地址的协议。 发展 DOI 的动机在于补充URI之不足,因为一方面 URI 指涉的URL经常变动,另一方面,URI 表达的其实是资源所在地(即网址),而非数字资源本身的信息。DOI 能克服这两个问题。一个 DOI 识别号经过解析后,可以连至一个或更多的数据。但识别号本身与解析后导向的数据并不相干,也可能发生无法取得全部数据,只能得到相关出版品信息的情形。DOI 的解析协议见诸 RFC 3652,RFC 3651 描述命名机制,RFC 3650 描述的则是其架构。DOI 通过 Handle 系统解析识别号,但实际应用上大多是通过网站解析;例如连进网址 http://dx.doi.org/10.1007/s00223-003-0070-0 ,就能看到对应识别号 10.1007/s00223-003-0070-0 的论文信息或全文。 2 原理 2000年1月由12 家世界顶尖学术出版商联合成立了非营利组织———出版商国际链接协会(简称PILA),负责对CrossRef 进行管理并为成员出版商提供链接服务,提供的链接服务可以从论文的参考文献直接链接到被引用论文的摘要或全文。其原理是:当出版商在线生成了一个数字化对象时,由国际DOI 基金会(简称IDF)负责提供一个唯一的、永久的DOI ,它与该数字对象存放的具体位置无关。 3 DOI的形式? DOI 的编码方案(即美国标准ANSI/NISO Z39.84-2000)规定,一个DOI由两部分组成:前缀和后缀,中间用“/”分割。对前缀与后缀的字符长度没有任何限制,因此理论上,DOI 编码体系的容量是无限的。 DOI前缀由两部分组成,一个是目录代码,所有DOI 的目录都是“10.”,即所有DOI 代码都以“10.”开头。另一个是登记机构代码,任何想登记DOI 的组织或单位都可以向IDF 申请登记机构代码。登记机构代码的分配也是非常灵活的,如一个出版商可以为其所有的信息资源只申请一个前缀,也可以为其数字图书、音像制品各申请一个前缀。DOI 后缀是一个在特定前缀下唯一的后缀,由登记机构分配并确保其唯一性。后缀可以是任何字母数字码,其编码方案完全由登记机构自己来规定。后缀可以是一个机器码,或者是一个已有的规范码,如ISBN 号或ISSN 号。 举例明之,以下是一个典型的 DOI 识别号:10.1006/jmbi.1998.2354其中的「10.1006」是前缀,由国际数字对象识别号基金会确定。其中,「10」为DOI目前唯一的特定代码,用以将DOI与其他采用同样技术的系统区分开;「1006」是注册代理机构的代码,或出版社代码,用于区分不同的注册机构。后缀部分由资源发布者自行指定,用于区分一个单独的数字资料,具有唯一性;以书籍为例,它可能是国际标准书号。发布者可以选择以何单位进行注册,例如,一本书可以注册单一的 DOI,也可以依各章节分别注册,甚至独立注册其中的一个表格或图片。 4 注册代理机构 目前DOI有10个注册代理机构: 华艺数字(台湾) - 网站 http://doi.airiti.com/ CNKI(中国知网) - 网站http://www.cnki.net/ CrossRef(美国) - 网站 (世界上最大的注册代理机构,只提供学术资料)https://www.crossref.org/DataCite (德国) - https://www.datacite.org/ Entertainment Identifier Registry EIDR (美国) - http://eidr.org/ mEDRA (欧洲) - http://publications.europa.eu/ OPOCE (Office des publications EU) (欧盟) - 网站 http://publications.europa.eu/ R.R. Bowker(美国) http://www.bowker.com/index.php/component/content/article/1/5 中国科技信息研究所(2007年3月至2011年11月由下属公司万方数据代行职责) - 中文DOI http://www.doi.org.cn/portal/index.htmJapan Link Center(日本) 5 优点 唯一性 DOI标识符作为数字化对象的识别符,对所标识的数字对象而言,相当于人的身份证,具有唯一性。这种特性保证了在网络环境下对数字化对象的准确提取,有效地避免重复。 持久性 一个数字化对象的DOI标识符一经产生就永久不变,不随其所标识的数字化对象的版权所有者或存储地址等属性的变更而改变。 兼容性 DOI标识符的兼容性体现在DOI号码的后缀中可以包含任何已有的标识符,例如国际标准书号ISBN,国际标准刊号ISSN,国际标准文本代码ISTC,出版物件标识符PII等。 互操作性 DOI的处理系统可以与任何因特网上不同的计算机操作系统在处理同一数据时能保持一致,能与不同时期的技术系统兼容。 动态更新 DOI系统可对其元数据、应用和服务功能进行快速和简便的动态更新。 6 DOI用途 DOI的作用很多,总结起来大致有以下几个方面: 1. 有助于实现链接的本地化,可以把中文DOI系统作为本地化链接方案的一部分,通过提供指向馆藏; 2. 全文信息的永久性链接来增加已获得资源的可用性、丰富其在线书目及数据库资源; 3. 可以提供链接的扩展服务,图书馆会员可为学术研究、教育、个人的、非商业化的目的使用DOI; 4. 相应元数据; 5. 提供一个对不同文献数据库的通用管理入口; 6. 通过标准的方式将不同的数据库集成; 7. 享受高效率的单边链接协议; 8. 享受低成本的扩张,实现自有文献资源使用效益与覆盖范围的快速增长; 9. 享受标准化带来的方便,实现二次文献、文摘信息及集成信息等与一次文献的无缝集成; 10. 实现中西文文献的有效链接。 11. EndNote可以通过DOI信息导入PDF的详细信息。 对于科研人员,尤其是发表科研文献的研究人员,如果能很好的利用DOI,效率将大大地提高! 数字对象唯一标识符(Digital Object Unique Identifier-DOI,DOI的主要目的是唯一标识网络环境下的各种信息资源实体(Entity),包括各种物理和数字资源,正如出版物贴上了条形码。DOI是从统一资源定位符(Uniform Resource Locator,URL)发展而来,被称为“下一代URL”。它与URL 的最大区别就是实现了对资源实体的永久性标识。科研人员可以在线找到基于DOI 的网络链接并点击该链接查找被引用论文。 DOI已成为科技期刊的“标准配置”以及论文的“身份证”、“出生证”,全球已有 4 万余种科技期刊为论文注册 DOI,并使用 DOI 链接到论文。全球的数字出版行业通过DOI进行跨出版商、跨系统、跨语言的资源链接,DOI还提供了知识产权保护、引文规范、使用量、引用量计量、多重解析等多种增值服务。 参考文献着录的国际标准(ISO 690)、国家标准(GB/T 7714)都推荐使用DOI标注引文,国外学、协会期刊规范、编排格式规范等均要求使用DOI标识期刊和论文、引文。 7 怎样通过DOI查找文献 通过DOI查找原始文献的方法很简单,只要将下面的url地址加在已知的doi前面就得到该文献在doi系统中的url. http://dx.doi.org/ 例如已知某文献的doi: 10.1080/14786410601129648,则该文献在doi系统中的url就是 http://dx.doi.org/10.1080/14786410601129648 事实上 如果已知doi, 也可通过以下地址由doi系统自动帮助查找url. http://dx.doi.org/ 在Resolve A DOI的提示框内输入已知doi, 点击Go按钮 doi系统就会自动链接到该文献的url,并显示相应的页面。 举例 下面,我们就以一篇Nature的文献为例,演示一下DOI查询文献的方便之处。 以In situ X-ray diffraction measurement of shock-wave-driven twinning and lattice dynamics这篇论文为例,其DOI码为10.1038/nature24061为登记机构代码,/后即为后缀,由登记机构自行规定,以确保论文的唯一性。 攻略一:使用DOI检索网站如CrossRef及ChinaDOI网站CrossRef(http://www.crossref.org),这是全球最大的DOI注册机构。 我们以 http://dx.doi.org为例进行演示,打开http://dx.doi.org,搜索其DOI号,如图: 点击go,就能够找到文献的出处了,可以看到这是一篇发表在Nature上的文章。 在地址来直接输入http://dx.doi.org/DOI也可以直接跳转到资源页面,如:“http://dx.doi.org/10.1038/nature24061” ChinaDOI网站( http://www.chinadoi.cn),中文论文都经此注册。 输入DOI,点击解析,也可直接跳转到上面的页面。 攻略二:直接使用Sci-Hub 登录 http://sci-hub.ac,输入文献DOI号之后点击Open。 会直接进入文献预览页面,点击右下角的保存就能下载。 攻略三:Library Genesis 登陆网站: http://gen.lib.rus.ec/。 输入DOI,选择“Scientific Articles”,点击“search”,即进入如下界面。 可以选择下面几个链接,其中也包括上面提到的Sci-Hub,小编选择第一个链接,点击进去,进入如下界面。 点击“GET”,即可下载。 是不是很方便了?
81757 次阅读|0 个评论
关于本刊及本刊发表论文的参考文献中DOI的著录规则的修改通知
waterlilyqd 2017-8-14 11:40
上周接收到Springer的通知,要求本刊按照CrossRef的要求修改本刊DOI的格式,同时,要求修改本刊所有文章中涉及到的DOI的格式。 ---------------------------------------------------------------------------------- Dear respected Co-Publishing Partners, This year Crossref changed their DOI Display Guidelines to make it easier for users to share Crossref DOIs. Since Springer Nature is member of Crossref we are legally bound to comply with the new guidelines. Please check https://www.crossref.org/display-guidelines/ for more information. Any occurrence of a DOI (article citation line, list of references, any link anywhere in an article, erratum or supplementary material) must thus in future be presented as a full DOI link in the form https://doi.org/ . It is no longer permitted to use a DOI name alone (e.g., 10.1007/s12345-123-1234-x ), it has to be e.g. https://doi.org/10.1007/s12345-017-1234-x . From 2018 onwards (copyright 2018): Please use only a Crossref DOI as a full link in the form https://doi.org/ . Example: https://doi.org/10.1007/s12345-017-1234-x Until 31.12.2017 (copyright 2017 or earlier): All display forms will be accepted, so you have time until end of the year to change your internal workflows to accommodate this significant change. But from 2018 onwards no article can and will get accepted for online publication which does not comply with the above requirements. Therefore I suggest you start publishing the articles with the new DOI display requirements as quickly as possible to prevent problems at a later stage. Best regards XXXX ----------------------------------------- Journal of Mountain Science在每篇文章的首页页眉处标注了该篇文章的DOI,格式是“ DOI: 10.1007/s12345-XXX-XXXX-X“ 。 另外,在首页的文章引用格式中也用是同样的格式。从今年第9期开始,本刊开始将格式修改为“ https:// doi.org/ 10.1007/s12345-XXX-XXXX-X ”。 本刊要求作者提供所有参考文献的DOI,过去我们采用的格式也是DOI:XXXXXXXXXXXXXXXXXXX;现在要求所有作者有参考文献中采用新的格式! 我们在Journal of Mountain Science发了通知,期刊网站上的稿件模板也正在修改中。
个人分类: JMS信息|4330 次阅读|0 个评论
利用VBA程序和HTTPS协议获取参考文献的DOI信息
hxiuzhou 2016-11-4 09:09
摘要 为了丰富文章信息,提升读者的阅读体验 , 本文编写了 VBA 程序,并利用 HTTPS 协议自动获取参考文献的 DOI 信息和超链接。经测试,运行 VBA 程序后,每 50 条参考文献大约需要 1 分钟即可解析完成,对注册过 DOI 的期刊文献的命中成功率几乎达到 100% 。对参考文献的体例结构进行精准分析和拆分是 VBA 程序运行成功的基础,向 CrossRef 机构申请成为会员使得 DOI 数据解析不受数据条目的限制,并对今后的数据挖掘提供方便。 关键词 VBA 程序 ; HTTPS 协议 ; DOI 2015 年文化产业专项资金项目 “ 中国科技类学术期刊国际传播平台 ” 支持 Email: hxz@scichina.or g PDF全文见: 侯修洲 , 黄延红 . 利用 VBA 程序和 HTTPS 协议获取参考文献的 doi 信息 . 编辑学报 , 2016, 28(5): 466-469 数字对象唯一标识符 DOI (Digital Object Identifier) 是辨识文献关联信息资源的关键字段信息,通过 DOI 可以快速链接到出版商网站发布的原文网页,也可以获取到该文献的完整 Metadata 元数据,方便读者下载和管理文献,在网络信息资源利用及文本挖掘方面有不可替代的地位和作用 。近年以来,出版商为了丰富文章信息,提升读者的阅读体验,往往会在参考文献中列出各个数据库的链接目标源, DOI 及其相关链接便是其中的一种。同时我国已经于 2015 年 12 月公布了新的参考文献著录标准 GB /T 7714—2015 《信息与文献 参考文献著录规则》 , 在标准中已经明确将 DOI 作为必备著录项目 。 但是在实际编辑出版中 , 出版商如何快速获取参考文献的 DOI 信息呢,在搜索引擎逐篇查询显然不可取,效率、时间和质量都难以保证。 VBA 程序 (Visual Basic for Applications) 在编辑出版工作中的应用已经有多人进行了尝试 ,本文充分利用 CrossRef 机构的会员身份,尝试借助 VBA 程序和 HTTPS 协议自动获取 Word 文档中的参考文献 DOI 。 1 DOI 查询方法 1.1 简单查询方法 DOI 作为 CrossRef 网站 (www.crossref.org) 的核心产品,该网站提供了查询 DOI 的几个方式 : 首先可以在其官方首页搜索关键词或主题检索文献信息,可以间接查询到 DOI 信息 ; 其次,该网站提供了一个简单查询页面 ( http://www.crossref.org/simpleTextQuery ), 任何人都可以在这个页面注册 Email 账户,然后将本地的文献信息拷贝到 ”Enter text inthe box below” 搜索框查询 DOI 信息。 每次查询时允许多条批量查询,并且可以附带查询 PubMed IDs 信息,但是该方法限制每个月最多只能查询 1000 条,并且还需要将返回的结果网页的数据复制到 Word 文档中,由于复制的仅仅是文本信息,原文档的格式也难以保留,并且每一个步骤都是手动的,效率也不是很高。中国肺癌杂志的王玥和毛善锋等人 利用 VBA 编程在 Word 中实现了自动调用简单查询网页地址、自动填充 email 和参考文献等功能,但是每个月 1000 条的文献查询限制阻碍了该方法的推广,并且由于每个刊的参考文献体例格式不一样,实际上, CrossRef 网站无法和待查的参考文献作出精确匹配,并且这个简单查询网页的核心只是一个模糊查询算法,难以精准锁定返回每篇文献的 DOI 。 1.2 利用 API 接口查询 DOI 的方式 CrossRef 网站已经认识到了简单查询页面不够精准的问题,并且已经开发了一套通过 API(ApplicationProgramming Interface, 应用程序编程接口 ) 精准锁定 DOI 的方法,主要包含两类,即 OpenUrl 开放链接源和 HTTPS 协议,这两种方式都允许会员和普通 email 用户查询,唯一区别是会员查询没有条数限制。 需要说明的是,由于注册 DOI 信息的主要是科技期刊文献, CrossRef 网站并不提供基于 API 接口的书籍、专利、博士论文、会议文集等其他形式的文献查询,所以本文讨论的也主要是如何获取期刊文献的 DOI 信息。 1.2.1 OpenUrl 开放链接源查询 DOI 通过 OpenUrl 开放链接源查询 DOI( http://help.crossref.org/using_the_open_url_resolver ), 对于会员,其查询格式如下,其中黑色字体部分是用户的用户名和密码: https://DOI.crossref.org/openurl?pid= username:password aulast=Maas%20LRMtitle=JOURNAL%20OF%20PHYSICAL%20OCEANOGRAPHYvolume=32issue=3spage=870date=2002 对于普通 email 账户,只需将上面网址中的 “username:password” 替换为注册过的 email 账户名即可。 不过无论是会员还是普通用户,对于 OpenUrl 开放链接源查询方式 ,上述地址最后返回的网页只是出版商的文章详情页,至于用户怎么从出版商的网页上获取 DOI 信息, CrossRef 是不负责查询的,由于各个出版商的网页格式各种各样,如果想通过网页抓取 DOI 文本信息,这对程序设计是一个很大的挑战。 1.2.2 HTTPS 协议查询 DOI 通过 HTTPS 协议查询 DOI( http://help.crossref.org/using_http ), 对于会员,其查询格式如下,其中黑色字体部分是用户的用户名和密码: https://DOI.crossref.org/servlet/query?usr= USERNAME pwd= PASSWORD qdata=|%20Natl%20Acad.%20Sci.%20USA|Zhou|94|24|13215|1997||| 上述网址中 ”qdata=” 之后每一个竖线间隔对应一个字段,分别为刊名、第一作者的姓、卷、期、首页码、出版年。需要提醒注意的是,该网址末尾最后三个竖线不能省略,否则不能获取 DOI 信息。 对于普通 email 账户,需要将上面网址中的 “usr=USERNAMEpwd=PASSWORD” 替换为注册过的 email 账户名即可 , 其代码为 “pid=email 账户名 ” 。 相比 OpenUrl 开放链接源查询方式, HTTPS 协议更简单快捷,比如通过 HTTPS 协议,网页只显示一串简单文本,由于无关信息少,所以打开网页速度非常快,并且可以直接在返回的网页文本中显示 DOI ,该字段信息被固定在最后一个竖线的末尾,方便后续程序来获取该文献的 DOI 信息,如图 1 所示。 图 1 利用 HTTPS 协议获取文献 DOI 信息的示意图 2 利用 VBA 程序和 HTTPS 协议 如果我们想利用 HTTPS 协议自动获取每条参考文献的 DOI ,首先面临的是 HTTPS 协议网址如何获取到文献的基本元数据,并且通过文献的元数据能够唯一确定这篇文献。一般来说,只要解析出文献的刊名、年、卷、首页码即可唯一确定文献,在 WORD 文档中,解析文献的刊名 - 出版年 - 卷 - 首页码元数据、启动 HTTPS 协议网址、获取到返回网页的文本并解析出 DOI 信息,以及最后决定性的一步,即将该 DOI 信息按照一定的格式填写到文献末尾 , 所有这些任务都可以交给 VBA 程序来完成。 2.1 解析文献元数据 以 Science ChinaPhysics, Mechanics Astronomy 一篇参考文献为例,我们尝试分析一下这篇文献的体例格式: “ Roberts P H,Glatzmaier G A. A three-dimensional self-consistent computer simulation of ageomagnetic field reversal. Nature, 1995,377: 203–209” 。经过分析,我们得出结论:这篇文献的体例为【作者 . 文题 . 刊名 , 年 , 卷 : 首页码 – 尾页码】,那么转换为程序语言则需要首先识别出【 * . * . * , * , * : * 】这样的段落,然后再作数据解析拆分,即能得到该参考文献的刊、年、卷、首页码信息,其中 * 为通配符,句点、逗号和冒号则是拆分段落中各元素时的标记位置,拆分函数代码如下: n1= InStr(x, .) ‘ 第一个句点出现的位置 n2= InStr(n1 + 1, x, .) ‘ 第二个句点出现的位置 n3= InStr(n2 + 1, x, ,) ‘ 第二个句点之后第一个逗号的位置 n4= InStr(n3 + 1, x, ,) ‘ 第二个句点之后第二个逗号的位置 n5 = InStr(n4 + 1, x, :) ‘ 第二个句点之后第二个逗号之后第一个冒号的位置 上述代码中, Instr 为 VBA 中的字符串函数,主要功能是获取指定字符在字符串首次出现的位置,以 “n2= InStr(n1 + 1, x, .)” 为例,其中, n1+1 是寻找的起始位置, x 为寻找的字符串, ”.” 是寻找的字符。后面 “‘” 代表注释部分。 接下来我们要根据上述拆分点解析出具体数据,代码如下: j = Trim(Mid(x, n2 + 1, n3 - n2 - 1)) ‘ 期刊名 year = Trim(Mid(x, n3 + 1, n4 - n3 - 1)) ‘ 出版年 vol = Trim(Mid(x, n4 + 1, n5 - n4 - 1)) ‘ 卷 If InStr(vol, () 0 Then vol = Trim(Left(vol, InStr(vol, ()- 1)) End If ref.SetRange ref.Start + n5 + 1, ref.End fpage = Trim(ref.Words(1).Text) 其中, Trim 函数功能为删掉字段首尾空格, Mid, Left 函数为取值函数,其意义和 Excel 中的同名函数一致。 2.2 启动并发送 HTTPS 协议 当我们获得了文献的关键数据之后,就可以启动 HTTPS 协议了,具体过程如下: link= https://DOI.crossref.org/servlet/query?usr= 用户名 pwd= 密码 qdata= “|” j “|” “|” vol “|” “|” fpage “|” year “|” “|” “|” ‘ 组合为 HTTPS 协议网址 Sethttp = CreateObject(Microsoft.XMLHTTP) http.OpenPOST, link, False http.send ‘ 发送 http 协议请求网址 2.3 获取返回数据并解析 DOI 信息 Ifhttp.Status = 200 Then re= http.responsetext ‘ 获取 http 协议返回文本 DOI= Trim(Mid(re, InStrRev(re, |) + 1, Len(re) - InStrRev(re,|) - 1)) ‘ 解析 DOI 数据 ref.SetRangeref.End-1, ref.End – 1 ‘ 创建写入位置 ref.Select ActiveDocument.Hyperlinks.Add Anchor:=Selection.Range,Address:=http://dx.doi.org/ DOI, TextToDisplay:= EndIf 3 主函数过程 综合上述代码,主函数过程如下: SubDOI() Setmyrange = Selection.Range ‘ 对选定的段落进行操作 ForEach i In myrange.Paragraphs Set ref =i.Range If ref Like*.*.*,*,*:* Then x = ref.Text ‘ 提取识别段落的文本 “2.1 解析文献元数据相关代码 ” “2.2 启动并发送 HTTPS 协议相关代码 ” “2.3 获取返回数据并解析 DOI 信息相关代码 ” End If Next End Sub 需要说明的是,必须先选中参考文献,才可以运行 VBA 程序,有关 VBA 程序的函数解释、界面介绍、录制宏及运行程序等方面可以参考文献 , 经测试,运行 50 条参考文献查询大概需要 1 分钟, 对注册过 DOI 的期刊文献的命中成功率几乎达到 100% 。 最终运行程序后的结果如图 2 所示 , 图中 CrossRef 已经自动带上了 DOI 的超链接。 图 2 利用 VBA 程序和 HTTPS 协议获取文献 DOI 信息的示意图 4 总结 本文利用 VBA 程序和 HTTPS 协议成功自动解析出了参考文献的 DOI 信息,需要说明的是,由于期刊均有自己特有的文献体例格式,所以本文中的拆分规则不可能也没必要去适应所有期刊的体例格式,这里只是提供一个解决问题的思路,具体问题还需具体分析,比如还是上面那篇文献,有的期刊体例格式可能是如下形式: “P. H. Roberts,and G. A. Glatzmaier, A three-dimensional self-consistent computer simulationof a geomagnetic field reversal, Nature 377, 203 (1995)” ,经分析,此体例可以拆分为【 *and 作者 , 文题 , 刊名 卷 , 首页码 ( 年 ) 】,那么转换为程序语言则需要首先识别出【 *and*, *, * (*) 】这样的段落 , 然后再按照这个数据特点进行进一步的拆分。 此外,注册为 CrossRef 网站的会员非常必要,相比普通 email 用户,会员用户获取该网站的引文信息更加便捷,几乎没有任何限制,并且可以免费获得 CrossRef 的技术支持。 5 参考文献 任瑞娟 , 孙玲玲 , 赵然 , 等 . DOI 在网络信息资源管理中的应用价值分析 . 情报科学 , 2010, 28(8): 1143-1146,1228 张欣欣 , 缪弈洲 , 张月红 . CrossRef 文本和数据挖掘服务 —— 《浙江大学学报 ( 英文版 ) 》的实践 . 中国科技期刊研究 , 2015, 26(6): 594-599 信息与文献 参考文献著录规则 : GB/T 7714—2015 . 北京 : 中国标准出版社 , 2015 陈浩元 . GB/T 7714 新标准对旧标准的主要修改及实施要点提示 . 编辑学报 , 2015(04): 339-343 刘铁英 , 张小白 , 叶慧玲 . Word VBA 及宏在科技期刊编辑中的应用 . 编辑学报 , 2007, 19(1): 47-48 游中胜 , 李若溪 , 欧红叶 , 等 . 利用 WordVBA 及宏实现编校信息快速查询 . 编辑学报 , 2009, 21(1): 72-73 王玥 , 毛善锋 , 刘谦 . Word 文档中通过 CrossRef 自动查询与整合英文参考文献 DOI 的实践 . 中国科技期刊研究 , 2013, 24(2):333-337 黄美君 , 姜爱蓉 . 合适的链接 最佳的服务 ——SFX 与 CrossRef/DOI 交互作用探讨 . 图书情报工作 , 2006, 50(3):93-96 李广建 , 李亚子 , 蒋君 . OpenURL 标准的版本演化及比较分析 . 图书馆杂志 , 2009, 28(7):53-59
5148 次阅读|0 个评论
[转载](ZT)DOI是怎么编排的
热度 1 fengjing413 2013-5-8 16:46
原文链接 http://blog.lehu.shu.edu.cn/dqlu/A61435.html DOI斜杠之前的六位数字代表出版社(具体怎么编不清楚) 例如,Springer旗下的杂志都是以10.1007打头,Elesevier旗下的则以10.1016打头。 DOI斜杠之后的数字和字母则没有全世界统一的格式。常见的有 1)期刊简称+卷号+文章ID 这是最好的编排方式,一目了然。 例如 DOI: 10.1103/PhysR evE.71.066303 PhysRevE是期刊,71是卷,066303是Article ID,其中06代表第六期,63杂志内容分类代码,03代表此文在本期本内中的位置(流水号) 2)期刊简称+收稿年月+文章流水号 例如 DOI: 10.1016/j.ijengsci.2008.06.004 代表International Journal of Engineering Science的出版社于2008年6月收到此稿,流水号是004 一篇文章在发表前,还有两个号,一个是收稿号,由收稿的编辑部给定,一个出版流水号,由出版商给定。 3)期刊ISSN+卷+期+流水号 例如 DOI: 10.1088/0256-307X/25/6/056 这是Chinese Physics Letters的编排方式 4 )期刊ISSN+收稿年+流水号 例如 DOI: 10.1016/S1001-6058(08)60115-8 这是Journal of Hydrodynamics的编排方式,S表示期刊,1001-6058是该杂志的ISSN,08年收到此稿,60115是流水号,-8是校验码 5)期刊内部代码+收稿年+流水号 例如 DOI: 10.1007/s00419-008-0233-6 S表示期刊,00419是 Archive of Applied Mechanics在Springer内部的代码,008是08年收到,0233-6是流水号+校验码 Journal of Shanghai University - English Edition也是采用这样的编排方式。 例如 DOI: 10.1007/s11741-004-0003-9 11741是JSHU-E在Springer的内部代码,其编辑信息网址是 http://www.springeronline.com/journal/11741/about 而全文下载的网址是(其中1007-6417是JSHU-E的ISSN) http://www.springerlink.com/content/1007-6417 6)无具体规则 例如 DOI: 10.1063/1.2120447 这是流体力学著名期刊Physics of Fluids的编排方式 例如 DOI: 10.1007/BF02458559 这是Applied Mathematics and Mechanics旧的编排方式,现在此期刊采用上述的5) 7)其他
3650 次阅读|2 个评论
[转载]中英五大数据中心签署大英图书馆DataCite服务,领航科研数据共享
shawn360 2012-11-2 09:13
编辑推荐: 华大基因同四家位于英国的数据中心(即考古学数据库服务、英国国家资料库、英国自然环境研究委员会和科学技术设施委员会)均签署了该项服务,成为首批与大英图书馆就DataCite服务展开合作的机构。据了解,华大基因是参与该项目的首个亚洲数据中心。 正文: 2012年10月29日,五大主要数据中心致力通过大英图书馆(British Library)的DataCite服务使科研人员可以更加轻松地访问和使用研究数据。大英图书馆DataCite服务为全球性的服务项目,其旨在解决查找、访问和再利用科研结果的相关问题。华大基因同四家位于英国的数据中心(即考古学数据库服务、英国国家资料库、英国自然环境研究委员会和科学技术设施委员会)均签署了该项服务,成为首批与大英图书馆就DataCite服务展开合作的机构。据了解,华大基因是参与该项目的首个亚洲数据中心。 数据来源于所有参与组织,主要涵盖从冰核到基因序列,从文化遗产到当前人口中提取的信息。这些数据都将采用数字对象标示符(Digital Object Identifiers, DOI)进行标识,从而使其能够检索和引用。目前,DOIs已被广泛使用,其可为学术期刊文章提供永久性链接。数据访问问题已成为当前科研人员所面临的巨大挑战之一。此次合作将为数据的访问问题提供一条实际的解决途径。英国皇家学会于今年七月份曾推出一期特刊《科学是一个开放性的事业》(Science as an open enterprise),主要倡导科研人员应该在其领域甚至更广泛的科研领域内对所拥有的数据进行广泛的交流与共享。这项报告还特别提及了华大基因所发布的首个DOI数据集,即2011年欧洲爆发的导致50人死亡的致死性大肠杆菌基因组序列,将其作为报告的封面图片,并在《明智开放数据的力量》(the power of intelligently open data)一节中作为案例进行了介绍。 开放数据使科研人员在以下方面获益: • 保证数据(或数据相关信息)链接的持久性和唯一性 • 数据引用更加快捷,更易检索及访问,有利于科研人员可以更好地去验证自己的研究或他人的成果 • 可获得大量当前还无法实现的新的研究机会 • 通过共享和被引用数据可获得更高的信誉和认可度 “如何保障科研人员能够便捷地引用数据、期刊文章以及其他参考信息,已经成为越来越重要的问题。而DataCite的出现将会给当前科研人员互相交流研究信息的渠道带来变革。”大英图书馆科学、技术及医学部门负责人Lee-Ann Coleman表示,“作为致力于为科研人员提供信息和其他实质性支持的重要机构,我们相信大英图书馆DataCite服务将能够解决数据共享中存在的一些障碍。我们期待这五个机构的参与能够吸引更多的单位参与进来,这将是改变共享资源模式迈出的重要一步。” 华大基因执行院长王俊表示:“华大基因是全球最大的基因组学研究机构以及全球最大的生物学数据产出者之一。DataCite的目标为建立认可和奖励数据产生者的学术结构,这点深深吸引着我们。通过DataCite的DOI标识,我们发布了之前一些未公开的数据集,使得这些数据已经能够被《科学》和《自然》等顶级期刊杂志所引用和认可。我们期待能够继续追踪和跟进我们的数据带来的影响。”除了能激励研究者更及时发布他们产生的数据,数据的引用也会提供更好的机制以保证这些数据集和引用数据的出版物之间的链接和关联。华大基因已使用该功能发行了最新的“大数据”期刊杂志——《GigaScience》。 据了解,以“数据和文献整合” 为主题的特别会议将于今年12月1日在香港举办的第七届国际基因组学大会暨亚太生物信息学峰会(ICG-7 Bio-IT APAC 2012)上召开。届时,各位与会人员将共同探讨有关数据出版和引用方面的更多新进展。 附大英图书馆DataCite服务网址: http://datacite.org/ 内容详见: http://www.datatang.com/news/148
2778 次阅读|0 个评论
如何用DOI下载文献
热度 4 caiyanjiang 2012-4-1 10:36
如何用DOI下载文献
DOI 是 "Digital Object Identifier" 的简写 用来标识在数字环境中的内容对象。 DOI 可以用来揭示有关该数字对象的一些信息 包括从 internet 哪里可以找到它等。 随着时间推移数字对象的某些有关信息可能会有变化【包括从哪里可以找到它,但是 DOI 不会改变】。 DOI 是一个永久性的标识号,由 International DOI Foundation 管理。 通过 doi 查找原始文献的方法很简 单→ 只要将下面的 url 地址加在已知的 doi 前面就得到该文献在 doi 系统中的 url. http://dx.doi.org/ 。 例如已知某文献的 doi 为 10.1103/PhysRevLett.95.253601 ,则该文献在 doi 系统中的 url 就是 → http://dx.doi.org/ 10.1103/PhysRevLett.95.253601 。 事实上,如果已知 doi, 也可通过以下地址由 doi 系统自动帮助查找 url. http://dx.doi.org/ ,在 "Resolve A DOI" 的提示框内输入已知 doi, 点击 "Go" 按钮 doi 系统就会自动链接到该文献的 url, 并显示相应的页面。如下图: 另外 CrossRef 网站也提供了通过 doi 查找 url 的功 能→ http://www.crossref.org ,在“ DOI Resolver ”输入提示框中输入已知 doi "submit" 即可。如下图: 另外,一篇文章在期刊网站的网址有可能发生变化 但是它在 doi 系统中的网址却永远不会改变,而且通过 doi 系统的自动转换后,将永远指向最新有效的期刊网站网址。 RSSReader 软件,可以定期收录最新发表的文献文章,其中的简短记录中就有 DOI 。 参考网址: http://anna-zr.javaeye.com/blog/484119 http://www.helixnet.cn/bbs/archiver/tid-26027.html http://www.sinoss.net/bbs/viewthread.php?tid=320
个人分类: 生活点滴|38962 次阅读|4 个评论
PDF导入Endnote X4的终结解决方案
热度 2 yangchuntao 2011-2-22 15:23
PDF导入Endnote X4的终结解决方案
很多人都在用Endnote X4,它可以轻松的实现PDF的导入。但是有些PDF文件,里面明明有数字对象唯一标识符(Digital Object Unique Identifier, DOI),但是在导入Endnote X4时还是只显示文件名和DOI。对于这种问题往往是由于Endnote X4不能正确识别DOI所致。我们可以自己重新在文章空白处录入DOI。使用Adobe Acrobat Professional” 中:工具→高级编辑工具→TouchUp文本工具,把DOI重新正规的编写一遍(在待添加文字处按“ Ctrl + 鼠标左键”,会出现一个“新建文本字体”的对话框)。注意:图画标记-文本框工具,加入的DOI好像是不行的。中文PDF暂时没有发现导入方法。
个人分类: 科学软件|8517 次阅读|0 个评论
如何使用DOI快速找到论文的全文下载网址
dqlu 2010-8-29 10:22
1) 什么是DOI 2) 如何使用DOI快速找到论文的全文下载网址 3) DOI是怎么编排的 全文见 http://blog.lehu.shu.edu.cn/dqlu/A61435.html
个人分类: 文献检索|8141 次阅读|0 个评论
科研小技巧: 文献身份证DOI的使用
热度 1 cwhm 2010-6-3 17:14
如同一本书有一个ISBN编码,一件商品有一个条形码,互联网上每一个网址有一个URL,我们经常阅读的每篇文献也有一个编码,这就是DOI。每篇文献的DOI也是唯一的,这和我们的身份证一样。正是DOI的唯一性,也为我们的科研提供很大的便利,我们可以借助DOI很方便、快捷、准确地定位到我们要找的那篇文献的出处,从而下载阅读,而不必将大量的时间用在google或者数据库查询上。 一:首先那里可以看到一篇文章的DOI呢? (a) 比如Elsevier数据库,在每篇文章的网页左上角都会有 (b)还有文章pdf电子档的第一页页角处都会有该文章的DOI (c)另外各种文献管理软件,比如Endnote,都会自动的将文献的DOI信息导入到软件中 二:如何使用DOI查询文献? 我们往往有这样的经历,就是用google查询文章的时候,往往能同时找到几个链接,或者找不到一个链接。而用DOI则不会出现上面的问题,它会自动的我们链接到这篇文章的出版商那里。网站域名解析需要使用DNS,DOI格式的文献身份证的解析可以在下面的网址进行,http://dx.doi.org/。只需要将要查询的文献的DOI那一串代码输入到查询框,然后GO!!,迅速就会把链接转到相应的文献数据里,然后接下来就是下载阅读了
个人分类: 期刊杂志|6799 次阅读|3 个评论
what is DOI
zhao1198 2009-10-13 16:55
Digital Object Identifier (DOI) The Digital Object Identifier (DOI) is an identification system for intellectual property in the digital environment. Developed by the International DOI Foundation on behalf of the publishing industry, its goals are to provide a framework for managing intellectual content, link customers with publishers, facilitate electronic commerce, and enable automated copyright management. Using DOIs: An Overview DOI Applications Publishing on the Internet requires new tools for managing content. Where traditional printed texts such as books and journals provided a title page or a cover for specific identifying information, digital content needs its own form of unique identifier. This is important for both internal management of content within a publishing house and for dissemination on electronic networks. In the fast-changing world of electronic publishing, there is the added problem that ownership of information changes, and location of electronic files changes frequently over the life of a work. Technology is needed that permits an identifier to remain persistent although the links to rights holders may vary with time and place. The network environment creates an expectation among users that resources can be linked and that these links should be stable. The DOI system provides a way to identify related materials and to link the reader or user of content to them. DOI has wide applicability to all forms of intellectual content and can therefore be applied to all forms of related materials, such as articles, books, classroom exercises, supporting data, videos, electronic files, and so on. DOI provides a basis for work now in progress to develop automated means of processing routine transactions such as document retrieval, clearinghouse payments, and licensing. Publishers and users are being encouraged to experiment with DOI usage, and to commonly develop guidelines for DOI scope and rules for usage. The DOI System and how it works The DOI system has two main parts (the identifier, and a directory system) and a third logical component, a database. The identifier: The DOI, is made up of two components. The first element -- the prefix -- is assigned to the publisher by a registration agency. Eventually, there may be multiple registration agencies to serve separate geographical regions or for each intellectual property sector (such as text publishing, photographs, music, software, etc.). However, at this stage there is only one registration agency and Directory Manager. Prefixes all begin with 10 to designate the DOI directory manager, followed by a number designating the publisher who will be depositing the individual DOIs, which ensures that a publisher can designate its own DOIs without fear of creating duplicate numbers. Publishers may choose to request a prefix for each imprint or product line, or may use a single prefix. The second element, following a slash mark, is the suffix. This is the designation assigned by the publisher to the specific content being identified. Many publishers have elected to use recognized existing international standards for their suffixes when such a standard applies to the object being identified (e.g., ISBN for a book), but may alternatively choose to use an internal code. In use, the DOI identifier is an opaque string without intelligent meaning other than as an identifier. The suffix can follow any system of the publisher's choosing, and be assigned to objects of any size -- book, article, abstract, chart -- or any file type -- text, audio, video, image or software. An object (book) may have one DOI, and a component within that object (chapter) may have another DOI. The publisher decides the level or granularity of identification based on the nature of objects sold and distributed over the Internet. The suffix can be as simple as a sequential number or a publisher's own internal numbering system. The directory: The power of the DOI system is its function as a routing or resolution system. Because digital content may change ownership or location over the course of its useful life, the DOI system uses a central directory. When a user clicks on a DOI, a message is sent to the central directory where the current web address associated with that DOI appears. This location is sent back to the user's Internet browser with a special message telling the system to go to this particular Internet address. In a split second the user sees a response screen -- a Web page -- on which the publisher offers the reader either the content itself, or, if not, then further information about the object, and information on how to obtain it. When the object is moved to a new server or the copyright holder sells the product line to another company, one change is recorded in the directory and all subsequent readers will be sent to the new site. The DOI remains reliable and accurate because the link to the associated information or source of the content is so easily and efficiently changed. The underlying technology used in the DOI system is optimised for speed, efficiency, and persistence. The database: Information about the object identified is maintained by the publisher. However it is planned that the DOI system will also collect some minimum level of associated metadata to enable provision of automated efficient services such as look-up of DOIs from bibliographic data, citation linking, and so forth. Thus information about the object identified (metadata) might be distributed over several databases. It might include the actual content or the information on where and how to obtain the content or other related data. From these database systems is generated the information that the user has access to in response to a DOI query, forming the third component of the DOI system. The DOI can also serve as an agent. In the future, the DOI will also be used to automate transactions. The DOI is being further developed to incorporate functionality which could enable the user to associate a function with the DOI.
个人分类: Writing|3084 次阅读|0 个评论
DOI对网络出版格局的影响
paperopen 2008-12-11 14:24
   摘要: 通过对DOI格式的分析,凸显了RA(register agency)的稀缺性。分析了了ISO目前正在进行的关于DOI标准的制定过程和RA的收费制度,提出了双向收费和费用太高是目前制约DOI推广的障碍。对目前国内外的出版机构进行了分类,对目前科技信息使用单位采购数据库产品进行了调研,得出了单个期刊数据库难有作为,必须要联合销售的结论。提出了如果对DOI非核心元数据扩展加入价格等商业内容的话,可借助DOI平台实现期刊自行定价的出版新格局的观点。 1  DOI应用和标准制定动态   随着DOI (Digital Object Identifier) 发展的深入,DOI的应用已经有了很多的扩展,目前成熟的应用为交叉引用定位(交叉引用) 基于DOI的搜索引擎。   有DOI的信息一般来说都是有价值的数字物品,给出的链接也都来源于官方站点,因此可靠性和价值更高。目前DOI除了DOI和物品实体(网页或者PDF等的链接地址)的关联之外,还可要求申请者提供物品的元数据(包括标题、摘要、关键词、发布日期、作者、卷期页码、文献种类等),这样就为新一代搜索引擎提供了数据资源支持。这种新型搜索引擎的数据来源不是通过蜘蛛来获得,而是通过由信息发布者来填写相关元数据,降低搜索成本,内容也更具价值。目前Google.scholar在进行这方面的常识 ,中国的空军工程大学也在进行这方面的研究,OA搜索引擎开网已经在2008年1月发布 。   目前DOI还没有国际标准, ISO正在建设DOI的国际标准,由TC 46(Information and documentation)负责,TC46有一个专门工作组TC 46/SC 9,SC9目前正在起草ISO/WD 26324(Information and documentation -- Digital object identifer system)(2006-08-07) ,目前尚未定稿,阶段为30.20(Committee stage的CD study/ballot initiated) ,在2008年初时阶段为20.20(Preparatory stage 的Working draft (WD) study initiated。也就是说在今年DOI标准从草案阶段进入了提交委员会通过阶段,因此DOI标准已经大势已定。   目前DOI标准以由非营利性组织国际DOI基金会(International DOI Foundation,IDF)发布的DOI标准为主流标准。IDF的DOI标准虽然目前还不是国际标准,但是目前已在世界范围内得到了支持和应用,成为了一个事实标准。如elsevier,springer等都先后支持了DOI,adobe reader,windows reader等也先后支持DOI。现在正在起草的ISO标准也是基于IDF的DOI协议 。   目前IDF正在通过RA(Register Agency)的方式进行推广,截至到2008-1-18,目前已经在全球发展了9家RA(最多支持9999家)。这9家RA是:Copyright Agency Ltd.,CrossRef,mEDRA,Nielsen BookData,OPOCE (Office des publications EU),R.R. Bowker,TIB (Technische Informationsbibliothek),Wanfang Data Co., Ltd.(中国的万方数据)。值的关注的是中国的万方数据成为了IDF的RA。RA的角色有点类似于互联网域名分配机构,算是IDF的一级代理,每年向IDF缴纳会员费(每年35000美元),还有不低于20000美元的DOI注册费,还有维护费(所有注册的DOI每个1美分,每年超过500万以上的部分为0.5美分)。RA可以为出版机构注册、申请DOI,收取DOI注册费用和会员费。   由于目前DOI的费用比较昂贵,特别对于发展中国家来说,因此一些地区和国家都在开发自己的DOI服务系统,试图和IDF分庭抗礼。日本开发了cIDF(content ID Forum),2004年发布了2.0元数据版本;欧洲多语种DOI登记机构mEDRA(Multilingual European DOI Registration Agency)也已经在2004年开始提供服务,我国也有人提出建立中国自己的DOI(CDOI)系统的设想。由于DOI的解析和域名解析一样,如果不在中国设置服务器的话,可能会影响到中国的信息安全。从最新的RA公告中可以看出,mEDRA已经成为IDF的RA。因此笔者认为开发CDOI的前景会比较渺茫,但是签于DOI国际标准正在制定当中,争取更多话语权的可能性是可行的方案。   但是从目前ISO最新发布的DOI标准讨论稿来看,主要依据的是IDF的DOI标准。    2 科技文献生产机构的分类   通过调研和分析,认为目前科技信息的生产机构的可以分为以下几类:    1)科技文献全文数据大型出版集团。 如springer,elsevier,nature等,这些集团不只拥有自己主办的众多期刊,还把一些有影响的期刊也招纳到麾下。目前中国一些有影响的期刊,如Cell Research(细胞研究)2006年与Nature合作,Journal of Integrative Plant Biology(植物学报)、Acta Pharmacologica Sinica(中国药理学报)2005年起改为英文版并与Wiley-Blackwell合作,Journal of Genetics and Genomics(遗传学报)从2006年起改为英文版并与Elsevier合作,浙江大学学报在2006年与springer合作。   这些大型出版集团有自己的成熟的发行网络,自己本身就是一个有价值、有资源的出版集团,他们的数据库产品就是产品。    2)一些专业科技文献数据库   这些商业科技文献数据库和上面提到的科技文献全文数据大型出版集团不同,自己不出版期刊、书籍,仅仅是把别人出版的内容(全文或者摘要等二次数据)进行筛选整理后成为一个数据库产品。如只有二次文献的SCI、EI、中国的CNKI、万方和维普。    3)一些中小型商业/半商业出版机构   目前中小型出版机构很多,出版物占世界总出版的80%以上,但是由于不成规模,自己出版的出版物要新进入国际大循环,只能加盟到像springer,elsevier这样有影响的大型出版集团,搭船出海。如中国所有的编辑部、期刊社就是这样。    4)一些OA出版物   目前随着OA(Open Access)运动的发展,出现了许多OA期刊,其中一些OA期刊颇具影响,如美国的plos系列期刊和BMC期刊。Plos目前有8种OA期刊,其中Plos Biology的影响因子达到了14,位居生物学期刊之冠。这些期刊对于读者来说是免费的,因此像springer这样的商业出版集团是不愿对这些免费期刊花费心血的。目前这些OA期刊大多都是通过自己的网站来推广,可喜的是目前也有了像doaj,open-j,citeseer,highwire,paperopen一些OA仓储(OA论文平台)来帮助这些期刊扩大影响。   5)一些科技文献产出机构   大学、研究机构是科技文献的主要产地,每个大学每年都会有大量的学位论文,诸如此类的还有研究机构的报告,如美国政府的AD报告等。目前这些大学的学位论文只能通过一些学位论文数据库来进行销售,如国外的UMI、PQDD和国内的CNKI和万方,合作中大学的自主权很少,对话地位也不平等。 类似的机构还很多,如专利、研究报告等。   6)产生有价值文献的企业   一些企业的datasheet,databook、selection guide ,Product Release等,都是一些有价值的文献,这些文献都是免费的。其实产品的价格也是一种有价值的信息,甚至可以为一种产品申请一个DOI。 3  科技文献使用单位订购文献数据库调查   通过我们对国立图书馆、研究机构图书馆、地方省立图书馆、综合性大学、专业性大学、师范类大学图书馆进行的调查,发现存在以下现象:   1) 大多数单位图书馆只订购了一些大型(期刊种类多、多学科)文献数据库。   2) 专业数据库产品得到相关单位的青睐。   3) 对于单个期刊的或者期刊种类很少的数据库或者期刊的电子版基本没有订阅。   通过分析,不难发现:   1)出版单位要想在市场取得好的业绩要么文献有价值,或者数据量大,但是目前世界上存在着许多有价值的小规模文献生产机构,如清华大学学报、博士论文等,这些出版单位目前只要加入一些知名数据库才会有所发展,而在和这些知名数据库的谈判中,话语权则很少。在中国这种现象更为严重,由于中国的科技文献市场基本被CNKI、万方、维普所垄断,这些信息集成尚给给杂志社的版权使用费和因网络出版造成的印刷版订户下降造成的损失不和同日而语。但是期刊社没有办法,如果不是通过这些数据库提供商,单个期刊的数字产品则很难销售。可喜的是有个别联合会在为自己的期刊争取权益,中华医学会将自己旗下的期刊组织起来,独家授权给万方以谋求合理的回报。但是大多数期刊仍然为砧上肉。加上目前核心期刊国际知名数据库(主要是SCI和EI)收录的导向作用,许多期刊开始尝试OA。   2)数据库机构使用单位也存在烦恼,随着技术的细化和数据市场的活跃,每年都会出现新的科技文献数据库,如何选购也是一件头疼的事情。   3)数据库的个人用户更麻烦。许多学生在毕业以后就无法像在大学那样方便的通过网络来查阅科技论文等信息了,如果要查看论文,只能购买数据库上网卡。    结论: 单期刊数据库难有作为,只有海量数据库、专业数据库才能有所作为。 4  DOI可能导致的出版业的变革   如果能开发出DOI服务器产品,让每个出版机构(期刊社、出版社、机构、大学、公司甚至个人)都自己发布自己的产品(相当于自己建立自己的商铺),出版单位自己定价(可以OA、交换共享、标价销售、集团购买等),而DOI则相当于一个总代理商(类似于纸介杂志出版时代的国家邮政总局的角色),这样就可把众多的中小型出版机构团结起来,形成一个超大规模的科技文献数据库,疏通中小出版机构电子文献的的发行渠道,促进技术传播和学术平等。而DOI负责统一和用户收费,并根据协议收取一定的佣金,也能得到发展。   如果这样,出版机构将有更多的自主权,如果在技术层面解决出版机构文献电子版发布问题,相信出版机构参与的积极性会很高,尤其是中小出版机构。   随着DOI的发展,在将来,甚至一些知名的数据库也可能会成为数据供应商。 5  DOI推广的瓶颈   DOI在中国的推广存在一些瓶颈,就是其费用太贵,而且是双向收费。CrossRef公司的收费标准 为年费275美金(公司每年保持调整价格的权利),每篇论文DOI注册费为1美金,这样一个每年出版1000篇论文的期刊每年有支付1300美金,折合1万元人民币,有点贵。还有除了出版机构付费外,还需要向通过DOI获取链接地址的用户收费,这部分费用主要是通过向机构收取,解析次数小于1百万的,每年会费为275$,1-5百万之间的,每年会费为550$,5亿次以上的每年会费为50 000$。   由于DOI时双向收费,因此这样就阻止了期在互联网的广泛应用,导致其提高期刊表现度效能的降低,这需要有胆识的RA的单向收费来解决。 本文已经发表在编辑学报2008年第5期。 本文略有删节。 目前DOI又有了些新发展: 1)RA由原来的9家变成了8家。中国区没有变化,仍是万方。 2)DOI的费率有所调整,万方在今年南宁会议上宣布将对签约期刊免费提供DOI(应该不仅仅是指独家代理签约期刊,也包括非独家代理的签约期刊。没有看到书面条款,但是就此问题请教过万方工作人员),但是要求全文指向到万方。如果需要指向到期刊指定的地址,则需要收费。目前的标准:年费600元人民币,每篇论文1元人民币 。
个人分类: 公开发表作品|6908 次阅读|1 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-20 11:26

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部