开放科学工作室分享 http://blog.sciencenet.cn/u/OPENRESOURCES

博文

美国NIH"作者手稿可用于文本挖掘" ——你知道如何用吗

已有 4735 次阅读 2016-3-18 19:55 |个人分类:OA资源|系统分类:博客资讯|关键词:学者| 开放获取, 文本挖掘, NIH, 科研数据, 数据服务

PMC是美国NIH 非常著名的一个开放获取论文仓储。PMC拥有超过30万美国国立卫生研究院(NIH)资助的科学家作者手稿(作者的手稿文件是PMC开放获取集子集中的一部分)。而最近,NIH宣布将这些论文以公众获取的方式向全世界提供文本挖掘。

用户可以通过ftp://ftp.ncbi.nlm.nih.gov/pub/pmc/manuscript/下载XML或纯文本格式的NIH资助作者手稿。内容包括20087月及之后NIH存储在PMC的所有稿件。公众不仅可以通过PMC访问手稿的全文、附图、表格和多媒体文件,而且可以下载XML文件和全文的纯文本文件。

这个消息对于众多从事相关领域工作的科研人员绝对是一个重大利好。以往,这些论文大多只提供在线或PDF的阅览或下载,科研人员要想对相关研究的所有论文(暂且不论是否真能找全所有论文)中的实验数据、方法等等对比、分析,往往要一篇篇的去看论文、收集数据, 这个过程往往是非常枯燥的、低效的、费时的。

现在,NIH如此善解人意的将这些论文开放给大众进行挖掘,科研人员收集数据、分析已有成果的数据从此变的so easy!按照上面给定的链接查找和下载自己想要的论文的XML格式版,然后利用一些技术手段或数据分析工具分分钟将有用的数据和分析的结果奉到你面前!

不过,有的科研人员会说,巧妇难为无米之炊啊,我不懂数据挖掘技术和工具怎么办?怎么办?放心好了,对于大部分专业的研究人员来说,不懂这些工具或技术很正常,科研人员的时间是相当宝贵的,是用来做科研的,不是用在进行数据挖掘和分析的,这方面,自然可以请专业人员来做。比如,中科院文献情报中心有关团队已经在开展为科研人员提供数据挖掘的服务了,感兴趣的可以看黄金霞的一篇博客:看http://blog.sciencenet.cn/home.phpmod=space&uid=2908120&do=blog&id=962019 





https://m.sciencenet.cn/blog-1035376-963443.html

上一篇:GoOA收录开放期刊推介(2)——医药科学专题 Frontiers
下一篇:美国资助机构纷纷发布开放获取政策——中国什么时候行动起来?

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-10 08:11

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部