科学网

 找回密码
  注册

tag 标签: 数据服务

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

美国NIH"作者手稿可用于文本挖掘" ——你知道如何用吗
OPENRESOURCES 2016-3-18 19:55
PMC是美国NIH 非常著名的一个开放获取论文仓储。PMC拥有 超过 30 万美国国立卫生研究院( NIH )资助的科学家作者手稿( 作者的手稿文件是 PMC 开放获取集子集中的一部分 )。而最近, NIH宣布 将这些论文以公众获取的方式向全世界提供文本挖掘。 用户可以通过 ftp://ftp.ncbi.nlm.nih.gov/pub/pmc/manuscript/ 下载 XML 或纯文本格式的 NIH 资助作者手稿。内容包括 2008 年 7 月及之后 NIH 存储在 PMC 的所有稿件。公众不仅可以通过 PMC 访问手稿的全文、附图、表格和多媒体文件,而且可以下载 XML 文件和全文的纯文本文件。 这个消息对于众多从事相关领域工作的科研人员绝对是一个重大利好。以往,这些论文大多只提供在线或PDF的阅览或下载,科研人员要想对相关研究的所有论文(暂且不论是否真能找全所有论文)中的实验数据、方法等等对比、分析,往往要一篇篇的去看论文、收集数据, 这个过程往往是非常枯燥的、低效的、费时的。 现在,NIH如此善解人意的将这些论文开放给大众进行挖掘,科研人员收集数据、分析已有成果的数据从此变的so easy!按照上面给定的链接查找和下载自己想要的论文的XML格式版,然后利用一些技术手段或数据分析工具分分钟将有用的数据和分析的结果奉到你面前! 不过,有的科研人员会说,巧妇难为无米之炊啊,我不懂数据挖掘技术和工具怎么办?怎么办?放心好了,对于大部分专业的研究人员来说,不懂这些工具或技术很正常,科研人员的时间是相当宝贵的,是用来做科研的,不是用在进行数据挖掘和分析的,这方面,自然可以请专业人员来做。比如,中科院文献情报中心有关团队已经在开展为科研人员提供数据挖掘的服务了,感兴趣的可以看黄金霞的一篇博客:看 http://blog.sciencenet.cn/home.phpmod=spaceuid=2908120do=blogid=962019
个人分类: OA资源|4739 次阅读|0 个评论
大数据环境下科研人员对数据的需求有多强烈
热度 4 Newhuang 2016-3-11 16:15
当大数据时代扑面而来的时候,图书馆是提前应对,还是被扑倒?提到这个问题,估计同行们都心情沉重,或佯装思考,或蹙眉挠头。我也没能力去想象,在苍茫的数据大海上,图书馆这只海燕该如何飞翔。 好吧,依然从图书馆最擅长的需求调查入手,探一探科研人员或学者们对数据的需求到底是怎样的。 从3月1日起,我们在中科院内发布“数据服务需求调查问卷”。截至到3月9日,收集问卷269份。 调查结果: 1 、 73.23% 的调查者了解有同行利用数据挖掘或分析方法来发表论文; 2 、在科学研究中,科研人员用到最多的数据为文献中出现的数据和原始实验数据(包括观测数据); 3 、 67.66% 的调查者对发表数据挖掘和分析相关文章感兴趣; 4 、科研人员在利用数据遇到的最大困难,是感觉数据量庞大且缺乏规律,不知道如何整理,需要技术支持,以及缺少高效的数据采集、处理、分析工具; 5 、科研人员获取数据最常用的方式,是自己一点一点下载和累积; 6 、科研人员最希望文献情报中心提供的数据服务形式,是按照科研人员的需要提供数据整理加工; 7 、科研人员最希望的数据服务合作方式,是有关机构面向科研人员提供非赢利性服务; 8 、 43.87% 科研人员对数据成果的保密及期限有要求,希望成果属于委托人,保密期至少 1 年。 问卷反馈具体情况,如下: 第 1 题:您知道,有科研人员利用数据挖掘或分析方法来发表论文吗? 第 2 题:您在科学研究中是否用到如下的数据? 第 3 题:您是否对基于大量科技数据进行科学研究感兴趣? 第 4 题:您认为在利用大量数据时,有哪些困难? 填写其他困难的答案包括:数据的准确性;数据可靠性未知;时间精力有限;人为障碍或商业行为,如气象、水文数据,是最可靠的,但是收费奇高,本身是大数据没错吧,单个收费,也成了大数据,极大讽刺;利用大数据出成果慢、少;缺乏想要的试验数据。 第 5 题:您通常以何种方式获取大量数据? 填写其他方式的答案包括:院文献中心(含分中心);数据库;自己通过实验或者仪器获得;网上搜;代码;测序。 第 6 题: 您希望 提供什么形式的数据服务 ? 其他形式的答案包括:原始数据最好。 第 7 题: 您希望以何种合作方式获得数据服务? 其他方式答案包括:可像订购手机话费的套餐那样,按需选择 第 8 题: 您对数据服务成果的保密及期限是否有要求? 其他答案包括:付费的话成果全部属于委托人,公益的话属于双方;非国家和军事类为什么要保密。 第 9 题: 是否希望为您提供数据服务? 希望提供服务的有 233 人, 占比为 87% 。 目前,调查问卷时间还没有结束。以上的 调查结果,供同行参考。
9030 次阅读|4 个评论
UIUC图书馆讲座:数据管理(Introduction to Data Management)
terahertz 2015-4-7 05:13
当地时间2015年4月6日下午1点在图书馆314房间参加了Data Management Workshop Series的第一部分,Introduction to Data Management,大约20人参加了本次研讨会。 本次的主题是 Data Management的入门,主要讲述了三个问题:一是开展数据管理的背景,有来自科研人员的实际需要,也有基金组织和期刊出版社的要求;二是 开展数据管理的意义或者好处,主要有满足基金要求、节约时间、让自己的数据能够被更多的人理解和访问;三是主要介绍了数据管理的各个组成部分:计划、组织、文档、备份与存储等。
个人分类: 出国留学|2621 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-16 04:19

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部