科学网

 找回密码
  注册

tag 标签: 科研数据

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

国内外数据治理研究进展:内涵、要素、模型与框架
terahertz 2017-11-7 08:51
(本文发表于《图书情报工作》2017年21期P 137-144 ) 摘要: 深入探析国外数据治理内涵、要素、模型与框架等,为我国数据治理的全面发展提供更为具体的建议和更为明晰的规划。 采用文献调研和网络调查相结合的方法,全面梳理国内外数据治理的研究现状。 国外数据治理研究主要集中在理论探索、模型框架以及实践应用三个方面;国内研究侧重于理论分析,尚且缺乏模型与框架等应用研究。结合已有研究,从数据治理的内涵、要素、模型与框架出发,分析已有数据治理模型的类型、特点、问题、挑战与机遇,提出开展数据治理活动的对策建议。 关键词: 数据治理 , 数据管理 , 开放数据 , 科研数据 , 数据科学 网络链接: http://www.lis.ac.cn/CN/abstract/abstract21938.shtml
个人分类: 发表论文|4361 次阅读|0 个评论
高校科研数据管理理论与实践
热度 1 terahertz 2017-11-3 15:59
《高校科研数据管理理论与实践》专著于2017年8月由江苏大学出版社出版。 主要包括9章: 第1章  绪论 1.1 科研数据管理研究背景 1 .2 科研数据管理研究进展 1 .3 研究思路、内容与方法 1 .4 本章小结   第2章 科研数据管理基本概念 2 .1 科研 数据 相关概念 2.2 数据管理 相关概念 2.3 数据科学相关概念 2.4 本章小结 第3章 科研数据生命周期理论 3.1 专业 机构的数据生命周期 3.2 高校的数据生命周期 3.3 本章小结 第4章 高校科研数据管理政策体系构建研究 4.1 高校科研数据管理政策 调查研究 4.2 高校科研数据管理政策典型 案例研究 4.3 高校科研数据管理政策 体系构建 研究 4.4 本章小结 第 5 章 高校科研数据管理服务内容 模型 研究 5.1 高校 科研数据管理服务文献调研 5.2 高校 科研数据管理服务网络调查 5.3 科研数据管理服务 内容模型 构建研究 5.4 本章小结 第 6 章 高校科研数据管理服务体系构建与策略 研究 6.1 高校科研数据管理服务 现状 6.2 高校科研数据管理服务体系案例 6.3 高校科研数据管理服务体系构建 6.4 高校科研数据管理服务策略 6.5 本章小结 第 7 章 国外 高校科研数据管理服务实践 研究 7 .1 高校科研数据管理服务案例 7.2 UIUC 科研数据管理服务阶段 7 .3 UIUC 科研数据管理服务体系 7. 4 UIUC 科研数据管理服务启示 7 .5 本章小结 第 8 章 国外 高校科研数据管理教育实践 研究 8 .1 Data Curation 研究现状 8 .2 UIUC 科研数据管理教育实践基本概况 8 .3 UIUC 科研数据管理教育课程案例项目 8 .4 UIUC 科研数据管理教育实践案例项目 8 .5 本章小结 第 9 章 我国高校 科学 数据管理实践 研究 9.1 我国科学数据管理 实践 9.2 武汉大学科学数据管理 实践 9.3 复旦大学科学数据管理 实践 9.4 北京大学科学数据管理 实践 9.5 我国高校科学数据管理 实践 比较 9.6 本章小结
个人分类: 图书情报|3585 次阅读|2 个评论
国外科研数据管理研究综述
terahertz 2017-10-13 08:41
(本文发表于《情报理论与实践》2017年第10期P130-134) 摘要 : 深入探析国外科研数据管理研究热点,能够为我国科研数据管理提供更为清晰的发展规划和更具针对性的建议。 通过网络调研和文献调研对国外科研数据管理的文献进行概念辨析和热点探讨。 国外科研数据管理研究热点主要集中在数据生命周期理论和科研数据管理服务。文章从科研数据管理政策、数据生命周期理论和科研数据管理服务体系构建3个角度提出我国开展科研数据管理活动的对策建议。 关键词 : 数据科学;科研数据;数据管理;开放数据
个人分类: 发表论文|2814 次阅读|0 个评论
英国高校科研数据管理政策内容调查及启示
terahertz 2017-1-18 09:16
(本文发表于《图书情报研究》2016年第4期P35-44) 摘要: 采用网络调查和内容分析法,在明确英国科研数据管理政策现状的基础上,分析其20所高校的科研数据管理政策并深入总结政策总体要求及内容,选择兰开斯特大学、利兹大学以及巴斯大学3所数据管理特色鲜明的高校作为典型案例,进行详细解读,发现英国高校制定的数据管理政策和数据管理模式在政策内容体系、动力机制以及责任细化等方面都可给我国高校的政策制定提供重要经验与启示。 关键词: 科研数据管理;;高校;;数据政策;;英国;;科研数据
个人分类: 发表论文|2389 次阅读|0 个评论
2016年研究数据管理与智能分析工具使用培训(湖南大学)
terahertz 2016-12-15 19:37
2016年12月13-15日,“研究数据管理与智能分析工具使用培训”在湖南大学举行。
个人分类: 图书情报|3123 次阅读|0 个评论
美国NIH"作者手稿可用于文本挖掘" ——你知道如何用吗
OPENRESOURCES 2016-3-18 19:55
PMC是美国NIH 非常著名的一个开放获取论文仓储。PMC拥有 超过 30 万美国国立卫生研究院( NIH )资助的科学家作者手稿( 作者的手稿文件是 PMC 开放获取集子集中的一部分 )。而最近, NIH宣布 将这些论文以公众获取的方式向全世界提供文本挖掘。 用户可以通过 ftp://ftp.ncbi.nlm.nih.gov/pub/pmc/manuscript/ 下载 XML 或纯文本格式的 NIH 资助作者手稿。内容包括 2008 年 7 月及之后 NIH 存储在 PMC 的所有稿件。公众不仅可以通过 PMC 访问手稿的全文、附图、表格和多媒体文件,而且可以下载 XML 文件和全文的纯文本文件。 这个消息对于众多从事相关领域工作的科研人员绝对是一个重大利好。以往,这些论文大多只提供在线或PDF的阅览或下载,科研人员要想对相关研究的所有论文(暂且不论是否真能找全所有论文)中的实验数据、方法等等对比、分析,往往要一篇篇的去看论文、收集数据, 这个过程往往是非常枯燥的、低效的、费时的。 现在,NIH如此善解人意的将这些论文开放给大众进行挖掘,科研人员收集数据、分析已有成果的数据从此变的so easy!按照上面给定的链接查找和下载自己想要的论文的XML格式版,然后利用一些技术手段或数据分析工具分分钟将有用的数据和分析的结果奉到你面前! 不过,有的科研人员会说,巧妇难为无米之炊啊,我不懂数据挖掘技术和工具怎么办?怎么办?放心好了,对于大部分专业的研究人员来说,不懂这些工具或技术很正常,科研人员的时间是相当宝贵的,是用来做科研的,不是用在进行数据挖掘和分析的,这方面,自然可以请专业人员来做。比如,中科院文献情报中心有关团队已经在开展为科研人员提供数据挖掘的服务了,感兴趣的可以看黄金霞的一篇博客:看 http://blog.sciencenet.cn/home.phpmod=spaceuid=2908120do=blogid=962019
个人分类: OA资源|4717 次阅读|0 个评论
UIUC图书馆讲座:数据管理(Introduction to Data Management)
terahertz 2015-4-7 05:13
当地时间2015年4月6日下午1点在图书馆314房间参加了Data Management Workshop Series的第一部分,Introduction to Data Management,大约20人参加了本次研讨会。 本次的主题是 Data Management的入门,主要讲述了三个问题:一是开展数据管理的背景,有来自科研人员的实际需要,也有基金组织和期刊出版社的要求;二是 开展数据管理的意义或者好处,主要有满足基金要求、节约时间、让自己的数据能够被更多的人理解和访问;三是主要介绍了数据管理的各个组成部分:计划、组织、文档、备份与存储等。
个人分类: 出国留学|2598 次阅读|0 个评论
数据丢失正威胁科研界 – 意得辑专家视点 Editage Insights
editage 2014-11-5 19:27
你有想过,如果你的研究数据突然不见了,会怎么样?这对科研人员来说无疑是个噩梦,而有些人还真的不幸遇到了,数据丢失固然是很吓人的事,但有些研究人员储存数据的方法更是让人震撼,先前加拿大温哥华英属哥伦比亚大学(University of British Columbia ,UBC )的进化生态学家Timothy Vines 曾在他的论文“ The Availability of Research Data Declines Rapidly with Article Age ”中提到,研究人员承认曾经把数据存储在阁楼、车库的箱子等地方,这种数据储存方式跟数据丢失基本没有两样。 不管是处在什么阶段的研究人员都必须面对研究数据管理的长期议题,Nature 中的 文章 用 统计数据来呈现数据存储的重要性: 数据正在快速增长 ,目前世界上有 90% 的数据是近 2 年产生的,而科研数据的年增率是 30% 。尽管资金投入有显著的增长,但 数据仍然没有有效的管理 ,目前全球在 RD 上的支出粗估为 1 万 5 千亿美元 ,但数据却不停在消失,数据的可取得性正以每年 17% 的速度在下降,超过 20 年以上的数据有 80% 已经不见。 上面的数据显示出科研界面临严重的数据管理问题,数据的丢失无疑是对科学的巨大损失,不足的数据会使得某些研究无法复制再现,曾经 发生过一个案例 ,农业研究人员Melvin McCarty 自1958 年到1973 年这 15 年间在布拉斯加州附近记录过各种植物以及青草的生命周期,40 年后,生态学家 Lizzie Wolkovich 开始寻找 Melvin McCarty 的数据来探究气温上升对植物生命周期的影响,当时 Melvin McCarty 已经去世,原始数据也找不到了。这些数据一旦丢了就无可挽回,重新搜集数据更代表着额外的支出。 研究数据会丢失的主要原因是数据的来源只有研究人员,因此拥有数据的人应该利用工具来有效管理数据,将数据妥善保存,一些可用的工具有:电子记事本( electronic notebooks )、云存储服务 (cloud storage services )中的 GoogleDrive 和代码托管网站(code hosting sites )中的 GitHub ,以及最近的工具 Projects 。 除了研究人员,期刊也扮演保护数据的重要角色,目前已有许多期刊要求作者在投稿时提供研究数据,确保数据的可取得性并完善保护, 数据共享被视为迈向开放科学的必要之路 ,因为数据共享能保护数据,促进科技的进步。 研究数据是无价的,科研人员和期刊应共同努力确保数据不会丢失。 您是否有使用数据管理工具?欢迎分享您的经验与看法。 延伸阅读: 原始数据是什么? 数据共享这一步走对了吗? ∷意得辑科学网博客 内容皆来自《 意得辑专家视点 》,转载请注明出处 ∷ 【 意得辑 提供专业 英文论文修改 、 学术论文翻译 、 英文论文发表一站式服务 www.editage.cn 】 ____________________________________________________________________________________________ 完整原文刊载于 意得辑专家视点 : 数据丢失了怎么办? http://www.editage.cn/insights/what-would-happen-if-you-lost-all-your-data
个人分类: 科研影响力和研究质量|3668 次阅读|0 个评论
博士后出站报告使用他人为博士论文服务数据是否涉嫌科研数据剽窃
热度 6 liranran 2013-7-12 15:55
博士后出站报告使用他人为博士论文服务数据是否涉嫌科研数据剽窃? 尊敬的科学网的朋友,大家好: 目前有一个问题想向大家咨询。我有两个朋友,a和b,a是职工,博士后,今年出站,b是硕转博的博士,明年毕业,遇到一个问题:两人关注于同一个研究区,a做地表水-地下水的耦合关系研究,b做研究区的水环境演变及生态风险评价。 由于b是 硕转博 的博士 ,2011年4月转博报告就既定了研究内容和论文的大概研究框架 (转博报告是单位通过学生汇报未来研究内容、方法、思路等由 专家评审考核硕士是否有资格转为博士 ) ,其中第三章即为:研究区水环境演变;a是2011年7月进站,也做相同的研究区,在进站报告、中期考核以及下一步工作计划和存在问题中均没有提及其博后框架中含有:水环境演变这一部分内容。但是今年出站的报告中,用了30页的内容对水环境演变予以了分析和阐述,所用的历史数据是由b整理(已经成文,投稿后被拒,正在修改,也由a修改指导过),而且研究区资料本来就很匮乏,在博后报告中也用到了b为博士论文服务的数据。 虽然a认为:他的研究只是把水环境演变作为背景调查,而且别人没有研究过,而且b的小论文中没有交代清楚,所以,你分析不出来还不让别人分析了?而且,他认为最终的落脚点不同,他认为是为地表-地下水的耦合做的基础,但是数据是一致的,而且,表现形式肯定也会面临重复。虽然在b的实验设计、野外采样、数据分析上,a都给予了大量的帮助,对于一个刚摸索科研的学生而言,遇到这样帮助自己的老师是幸运的,但是,这并不意味着b就要把自己用于博士论文的数据与a共享,而且,如果从工作量的角度,b也为a在野外工作20多天采集地下水的数据。而也正是因为a的帮助,在a向b索要资料是,b都给与了提供,但是,b以为这数据是用于地下-地表水的耦合分析,例如:通过地下水与湖泊水化学特征的对比,是否能证明近湖地下水与湖水存在交换。而且,a在地下水的分析中仅获取了八大离子的数据,而b为了考虑湖泊的生态风险,对营养元素、有机污染都做了分析,但是,这些数据全部被a包含在了出站报告中。 a口头许诺出站报告不会上网,而且不用这部分数据写中文文章。b也终于意识到了自己的天真和幼稚,要求a要么删除其中使用b采集、获取、整理的为b的博士论文的数据,要么就在数据使用处表明:此数据有b博士采集、获取、整理并为b的博士论文服务,否则,将追究a侵占b科研数据的法律责任。 野外工作的开展应该有一个服务的主旨,大量使用b的数据如果不注明,b毕业论文的第三章要么严重缩水,而且去年的实验数据的分析也要有所区别,否则就有可能面对剽窃他人科研数据的质疑。最关键的是:数据所有权归谁?虽然a给予了指导,做了工作,但最终目的是为b的论文服务的呀。 一句话,由于b缺乏数据保护意识,顾虑人情才有了现在的局面,我想向大家咨询:a的这种行为是否涉嫌科研数据剽窃? 谢谢各位老师和朋友,请给与宝贵意见,谢谢!
7899 次阅读|16 个评论
大数据时代下科研数据的共享及处理
shawn360 2013-3-27 13:36
1 、大数据、云计算与科研数据 ² 什么是大数据? n 引发大数据热的几个因素(技术成熟、应用推动) n 大数据的特征( 4V 论 VS 周涛论) ² 大数据与云计算的关系 n 一个硬币的两面 n 大数据与云计算的“惺惺相惜” ² 大数据对科研范式的影响 n 微软的预言:第四范式 n 数据密集型科学的三个基本活动 n 大数据与科研数据关系 n 科研数据的困惑 2 、科研数据共享服务实践与挑战 ² 科研数据共享的意义 ² 科研数据共享的价值所在 ² 数据堂的科研数据共享实践 n 科研数据云计算 n 科研机构数据专区 n 科研数据直通车 n 数据挖掘竞赛 3 、科研数据 / 研发数据的处理应用 ² 大数据应用跑到了科研前面 ² 大数据处理一般流程 ² 科研数据处理应用案例 n 图片、视频、语音、文本等非结构化数据的处理 n 应用场景及学科相关 4 、结语 ² 大数据生态环境 ² 不仅仅是进化 报告于2013年3月25日中国科学院国家科学图书馆智慧信息中心
5011 次阅读|0 个评论
[转载]中英五大数据中心签署大英图书馆DataCite服务,领航科研数据共享
shawn360 2012-11-2 09:13
编辑推荐: 华大基因同四家位于英国的数据中心(即考古学数据库服务、英国国家资料库、英国自然环境研究委员会和科学技术设施委员会)均签署了该项服务,成为首批与大英图书馆就DataCite服务展开合作的机构。据了解,华大基因是参与该项目的首个亚洲数据中心。 正文: 2012年10月29日,五大主要数据中心致力通过大英图书馆(British Library)的DataCite服务使科研人员可以更加轻松地访问和使用研究数据。大英图书馆DataCite服务为全球性的服务项目,其旨在解决查找、访问和再利用科研结果的相关问题。华大基因同四家位于英国的数据中心(即考古学数据库服务、英国国家资料库、英国自然环境研究委员会和科学技术设施委员会)均签署了该项服务,成为首批与大英图书馆就DataCite服务展开合作的机构。据了解,华大基因是参与该项目的首个亚洲数据中心。 数据来源于所有参与组织,主要涵盖从冰核到基因序列,从文化遗产到当前人口中提取的信息。这些数据都将采用数字对象标示符(Digital Object Identifiers, DOI)进行标识,从而使其能够检索和引用。目前,DOIs已被广泛使用,其可为学术期刊文章提供永久性链接。数据访问问题已成为当前科研人员所面临的巨大挑战之一。此次合作将为数据的访问问题提供一条实际的解决途径。英国皇家学会于今年七月份曾推出一期特刊《科学是一个开放性的事业》(Science as an open enterprise),主要倡导科研人员应该在其领域甚至更广泛的科研领域内对所拥有的数据进行广泛的交流与共享。这项报告还特别提及了华大基因所发布的首个DOI数据集,即2011年欧洲爆发的导致50人死亡的致死性大肠杆菌基因组序列,将其作为报告的封面图片,并在《明智开放数据的力量》(the power of intelligently open data)一节中作为案例进行了介绍。 开放数据使科研人员在以下方面获益: • 保证数据(或数据相关信息)链接的持久性和唯一性 • 数据引用更加快捷,更易检索及访问,有利于科研人员可以更好地去验证自己的研究或他人的成果 • 可获得大量当前还无法实现的新的研究机会 • 通过共享和被引用数据可获得更高的信誉和认可度 “如何保障科研人员能够便捷地引用数据、期刊文章以及其他参考信息,已经成为越来越重要的问题。而DataCite的出现将会给当前科研人员互相交流研究信息的渠道带来变革。”大英图书馆科学、技术及医学部门负责人Lee-Ann Coleman表示,“作为致力于为科研人员提供信息和其他实质性支持的重要机构,我们相信大英图书馆DataCite服务将能够解决数据共享中存在的一些障碍。我们期待这五个机构的参与能够吸引更多的单位参与进来,这将是改变共享资源模式迈出的重要一步。” 华大基因执行院长王俊表示:“华大基因是全球最大的基因组学研究机构以及全球最大的生物学数据产出者之一。DataCite的目标为建立认可和奖励数据产生者的学术结构,这点深深吸引着我们。通过DataCite的DOI标识,我们发布了之前一些未公开的数据集,使得这些数据已经能够被《科学》和《自然》等顶级期刊杂志所引用和认可。我们期待能够继续追踪和跟进我们的数据带来的影响。”除了能激励研究者更及时发布他们产生的数据,数据的引用也会提供更好的机制以保证这些数据集和引用数据的出版物之间的链接和关联。华大基因已使用该功能发行了最新的“大数据”期刊杂志——《GigaScience》。 据了解,以“数据和文献整合” 为主题的特别会议将于今年12月1日在香港举办的第七届国际基因组学大会暨亚太生物信息学峰会(ICG-7 Bio-IT APAC 2012)上召开。届时,各位与会人员将共同探讨有关数据出版和引用方面的更多新进展。 附大英图书馆DataCite服务网址: http://datacite.org/ 内容详见: http://www.datatang.com/news/148
2778 次阅读|0 个评论
搜狗实验室数据专区开通,提供丰富数据资源
shawn360 2012-9-5 09:29
搜狗实验室依托搜狗搜索技术研发能力和海量数据获取能力,搜狐矩阵的互联网资源,清华-搜狐搜索技术联合实验室面向产业界的研究工作,自2006年11月成立以来一直致力于推动互联网相关技术(中文处理技术、搜索引擎技术和多媒体处理技术等)发展。目标是将搜狗实验室发展成为一个提供相关技术数据资源和效果评测的平台。 搜狗实验室先后提供了互联网语料库、网页链接关系库、用户查询日志等海量、真实的数据资源,免费供研究机构使用。这部分数据资源现已受到研究界的普遍关注,已有200多所国内外高校实验室、企业研究机构的1000多个注册用户下载、使用。这些数据也被用到清华-搜狐联合实验室合作发表的包括WWW、SIGIR在内的多篇论文中。 搜狗实验室数据专区此次开通,将提供丰富的Sogou技术报告、语料数据、新闻数据、图片数据及自然语言处理相关数据,这些数据资源均以无偿的形式与业内研究人员和热爱搜索行业的有志者共同分享,以促进学术界和产业界的良好互动。 马上访问搜狗实验室数据专区: http://www.datatang.com/member/73042/
6425 次阅读|0 个评论
[转载]CCF网站推出科研数据免费下载服务
shawn360 2011-10-13 15:22
为了充分满足中国计算机学会会员在论文写作、科学实验、教学实习、项目研发等相关过程中的科研数据需求。CCF网站( www.ccf.org.cn )联合数据堂( www.datatang.com )推出了面向全体会员的“CCF科研数据”服务,该专栏提供了10000多组科研数据集的免费下载。数据分布在机器学习、数据挖掘、人工智能、信息检索、算法理论、数据库、计算机图形、人机交互、自然语言处理、网络和通讯、视频处理、科学计算、计算机仿真、万维网、计算生物学、语音处理、图像处理等多个科研领域。 盘活现有科技资源,实现科技数据共享是科技部十二五期间的主要工作之一。“CCF科研数据”是在计算机领域实现科研数据有效共享一个实践。科研数据是一种特殊的资源,有别于常用的科技图书、论文、报告等文献,但对科研工作者来说,它又是必不可少的科技创新资源,科研数据受共享机制等各种原因限制,一直未能发挥最大作用,通过“CCF科研数据”,相信可以为会员带来更丰富的资源、为科研工作带来更多便利与更大价值。 马上访问: CCF 科研数据 原文来自中国计算机学会网站: http://www.ccf.org.cn/sites/ccf/nry.jsp?contentId=2636902149379
2350 次阅读|0 个评论
两种科学数据/科研数据的获取途径
热度 1 shawn360 2011-9-2 10:20
“国家投资产生的科学数据主要包括两种类型,一是行业部门长期采集和管理的科学数据;二是各类科技计划项目产生的研究型数据。长期以来,获取科研数据难一直是科技工作者反应比较集中的问题之一,很多科学家一直呼吁由国家财政支持的科研项目的数据能够实现共享”,科技部基础司沈建磊语。 “而数据只有流动起来,才能产生最大价值。科学家们在开展一项科学研究时,第一件要做的事,可能就是搜索一下前人做过哪些研究、取得过哪些成果,尽量多地了解和自己研究课题相关的数据,这些研究型数据对他们来说可能非常有用。”孙九林原始如是语。 科研数据的获取和共享,的确是老大难问题,就目前科学数据获取的途径看来,可以看看以下两种: 1、中科院科学数据库( http://www.csdb.cn/ ) 科学数据库1987年正式启动数据资源建设,1988年,中国科学院批准“科学数据库及其应用系统”在对外活动中使用“中国科学院科学数据库”的名称。在“八五”、“九五”期间,科学数据库及其应用系统被列为中国科学院基础研究特别支持项目,“十五”期间,被列为中国科学院信息化建设重大项目。科学数据库数据内容比较丰富,覆盖了物理、化学、天文与空间、材料、生物、地学、资源、环境、能源、海洋等众多学科领域,数据库种类包括数值库、事实库和多媒体库。主要的主题库如下: 1) 理化性能及分析数据库 2)新疆资源生态环境数据库 3) 高能物理科学数据库 4)纳米研究专业数据库 5) 新能源与环保专业数据库 6)中国典型煤种热转化特征数据库 7)储氢材料数据库等等 2、数据堂-科研数据共享平台( www.datatang.com ) 数据堂是一家新型的数据共享网站,主要的功能是为国内外高等院校、科研机构、研发企业及相关科研人员提供科研数据查找、数据需求发布、数据分析等服务内容。数据堂网站与科学院数据库的区别在于,其内容很多是由科研用户自己上传的,用户还可以发布数据需求,目前其主要覆盖计算机科学相关领域的科研数据领域,如下: 1) 数据挖掘 2) 图像处理 3) 自然语言处理 4) 机器学习 5) 智能交通 两个网站的内容都是以提供科研数据内容及相关服务为主,但差异很大,科学数据库系统性的大数据居多,数据堂分散的小数据居多,在数量上也不可同日而语,但都可以作为大家日常查数据的方式之一。
6792 次阅读|2 个评论
如何用科研数据设计“好的”统计图形?
郭崇慧 2011-3-15 17:39
如何用科研数据设计“好的”统计图形?
在撰写科研论文时,经常需要利用科研数据来设计统计图形。虽然借助于计算机可以很容易地绘制出漂亮的图形,但许多初学者往往过于注重不必要的修饰,而忽略了图形所要表达的信息。 事实上,一张精心设计的统计图形是展示数据的最有效工具。通常统计图形具有四个方面的作用:( 1 )探究数据集的内容;( 2 )用于发现数据之中的结构;( 3 )检查统计模型之中的假设;( 4 )沟通传达分析结果。最重要的是一幅 “ 好图 ” 可以准确表达数据所要传递的信息。 Edward R.Tufte 指出,一张好的图形应包括以下基本特征:( 1 )显示数据;( 2 )让读者把注意力集中在图形的内容上,而不是制作图形的程序上;( 3 )避免歪曲;( 4 )强调数据之间的比较;( 5 )服务于一个明确的目的;( 6 )有对图形的统计描述和文字说明。 Edward R.Tufte 还提出了五种鉴别图形优劣的准则:( 1 )应精心设计以有助于洞察问题的实质;( 2 )使复杂的观点得到简明、确切、高效的阐述;( 3 )在最短的时间内以最少的笔墨给读者提供最大量的信息;( 4 )一张好的图形应当是多维的;( 5 )表述数据的真实情况。 参考文献: 1. Edward R.Tufte . The Visual Display of Quantitative Information. 2nd Edition. Cheshire, CT, USA: Graphics Press. 2001. 2. 贾俊平 . 统计学(第二版),清华大学出版社, 2006
个人分类: 科研笔记|5528 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-28 03:12

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部