科学网 › 标签 › 数据共享

标签: 数据共享

相关帖子	版块	作者	回复/查看	最后发表

没有相关内容

相关日志

欢迎参加DataONE关于数据管理和共享的调查: 热度 2 book 2013-11-5 17:54; DataONE正在做一个匿名网上调查，关注科学家对于科学数据的管理、使用、共享等，欢迎大家参与调查。问卷网址： http://tinyurl.com/DataONEScientistsSurvey ----- Scientists and research data: Continuing to build an understanding of your data needs Led by our Usability and Assessment Working Group , DataONE is conducting an online survey to better understand how scientists work. Your responses will help us better understand how scientists create, preserve, manage, and share their data which will then allow DataONE to better serve their data management needs. The questionnaire should only take about 20 minutes to complete. Questions relate to the data management practices of scientists, the data education practices of scientists, and how your organization and/or designated data managers are involved with your research data. Your responses will be recorded anonymously so that no one can link your responses to you personally. After completing the survey, we would be grateful if you could forward to your colleagues; faculty, researchers, lecturers, post-doctoral associates, and graduate students in sciences, technology/engineering, health sciences, and social sciences. Thank you. http://www.dataone.org/news/help-us-understand-how-scientists-work-data -----; 个人分类: 研究进展|3431 次阅读|4 个评论

大数据时代的基础是数据开放，而不是信息技术和设备: wya 2013-10-30 10:28; 博主注：数据无法轻易获得，何谈挖掘和使用数据？因此，大数据时代的基础是数据开放，而不是信息技术和设备。数据开放的核心就是打破行业与部门的数据垄断收益。这是最难解决的。某些国家在数据收集上不遗余力，项目经费庞大，甚至以公权力收集数据。但在民众需要用数据时，往往需要出钱购买，而且要价不低。其中最有用的数据往往给钱也不行，需要凭关系。当然，这样的数据不用也罢，因为没有第三方使用、检验、评估的数据往往质量不高，甚至弄虚作假。各国政府掀起开放数据运动，英国政府一马当先 http://data.163.com/13/1030/05/9CDLHN7N00014MTN.html 开放政府数据的意义不仅在于可以推进民主、政府公信力，使民众了解并行使自身的权利，同时能为社会和企业所用，从而创造更多社会价值。比如，在美国政府数据网站上的一份由16万份行政区地图组成、精确到的道路、建物、水系、行政区界线等详细资料的庞大美国地图，就是网站上被下载得最多的资料之一。这份地图将会为地图公司和导航设备企业提供实际的帮助。 http://news.163.com/special/00012Q9L/govwebsite.html Data.gov网站（左图）提供由美国联邦政府行政部门所产出的高价值、可供再处理数据，免费供公众查询、研究和利用。作为一个政府数据集的大型集散网站，这个网站提供从人口普查地图到生物物种保护提示等信息，甚至收录这些数据集的后设资料、以及处理所需的软件工具，所有人都可以自由下载使用。网站的数据资料不仅有利于公众了解政府政策，此外也对居民的日常生活起到实在的帮助。比如，一份由16万份行政区地图组成、精确到的道路、建物、水系、行政区界线等详细资料的庞大美国地图，则是网站上被下载得最多的资料之一。; 个人分类: 社会观察|4011 次阅读|1 个评论

《自然》编辑对我的采访：关于数据共享: 热度 4 book 2013-8-6 01:53; 最近收到《自然》编辑 Richard Van Noorden 的邮件，他正在给 Nature 准备一篇有关数据共享的文章，给年轻科学家一些数据管理和共享方面的建议。他了解到我做了一些数据共享方面的工作，希望我能回答一些问题。下面把我们俩聊到的一些问题列出来，或许对一些人会有些帮助。 1. 建议：应该将数据共享在学校的数据库、专门的数据保存机构（ Figshare ， Dryad ，或其他）、还是个人网页 —— 或者所有这些地方？科学家应该让自己的数据尽可能地能够被检索和引用，这不仅对自己有益（比如增加数据及相关文章的引用），也有利于其他科学家重复利用数据。我首先推荐专门的、学术界公认的数据保存机构，如果该数据库能够为数据集提供可引用的对象（ DOI ，永久链接、数据遍号等）则更好。随着数据共享进程的快速发展，我认为越来越多的数据库将为数据集提供 DOI 。除去将数据保存在专门的数据库，我还建议同行们能够将数据共享在本单位的数据库或者个人网页，例如可以提供指向他们数据集的 DOI 或永久链接，以及数据集的引证方式。一些知名的数据保存机构，如 GenBank （及 INSDC 的其他数据库）用于保存核酸和蛋白序列数据等， GBIF （全球生物多样性信息机构）用于保存物种分布数据， NOAA （美国国家海洋和大气局）的国家气候数据中心用于保存气候数据， Dryad 用于保存生态和进化领域的数据集（主要是论文相关，没有格式限制）， figshare 用于保存任何类型的数据。好的科技期刊一般也会为作者提供数据可用性（ dataavailability ）建议，比如： Nature journals: http://www.nature.com/authors/policies/availability.html ; Science : http://www.sciencemag.org/site/feature/contribinfo/prep/gen_info.xhtml#dataavail ; BioMed Central journals: http://www.biomedcentral.com/about/supportingdata ;PLoS journals: http://www.plosone.org/static/policies.action#sharing 。一些研究领域也有它们特定的推荐。我们做过的一项关于生物多样性数据共享的国际调查研究发现，仍然有很多研究者并不熟悉他们自己领域的数据保存机构（ Huanget al, 2012, Conservation Letters 5: 399-406 ）。我建议年轻科学家们要多从年长的同行和期刊的作者指南等地方获得有关数据保存机构和他们领域内常规做法等信息。 2. 建议：在你开始数据共享之前，你期望知道哪些东西？我有关这方面的建议涉及数据共享流程的不同步骤。首先，年轻科学家应该了解数据共享和数据可用性对于科学发展非常重要，这里有很多原因，比如研究的可重复性、数据整合分析、科研道德等。第二，他们应该了解自己的研究领域用到什么样的数据，常用的数据格式是什么；还应该熟悉相关的数据保存机构以及数据提交工具。第三，在数据收集和管理过程中，要尽可能的使用标准数据格式、准备元数据描述、以及做好质量控制；还应该注意让数据集能够更容易与其他数据集整合（比如使用一些通用的数据项）。第四，当发表和共享数据时，需要了解期刊和数据库的政策和要求，并选择使用知名数据保存机构，提供元数据描述非常重要。为了让自己的数据集能够更好地被检索和引用，最好选择提供 DOI 的数据库。另一件重要的事情是数据分享者有义务及时更新自己的数据集（如果有需要的话）。最后，我自己的经历告诉我，共享和开放的态度总会给你意想不到的收获。 3. 不同领域是否有各自的标准，哪些领域在数据共享方面比较领先？是的，不同研究领域往往有自己的标准，并有特定的数据保存结构。但不同领域面临着相同的挑战，比如如何刺激科学家个体的共享意识和共享实践。除去特殊的政府驱动的项目（比如 NASA ），我认为遗传学（及相关领域）在数据共享方面比较领先。比如，在遗传学、基因组学、生物医学、分子生物学、分子系统发育等领域，大多研究者都知道在发表论文时应该将核酸和蛋白质序列数据在 GenBank （及其他 INSDC 数据库）共享（ Strasser, 2008, Science 322: 537-538 ）。然而，虽然这些数据的共享在这些领域是一个基本要求，但仍然有很多研究者并没有将他们的数据共享出来（ Nooret al, 2006, PLoS Biology 4: e228 ），或者说，期刊的要求并不是那么严格。在其他研究领域，研究者的数据共享意识和实践可能更糟。我认为这对于期刊和数据库将来采用联合数据保存政策，以及改进工作流程有重要的暗示（ Huang Qiao, 2011, Trends in Ecology Evolution 26: 377-378 ）。期刊和数据保存机构的政策应该能够保证作者或数据分享者适当的利益。为了帮助作者们适应数据保存政策，期刊可以采用更加严格的政策，比如要求论文正式发表前必须将论文相关数据提交至相关数据库共享。 4. 我想知道资助机构的政策如何促进研究者改变他们的行为方式，或者说这更多的是一个文化方面的事情？我们的调查研究（ Huang etal, 2012, Conservation Letters 5: 399-406 ）设计了特定的问题来了解资助机构和科学家的工作单位的政策对于数据共享的影响，虽然只有三分之一的科学家说他们单位或资助机构鼓励数据共享，我们的研究显示这些受到鼓励或政策要求的科学家更愿意共享。因此，资助机构可以通过提供有关数据管理的详细政策或指南来促进数据共享。你可能知道美国国家科学基金会从 2011 年 1 月开始要求所有项目申请书中包含一个保证研究结果和原始数据传播和共享的数据管理计划。然而，有时候承诺并不等同于行动，恐怕几年后我们才能知道该政策的直接影响到底有多大。但毫无疑问，机构的引导在数据共享落后的国家或地区将非常重要。数据共享很大程度上可以说是文化上的事情，既跟科学家个人意识有关，也跟机构的政策有关。在我所在的生物多样性领域，我认为很多方面数据共享文化并不发达，一些主要的生物多样性数据库或大型项目“自上而下”的运作模式有其局限性（ Huang Qiao, 2011, Trends in Ecology Evolution 26: 377-378 ）。对数据共享的重要性和挑战越多，我越觉得我们应该理解如何促进科学家个体的共享文化，毕竟研究者个体才是一个稳定的共享文化的培育者，因此“自下而上”的共享是极其重要的。相关博文：同行评审的数据论文可行吗？科学家为何不愿意分享数据？; 个人分类: 科学那些事儿|9510 次阅读|4 个评论

“科学数据能卖吗”的讨论: 热度 1 book 2013-6-23 11:00; 韩健老师在新博文“ 把科学数据当艺术品卖 ”中提到的跟科学有关的艺术品，是科学数据生产和加工过程中衍生的图像等，实际上卖的并不是科学数据（ datasets ）。我这里想讨论的是跟卖数据本身有关的事儿。前几天，在兰州参加了“第一届地球系统科学数据论坛”。会议组织者挺有心，除了共享项目相关单位之外，还邀请了来自其他研究领域的研究者，以及一些地理信息公司、数据公司、共享组织的代表参加。对于我这个生物多样性领域的研究者来说，参加此次会议是很好的学习机会，不但了解了我国地球科学领域数据共享的进展情况，还从不同角度听到大家对于数据共享共性问题的看法。有的问题可能需要更多的讨论，这里先说说“公共资金支持所获得的科学数据能卖吗”这个问题。近两年国内出来一个“数据堂”公司，有些人或许已经有所了解。数据堂的标签是“科研数据共享平台”，“致力于为国内外高等院校、科研机构、研发企业及相关科研人员提供科研数据支持”，并且“在国家科技部的大力支持下，数据堂与国内著名科研机构、高等院校、科研组织通力合作”。数据堂公司的科技数据共享发起人里头，有不少中科院和知名大学的研究人员。这次会议上数据堂联合创意人之一的肖永红做了一个介绍数据堂的报告，我比较关心他提到的一个信息：科研数据的有偿使用。在他的介绍中，数据堂鼓励科研团队或研究者个人建立分享主页，科研人员在共享数据时可以自己选择免费共享（使用者免费下载）或有偿共享（使用者下载数据时需要支付堂币或积分）。另外，研究者也可以将数据卖给数据堂公司，再由公司确定如何共享。在其发布数据页面，数据堂公司列出的为何在数据堂发布数据的第一条原因就是“获得数据收益：有偿共享”。从公司层面来说，盈利是基本目的，这无可厚非，它有必要采用吸引科研人员的方式来让大家把数据拿出来。但问题是：科研人员在公共资金的支持下所获得的科研数据，理应免费共享。如果研究人员将政府公共资金支持所获得的大批量数据卖个公司，或者有偿让公众使用，是否违背了公益研究的道德准则？在跟一些与会同行的讨论中，有人提到身边就有一些研究生将数据卖给公司的例子，也有人提到项目团队里头有些保密性质的文件或数据被公开的例子，有人担心数据堂会不会成为百度文库那样的机构。大家还担心一个问题：如果越来越多的科研人员出售（应当免费的）科研数据给公司，公司将来会不会摊上事儿？我觉得数据堂公司的创意挺好，也应该有很好的发展空间，但或许它需要考虑：如果公共资金支持的科研数据不能采用出售或有偿使用的方式，那么公司面向科研人员群体的营销策略（差异化的营销策略）需要适当改变，比如免费提供数据共享平台给科研人员（免费才能吸引更多的用户，也会带来很多附带收益比如广告和数据挖掘收益），其盈利模式可以是其他社会群体或个体、企业、以及免费模式带来的附带收益。; 个人分类: 科学那些事儿|5449 次阅读|1 个评论

对“你愿意共享原始数据吗”讨论的回复: 热度 3 book 2013-6-12 20:15; 5 月 30 日晚上查邮箱，看到一个加拿大同行发来邮件说， “ 晓磊：看到一篇博文，讨论你的一篇文章，也许你感兴趣 ” ，随信发来一个链接。原来是科学网一篇博文讨论我们去年在 Conservation Letters 发表的一篇有关数据共享的文章。由于当时正是我们筹备 6 月初主办的一个国际会议最紧张的时候，我实在没空关注这篇讨论。 6 月 2 日，我们的会议开幕那天，收到科学院版纳植物园刘佳佳的邮件，“ Hello, Dr. Huang: We recently discussed one your paper, of which the idea is really good. And we have some questions on this paper on the methods section, do you think it would that be helpful on your future study or you can answer some of them? ”，刘佳佳是那篇博文的作者。看意思是他们研究组在文献讨论会上讨论了我们的文章。同样由于会议期间要处理的事情太多，我写邮件说等会议结束才能回复。我们的文章能引起他们研究组的兴趣并开展讨论，要表示感谢。这篇博文算是对《生态学文献讨论 41 ：你愿意共享你的原始数据吗？》一文的回复，对他们提出的问题（下文中下划线部分）进行了一些讨论。任何一篇已发表的文章，不同读者都会提出不同的问题，其实对于作者自己，或许也都知道缺陷所在。科学问题应该是越讨论越明了的，我也希望这样的讨论越来越多。我之前曾发博文介绍过我们这篇文章：“ 科学家为何不愿意分享数据？ ”。问题 1. 本文数据量的问题，只有一年的时间，且是 2009-2010 年，正是 meta-analysis 较为热火的年份，且只选了 3 个杂志，据我所知，这三个杂志，很多并不是第一手数据的，尤其是 journal ofbiogeography ，由于很多数据是从各个地方来的分子材料或者标本材料，或者部分数据来源于其他人，并不是自己一手采集的。所以数据严重存在 bias 且数据量不够。刘佳佳等可能在这个问题有些误解。实际上，我们文章开展的国际调查研究关注的是科学家个体对于生物多样性数据共享的认识，论文作者或者说数据提供者在我们看来是很好的对象。我们是 2011 年设计的调查，调查对象是 2009 和 2010 年在生物多样性和生态学领域三个主要刊物（ Biodiversity and Conservation , Diversity and Distributions , Journal of Biogeography ）上发表论文的通讯作者。选择刊物时我们也有过考虑，客观地说，这三个刊物所发表的论文更多地使用了原始数据。即使有 meta-analysis 类型的论文，其比重恐怕也远小于 Global Ecology and Biogeography 之类的期刊。并且对于数据共享，重要的是将数据共享出来，如果一篇论文所使用的数据是作者从众多前人文献收集来的，只要他选择将那个数据集共享，就算是一种进步。对于“并不是自己一手采集的”这个问题，还有一个更直观的例子： GBIF 的数据集，基本上来自全球生物标本收藏机构，而这些标本收藏机构的原始数据，也是众多科学家很多年采集的，也不是那个共享者一手采集的。其实我们自己也知道调查对象的集合还可以更大些，比如调查更多年份更多期刊的作者群，但当时一方面考虑到近期年份的作者群才是正在活跃的一批科学家，另一方面考虑到收集每篇论文的通讯作者电子邮件的工作量也不小。最终确定了 2 年、 3 个期刊的体量。问题 2. 问卷设计方面：如 Do you collect primary biodiversity data(species distribution) in the field yourself? 只给出了是否的选择，这是不科学的，因为很多人部分数据来源于野外。且数据有等级差异，物种分布数据的珍贵度（如数据量、数据完整度、数据质量）等没有进行区分，一同对待。如若做一个等级分析，应该是数据越珍贵，越难采集，越不愿意共享。但是很多很边角料数据当然无所谓了！刘佳佳等认为调查问卷中“你是否自己采集原始数据”这个问题有些不够全面，实际上我们在问卷中还问了 2-3 个与此相关的问题，目的是想通过相关问题的答案综合判断被调查者的研究中主要的数据来源是什么。确实，数据收集难度越大，期望科学家将其共享的难度也会越大。刘佳佳等对数据珍贵度进行划分这个建议对将来的调查研究会有所帮助。在我们目前的研究里头，由于想对科学家个体对数据共享的态度有个基本的认识，我们的问卷问题并没有划分到非常多的细节。（这里要谈到一个设计调查问卷时需要关注的一个问题，即一定不要让被调查者觉得回答你的问题很麻烦，我之前曾参与过一些问卷，由于有太多逻辑连接的问题，让人回答得很累，于是选择中途离开。）问题 3. 所有的问卷调查都是真实的吗？我很怀疑。很多老外说着可以共享，事实上不会的。所以实验数据的真实性没有得到较好的提升，设计相关的问题来排除这一类的误差。本问卷调查没有排除此类的问题，所以严重存在问题的。这个问题我觉得有必要着重说一下，因为我觉得刘佳佳这种质疑并不科学。我们认为所有的问卷回复都是真实的。一方面，被调查者都是科学家，相信大家有客观严谨的态度。另一方面，我们必须相信问卷回复的真实性，如果你连你的调查者都不相信，还怎么做调查研究。这就像做研究的时候引用前人的研究结果，你可以客观的质疑，但一定要是理性的质疑，可能大多时候你必须相信前人的结果，科学就是这样积累和发展的。并且，其实我们是可以通过综合考量被调查者对不同问题的回答来判断其真实性的，如果是不真实的回答，很难保证其答案的逻辑一致性。你会发现，其实仍然有很多人回复不愿意共享，我们的研究也揭示了共享文化并不发达。如果刘佳佳等去读读我们随论文共享的那 18 页被调查者提交的评论，或许会对大家的态度能有更好的认识。问题 4. 没有涉及到数据共享的问题，只涉及到了数据共享的好处。如数据共享是否会促进更多室内生态学家的诞生？只会统计没有野外经验。分工更明确，以至于现实和理论脱节…… 我们文章中，既涉及了目前数据共享中存在的问题，也谈到了数据共享的好处。存在的问题比如共享文化不发达、缺少共享意识、数据保存结构的问题等等，正是由于问题的存在，才会有我们给出的那些建议。数据共享的好处，是给科学家一定的动因，更多地去共享。刘佳佳等提到的“ 如数据共享是否会促进更多室内生态学家的诞生？只会统计没有野外经验。分工更明确，以至于现实和理论脱节…… ”，确实是一个现实问题，越来越多玩统计算法而不注重野外试验，是生态学发展中面临的一个问题。实际上在被调查者的评论中，以及我们文章中，都有提到一些。我们关注的，还有另一个问题，即很多基于统计分析的生态学论文结果的可重复性，有同行在评论中说，“很多人不愿意共享原始数据，是怕被发现他们的论文中统计分析结果错了”，如果实现数据共享，就可以增加对结果可靠性和和可重复性的控制。问题 5. 数据分析太弱，都是展示性数据，没有进一步分析。且让人信服度不高。如果了解我们这篇调查研究论文的目的，以及发表时这个领域的发展状况，刘佳佳等或许就不会做这样的判断。开展这个研究之前，我们能看到的都是政策者或数据保存机构在那谈论该如何如何共享，但我们极少听到作为主要数据分享者和使用者的科学家个体的声音。作为可能是第一篇涉及科学家个体对生物多样性数据共享态度的文章，我们要将数据结果真实的呈现给大家，并且我们在讨论时其实没有什么可以引用的前人研究。另外，调查性研究并不像丝丝入扣的实验性研究或公式推导。我们由调查结果给出一些相对合理的共享建议，也算是一种进步。其实，数据是最有说服力的，有时候只展示数据，可能就足够了。如果单就某一篇论文中的那些文字来评论，常能发现一些问题，比如数据不够全面、分析还可以做得更好等。但我们也要认识到，一篇论文是否应该发表，还要放大某个领域的背景下去看，看看它是否带来了一些新的信息和进展。我们这篇论文的贡献，可能正是将那些数据（包括被调查者回复的 18 页评论）以及数据反映出来的问题和建议呈现给这个领域，让相关决策多了更多的信息参考。不过，我们也在论文中提到，我们的调查研究肯定有不全面的地方，比如某些问题的设计，希望我们的工作能给未来进一步的研究提供一个参考。还是如上面说的，谢谢刘佳佳他们的讨论。希望不管是在科学网上，还是私底下，这样的讨论和交流都越来越多。; 个人分类: 科学那些事儿|7102 次阅读|3 个评论

生态学文献讨论41：你愿意共享你的原始数据吗？: 热度 3 mengchanghe 2013-5-30 08:58; Willing or unwilling to share primary biodiversity data: resultsand implications of an international survey 2012 Huang et al. Cons. Letters.pdf 咋一看，居然是中国人的文章，似曾相识，才想起来这作者以前就发表过一篇 TREE 的文章的，这话题确实很就现实 …… 文中已经讲了太多了，事实上也是做科研的人经常会碰见的问题，每个人估计也有各自感受。总体上当然是数据共享于人于己都好，关键是如何操作的问题。本文也提出了一些建议。言归正传，涉及到本文。题目是很现实的，方法是很简单的，结果是一目了然的，讨论也有很多相关的材料。总而言之，很简单明了，是很适合发 letter 的。作者在这一领域已经有比较明确的定位和知道自己该做什么的，入了行。然而，本文是很有些问题的，需要商榷： 1. 本文数据量的问题，只有一年的时间，且是 2009-2010 年，正是 meta-analysis 较为热火的年份，且只选了 3 个杂志，据我所知，这三个杂志，很多并不是第一手数据的，尤其是 journal ofbiogeography ，由于很多数据是从各个地方来的分子材料或者标本材料，或者部分数据来源于其他人，并不是自己一手采集的。所以数据严重存在 bias 且数据量不够。 2. 问卷设计方面：如 Do you collect primary biodiversity data(species distribution) in the field yourself? 只给出了是否的选择，这是不科学的，因为很多人部分数据来源于野外。且数据有等级差异，物种分布数据的珍贵度（如数据量、数据完整度、数据质量）等没有进行区分，一同对待。如若做一个等级分析，应该是数据越珍贵，越难采集，越不愿意共享。但是很多很边角料数据当然无所谓了！ 3. 所有的问卷调查都是真实的吗？我很怀疑。很多老外说着可以共享，事实上不会的。所以实验数据的真实性没有得到较好的提升，设计相关的问题来排除这一类的误差。本问卷调查没有排除此类的问题，所以严重存在问题的。 4. 没有涉及到数据共享的问题，只涉及到了数据共享的好处。如数据共享是否会促进更多室内生态学家的诞生？只会统计没有野外经验。分工更明确，以至于现实和理论脱节 …… 5. 数据分析太弱，都是展示性数据，没有进一步分析。且让人信服度不高。总之问题不少，但是本文的idea还是可以的。接：拒=3：7。这一类文章成果很容易发表啊，值得学习。; 个人分类: 文献阅读及心得|3384 次阅读|3 个评论

中国式的数据共享: 热度 11 lijianguo531 2013-5-16 21:36; 今天中午组里开会，主要参加人员有中国科学数据共享平台分区负责人和我们项目组同学老师。开这个会议的主要目的是加强项目组与数据共享平台之间的合作。在会议中，数据共享平台的负责人详细介绍了数据共享平台当中有哪些数据可以供我们使用，给我们列了一个表。同时也提出希望我们项目组的数据在不涉及保密和版权的前提下也能放到共享平台当中。我在旁边很仔细的听老师和负责人之间的交谈，仔细的听有两个原因：（1）硕士时候就在贡献平台上申请过很过次数据，成功的案例很少，除了国外都够可以免费下载的Landsat、DEM和MODIS数据以外，想了解一下成功申请的条件；（2）为什么屡试不成，想听听原因。先讲一个我自己的亲身经历。去年，因为项目需要，我想申请一个江苏省近50年以来的气象站点数据集。我就找到中国气象科学数据共享服务网，按照上面的要求注册账号→下载申请表→找导师和领导签字→院里盖章，并附上研究项目授权书、身份证复印件以及研究目的等等要求资料寄过去。半年过去了，直到今天我还没有收到半点消息。如果按照这种共享水平，我们的项目就完了。我不知道国家搞科学数据共享的目的是什么？但是我感觉最起码这是件好事，可以帮助科研人员减少用在基础数据收集方面的时间和精力，也可以服务于地方决策。但是现在的数据共享平台给我的感觉是动静大于实际效果。不过今天听这位负责人讲述之后对数据共享也有一点初步的认识和看法：（1）共享数据为什么大部分要进行离线申请？据负责人讲，其实他们也不愿进行这样复杂繁琐的工作，只是这项工作是由科技部和财政部牵头进行。财政部主要负责经费的问题，但是如果没有纸和红章等硬货就没有办法体现共享事业的工作量，经费的落实有困难。至于申请提交之后审核通过不通过的问题，那就另说了！离线申请太麻烦，这也是我多次放弃申请数据的主要原因。（2）共享数据的来源与科学性据负责人讲共享数据多源于其他国家科学基金结题获取的数据经整理之后形成，也有一些是来自于依托单位的自身数据还有一部分甚至来自于负责人的私人关系！这里很让我惊讶，科学数据共享本是国家、政府或科学团体主导的事情，需要的是政府引导，群策群力去实施。现在却需要依托单位的自身数据，甚至靠私人关系去解决数据来源问题。这本来就是一件很荒谬的事情，也是一件绝不可持续的事情，但是我也确实佩服这些能利用私人关系解决问题的人！同时数据来源的多样化就造成数据的科学性问题，这些数据是否可靠？经过甄别没有？因为如果错误的数据应用到科研当中（因为我们一般思维都是共享平台的数据是科学的、可靠的），会直接导致错误的科学结论甚至影响地区决策。（3）中国的数据共享和国外的区别写到这里写不下去了，本人土鳖，井底之蛙，不清楚国外科学数据共享的程序和规则！但是总觉得国内数据共享程度和水平还不够！各位博友如有这方面的经历，可以在这里讨论一下！; 个人分类: 学术视野|6425 次阅读|15 个评论

[转载]对地观测数据国际共享遇阻: chenhuansheng 2013-3-7 14:26; 作者：邱锐潘希来源：中国科学报发布时间：2012-2-17 7:6:3 选择字号：小中大对地观测数据国际共享遇阻 ■本报实习生邱锐记者潘希 “每时每刻，全球都有近千颗卫星在观测地球，一方面有许多重复观测，产生了资源浪费；另一方面，各国科研实力不等，观测能力也不均衡。如果能将目前各国对地观测能力加以整合，可极大增强人类应对灾害的能力。” 谈及近日地球观测组织（英文简称GEO）中国秘书处在北京启动时，中科院对地观测与数字地球中心数据技术部主任李国庆研究员作上述表示。 GEO中国秘书处设在国家遥感中心的一间办公室里。每天都有来自国内数十个部门的卫星观测数据在这里交换和上传，并作为我国的基础数据，提供给地球观测组织的87个成员国和欧盟及其他组织间进行数据共享。该组织的主要工作，即为推动国际间对地观测数据共享，最终建设一个全球性的对地观测系统。然而，现实却与理想产生了差距。欧美：亏本的买卖？中国是GEO的创始国之一。从2005年该组织成立至今，中国也一直是执行委员会的成员国和联合主席国。在该组织中国秘书处，工作人员来自国内各个对地观测相关单位。在推进各国对地观测数据共享时，他们遇到了相当的阻力。 “美国对地观测卫星有185颗，我国有50颗，而有些非洲国家一颗都没有。在全球数据资源共享问题上，美国和欧盟虽然有很多质量很好的观测数据，但就是不愿贡献出来。”李国庆说。 “在搜集各国对地观测数据时，美国曾将早已在网络上公开的数据提交给我们，以此来凑数。”一位从事对地观测数据共享推进工作的业内人士也对记者大吐苦水。分析产生这种状况的原因，恐怕在于欧美等国心态的不平衡。该人士认为，毕竟欧美等国对地观测能力强、技术先进，其观测数据数量多，也更加准确。“把自己的好东西直接送给别人，这个所谓的数据共享，被欧美等国认为是个亏本的买卖。” 对地观测是学科交叉较强的一个领域。从前端的载荷，到后期的火箭发射及数据运用，技术上许多部门都有涉及。近十年来，中国在对地观测领域投入非常大。中科院院士、中科院对地观测与数字地球科学中心主任郭华东曾表示，我国目前对地观测的水平处于世界第一梯队后部或第二梯队前部，需要通过国际合作来掌握领域内最前沿的方向、最新的信息。中国：担负起责任在全球数据共享问题上，两院院士、武汉大学测绘遥感信息工程国家重点实验室主任李德仁认为，发达国家应帮助发展中国家在地球观测领域进行技术创新，促进其发展，共同推动全球合作。中国一直主张推动全球“数据民主”进程，坚持所有成员都有权使用全球对地观测的数据。为此，中国不但每年都向GEO提供资金支持，还积极帮助一些非洲国家提高其对地观测能力。例如，我国曾于2007年为非洲某国援建卫星数据接收装置，使该国具备了接收我国对地观测卫星相关数据的能力。同在2007年，中国还制定了《中国综合地球观测系统十年计划》。“中国将积极推动地球观测数据在非洲及亚太地区的接收、共享和应用，促进各国尤其是发展中国家从地球观测中受益。”李德仁说。出路：多措并举但是，对于欧美国家不愿进行数据共享的难题，李国庆坦言，目前还没有特别有效的解决方案能让各成员国或部门单位积极主动地将自身的数据共享出来，只能通过缓慢推进，逐步使大家意识到共享数据能带来的好处。据记者了解，一些国际组织为解决这个难题，也采用了一些策略。一是依据“多劳多得”的原则，为共享数据较多的成员提供相应的数据服务。即若某位成员提供数据量大，且质量较好，那么就为该成员提供权益均等的数据。通过这种方式，可以使各成员逐步尝到数据共享的“甜头”，最终由被动提供，转向主动提供数据。另一种策略为，并不要求各成员将全部数据都共享出来，而是采取“小步前进”的原则，让其先将一些与自身利益相关性较小的数据共享，对与其核心利益相关的数据则暂缓共享。据业内人士透露，GEO同样采取了上述两种策略，以推进各成员数据共享。《中国科学报》 (2012-02-17 A1 要闻); 1927 次阅读|0 个评论

同行评审的数据论文可行吗？: 热度 2 book 2013-1-17 13:45; 科学数据共享越来越引起广泛的关注和讨论，“大数据”一词也更多得进入大家的视野。我之前在《科学家为何不愿意分享数据？》一文中介绍了我们所开展的一项有关科学家对数据共享的态度和期望的国际调查研究。调查显示科学家希望从数据分享中获得相应的回报，并在科研评价体系中获得足够的认可。 2012 年 2 月，全球生物多样性信息机构（ Global Biodiversity Information Facility ， GBIF ）在其网站宣布了一份意见书，提倡推进基于同行评审的生物多样性数据发表模式。这实际上是 GBIF 和出版商 Pensoft 在 2011 年所提议的“数据论文（ data paper ）”的升级版本。他们提议“用于网络共享的数据集的元数据文件可以采用学术论文的形式发表”（即数据论文），该类论文主要是一个包含数据集链接的元数据文件。作为一种新的共享模式，联合国生物多样性公约组织（ Convention on Biological Diversity ， CBD ）在其 2012 年 4 月份的一份旨在促进生物多样性数据共享的文件中推荐了数据论文。数据论文被提出的主要目的是为改善科学评价机制和数据质量控制提供一个方法。一方面，数据论文是正式的学术论文，其引用可以被用于科研评价体系，从而激励科学家更多的分享生物多样性数据。另一方面，同行评审过程可以进一步控制数据集的质量。就其出发点，数据论文看起来很合理，也因此一些从事生物多样性研究的同行也已在一些报告中介绍数据论文。但实际上，如果考虑到潜在作者群体的行为特征，以及同行评审过程本身的特点，数据论文或许缺少一定的可实践性。收集并分享生物多样性数据的人群基本上可以分为三类。一是由公共资金支持的博物馆或标本馆，对于这些单位来说，共享数据本就是其基本义务（比如大多有对外共享数据库），因此数据论文对他们的吸引力有限。二是“公众科学家（ citizen scientist ）”，即非职业研究人员或爱好者，这类人或许乐意用数据论文来共享数据，他们却很多并不熟悉学术出版模式。三是职业的科学家群体，这类人是数据分享的主体。但对于他们来说，其研究多是问题驱动，并且往往不愿意分享尚未分析研究的原始数据，我们所开展的国际调查就揭示了这一点。因此，从前在作者群的特征来看，数据论文的适用对象并非那么广泛。实际上，科学家在发表学术论文时，多将相关数据用附件材料的方式共享，这也是作者的基本义务。因此，数据论文在我们看来有些重复发表的嫌疑：科学家有必要将其在附件材料中共享的数据用数据论文的方式再次发表吗？数据论文的推广还有一些其他问题。比如，是否应该有篇幅或数据量限制？一个广泛分布的物种的几十条分布记录好像不值得发表一篇数据论文。另外，目前鼓吹数据论文的出版商多采用开放获取的出版模式，且收取一定的发表费用，那么科学家在发表数据论文时，谁来承担发表费用？就科学家的个体意愿来讲，很少有人愿意花钱将自己的原始数据共享。对于公众科学家来说，由于没有研究经费的支持，不可能期望由他们支付数据论文的发表费用。我之前发博文介绍过《同行评审中的“审者悲剧” 》，数据论文的同行评审过程无疑会加重所谓的“审者悲剧”。虽然 GBIF 和 Pensoft 提供了一个数据发表流程，从 2011 年 5 月至 2012 年 10 月，只有五篇数据论文在 Pensoft 期刊发表，并且数据论文的倡议者参与了其中两篇（“托儿”）。这也暗示数据论文的可实践性存在一定的问题。如果要进一步推广数据论文，上面所提出的问题值得思考和讨论。实际上，要解决数据论文所主要关注的科研评价和数据质量问题，并非要大力鼓吹所谓的数据论文，期刊和数据保存机构采用联合数据保存政策是一个更值得推广的策略。数据保存机构可以给每个数据集（论文相关数据或直接提交的数据）分配一个唯一且可以交互的数据标志符（ DOI ），可以容易的解决数据所有权和引用等问题；期刊采用较为严格的数据保存政策，要求论文作者在投稿时提交详细的元数据描述并将相关数据分享至数据保存机构，也有助于控制数据质量。相关文献和博文： Huang X, Hawkins BA, Qiao G. 2013. Biodiversity data sharing: will peer-reviewed data papers work? BioScience , 63: 5-6. Huang X et al. 2012. Willing or unwilling to share primary biodiversity data: results and implications of an international survey. Conservation Letters , 5: 399-406 Huang X, Qiao G. 2011. Biodiversity databases should gain support from journals. Trends in Ecology Evolution , 26: 377-378. Chavan V, Penev L. 2011. The data paper: a mechanism to incentivize data publishing in biodiversity science. BMC Bioinformatics , 12 (Suppl 15): S2. Hochberg ME, Chase JM, Gotelli NJ, Hastings A, Naeem S. 2009. The tragedy of the reviewer commons. Ecology Letters , 12: 2-4. 《科学家为何不愿意分享数据？》《数据共享获奖背后的故事》《论文数据共享，你守规矩了吗？》《同行评审中的 “审者悲剧” 》; 个人分类: 科学那些事儿|6918 次阅读|4 个评论

科学家为何不愿意分享数据？: 热度 8 book 2012-8-15 23:13; 我们联合中国科学院、美国加州大学、美国农业部和加拿大蒙特利尔大学等单位的同行，在前段时间开展了一项有关科学家对数据共享的态度和期望的国际调查研究。该调查研究取得了一些很有意思和启发的结果。科学家为何不愿意分享数据？什么情况下愿意分享？哪些措施可以促进共享？科学数据共享越来越引起广泛地关注和讨论，一方面由于数据共享对于科学本身和“大科学（ big science ）”的发展至关重要，也由于它是各国政府科学决策的重要议题。《科学》和《自然》都曾在近期发表社论和专刊来讨论如何科学数据共享存在的问题及如何推进共享进程。 2012 年 3 月 29 日，美国白宫科学和技术政策办公室以及总统执行办公室宣布启动“大数据（ big data ）计划”。在全球变化和环境恶化背景下，为更好地理解和保护地球生物资源，生物多样性数据的共享显得尤其重要。 2001 年，由联合国环境规划署和多国政府启动了“全球生物多样性信息机构（ Global Biodiversity Information Facility ， GBIF ）”，旨在促进全球生物多样性数据的共享。虽然近年来有越来越多的大型数据共享计划被启动，但包括 GBIF 在内的众多计划存在一个问题：它们“自上而下”的运作模式会忽略众多科学家们的观点和意见，从而可能妨碍数据共享进程。实际上，作为数据的收集者、发表者和使用者，科学家们的任何意见都应该被科学决策过程充分考虑。为更好地了解科学家对于生物多样性数据共享的态度、经验和期望，我们联合中国科学院、美国加州大学、美国农业部和加拿大蒙特利尔大学等单位的同行，于 2011 年 7 月至 9 月开展了第一项有关该主题的国际调查研究。调查采用网络问卷的形式，参与调查的对象包括生物多样性和保护生物学领域主要期刊的通讯作者，以及相关领域国际学会的成员。调查引起了国际同行很大的兴趣，研究团队共收到五百多份回复及来自 150 多位科学家共十八页的评论。这些回复和评论真正反映了科学家们对于生物多样性数据共享的观点。调查结果显示大部分科学家都认为数据共享非常重要，并愿意分享已发表论文的相关数据，但超过 60% 的科学家不愿意共享未发表的数据。调查显示在生物多样性领域数据分享文化并不发达，一些技术和认识障碍包括需要对数据做更多分析、同行竞争、缺少足够的回报、缺少简便的数据提交工具、没有足够的时间和经费、不熟悉相关数据保存机构等。实际上有关数据共享有两类截然不同的看法：部分人认为由公共资金支持的研究所获得的数据理应向全社会共享；另一部分人认为科学家共享数据应该获得相应的利益或回报。调查显示科学家们希望从数据分享中获得相应的回报，比如数据所有权、共同作者身份、更多的引用等。很多被调查者认为数据共享应该在科研评价体系中获得足够的认可，比如数据集的重新利用或引用应该获得像论文引用一样的对待。一个有意思的假设是：受到研究单位或资助机构鼓励的科学家应该更倾向于分享数据？对调查结果的统计分析清晰地证实了这个推论。这暗示研究结构或资助结构对于科学家的分享行为有重要的影响力，来自单位的积极措施将有助于促进数据共享。通过对主要全球性多样性数据库的调研，我们之前曾在《 Trends in Ecology Evolution 》发文建议“多样性数据库和科学期刊采用联合数据保存政策”，将研究论文所基于的多样性数据用较为统一的数据格式整合进数据库。通过对《 Journal of Biogeography 》杂志 2010 年所发表的 104 篇标明物种和分布数量的论文（全年论文的一半）的统计分析，我们发现这些论文贡献了 12782 个物种的 367000 条分布记录。这些数据说明一个期刊仅一年就可贡献大量的生物多样性数据。联合数据保存政策对于数据库和期刊应该是双赢的策略，并将是一个在数据数量和质量上可持续的方法。在该次国际调查中，大部分科学家表示愿意接受联合数据保存政策，并表示愿意在论文发表后立刻或者在一小段时间内将相关生物多样性数据共享。这暗示联合数据保存政策的方法值得推进。调查还反映了科学家对多样性数据库的期望，包括标准数据格式、简单易用的数据提交工具、高数据质量、数据库间的交互和协调等。该国际调查研究首次关注作为生物多样性数据分享者和使用者的科学家们的看法，所获得的数据集也有重要价值。总结和讨论该调查结果的论文于最近发表在《 Conservation Letters 》。为了践行数据分享，我们已将所获得的原始数据集和十八页评论在 Dryad 共享，供大家下载使用。针对调查所揭示的问题，论文给出了促进数据共享的相应建议，比如：利用统一数据标识符（ DOI ）可以解决数据所有权和计算引用的问题；研究结构和资助机构应该更多地鼓励数据分享并提供详细的分享指南；数据库和期刊采用更加合理和严格的数据保存政策；数据库应更多地考虑数据提供者和使用者的夙求，提高数据库的可操作性和数据质量。相关链接：《 Conservation Letters 》文章《 Trends in Ecology Evolution 》文章调查所获得的原始数据集相关博文：《数据共享获奖背后的故事》《论文数据共享，你守规矩了吗？》《 Google 时代的科学数据问题》; 个人分类: 研究进展|7963 次阅读|16 个评论

数据共享的未来趋势及面临的挑战: 热度 1 shawn360 2012-7-20 08:46; 按： 2012 年 6 月出版的 Nature Biotechnology 杂志刊登了一篇题名为 “ My data are your data ” 的文章，介绍了数据共享的未来趋势，并分析了数据共享面临的挑战，本文介绍其主要内容。数据共享的未来趋势及面临的挑战生命科学领域拥有成千上万个数据库， 300 多个术语系统和 120 多种交换格式。在目前数据推动的大科学时代，不断增加的数据共享是科学进步的核心，并吸引着来各方关注。而且，数据共享领域也出现一些新的趋势，主要表现在共享的数据形式更加多元化，共享的层次更加深入。然而，要实现更广泛、更深入的数据共享，需要克服技术障碍和人的影响因素。 1 数据共享的必要性共享在科学界一直是美德。虽然许多科学家接受研究数据共享的想法，认为需要共享研究数据，但是很少人将其付诸实践。随着生命科学研究产生各种类型的大数据集，传统的通过 HTML 和 PDF 格式在网上传送研究论文的共享方法即将过时。另一方面，数据也拥有更长的尾巴 1 ：假设和争论、元数据、方法、软件代码和工具、多媒体、工作流程和模式等。这些挑战激发了一些新的数据共享行动计划，例如 Biosharing 项目、其他几个非营利项目和商业项目，从而使共享更易实现、更受欢迎（见表 1 ）。专家们认为，共享是必需的。如果不共享数据和方法，会存在重复研究的风险，也会错过一些新的发现。表 1 目前重要的数据共享行动计划项目名称共享功能共享趋势商业项目 DNAnexus 拥有 NCBI 序列阅读档案（ SRA ），用于下一代测序平台中产生的原始序列数据分析在谷歌云端建立用户界面和镜像（ mirrors ） 300-400TB 的 SRA 数据（无医学数据），提供拥有知识产权的基于云的分析与可视化工具，这些工具可共享给用户 Illumina 基础空间 Illumina 的平台用户产生的数据共享、分析与储存基础空间（ BaseSpace) ，位于亚马逊 AWS 云设施中的基因组学数据共享空间，目前处于 β- 版测试阶段，需要用户注册。 Life Technologies Ion Torrent Community 用户门户，共享数据、协议和代码共享门户 Ion Torrent 社区要求注册完整基因组学（ Complete Genomics ）提供测序服务、数据管理与分析，结果共享下游分析与数据共享服务，进入软件服务提供商的市场基因数据对流程用户和能力用户（ power-users ），软件提供了共享功能定位于制药外包和公私合作项目，如欧洲的 InnoMedPredTox 基因组探索基于分析工具建立的共享功能随着消费者共享行为改变，越来越少人关注数据储存。需要共享原始数据的分析结果 ID 商务解决方案拥有数据分析与整合功能的软件与咨询公司， InforSense Suite 肺基因组学研究联盟扩大了其名为 ClinicalSense 的数据集，用于其数据分析与共享门户非商业联盟描述项目 Pistoia 联盟制药与生命科学公司组成的合作团队，探索竞争前数据共享启动了如下方面的数据共享项目：下一代测序数据、生物标记物交换标准生物 IT 联盟微软公司创建，现在是非营利机构创建数据模型与传播标准，在转化医学领域实现数据共享非营利性行动计划生物共享（ Biosharing ）生命科学领域的国际机构形成网络，旨在数据共享与标准化开发名为 “ 调查－研究－分析（ ISA ）共享空间 ” 的标准，以优化数据共享 crowdlabs 计算工作流程的库，提供高性能计算服务使用 VisTrails ，这是一个开源的工作流程系统 Galaxy 基于网络和云的开源测序分析工具 Galaxy Pages 让用户看见、重复使用和拓展工作流程 myExperiment Virtual Research Environment 英国南安普敦、曼彻斯特和牛津三地的大学之间的合作共享工作流程的平台，用户可以共享工作流程，或保持私人所有美国 NCBI 提供在线数据库和分析工具等资源 Sage Bionetworks 由默克制药公司前研究人员创建的非营利项目，聚焦于共享科学 W3C 语义网是万维网 (W3C) 的一部分拥有致力于开发生命科学数据共享的医疗与生命科学语义网兴趣小组 Workflow 4 Ever 基于网络的资源储存与共享方法与工作流程拥有基因组学和天文学领域的合作伙伴，与 “ 在分散的计算设施上共享大规模科学模拟的可互操作的工作流程（ SHIWA ） ” 相互补充共享网络与数据库生物门户（ BioPortal) 由 NIH 国家生物医学计算中心下属的国家生物医学本体中心运营的一个数据库储存了 300 多个生物医学领域的控制词表和本体，用户可以下载这些本体，并与其他人共享概念网络联盟由荷兰生物信息中心实施，致力于语义网的应用建立统一、用户友好的文本挖掘在线平台 Cytoscape 分析和可视化生物网络的开源软件开发者开发一个可用于共享网络模型的数据库 Datacite 非营利的国际图书馆联盟提供基于数字对象标识符（ DOI ）挖掘的数据共享服务 Force11 一个由编辑人员、出版商、科学家、图书馆馆员、研究资助者组成的团队成立于 2011 年，旨在探索可用于共享、创建和交流学术知识的新方法基因编码项目加州大学圣克鲁兹分校与曼彻斯特大学联合实施的数据收集行动计划利用软件工具扫描期刊论文中的基因组学标识符，将其绘成图，并与人类基因组相关联来源： Nature Biotechnology 杂志研究， Frost Sullivan 公司的数据。 2 数据共享的未来趋势随着语议网、云计算等技术的发展，未来的数据共享将更加多元化、更加深入。 2.1 多种形式的数字化未来的科学数据共享可能与现在的做法完全不一样。有专家认为，知识不应仅限于在纸上交流，还应该以电子 / 数字化形式传播。 2011 年由科学家、图书馆馆员、研究资助者以及几个出版社的编辑组成的 Force 11 团队致力于 “ 语义增强的多媒体数字出版 ” 。该团队在 2011 年秋天出版的 “ 宣言 ” 中建议 “ 反思学术期刊的单元和形式 ” ，让出版从简单的电子化复制印版期刊出版物转向数字化复合体。他们正在朝 “ 网络化的知识目标（ networked knowledge objects ） ” 方向努力，已经为数据、方法和元数据增加语音。 2.2 将科技文献计算化访问一些研究人员正在督促出版商将科技文献进行计算化访问（ computational access ），这样机器就可以比人更快地获取和共享研究结果。例如， 2009 年，加州大学圣克鲁兹分校与曼彻斯特大学联合启动实施的 “ 基因编码 ” 项目，旨在进行这方面的探索。 2.3 共享研究的 “ 特殊调料 ”—— 研究过程的数据、软件和工作流程针对目前共享的研究信息仍然有限、难以从这些信息中获取重复某项研究所需的所有要素的问题，有些数据共享团队已经开始在论文中共享研究过程中的数据、软件和工作流程。目前，计算生物学家通过门户网站共享软件工具和代码，同时，他们还创建通常安装在云中的网络服务。美国约翰·霍普金斯大学医学院的 Salzberg 和他的小组在一篇比较目前重要基因组组装程序的论文中共享了研究中使用的软件和数据，将软件方法的详细信息即所需要的 “ 特殊调料 ” 包含其中，虽然可能会相当复杂，但是可以运行这些组装程序并重现他们的研究结果。 2.4 共享网络模型目前，系统生物学研究人员已经交换了基因与蛋白相互作用网络的模式、序列和软件代码，但还不能存储正在运行的假设推论。为了探索交换模式的新途径，加州大学圣叠哥分校开发分析和可视化生物网络软件 Cytoscape 的研究人员 Trey Ideker 与总部位于西雅图的非营利组织 “ 智者生物网络（ Sage Bionework ） ” 合作鼓励共享。由默克公司前研究人员 Stephen Friend 和 Eric Schadt 于 2009 年成立的 Sage Bionetworks 是一个开放不同类型数据和网络模型的库。另外， Ideker 的团队正致力于以 Cytoscape 为基础的网络模型共享数据库。 3 数据共享面临的挑战 3.1 关注共享标准 2012 年 1 月， 50 多名来自 30 个学术和商业机构的研究人员就数据集描述标准达成一致意见。由研究人员和出版商组成的 “ BioSharing 行动计划 ” 启动了 “ 调查－研究－分析共享空间（ Investigation-Study-Assay Commons ，简称 ISA 共享空间），有望优化不同数据库之间的数据共享。 3.2 当管线（ pipeline ）断裂 —— 需要保持系统的稳定性，加强系统维护要实现同时共享分析步骤，期刊论文必须能够链接到远程计算和数据资源。由不同团体和机构运营的本地和远程计算资源中的工作流程混合了管理功能。如果超越其节奏，工作流程的管线将断裂：站点上的软件崩溃、网络服务改变数据格式、储存失误导致网络服务断线。一个本可共享的、可重复的工作流程就会变得不能共享和不可重复。曼彻斯特大学的计算机科学家 Carole Goble 的团队已经建立了许多网络的生命科学共享平台，他们开发的 Workflow 4 Ever 平台，通过维护工作流程来延长方法共享的使用寿命。 3.3 面临的其他技术障碍研究人员在论文中包含网络模型时，其中许多网络模型不可避免地被塞进了出版物的在线补充部分。而仅有非常少的部分人会发现这些额外的补充材料，甚至更少的人会引用这些材料。在出版的论文中同时共享方法的 “ 特殊调料 ” 数据和元数据仍然是存在巨大的问题，其中之一是如果要审稿人来监管这部分工作，会大幅度增加审稿人的工作量。为此，埃默里大学计算生物学家 James Taylor 与 Galaxy 平台合作开发开源序列分析工具，这种工具能下载或在云上使用的开源序列分析软件。基于 Galaxy 的 Galaxy Pages ，能共享数据和工作流程的分析步骤，避免增加审稿人的工作量。 3.4 人的因素需要让科学家们转变观念，让他们认识到产生并分享数据和方法的重要性。要达到这一目标，一方面可以采取加强宣传与培训等措施，另一方面，共享平台的设计和构建中，可以利用一些技术方法，使共享更容易实现。共享平台的构建者要考虑到科学家们对数据共享可能产生的恐惧，创造 “ 避风港 ” 似的环境，同时也让科学家们围绕共享物建立 “ 信誉经济（ a reputation economy ） ” ，以便他人看到什么人分享了多少。同时，美国 Dana-Farber 癌症研究所的 Quackenbush 及其团队为美国美国肺癌基因组学研究联盟设计数据协调与分析中心、 Goble 的团队设计 myExperiment 平台等的实践经验表明，数据共享平台需要保持一定的透明度，同时允许参与的科学家们有一定的私人空间。另外， Goble 团队为欧洲微生物系统生物学协会（ SysMOSEEK ）创建了人和机器可读的电子数据表，该电子数据表的单元格中嵌入了 BioPortal 的控制词汇表，规范化分类，便于数据录入和读取，从而更好地鼓励共享。此外，还需要与各利益相关方加强合作。例如 “ 基因编码 ” 项目运行两年多来，但受到出版商的冷遇。阮梅花整理自： http://www.nature.com/nbt/journal/v30/n6/full/nbt.2243.html 来源：中科院国家科学图书馆《生命科学监测快报》2012年第13期; 6780 次阅读|2 个评论

数据共享获奖背后的故事: 热度 10 book 2012-4-12 07:22; 在很多研究领域，科学数据的共享越来越显得重要，并且引起了越来越多的政府机构及国际组织的重视。虽然数据共享在很多研究人员看来应该是基本义务（比如在遗传学和医学领域， DNA 序列、蛋白质结构等数据的共享已经是任何人都知道的常规事情），但执行起来却并不是那么回事儿，很多人并不愿意分享。这背后的原因，更多的还是观念和利益问题。其实有研究发现，如果一篇论文将相关原始数据共享，其引用率将比不共享数据更高，这可以算数据共享的一个好处。其实，数据共享背后的道理却也很简单，公共资金支持的研究，当然要将所有的研究成果包括数据共享给社会。但是，很多人仍然觉得自己辛苦获得的数据与别人共享（哪怕是论文相关数据）会减少自己的竞争力，认为数据就是硬货币，这种观念在科学发展相对落后的国家更常见。为了促进数据共享，一些国家的研究资助机构采用了自上而下的措施。比如，美国国家科学基金会（ NSF ）和英国生物技术和生物科学研究委员会（ BBSRC ）都开始明确要求项目申请人在申请书中包含有关数据保存和共享的承诺与措施； Wellcome Trust 、英国的一些研究委员会、以及美国国家卫生研究院（ NIH ）也签署了联合声明，以促进医学研究数据共享从而造福公共健康。科学期刊在数据共享进程中也起着重要作用。比如 BMC 和 PLoS 期刊，都有比较明确的数据保存和共享要求。 2011 年度 BMC 数据共享奖颁给了 Tommi Nyman （芬兰）、 Veli Vikberg （芬兰）、 David R Smith （美国）、 Jean-Luc Boevé （比利时）四人。获奖理由是他们在 BMC Evolutionary Biology 所发表的一篇有关叶蜂亚科生态物种形成的文章中，将所有的标本采集及生态数据作为附件材料共享。下面是他们附件材料清单，与一般论文只分享序列数据相比，确实算是一个详细的共享。 Additional file 1: Collection data for exemplar specimens, and taxonomic and ecological background information. Excel file containing collection data for the specimens used in the study, as well as species numbers, geographical distributions, larval lifestyles, and collective host ranges of genera, subgenera, and species groups within the Higher Nematinae. Format: XLS Size: 156KB Download file Additional file 2: Sequence data used in phylogeny reconstruction and resultant phylogenetic trees. NEXUS file containing the data matrix and trees obtained from the Bayesian phylogenetic analyses in MrBayes and BEAST, and the maximum-likelihood tree from the analysis using RAxML. Format: NEX Size: 434KB Download file Additional file 3: Data file and run parameters for BEAST. XML file used for the phylogenetic analysis in BEAST. Format: XML Size: 345KB Download file 其实他们的获奖，还有段挺好玩的故事，对于数据共享有一定的启示。作者们自己谈到，在他们的稿子被审稿期间，一个匿名审稿人曾两次要求他们将论文所用到的除序列数据之外的其他原始数据也作为附件材料共享。正是这名审稿人和编辑的坚持，作者们才共享了全部数据。但他们，也获得了相应的利益，比如获得 BMC 数据共享奖，比如被邀请加入一些旨在促进数据共享的组织的委员会。这个故事的启示在于，科学家个体，以及审者们，可以一起促进数据共享的进程。严厉的期刊政策将使得作者在收集和整理原始数据时更加认真，数据的共享也将使得研究结果能够被检验。虽然数据共享背后的道理很简单，但全球性的数据共享文化的营造，仍有很长的路要走，并且需要更多可行的措施来促进研究人员对于数据共享认识的转变。不管科学家个体喜欢与否，数据共享必定会成为科学研究中的常规。相关博文：论文数据共享，你守规矩了吗 Tommi Nyman, Veli Vikberg, David R Smith, Jean-Luc Boevé. 2010. How common is ecological speciation in plant-feeding insects? A 'Higher' Nematinae perspective. BMC Evolutionary Biology 10: 266 doi:10.1186/1471-2148-10-266; 个人分类: 科学那些事儿|8954 次阅读|20 个评论

论文数据共享，你守规矩了吗？: 热度 9 book 2011-11-12 09:02; 发表论文是每个研究人员至关重要的事情，证据翔实的高水平论文就像是研究人员的名片。科学发展到今天，科学界越来越认识到数据共享对于促进重大科学发展和科研文化的重要性。逐渐有更多的研究人员在发表论文时，尤其是在高水平杂志发表论文时，会将论文正文篇幅所不能包括的一些重要的相关结果和原始数据共享。这种共享一般有几种形式，或作为论文附件材料（ supplementary material OR supplementary file ），或上传到公共数据库，或直接将数据提供给索要数据的同行。论文附件的形式对很多研究人员来说应该不会陌生，为了让论文获得发表，我们要提供尽可能多的证据，而论文正文篇幅有限，所以有时会将部分结果或数据作为附件材料提供。我个人觉得论文附件提供原始数据的比重可能并不大，更多的是一些相关分析结果。将原始数据上传到公共数据库共享，生命科学领域中最有名的例子应该是 GenBank （ http://www.ncbi.nlm.nih.gov/genbank/ ），或者说是 International Nucleotide Sequence Database Collaboration 的三个数据库： GenBank ， DNA DataBank of Japan (DDBJ) ， European Molecular Biology Laboratory (EMBL) 。现在，从分类学、进化生物学、生态学，到分子生物学和医学研究，应该鲜有人不知道这几个数据库（或其中一个）。只要你的论文用到了序列数据，论文发表后将序列数据提交到 GenBank 应该是一个常识。我不太清楚其他领域的情况，比如化学或物理学领域，也应该有类似的公共数据库和“行规或规矩”，请其他领域的同行也举些例子。虽然数据共享在很多研究人员看来应该是常识和基本义务，但每个人执行起来却并不是那么回事儿。 2006 年 PLoS Biology 有一项有趣的研究，作者们想看看到底有多少比例的研究人员没有将他们的序列数据提交到 GenBank 等数据库。他们选择了 6 种高水平期刊（ Evolution, Molecular Biology Evolution, Nature, PNAS, Science ），这些期刊都有明确的政策，要求论文作者将序列数据提交至公共数据库。经过对 2006 年 2 月开始 6 期文章进行分析，作者们发现情况并不乐观。这些期刊都发表了并未提供序列号的文章，比例分别从 3% 到 20% ；并且其中 3% 到 15% 的文章根本就没有将序列提交到 GenBank 。针对如何让这些没有共享序列的论文将其序列共享，该文作者也提供了 2 个建议。一个比较严厉的建议是，在相关序列数据共享前，期刊应该禁止这些文章作者投稿；另一个建议是，期给这些文章作者一个月的期限，如果这个期限内作者没能提供序列号，则期刊将这些文章从其网站移除（这个建议基于现在大多研究者依靠网络获取参考文献），直到作者提交序列号。 2009 年 PLoS ONE 也发表了一项类似的调查研究，该文作者选择了两种有明确数据共享政策的 PLoS 医学期刊（ PLoS Medince 和 PLoS Clinical Trials ）上的十篇论文作为跟踪对象，并通过 email 的方式向论文作者索要论文相关数据。他们的调查结果更让人惊讶：仅仅有一个作者提供了数据。或许有人会说这项调查研究的取样太小，也或者医学论文的作者对数据共享有更保守的态度，但 10% 的共享率还是着实让人吃惊。这个例子说明，即使期刊有明确的政策要求作者共享数据，或许也不能收到理想的效果，甚至差得还挺远。回到序列数据的例子，虽然论文发表时将序列提交到公共数据库已经是一个常识，也是编辑部对作者基本的要求。但不同期刊采取的方式有些不同，有的期刊要求投稿时必须包含序列号（只有序列数据已经提交到数据库才会有序列号），而有的期刊则允许作者在论文发表前再提供序列号。记得有一次，我跟一个同事同时投稿。我们俩的稿子都用到了 DNA 序列数据，投稿前我已经将序列提交到 GenBank 并获得了序列号；而同事说他还没有提交，因为他要投的期刊也会将尚没有序列号的文章送审。我每次都会在投稿前将序列提交，所以我并不知道生物学领域不需要在送审前提交序列号的期刊是否常见。或许，这里就是那个漏洞。这种期刊政策的差别会使得有些期刊的作者在论文发表时并没有提供序列号（也没有将序列提交到公共数据库）。如果期刊政策是硬性的，都规定论文送审前必须提供序列号，这个问题应该可以解决。对于其他类型的数据也如此，没有共享，则不送审，这样的政策理论上来说应该很好执行。开放获取的 PLoS 期刊、 Science 、 Nature| 、 PNAS 等基本上都要求作者有义务将论文相关数据共享，并有相应的期刊政策，越来越多的期刊也都开始有这样的政策。不管期刊采用哪种政策，论文相关的数据应该共享给同行，起码，你的论文应该能够被感兴趣的同行检验。数据共享从理论上来说应该是研究人员的基本义务，但去实践的时候，则有很多的分歧，这仍是个值得讨论的问题。或许我们可以问的第一个问题是：论文数据共享，你守规矩了吗？你是不是上面两篇研究中提到的那些研究人员。第二个问题是：论文数据共享，你愿意守规矩吗？ Noor M.A.F. et al . (2006) Data sharing: how much doesn’t get submitted to GenBank? PLoS Biology , 4: e228. Savage C.J., Vickers A.J. (2009) Empirical Study of Data Sharing by Authors Publishing in PLoS Journals. PLoS One , 4: e7078.; 个人分类: 科学那些事儿|15288 次阅读|23 个评论

[转载]共享信息数据给力科学发现，揭示科研新模式: shawn360 2011-9-7 17:33; 2011年7月28日，由深圳华大基因研究院、德国汉堡—埃普多夫大学医学中心、中国疾病预防与控制中心和军事医学科学院微生物流行病研究所等单位主导完成的德国致病性大肠杆菌国际合作研究成果在国际著名杂志《新英格兰医学》（ The New England Journal of Medicine ，NEJM）上在线发表。德国致病性大肠杆菌研究项目首次展示了快速的基因组测序技术和及时的数据共享给全球各科研领域所带来的巨大贡献，证实了信息数据的快速共享在公共卫生事件中可发挥至关重要的作用，同时也为应对全球重大突发性紧急公共卫生事件提供了一个全新的解决思路。在此次疫情中，华大基因和德国汉堡—埃普多夫大学医学中心的研究人员以最快的速度完成对致病菌的基因组测序及分析并向全球免费公开所有数据，并声明在公共领域许可证范围内，所公开的数据没有使用限制。该数据库的公开使得整个科学界在第一时间共享了相关数据信息 ( http://www.sciencemag.org/content/332/6035/1249.full )，省去了从数据产生到文章发表的时间，为了尽快控制疫情奠定了重要的科学基础。据了解，华大基因的相关研究人员在收到样品后，3天内完成了大肠杆菌基因组的测序和初步组装，确定该菌株属于血清型O104，并及时将相关基因组序列数据公开分享，促进了全球生物信息学家的通力合作；在数据发布的24小时之内，完成了对该大肠杆菌的基因组组装；在数据发布的2天后，研究人员发现引起此次爆发的菌株与2001年在欧洲分离的菌株01-09591及2002年的中非分离株55989有高度相似性并展开进一步分析比较；5天后，研制出该大肠杆菌的诊断试剂盒并向全球范围内无偿提供检测实验方案及所需引物序列信息；2周内全球的研究人员在维基百科中公开了24篇关于该菌株的毒力、抗性基因、进化等方面最新的研究报告。华大基因微生物项目负责人覃俊杰博士说：“为尽快揭示德国大肠杆菌的致病机理及控制疫情的恶化，我们与合作方共同决定采用这种快速的数据共享方式，及时公开我们获得的相关数据，希望能够为全球生物信息学家及流行病研究学者的广泛合作提供基础支持，加速对该致病性大肠杆菌的研究进程。” 军事医学科学院微生物流行病研究所全军微生物检测研究中心主任、国家“973”首席科学家、国家科技重大专项课题负责人杨瑞馥教授补充说：“该研究成果不仅对德国致病性大肠杆菌的进化起源和致病性等方面的研究打下了坚实的基础，更为重要的是为全球其他传染性疾病的应对机制提供了一个新的国际协作模式。” 华大基因研究院副院长王俊教授表示：“基因组测序为鉴定和了解新型病原奠定了重要的基础，信息数据的免费、快速发布及共享能够极大地加速疾病诊断和治疗的过程，对大规模突发性公共卫生事件的快速应对具有十分重要的意义。” 德国负责传染病监督及预防的罗伯特-考赫学院7月26日宣布，肠出血性大肠杆菌疫情在德国的爆发已经结束。这场疫情最终导致德国范围内50人死亡，仅汉堡医院就有3496名病人被诊断为感染肠出血性大肠杆菌，在德国以外的欧洲地区也发现了76名患者。另据悉，华大基因（BGI）和BioMed Central（简称 BMC ，生物医学中心）共同主办的《GigaScience》杂志已开始征集投稿并计划于今年11月份正式上线。该杂志是一个面向所有使用或产出海量数据的生物学研究者的开放阅读期刊，主要采用全文文献与大型数据库相结合的崭新模式，为广大科学工作者提供前沿、有效的数据以及生物学发现等资源。具有DOI的德国大肠杆菌基因组数据库使得大肠杆菌成为第一个以这种方式公开数据的物种。此外，研究人员也可以按照同样的方式向数据库中添加已经经过证实的有价值的信息，以不断更新研究发现，并促进全球科学的快速发展。【注！转自华大基因研究院，原文链接已失效】; 1908 次阅读|0 个评论

[转载]数据堂——数据共享平台: rbwxy197301 2011-8-5 15:17; 数据堂（ http://www.datatang.com/ ）是国内专业的科研数据共享服务平台，致力于为国内外高等院校、科研机构、研发企业及相关科研人员提供科研数据查找、数据需求发布、数据分析等服务内容。本着支撑科学研究，助力企业研发的原则。数据堂在严格遵守知识产权的相关规定的前提下，始终以“专业、权威、开放、共赢”作为科研数据服务的核心。数据堂与相关研究机构、高等院校、科研组织通力合作，并在国家相关部门的大力支持下，积累了丰富的数据资源及增值服务的经验。数据堂拥有一支专业、高效的数据加工和服务团队，对分散在各个领域的数据进行收集、加工、整理，将其提炼成为高价值的数据知识，通过统一的平台提供服务，使得科研机构、企业、高校和个人之间实现充分的数据共享，使得各类科研数据的使用价值发挥到最大。数据堂可充分满足用户在论文写作、科学实验、实验教学、项目及产品研发过程中对各种数据的需求，具体而言：通过数据堂（ http://www.datatang.com/ ），您可以：快速检索获取相关研究主题的科研数据快速发布您所需要的数据需求信息推广、共享您拥有的科研数据根据学科及专业分类浏览相关科研数据获取数据相关论文、用途等增值信息分享他人使用科研数据的经验评论您感兴趣的科研数据以上内容摘自： http://datatang.com/about/about.aspx; 个人分类: 信息检索|2868 次阅读|0 个评论

KFC: 影像数据共享文化: zuoxinian 2010-10-10 12:32; 最近忙于结束掉手上的一个问题，一直没有写写博客。今天简单写一个。组里最近升级了以前的关于影像数据共享的项目 1000FunctionalConnectomes (我们戏称为KFC,肯德基啊）。为了加强这种共享文化，Mike进一步的邀请来自世界若干实验室的PI共享包括静息态，扩散张量，结构影像数据和智商及各种行为学数据，这次最大的不同是，这些实验室将持续共享他们的数据（比如：一周5-10被试）。关于这方面的详细资料可以在升级的 KFC网站上找到。中国的共享中心是北京师范大学认知功能神经科学与学习国家重点实验室，负责人是臧玉峰研究员。这些数据的共享对于静息态迈向临床应用应该有重要意义。10月10日，NIDA的头目在其 Blog 上专门强调了这个项目。比较令人高兴的是，现在已经看到多学科的研究人员开始利用这些数据。比如：最近有一个来自工程领域的工作，其利用香农商分布检测这些数据的质量，并报告了若干数据潜在的质量问题（ www.cs.bris.ac.uk/Publications/Papers/2001205.pdf ）。希望将来看到更多复杂网络和统计物理领域的研究人员利用这些数据来建模大脑系统。; 个人分类: 个人软件|4451 次阅读|0 个评论

This is your brain online: the Functional Connectomes Project: zuoxinian 2010-4-9 00:55; Today Nature Medicine reported this project. YourBrainOnline; 个人分类: 科研笔记|3712 次阅读|1 个评论

Collective brain maps: zuoxinian 2010-3-31 02:16; 最新一期的Nature Methods发表了关于千人静息脑项目的评论文章：《 Collective brain maps 》。如果看不到全文，可以下载附件中的PDF。附件：CollectiveBrainMaps; 个人分类: 科研笔记|3297 次阅读|0 个评论

千人脑功能连接项目: zuoxinian 2010-3-16 05:54; NOTE1：组里发起的千人脑功能连接项目目前初步完成，数据已经上载到NITRC供大家使用（http://www.nitrc.org/projects/fcon_1000/），相应的处理程序也已经附上。在静息态（resting－state）脑研究领域，中国具备很高水平，特别是从这个项目的数据贡献者的分布来看。北京师范大学认知神经科学重点实验室的臧玉峰研究员对这项工作起了巨大的推动作用，其本人也是此项目委员会的成员之一。; 个人分类: 科研笔记|5537 次阅读|3 个评论

中国地震局最近震情分析及相应对策: 杨学祥 2008-9-4 06:11; 中新网 9 月 3 日电测绘局、地震局今天下午举行新闻发布会，通报汶川地震地形变化监测结果，介绍汶川地震对地震周边地区及青藏板块地形的影响。中国地震局副局长阴朝民在发布会上介绍了近期地震发生比较多的两个原因。第一，汶川 8 级地震发生以后，从我们多年总结研究的经验来讲，这么大的地震发生以后，在全国范围内会存在一些调整，会发生一些地震，所以最近我们感觉震区以外的一些地区，包括西藏、新疆以及四川与云南交界的地方发生一些地震。按照统计规律，每年我们国家发生 5 级以上地震是 18 次左右。到目前为止，除汶川地震强余震以外，现在中国大陆已经发生了 21 次 5 级以上地震，从目前情况来说，整个地震数量超过平均水平，相对来说强一些。第二，最近地震发生这些区域在我们国家都是地震多发地区，包括新疆、西藏、云南，是我们国家地震多发的一些省市，从本身来讲，这些地方也会发生一些地震。 ( 据中国政府网文字直播整理）以上数据与我的统计结果基本相同，不同的是，我统计的 5 级以上地震包含汶川地震强余震。整个地震数量超过平均水平，已是大部分人的共识。中新社北京九月三日电中国地震台网中心预报部主任刘杰在今天召开的新闻发布会上说，攀枝花 - 会理六点一级地震不是汶川的余震，以后还有发生五至六级余震的可能。刘杰指出，攀枝花 - 会理地震，是属于昔格达 - 元谋断裂，汶川是位于龙门山断裂，这两次地震震中位置相差五百五十公里，因此这次地震不是汶川的余震，而是新区发生的新的地震事件。他解释，汶川地震震级是八级，能量非常大，一分多钟的快速释放，必然造成整个构造体系就是人们说的南北地震带出现一种不平衡，导致了其他一些与其联动的断裂带重新进行调整。因此，攀枝花 - 会理地震是独立的一次地震现象。针对此次地震之前是否有异常问题，刘杰说，地震前在凉山州附近，中小地震，三四级地震活动确实出现增强，有一些前兆，也发现一些异常。但不仅仅是这个地区，汶川地震后，在川滇地区出现大范围的异常，仅仅依靠有些地震活动增强和一些个别前兆，要想做出很精确的短临预报实际上比较难，根据一些趋势，感觉这个地方可能会出现调整，但实际上很难做出短临预报。地震前兆不仅仅是地震次数的异常变化，地形变化、重力异常、地温变化、地下水位变化、地磁变化、地电变化、氡含量变化也值得关注。公开有关测量资料，不仅有益于相关专家研究讨论，而且有益于公众了解震情，自己做出判断。在目前条件下，准确的临震预测是困难的，震情资料的测量数据是客观的。权威专家不能作出判断，唯一合理又公平的方法是把真实测量资料交给公众，让更多的专家和公众自己判断。公众应该有知情权。网友《很好》认为，在临震预测准确性很低的条件下，容许个人发布地震预测意见也是可以的，短期内也许会产生许多混乱 ( 谣言四起 ) 而付出一定的代价，但会极大地普及地震知识，从而极大地增强全民的抗震免疫力，抵御各种不实谣言。同时也将极大地鼓舞各种地震预测方法的研究。前提是 ------ 地震、地质、气象、测绘等部门解除相关资料数据成果的垄断，实现最大程度的全民共享。我的意见是，概率预测的好处是，每个人在预测过程中都要给出最有力的证据，而公众在不同的预测中不仅可以学到知识，而且会有不同的取向，不断提高判定能力。个人取向个人负责，不至于造成一边倒的恐慌。在争论的过程中，预报者和公众都会提高认识和经验。网友《很好》的意见值得相关部门考虑。据新华社电国家测绘局、中国地震局昨日联合公布汶川地震地形变化监测结果。监测显示，汶川地震引起震中区域监测点的水平位移量达 238 厘米，沉降量达到 70 厘米，隆起量达 30 厘米。国家测绘局、中国地震局于 2008 年 5 月下旬至 7 月中旬，共同组织实施了汶川地震地形变化监测与分析工作。监测表明，龙门山断裂带西侧块体向东偏南运动，位移达 20 至 70 厘米；东侧块体向西偏北运动，位移达 20 至 238 厘米。东侧块体下沉达 30 至 70 厘米。陕西南部区域向西北方向运动，最大位移量达 4 厘米；甘肃陇南区域向东北运动，最大位移量达 5 厘米。青藏高原珠峰地区的监测点向西偏南运动，水平和垂直方向位移量均为 2 至 3 厘米。国家测绘局、中国地震局累计派出了约 100 个专家技术组对地震周边地区和青藏高原珠峰地区的 180 个全球导航卫星系统点进行了野外测量，同时获取了全国范围的 28 个全球导航卫星系统连续运行站的监测数据，得出了最终的地形变化分析结论。汶川地震地形变化监测不仅要说明汶川地震造成的地形变化现状，而且应该通过测量结果给出未来地形变化的趋势，就是说，继续监测地形变化的微小变动。这样才能有益于地震的预测和预防。比如，北京时间 2008-08-30 20:46 在新疆维吾尔自治区巴音郭楞蒙古自治州和静县 ( 北纬 42.7, 东经 83.9) 发生 5.3 级地震，该地区及其周边地形变化如何？参考文献 1．中国地震局分析近期地震频发原因。 2008 年 09 月 03 日 15:33 中国新闻网。 http://news.sina.com.cn/c/2008-09-03/153316225601.shtml 2．杨学祥到目前为止 2008 年中国 5 级以上地震 73 次：聚焦中国西部强震频发 . 发表于 2008-8-31 20:55:39 科学网。 http://www.sciencenet.cn/blog/user_content.aspx?id=36839 3．杨学祥 . 我国进入地震活跃状态：地震频繁的 2008 年 . 发表于 2008-9-2 6:59 :20 科学网。 http://www.sciencenet.cn/blog/user_content.aspx?id=36994 4．张希敏。官方称攀枝花地震后不排除发生 5-6 级余震可能。 2008 年 09 月 03 日 19:52 中国新闻网。 http://news.sina.com.cn/c/2008-09-03/195214398131s.shtml 5．杨学祥 . 汶川地震反思：小震闹的同时要看大环境 . 发表于 2008-8-30 6:25:27 科学网。 http://www.sciencenet.cn/blog/user_content.aspx?id=36661 6．杨学祥 . 我国进入地震活跃状态引发的地震预测讨论值得关注 . 发表于 2008-9-2 12:14:45 科学网。 http://www.sciencenet.cn/blog/user_content.aspx?id=37088 7．徐春柳。中国地震局：汶川地震震中区水平位移 238 厘米。 2008 年 09 月 04 日 02:27 新京报。 http://news.sina.com.cn/c/2008-09-04/022716227110.shtml 8．杨学祥 . 中国中西部中强地震已经开始向青藏高原外围扩展 . 发表于 2008-9-1 7:29 :42 科学网。 http://www.sciencenet.cn/blog/user_content.aspx?id=36868; 个人分类: 灾害预测|4168 次阅读|3 个评论

更多...

帐号		自动登录	找回密码
密码			注册

关闭 安全验证

标签: 数据共享

相关帖子

相关日志

关闭安全验证