上周,《学习时报》发表了题目为《大数据时代要有大方略》的署名文章,其中提到了大数据的相关问题。这让我想起了不久前翻译的一篇文章(《科学需要更多的点石成金》,今年内会发表在某期刊上),其中也探讨了大数据的深入发掘等问题。加之近期对国外一些期刊的关注,更加使得我对大数据和开放存储有些想法,再次略述一二,与大家探讨。 《 Journal of Science Communication 》杂志近期几篇文章对科学传播进行了深入的反思(相关内容见本人以前发布的几个翻译过来的文章),其中谈到了当前的科学传播还处于满足小众的需求方面,还是小范围的“自娱自乐”,因而有其局限性,而对于如何突破这个瓶颈,开放存储是一个比较好的出路,开放存储对于大数据的发掘和利用也是一个有效途径。同时今年年初《纽约时报》的一篇关于《新英格兰医学杂志》创刊 200 周年的文章中也对开放存储进行了深入的探讨。其中谈到了传统出版和发行的一些弊端,甚至有人认为纳税人出钱支持了研究,最后还要出钱去买发表了的研究成果,这无异于为同一件事情花了两次钱。 网络博客,网络出版这些开放存储的模式给传统出版提出了严峻的挑战。但就公共科学图书馆( Plus ONE )来说,它发表的文章数量就足以让那些引用率超高的 SCI 期刊汗颜。而且越来越多的人也开始选择利用开放存储的模式来发表自己的观点,看法和研究成果,虽然开放存储还面临着诸多的质疑和批判。而从国内来说,科学网等一批博客也云集了众多的科学粉丝,虽然这些博客还并没有突破上述的“自娱自乐”这个沉默的螺旋,但是至少出现了一些曙光,而其发展的精髓则在于更民间,更亲民。 而大数据时代呼唤数据的共享与共建。越来越多的科学研究无法紧靠一己之力可以完成,通力合作成为了常态,就像前两天振奋人心的“上帝粒子”也是科学共同体集体智慧的结晶之一吧。 同时大数据也可以更加开放地开展对比研究,如果同样的项目,各自采集数据的标准不一,或者对原始数据进行了加工处理后进行共享,那么有些时候可能会遗漏一些重要的信息和数据。这对于大数据的利用也是一个致命的打击。因而有文章认为以前的一些研究采集的数据之所以难以进行深入的发掘,就是因为那个时候并没有考虑到未来对该数据可能的深入发掘和利用。 而当前的开放存储的出现为大数据的共建,共享和深入发掘提供了好机会,而唯一的障碍可能就是大数据共享的意愿吧。并不是所有的人都愿意把自己的成果(成果也是大数据的一部分)拿出来共享,因为至少就目前来说,通过开放存储发表的“成果”还不能称之为成果。而且开放存储也并没有真正走入科学共同体考核体系之内,这也进一步抑制了开放存储的发展,同时也给大数据时代带上了枷锁,成为大数据发展的一个瓶颈。 期待将来可以把通过开放存储途径发表的成果纳入到考核范围内,这样会有更多的人涌现出来支持并促进开放存储的发展,也会给大数据的发掘和利用提供更广泛的平台。 大数据更加呼唤开放存储! 附件一段刚才一个人发来的邮件内容: A newspaper report saying that the UK will make scientific research freely available by 2014: LONDON: The British government has revealed controversial plans to make publicly funded scientific research immediately available for anyone to read for free by 2014, in the most radical shake-up of academic publishing since the invention of the internet. Research papers that describe work paid for by the British taxpayer will be free online for universities, companies and individuals to use for any purpose, wherever they are in the world. The universities and science minister, David Willetts said he expected a full transformation to the open approach over the next two years. The move reflects a groundswell of support for ''open access'' publishing among academics who have long protested that journal publishers make large profits by locking research behind online paywalls.
摘要: 虽然一些科学共同体深入地探讨了开放存储出版的出现,但是在科学传播共同体内部这个问题一直不是辩论的核心。大多数科学学科领域的学者有他们自己可供利用的开放存储的选择,比如杂志,数据库,预印文本等等。可笑的是,致力于研究科学传播结构的科学共同体见证了这个转型,但是却没有直接参与其中。结构性和文化性障碍都阻止了科学传播出版过程中开放存储部门的增长。在这个评论中,我希望在我们的学术实践领域里展开一个就更加开放的传播环境的需求进行的辩论。 至少在我看来,公共科技传播会议( PCST )的一个结果就是我们意识到我们的共同体在向其领域之外进行传播的时候是多么的糟糕,我想这对于一个主要焦点是科学传播的共同体来说是多么的让人难以置信。更可笑的是,这也是我们几十年来一直尝试传递给科学家的观点。我们是否应该对自己进行一番反思呢?在这篇短文中,我试着建议我们为什么要考虑把不同的传播实践融入进来,以及我希望在我们的学术实践领域里展开一个就更加开放的传播环境的需求进行的辩论。 今年 4 月,上千名研究者,教师,记者和其他科学传播从业者齐聚意大利佛罗伦萨,参加第 12 届 PCST 国际会议。在会议讨论并解决的若干议题中,很少有涉及到我们共同体的传播结构的问题,我认为也没有几个圆桌会议和全体会议表明我们需要提升并加强 PCST 学者与公众进行交流的方式的反思。既然我们已经意识到历史学和社会科学告诉我们研究者采用的传播工具和实践取决于保持共同体自身运作的激励体系。因而,对于 PCST 共同体内最小的学术部门来说(我这里指的是在博物馆研究、媒体和教育方面从业的个人和团体),公共传播是传播知识和方法的主要方式。因为对他们来说,在公开的场合进行的日常的公共性互动是太常见不过的了,而且他们每天的工作都反映了要应对复杂情况的意识。在这里,我不想提那许许多多的例子来说明开放且互动的科学传播共同体会是多么重要,因为这些你们都有所了解。 这个问题来源于 PCST 共同内中那些和学术有着紧密联系的部分。我认为我们没有把我们过去几十年里提出的对科学共同体的建议、批判和变化融入我们的日常实践和学术实践之中。我们研究公共传播,但是我们的传播实践远远落后于现状。即使学术圈好像在不同的且更具内部激励机制的氛围下运转,我们都知道公共传播是科学领域增长,扩展和接纳的重要前提条件。进而,我们意识到——我知道一直说“我们意识到”是毫无意义的——知识的生产是一项传播事业,公共传播也是新知识探讨,协商和生产的地方。丰富的知识通常来源于具有丰富传播实践的地方。 虽然我们可以探讨很多可以对我们的工作进行传播的方式,以及把这些知识转换成科学家,政治界,经费资助者和公民间进行公开讨论的问题,但是我这里只探讨一个问题:获取科学传播的学术出版物。科学传播杂志( JCOM )也许是唯一一个致力于科学传播的开放存储的杂志。科学传播中的大多数学术著作同在传统的杂志中发表,它们并没有开放存储的政策,因而,政策制定者和科学记者都冒着发展中国家无法获取的危险,更别说那些其他从业者和普通公众了。这听起来也许有些奇怪,而且虽然有几个科学共同体深入探讨了开放存贮出版物的问题和需求,但是这个议题从来都不是 PCST 共同体探讨的核心问题。大多数科学学科中的科学家现在开始使用办公自动化( OA )系统,比如杂志,数据库,预先打印稿等。可笑的是,致力于研究科学传播结构的科学共同体见证了这个转型,但是却没有直接参与其中。科学传播论文很少发表在开放存储的杂志中。 这个问题的另外一个方面就是大多说杂志(包括 JCOM )并没有采取最新的工具来向社会媒体开展科学传播。虽然一些在线的科学杂志开始为读者提供可以就它们发表的文章进行讨论的工具,但是 PCST 共同体的大部分参考杂志都是封闭且有些“过时的”。我这里并不单单指博客,同时也指那些给我们发表了论文但没有意识到评估内容相关性的新方式的杂志,比如社会网络的影响,下载数,评论等等。科学传播论文很少在社会媒体中引起反响。 那么我们可以做什么呢?显然,我们必须意识到这些问题对于社会科学来说是重要的。但是科学传播有它自己的特质。一方面有结构性的问题。开放存储出版物从经济和发行一本新的杂志或者建立一个新的数据库所需的精力方面来看可能会造价昂贵的。学术性的科学传播长期遭受了缺乏经费的折磨,也没有把自己变成制度化的学科,这使得事情更加复杂。但是文化方面的问题也发挥着作用。只要新一代科学传播研究人员不对当前的体系提出质疑,这种情况就不会发生变化。最后,还不清楚在我们未来转向一个更加开放的传播环境的时候,我们是否还要依赖当前的学术刊物出版商吗。即使它们最近开始了自动化办公的实验,学术刊物出版商比如 Sage 和 Elsevier 都是私人公司,它们的商业模式要依赖于大学图书馆的订阅并且它们并没有把这些内容向更广泛的读者开放的动机。就像很多科学领域一样,科学传播领域的变化很可能来自于外部的压力,而不是出版商自己的决定。独立自主的行动是这个改变的前提条件。 就像我说的那样,科学传播体系的历史和保持不同传播实践运行的经济性和社会性的激励措施相关联。同时我们也知道技术创新通过给科学共同体提供新的可以用在更独立和更开放环境中的工具而改变了这些实践。印刷术的出现是科学革命以及建立开放科学这个转向背后的主要原因。以印刷为代表的技术创新随之带来的是新的科学出版物的出现以及给科学家提供了在独立且开放的体系中发表学术出版物的机会。然而根据一些作者的观点,这个体系限制阻止了新的更加开放的传播实践的出现。另外一方面,互联网为我们提供了新的工具,科学本身也给我们提供了例证,并且告诉我们开放存储出版的可行性和有利条件:我们为什么不就我们的出版系统开始一个(公开的)辩论呢? 原文载于: A. Delfanti, Open Access and Science Communication. Reflections on the need for a more open communication environment, Jcom 11 (02)(2012)E