科学网

 找回密码
  注册

tag 标签: 万维网科学

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

万维网科学的历史、发展和挑战
热度 9 lionbin 2017-1-24 16:08
我最早接触互联网,是1995年参加中国科学院百所联网科学数据库建设之时。那时,频繁地在Netscape或IE中输入WWW的时候,就很奇怪,这三个W组成的字母究竟是什么呢?通过学习,慢慢理解了,WWW是World Wide Web的缩写(有时候仅仅用Web,也是WWW的含义),是互联网所提供的服务其中之一,一个由许多互相链接的超文本组成的系统。其核心,由统一资源标识符(URI)、超文本传送协议(HTTP)和超文本标记语言(HTML)三个标准构成。提姆·伯纳斯·李(Tim Berners-Lee)被称为 WWW之父,他在1989年,看到了将超文本系统与互联网结合在一起的机会,并在1990年9月至12月创建了这样的系统,并于1991年的8月23日正式向公众开放。1994年6月,北美的中国新闻电脑网络(CND)在为其电子刊物《华夏文摘》推出网站服务时,中国科学院已故院士、科学网李小文先生通过电子邮件提出翻译为“万维天罗地网”,简称“万维网”,正好与汉语拼音的简称完全相符,大家一致认为这个译法“信、达、雅”面面俱到,一锤定音。于是,“万维网”成为World Wide Web的标准翻译被广泛采纳 。 万维网的诞生,从根本上改变了我们生活的方方面面,对世界产生了深刻而又复杂的影响。 人们越来越认识到,必须有一个明确的研究议程来了解当前不断变化的潜在网络,更需要创建一个新的领域来探索万维网潜在的科学、工程原理和社会影响。2005年9月,在伦敦举办的英国计算机协会的研讨会上,万维网研究的科学家们讨论了构成万维网科学内核的科学和工程问题。与会人员考察了万维网的新趋势,并就如何利用新媒体的机会、数据资源以及知识库“网络化”的具体类型进行了激烈辩论。该研讨会涵盖了广泛的技术和法律主题。例如,从已经进行了许多研究的万维网构架和拓扑结构到网络连接的法律问题等等。这项工作使得一些人认为万维网的发展遵循一个进化路径,建议在一个生态条件下观察万维网。 分析万维网需要更好的数据模型是显而易见的。给定一个主题,如何找到权威的网页?对于这样一个简单的问题,传统的信息检索技术对于规模越来越大的网络是不够。人类在网络上交流的话题是可以通过链接矩阵进行分析的,信息检索和基于结构的搜索中的数学问题,定会随着万维网的发展变成一个热门的研究领域。然而,为模拟万维网所开发的数学框架,在方法有很大的不同。虽然系统分析中面向过程的方法、人工智能和语义研究的符号建模方法、以及在网络分析中所使用的数学方法都是相关的,但目前还没有一个数学的模型可以统领一切。十多年前的万维网正在经历一次从文本文档到数据资源的扩展。在人类可读文档的网络中,自然语言处理技术可以从这些文本中提取一些语义。这些方法是基于“隐藏”的语义,但计算机通过使用启发式技术来概括人类之间通信的意图。在关系数据和逻辑判断的“语义网”中,如果将计算机逻辑包含在这些元素中,就可以做得更多。研究人员可使用新的、基于逻辑的语言来回答问题,进行假设检查和数据建模。 次年(2006年),提姆·伯纳斯·李等在Science上发表了一篇文章“创建万维网科学” ,提出应形成专门的跨学科研究团体,推动万维网科学的各种学术计划和研讨会。这里讨论万维网的时候,特意加上了“科学”二字。物理学和生物学是人们能理解的科学,它们分析自然世界,试图通过寻找微观规律来外推到宏观领域,这是建立在观测行为基础上的研究。相比之下,计算机科学,虽然也进行局部分析,但主要还是综合的。如果要产生新的计算机行为,就涉及到构建新语言和算法。万维网科学正是这两个特征的结合。万维网是通过正式指定的语言和协议创建的工程空间。然而,由于人类是网页的创造者,与之有紧密的联系,其相互作用形成了万维网上宏观尺度的全新模式。人类的互动受社会习俗和法律的约束。因此, 万维网科学本质上必须是跨学科的,其目标一方面是要了解万维网的发展,另一方面又要创造新的方法让更强大和更有利的模式出现。 又是十年过去了,互联网已经成为信息传播的主要手段,不管是在科学研究还是公共领域,万维网日益成为一个重要的资源,并频频对现有的技术和社会管理提出挑战。 十年前,几乎没有多少人使用智能手机,大数据的概念还只是在学术圈有人提及,更没有人知道,数据科学会成为世界上最酷的工作。十年后,社会已经越来越依赖于互联网技术,几乎涵盖了通讯与处理信息的方方面面,网络访问正变得越来越移动且无处不在。 于是,2006年与提姆·伯纳斯·李一起合作发表那篇里程牌文章的两位合作者James Hendler和Wendy Hall在十年后再次撰文,探讨了近十年来万维网科学的发展 。 他们认为,过去十年万维网科学的研究人员一直专注于万维网各方面的发展。如今对数据科学的兴趣可归因于大量的信息存储,无论是结构化的(元数据组织在明确的字段中,如温度或降水)还是非结构化的(文档,图像和视频)数据,都为网络所用。基于移动网络平台的信息,如智能手机的地理定位信息,越来越多地应用于打车、旅行等新兴产业和共享经济(如共享单车)中。社交媒体分析师们希望能从数学和社会两个方面解析一些问题,通过结合社交网站中所分享的信息和移动应用程序(apps)中所收集的信息能更全面地反映某种趋势。虽然移动应用程序看起来并不像网页浏览,但它们都是依赖于同一个网络体系结构。现在,世界各地各级政府都习惯通过网络发布一系列开放数据了——从实时公共交通到到环境病原微生物报告。网络出版也正让研究人员能更快更方便地获得杂志和会议论文,还有一些在线论坛正为科学家和更广泛的研究团体提供新的信息资源。维基百科等网站是由多人互动所推动的,越来越多的公民科学网站,如拥有众多公民科学项目的宇宙动物园网站(Zooniverse),为科学家与万维网志愿者们的互动提供了新的方式。这些网站利用了数以百万计人的认知能力,其结果是“社交机器”在社会影响力方面的影响是极其强大的,仅仅维基百科每月的浏览量就高达数十亿。 2009年,IBM提出“智慧地球”概念,被美国人认为与当年的“信息高速公路”有许多相似之处。当年,美国将新能源和物联网列为振兴经济的两大重点,中国政府总理“感知中国”的讲话也推动将物联网正式列为国家五大新兴战略性产业之一。物联网这个物物相连的互联网技术,让所有的物体都具有收集和交换数据的功能,无疑会产生更多的信息,这些信息不仅是个人的运动数据,还包括现代社会中有关能源和各种资源的的信息。可获得信息的增长也导致许多领域对数据分析的利用越来越多,自此, 网络科学、数据科学和万维网科学正帮助那些为解决大尺度问题的科学家和工程师们产生新的技术。 2012年,遍布世界各地的万维网科学实验室开展了一项研究,称为“网络观测台”(Web Observatory),旨在收集和分享有关万维网利用的数据。随着研究的开展,该工作从静态分析转移到实时跟踪万维网使用的变化,并不断改善预测模型来了解互联网上信息使用的影响。在计算机科学中,与万维网相关的研究主要集中在信息检索算法以及通过互联网的信息路由算法。而计算机科学之外的研究人员却越来越依赖于网络,但他们也没有办法探索万维网上所出现的新趋势,也没有与万维网研究群体讨论如何为科学家的需求服务。 万维网科学研究人员正在研究我们可以从众包、群体智能、公民科学以及各种基于万维网技术所累积的数据中获得什么。 那些设计成功且妥善运营的网站有什么开发原则,如何为科学家和其他网站创立者降低进入门槛。 当然,随着万维网信息的不断增长,数据提供者与信息潜在用户之间有关隐私问题的张力也会随之加剧。如互联网管理及其政策、万维网工程原则、数字身份,数字文化,以及社会面临的隐私和道德问题,因为我们现在的生活越来越多是在线的。目前,更多的学生正进入科学、技术、工程和数学(STEM)领域,这带来了不菲的经济优势。无论在发达国家还是发展中国家都有一个共同认识,在当今社会发展中社会科学和人文科学的价值较小。然而,万维网不仅是机器的网络,它是世界上数十亿的人以前所未有的方式相互作用的网络。关注万维网科学和工程对社会的影响,同时社会也对万维网和互联网的发展产生影响,这需要我们深刻地理解社会-技术系统。因此, 万维网科学必须保持一个跨学科的追求,团结一大批来自物理和数学、工程、人文科学和社会科学等许多领域的研究人才,这样万维网才能继续使人们团结在一起,为社会提供难以想象的机会。 参考资料: (1) “万维网”一词是李小文院士的首创与独家发明——大概率事件 (2) Tim Berners-Lee, Wendy Hall, James Hendler, Nigel Shadbolt, Daniel J. Weitzner, 2006. Creating a Science of the Web. Science, 313: 769-771. (3) James Hendler, Wendy Hall, 2016. Science of the World Wide Web. Science, 354: 703-704.
个人分类: 一起读顶刊|13171 次阅读|16 个评论
对“万维网科学”的一些想法
yzeng 2008-7-14 15:58
万维网科学(Web Science)诞生的过程大抵是这样的:研究、实践者们意识到万维网已经在各个研究领域、生活中给人们带来了巨大的变革,其发展不单涉及到计算机科学,也给社会学、心理学、物理学、数学、经济学带来了很多新的挑战(如基于万维网的社会网络 、万维网上的信任关系 )。因此我们不能够仅仅停留在使用万维网上,而应当将其作为研究对象,吸引来自不同学科背景的研究者和实践者,发展成一个交叉型的学科 。 WSRI创建者中的两名,Wendy Hall教授, Nigel Shadbolt教授,分别在大会上对WSRI进行介绍和进行研讨会Keynote Speech(笔者摄于 WebEvolve2008 研讨会) 万维网科学(Web Science)这个关键词进入人们的视野可能是源于英国计算机学会2005年9月在伦敦举行的Web Science Workshop ,而广为人知的时候应当是在万维网的发明人Tim Berners-Lee连同英国南安普顿大学、美国麻省理工大学的若干名教授在《Science》上联合发表论文Creating a Science of the Web之后。 随后,Foundations and Trends in Web Science期刊的诞生、首届万维网演化研讨会( WebEvolve2008 )的举行、以及在CACM , IEEE Intelligent System 等杂志上一系列相关文章的发表、万维网科学研究中心( WSRI )的成立,使得万维网科学作为一个科学领域开始被人们接受。而2007年7月30日,由王飞跃教授、蒋昌俊教授等学者组织的第99期东方科技论坛 万维学的基础理论和应用 在上海的召开、科学时报的一篇王飞跃教授的文章 、 东南大学万维网科学研究所 的成立、以及2007年 东南大学万维网科学研讨会 的召开,也标志着这个领域在我国引起了专家学者的广泛关注。 左图:东方科技论坛 万维学的基础理论和应用 研讨会 (图片来自 同济大学电子与信息工程学院新闻 ) 右图:2007年 东南大学万维网科学研讨会 (图片来自 东南大学万维网科学研究所 网站 ) 自从这个领域提出开始,就不断地接收到各种各样的意见。例如万维科学中没有特别强调数据挖掘的作用 ,以及万维科学的提出者对内嵌于社会的理解需要更为深入 等等(James等人在2008年7月CACM上的文章可以看作是对万维网科学的社会性的初步解释 )。甚至还有很多人提出万维网科学根本不是一个新的研究领域(就我了解到的情况,2004年Webology的提出似乎与Web Science有着很相似的目的 )。 这让我不禁想起两个相关的事情。首先是一个类比,即万维网科学与计算机科学。正如学者们意识到计算机相关的理论、工程与技术需要成立一个专门的学科来进行研究的时候一样,计算机科学被提出了。然而这并不意味着计算机科学是一个全新的研究领域,因为其相关的学科早已开始对此类问题的研究(众所周知无论从计算机体系结构还是从程序设计语言等领域来讲,开拓者们大都是来自物理和数学领域)。万维网科学与此类似,无论是从社会学角度研究万维网,还是提供适合万维网上的知识表示与推理方法,都不是什么全新的研究领域和思路。万维网科学的贡献并不在于一个具体的方法、模型,而正如计算机科学一样,它使人们意识到:我们应当把万维网当做一个学科来研究。另外一个事情便是Science 2.0 ,《Science》上刊登了这篇文章之后便有人提出《Scientific American》以及万维网上早有相关概念和思想的讨论,而似乎忽略了作者的本意,即让人们意识到现在的科研方式与传统的科研方式之间的改变,并拥抱这种变化。 站在这个思路上来看,我们似乎就不会去思考万维网科学是否全新,是否有创意。而更应当关注的是:是否有必要成立这样一个学科,我们能够为这样一个学科做哪些具体的工作。 历史证明了一切,很少有人会记住谁第一次提出了计算机科学这个词,而广为人知的是冯.诺依曼(John Von Nouma)、狄杰斯特拉(Edsger W. Dijkstra)、高德纳(Donald E. Knuth)等这些解决了领域中具体问题、提出了领域中具体方法的这些人。因此若干年后,我们可以预见,为人们所记住的也必然是解决了万维网科学当中关键问题的名字。 我们应当以什么样的态度来面对这样一个学科呢?James的文章 中有这样一句话:万维网的变化速度使得知识最渊博的研究人员都很难洞悉 ,因此面对着这样一个分散式 的社会机器(Social Machine) ,我们如果能够首先赶上其发展的步伐,又能够在保持其蓬勃发展的同时避免不可预期的影响 就再好不过了。 那么站在万维网科学自身来看,究竟有哪些相关的学科需要参与到万维网的发展中来呢?万维网科学研究中心给出了一个初步的设想,即至少包括:计算机科学、数学、人工智能、社会学、心理学、经济学、法律、生物学、生态学、媒体学等等 。由此想到的一个问题便是,倘若真要开设万维网科学这样一个专业,需要开设的相关课程也就逐渐清晰了。然而与传统的课程间还是应当有区别的,例如针对万维网科学来说,生态学课程的内容可能需要与万维网有机的结合,发展为一门Web生态学(Web Ecology) 。而讲授传统的人工智能课程也显然不能满足万维网科学的要求,一门探讨万维网上的人工智能和社会智能的学科Web智能( Web Intelligence )也是十分必要的(这个学科已经经历了8年的发展 )。 我有幸参加了首届万维网演化研讨会( WebEvolve2008 )。一个深刻的感受便是,无论是万维网科学的提出者,还是与会者,都有一个强烈的共识,即应当将万维网当做一个学科来研究、发展,以及应当由来自不同领域的研究者共同参与。对于这样一个学科,美国和英国已经动起来了,我们国家东方科技论坛上与会专家也倡导了,但在我们国家,什么时候才能够真正成立起一个学科来呢?我们国家相关的学者又能为这样一个领域做些什么工作呢? 参考文献: Alireza Noruzi. Introduction to Webology. Webology, 1(1), Article 1, 2004 (http://www.webology.ir/2004/v1n1/a1.html). Andrew Smith, Mark Gerstein. Data Mining on the Web, Science, letters, vol 314, 15th December, 2006. Ben Shneiderman. Web Science: A Provocative Invitation to Computer Science, Communications of the ACM, 50 (6). 25-27, 2007. Ben Shneiderman. Science 2.0. Science, vol 319, 7th March, 1349-1350, 2008. Hai Zhuge, Shi Xiaoqing, The Web ecology. Proceedings of the First International Workshop on Understanding Web Evolution (WebEvolve2008), 27-34, 22nd Apr 2008, Beijing, China. Harith Alani, Peter Chandler, Wendy Hall, Kieron O'Hara, Nigel Shadbolt, Martin Szomszor, Building a Pragmatic Semantic Web, IEEE Intelligent Systems, 23 (3), 61-68, May/Jun, 2008. James Hendler, Nigel Shadboldt, Wendy Hall, Tim Berners-Lee, and Danny Weitzner. Web Science: An interdisciplinary approach to understanding the World Wide Web, Communications of the ACM, July 2008. Jennifer Golbeck. Trust on the World Wide Web: A Survey, Foundations and Trends in Web Science, 1(2), 131-197, 2008. Ning Zhong, Jiming Liu, Yiyu Yao and Setsuo Ohsuga, Web Intelligence (WI), Proc. the 24th IEEE Computer Society International Computer Software and Applications Conference (COMPSAC 2000), 469-470, Taipei, Taiwan, October 25-27th, 2000. Ning Zhong, Jiming Liu, Yiyu Yao. In Search of the Wisdom Web Special issue on Web Intelligence (WI), IEEE Computer, 35(11), 27-31, November 2002. Prabhakar Raghavan, Social Networks: From the Web to the Enterprise, IEEE Internet Computing,6(1), 91-94, Jan/Feb, 2002. Tim Berners-Lee,Mark Fischetti. Weaving the Web. HarperSanFrancisco, 1999. Tim Berners-Lee, Wendy Hall, Jim Hendler, Nigel Shadbolt, Daniel Weitzner (Eds.). Web Science Workshop Report. British Computer Society, London, 12th-13th September, 2005. Tim Berners-Lee, Wendy Hall, James Hendler, Nigel Shadbolt, Daniel J. Weitzner. Creating a Science of the Web, Science, 313, 11st August, 769-771, 2006. Tim-Berners Lee, Wendy Hall, James A. Hendler, Kieron O'Hara, Nigel Shadbolt, and Daniel J. Weitzner. A Framework for Web Science. Foundations and Trends in Web Science: Volume 1, Issue 1, 2006. 王飞跃. 万维学 面向下一代网络世界的新兴科技前沿, 科学时报,2006年11月24日. Colliding Web Sciences. (http://webscience.org/images/collide.jpg).
个人分类: 万维网科学|7026 次阅读|2 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-19 03:11

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部