科学网

 找回密码
  注册

tag 标签: 万维网

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

[转载]万维网创建者的公开信
Fangjinqin 2017-3-17 21:42
正在加载第2页 正在加载第3页 正在加载第4页 上一页 下一页 1/42/43/44/4 1 2 3 4
个人分类: 信息通报|1425 次阅读|0 个评论
“万维网”一词是李小文院士的首创与独家发明——大概率事件
热度 6 hillside 2015-1-12 21:28
——由“三维空间”核裂变为“万维网” ,也许真出自老邪先生的异想天开! 小文先生对于文字锤炼有比较浓烈的爱好,他的博文时常三言两语,可谓微言大义。 我也喜欢咬文嚼字,发表过专门的学术文章《跨学科视角下的“水到渠成”新释》。2012年下午,我在科学网曾经发起过对“robust”汉译名称的讨论(《令人费解的鲁棒性——论robust的汉译》, http://blog.sciencenet.cn/blog-350729-529132.html 2012-1-15 13:42 ),小文先生当天深夜撰写了《怎么理解“鲁棒性”》的短帖进行响应:“老邪是这么理解的:鲁智深那根禅杖,很结实。”( http://blog.sciencenet.cn/blog-2984-529259.html 2012-1-15 23:11) 小文先生曾出过一个上联“哈韩、哈日,不如哈佛!”,我也曾试对以“耶娘耶苏,不输耶鲁!”( http://blog.sciencenet.cn/blog-2984-754578.html 2013-12-31)进行唱和。 由上述可以看出小文先生推敲文字的精神。 读到智宇博友的《美国最著名中文网站发文悼念李小文先生》( http://blog.sciencenet.cn/blog-1374168-858585.html ),该消息提到,李小文是“万维天罗地网”(简称“万维网”)的发明人(参看附1截图)。 经过一番查证,我大致已经认定, “万维网”一词确实是李小文院士的首创与独家发明,“万维天罗地网”也非常符合小文先生信马由缰、天马行空的浪漫想象。 欢迎海内外有知的网友进行补充与点评。 附1: http://blog.sciencenet.cn/blog-1374168-858585.html 附2: http://it.dgzx.net/personalweb/20021/dxxgx/web/x_zhishi/qiyuan.htm Internet译为中文,有译成互联网、国际网络、因特网 等,这里使用互联网这个名称。互联网的来源地是美国,而追溯美国互联网的起源,是可以从1957年苏联抢先用火箭发射第一个人造地球卫星Spunik一号说起,那时苏联抢在美国前头发射人造地球卫星,使美国朝野大受刺激,全面检讨国家的科学技术政策和教育,以便急起直追。当时美国总统艾森豪威尔决定设立一个用来发展科学技术的机构,叫做ARPA(Advanced Research projects Agency), 就是这个机构后来提供经费设立最早的互联网,它叫做APRANET。 互联网的发展成世界性的特大网络,本来是用来在各大学之间交换科学研究信息,但后来大家更感兴趣是它的电邮功能(E-mail)。就是说,大家更感兴趣的是利用互联网传送各种各样的信息,包括私人的信息。早在互联网只能传送文字信息的时候,有机会接触互联网的人用它来讨论各种各样的问题,而现在已成 为一个重要操作系统,就是在那个时候由散居世界各地的电脑编程人员,通过互联网进行讨论和交出自己的研究成果,而逐渐形成一个完整的操作系统。 后来在互联网中产生具有多媒体功能的 万维网(WWW) ,本来其目的就是让世界各地的核子物理学家能够分享欧洲粒子物理研究所(CERN)的研究资料。结果对万维网最感兴趣的是互联网的普通用户,而这个时候个人电脑的功能越来越强大,价钱便宜的已具有多媒体的功能,就是说大家已有条件使用万维网了。因此万维网的用户越来越多,让用户可通过电话线以计时的方式接驳到互联网。  由于互联网所用的方法简单好用,很快就可以找到所需要的资料,而由于大家都习惯了互联网所用的方法,因此现在企业内部的网络也用互联网的方法,它叫做内联网(Intranet)。 互联网在发展远程教育、人际交流和计算机开发等方面发挥着巨大的作用,多媒体与网络结合实现“交互式”传播,进而引起新的传媒革命。互联网的出现也引发了许多新生事物,如网上婚姻、网上购物、网上大学等。 附3: 北美万维网:http://www.creaders.net 2014-04-28 17:33:34 新京报 (该网站国内无法打开,转引自嵇少丞博客:《中科院扫地僧院士爆红 泰斗级的海归专家》《 http://blog.sciencenet.cn/blog-51597-789666.html 》) 注:我判断该网站名称“万维网”可能与小文先生相关,但限于网络无法连接的现状,我暂时无法直接追查。 附4: http://blog.sina.com.cn/s/blog_4b531f6401007xs2.html 第一份中文网络杂志——《华夏文摘》研究 1994年 1994年4月5日 《华夏文摘》庆祝该刊创刊三周年,出版“电脑网络与电子刊物专辑”(编辑张名,美国),刊登鲁冰夫《电脑中文杂志〈华夏文摘〉》等文章,回忆CND和《华夏文摘》的创办过程 1994年5月15日 《华夏文摘》推出增刊第35期“归国见闻与感想专集”(编辑:萧同,美国), 1994年6月4日 CND的万维网服务站正式开通。 《华夏文摘》 在 第166期 的启事中, 第一次将WORLD WIDE WEB 译为“万维天罗地网”,简称“万维网”。这一译名后来被广泛接受。 1994年10月 CND万维网站开始提供《华夏文摘》HTML(GB码、HZ码)版。1995年4月,又提供《华夏文摘》HTML(BIG5码)版。 附5: http://tieba.baidu.com/p/848912695 第一份中文网络杂志《华夏文摘》,不是新语丝 1994年6月,它第一次将“World Wide Web”译为“万维天罗地网”,简称“万维网”——这三个汉字拼音的开头,也是“WWW”。这一中文译名直到今天仍被广泛使用。 附6: http://blog.sciencenet.cn/home.php?mod=spaceuid=51597do=blogid=861052 记得1994年5月底6月初,CND/《华夏文摘》即将推出 WWW.CND.ORG 网站服务时,编辑们在内部电邮里热烈地讨论World Wide Web 应当怎样翻译才好。李小文在最后时刻提出翻译为“万维天罗地网”,简称为“万维网”,与汉语拼音WWW完全相符,大家一致认为这个译法“信、达、雅”面面俱到,一锤定音,“万维网”一词后来被广泛采纳。 我想他能提出这个译法,应当与他的地球遥感专业背景有很大关系。有意思的是,我们的Old Lix 当时不能写中文,但是他可以用CND/《华夏文摘》志愿者魏亚贵编写的“zW DOS”PC软件阅读中文,所以他在讨论中用拼音来表达,“万维天罗地网”是他用拼音写出,附加英文解说,由另一位编辑转成汉字,才最终获得大家认可。 附6注:原始出处可能为: http://hx.cnd.org/?p=107034
个人分类: 人物沧桑|5713 次阅读|10 个评论
万维网开放20年
kejidaobao 2013-6-16 13:16
文/杨书卷 用鼠标轻轻一点,即可从一个网页轻巧地跳转到另一网页——如此简单的一个动作,在20年后却改变了整个世界。 互联网在20世纪60年代就已诞生,但并没有迅速流传开来,因为它操作复杂,网页内容和形式都极为枯燥,直到1989英国物理学家蒂姆·伯纳斯·李发明了World Wide Web,即WWW超文本传输,才以Web页图文并茂、声像结合、随意链接的浏览方式,给予了互联网靓丽的青春,互联网也随即被称为“万维网”。 更重要的日子是1993年4月30日,在那一天蒂姆·伯纳斯·李决定把他的发明无偿提供给全世界使用,并在他当时工作的欧洲核子研究中心建立了世界上第一个万维网网站,第一张Web网页在Internet上首次露面后,立即引起轰动,随即席卷全球。 现在,为了纪念这个历史上重大的日期,欧洲核子研究中心决定重建推出万维网的第一个网站,世界上第一张网页也在2013年4月30日被复刻上线,它的内容简单有趣,是关于技术的,使得早期的浏览者能够了解这一新发明并创建自己的网页。 这是万维网诞生20周年庆祝计划的一部分,目的是让人们了解万维网的起源、重要性及其对现代生活的影响。即时新闻、即时通讯、搜索引擎、维基百科、社交网络、音乐分享、图片分享、网络电视、网上购物、网恋、电子邮件、网络地图……种种眼花缭乱的应用构建起我们已须臾无法离开的网络世界,这其实都缘起于20年前那轻轻的一点(4月30日法新社)。 而互联网最伟大的特性——自由、平等、开放,也一直在被世界以各样的方式深刻诠释。在耶鲁、哈佛、麻省理工等美国知名高校都纷纷在网上提供课堂实录的录像即“网络公开课”以飨全世界的求知者后,由多个欧洲国家参与的“大规模网络公开课程”也于4月25日正式启动。“大规模网络公开课程”涉及数学、经济、电子商务、信息技术、气候变化、文化遗产、国际关系、语言学习等诸多领域,目前包括12种语言开设的近40门课程,只需登录网址www.OpenupEd.eu就可免费上课,为上百万的欧洲人提供低门槛、高质量的网络教育,它的启用成为欧洲教育史上的里程碑事件,体现了互联网的真正价值所在,也为纪念万维网开放20年书写了华丽的一章(4月26日新华社)。 20年后,互联网还在继续发展,近日,来自美国、巴西和中国的科学家首次在小鼠身上实验了一种“脑对脑接口”,为搭建未来一种有趣的“脑联网”提供了可能。 “我们以往研究脑-机接口,发现小鼠的大脑能轻松地适应和接受来自体外设备的输入。”项目负责人、美国杜克大学医学院教授米格尔·尼科莱利斯说,“所以,这次我们的问题是‘如果大脑能理解来自人工传感器的信号,那它是否也能理解另一个身体发出的感觉信息?’” 他们用微电极阵列植入小鼠脑部,并把两只小鼠的电极连接起来,一只作为“编码鼠”,另一只作为“解码鼠”。两只老鼠之前已被“训练”成熟——如果根据指示灯按下正确的杠杆,就会得到奖赏。但现在,两只小鼠分别关在不同的“小房间”里,“解码鼠”看不到指示灯,它要想按下正确的杠杆只能依靠能看到指示灯的“编码鼠”发出的脑部信息,而这些信息是经由脑对脑接口传入“解码鼠”脑中的。 研究人员检验了“解码鼠”的破译成功率,结果发现最大成功率达到了70%,只比理论值78%略低一点。他们看到,当“解码鼠”犯错时,“编码鼠”几乎也会同时改变它的脑功能和行为,而且脑对脑接口允许双向交流。 “这些实验证明,我们能在鼠脑之间建立起复杂的直接通讯连接。”尼科莱利斯补充说,“这是由‘一个中心、两个大脑’组成的神经系统。” 为了测试脑对脑通讯能达到多远,研究人员还将一只“编码鼠”带到了巴西,通过互联网和美国的“解码鼠”脑部“交流”,两只小鼠依旧表现出色。而且理论上这一系统不受大脑数量的限制,也可以是多个大脑组成的网络,或称“脑联网”,能在一对脑或多脑网络之间实现信息交流、处理和存储。以此为基础,还可能带来一个全新的学科领域——社会互动神经生理学(4月26日《科技日报》)。 当世界被WWW搅得天翻地覆时,它的发明者——蒂姆·伯纳斯·李,却一直安静地在一所普通的英国大学里继续着自己的研究。当时,他并不是没有看到WWW的商机——否则,他今天的财富足以和比尔·盖茨比肩——比他伟大的发明更伟大的是,他没有像其他人那样为“WWW”申请专利或限制它的使用,而是将WWW无偿向全世界开放,为互联网的全球化普及翻开了里程碑式的篇章,美国《时代》杂志这样称誉他的贡献:“与其他影响世界的发明不同,这是一件纯粹个人的劳动成果,万维网只属于蒂姆·伯纳斯·李一个人,他一手把只有精英们掌握的通讯系统变成了人人可用的大众媒体,几乎可以媲美古登堡印刷术。” 智能网、语义网、物联网、量子网络、“脑联网”……无论互联网发展发展到什么阶段,透过这些纷繁互联网最核心的精神是不变的,那就是“永远的开放与创新”。当然,不断增多的安全威胁,比如病毒、恶意软件和对隐私的侵犯等,也为互联网的未来发展蒙上了一层阴影,但透过蒂姆·伯纳斯·李的人性光辉,也许可以让我们相信,人类自身有着追求美好本质的力量,它能带领互联网走向更加美好的未来。 正因如此,蒂姆·伯纳斯·李亮相2012年伦敦奥运会开幕式,打出了“This is for everyone(互联网献给所有人)”的字样,而独自一人坐在“电脑”前的他则享受了来自全世界的热烈掌声。
个人分类: 科技风云|2737 次阅读|0 个评论
一个万维网巨星的陨落, 一位万维网天才的消亡
热度 9 ZSHuang 2013-1-14 20:58
一个万维网巨星的陨落, 一位万维网天才的消亡
2013年1月12日,星期六,世界万维网组织及其万维网研究人员收到万维网之父发来的令人震惊的消息: Aaron is dead. Wanderers in this crazy world, we have lost a mentor, a wise elder. Hackers for right, we are one down, we have lost one of our own. Nurtures, careers, listeners, feeders, parents all, we have lost a child. Let us all weep. timbl 阿隆 已经死了。 在 这个疯狂世界的 流浪汉们 , 我们失去了一位 导师, 一位睿智的老者 。 为了 权益的 黑客 , 我们是一家人 了, 我们已经失去了 我们中的一位 。 培育者 ,职业者, 倾听者 ,反馈者, 以及所有的父母 , 我们已经失去了 一个孩子。 让我们 哭泣吧 。 --- 蒂姆·伯纳斯—李 ============================ 一个万维网巨星的陨落, 一位万维网天才的消亡。 连日来,愤怒与悲伤在学术界中蔓延。 详情请见: 一个理想主义黑客的死亡:冷酷仙境与世界尽头 http://tech.sina.com.cn/i/csj/2013-01-14/16477976515.shtml 美国著名黑客、RSS 1.0规范制定者、Reddit联合创始人阿隆•斯沃茨(Aaron Swartz)上周五在纽约的家中自杀身亡,年仅26岁。   这位攻破两大数据库一举成名的青年才俊,用悲剧为短暂的一生画上了句号。如果说,互联网信息的自由流动和分享是黑客们的冷酷仙境,那么斯沃茨以如此方式走到世界尽头,不禁令人扼腕叹息。   数字时代的罗宾汉   1986年出生的斯沃茨年少成名,在14岁时参与制订了RSS 1.0规范。他曾在斯坦福大学就读,但在1年后退学,并创办了软件公司Infogami,获得了硅谷著名孵化器Y-Combinator的支持。在后者的 建议下,Infogami在2005年与Reddit合并。   2006年,Reddit被卖给了美国传媒巨头康泰纳仕集团,斯沃茨转到该公司旗下的《连线》杂志工作,但过得并不开心。2007年1月,他被迫辞职,随后在哈佛大学Edmond J. Safra道德伦理研究中心担任研究员。   此外,他还是Demand Progress组织的联合创始人。该组织致力于推动有关社会公平问题的网上行动,例如阻止由好莱坞支持的互联网隐私保护法立法。   与Facebook创始人马克•扎克伯格、Twitter创始人杰克•多西和Instagram创始人凯文•希斯特罗姆等同龄人相比,斯沃茨的创业经 历算不上显赫。然而,他在工作之余干出了两件惊天动地的大事,成为整个黑客社区的偶像,并被英国《卫报》誉为“数字时代的罗宾汉”。   一个黑客的理想主义   斯沃茨的信条是:“信息即权力。但是,与所有的权力一样,有人希望将这种权力据为己有。”信息的自由流动和分享,成为这位年轻人在短暂一生中始终追寻的目标。   制定RSS规范,让PC用户多了一种崭新的新闻阅读方式,只是斯沃茨实现理想的第一步。他随后推动许多网站免费分享文件,成为互联网上的英雄。但很快,麻烦来了。   2008年,斯沃茨盯上了美国法庭电子记录公共接入服务(PACER)。该服务提供联邦司法案件的存档,每篇文档收费10美分。一些社会活动家认为, 这样的文档应免费提供给公众。斯沃茨随后编写了一个小程序,利用免费帐号从该服务中下载了2000万页文档,占整个数据库的约20%,并开放给公众。   美国联邦政府随后对这一事件进行了调查,但并未起诉。政府在某种程度上的宽容,让斯沃茨在后来的行动中更加肆无忌惮,也最终酿成了一场悲剧。   35年监禁与100万美元罚款   2011年,斯沃茨更进一步,希望将美国著名期刊数据库JSTOR开放给公众。他入侵了麻省理工学院的计算机网络,并下载了480万篇文档。   JSTOR随后表示,不会起诉斯沃茨。不过,美国马萨诸塞州地区法官卡尔曼•奥提兹(Carmen Ortiz)坚持起诉,并表示:“盗窃就是盗窃,无论你使用计算机命令还是撬棍,无论盗窃目标是文档、数据还是钱。”   同年1月,在斯沃茨因此被捕后的第三天,一个用户名为Greg Maxwell的人,在著名文件分享网站海盗湾上传了一个torrent文件,包含18592篇、共计32.48GB来自 JSTOR 的论文,并表示“这些论文应该对所有人免费”。   在支付10万美元保释金后,斯沃茨被放回了家中。截至斯沃茨自杀身亡,这一涉及网络欺诈和计算机欺诈的案件仍在进行中。如果斯沃茨被认定有罪,他将面临最多35年监禁和100万美元罚款。   自杀倾向   斯沃茨的好友奎因•诺顿(Quinn Norton)回忆道,斯沃茨很少谈论正在进行的诉讼,但这毫无疑问让他“精疲力尽”。   诺顿同时表示,斯沃茨近年来状态不佳,遭受了慢性疾病和沮丧情绪的困扰,但“至少对世界仍抱有希望”。   斯沃茨此前曾在个人笔记中谈到了对抗沮丧和自杀倾向的努力。不过,斯沃茨对世界有着自己的想法,而当前的世界并不符合他的想法,这令他感到人生的痛苦。   在2007年的一次谈话中,斯沃茨曾表示,在职业生涯的低潮期,他曾有过自杀的想法。他也谈到了如何应对沮丧的情绪。他曾表示:“出去呼吸新鲜空气,与相爱的人共处,这些不会使你感觉稍好,只会更失望。你无法感受到其他人的快乐,所有事情都令人悲伤。”   在情况恶化之后,他又写道:“你能感觉到痛苦的痕迹在你脑海中流动。你虐待自己的身体,希望逃离,但是做不到。这还只是较轻的症状。”   “这不是一个人的悲剧”   悲剧发生后,同情的声音迅速占据网络舆论的主流。斯沃茨的家人发表声明称:“阿隆的死并不仅仅是一个人的悲剧。这一罪恶的司法体系充斥着恐吓行为和无法无天的公诉人,最终酿成恶果。”这一言论迅速被媒体大加宣扬。   另一方面,近9000人在白宫网站请愿,要求奥巴马政府撤销对斯沃茨的指控。而麻省理工学院校长拉斐尔•赖夫(L. Rafael Reif)上周日对斯沃茨的死表达深切哀悼,称学校全体成员“对这样一位极富前途的年轻人的去世感到极其悲痛”,并将对此事展开内部调查。   然而,激进人士已经开始采取行动,攻击了多家与此事有关的网站。著名黑客组织Anonymous在黑掉麻省理工学院官网后,在该页面上发表一个声明, 提出了四项立法要求,包括修改计算机犯罪法案、修改版权与知识产权法等。考虑到Anonymous只是一个松散的黑客社区,这些诉求几乎不可能得到满足。   Anonymous在声明的最后写道:“你曾是我们中最棒的一个;愿你能够激发我们的无限潜能。”   (彦飞)
个人分类: 科海拾贝|12021 次阅读|10 个评论
一种统一的评价网络演化模型优劣的方法
热度 5 pb00011127 2012-5-19 21:11
大量生物、技术、信息系统都可以用网络来刻画,其中诸如互联网、万维网、 P2P 网络、在线社交网络等都是信息科学特别关注的对象。网络在演化生长的过程中表现出很多有趣的结构特征,比如集聚性、社团性、无标度性、小世界性等等。建立网络模型重现观察到的结构特性,是最常见的理解网络生长过程潜在驱动力量的方法。针对同一类网络甚至同一个网络,往往有多个理论模型,每一个模型都声称能够捕捉真实网络某几个方面的特征。由于刻画网络结构的特征量成百上千,数不胜数,模型 1 可能在刻画特征 A, B, C 方面胜过其他模型,而模型 2 给出最符合特征 D, E 的结果——事实上,直到现在,我们没有一种本质上有效的方法,来判断不同模型的优劣。 王文强等人的论文第一次试图解决这个困难的问题!链路预测是复杂网络的一种重要分析方法,其目标是通过学习当前观察到的网络结构,计算尚未出现连边的节点对之间存在连边的似然。受到这个方法的启发,王文强等人认为每一个演化模型原则上都对应于一种链路预测的算法,因此,如果把当前网络的真实结构看作基于一段时间之前的网络在模型对应的链路预测算法下预测得到的,我们就可以分析当前网络出现的似然。王文强等人认为,让当前网络似然更大的算法所对应的演化模型更好——这实际上提供了一个评价网络模型优劣的不依赖于任何特定的结构特征或特征组的统一的平台。 王文强等人以真实的互联网数据为基准,比较了有代表性的互联网演化模型的优劣。有趣的是,他们发现通过他们的评价机制得出的模型的“最佳参数”在刻画新增节点的性质的时候,要明显好于通过其他办法得到的“最佳参数”。该工作还隐隐约约包含了一个重要的思想,就是以前的研究,总是关注网络从无到有的过程,希望找到一个普适的模型,一股脑刻画网络一生的行为。实际上,网络初始的增长和中后期的增长机制可能是完全不一样的!链路预测更像是关注网络从少到多,从当前到未来的短期行为,这可能更加重要!即便是在一个模型下,通过与真实网络对比,不同增长时期的“恰当的参数值”也会不一样。这个问题在以前的研究中罕有讨论,但是可以通过本文提出的办法进行分析、挖掘。 论 文信息: W.-Q. Wang, Q.-M. Zhang, T. Zhou, " Evaluating network models: A likelihood analysis", EPL 98 (2012) 28004. 
 全文可通 过链 接 http://iopscience.iop.org/0295-5075/98/2/28004 获 取 全文下载: Evaluating Network Models.pdf
28349 次阅读|12 个评论
语义技术与活地球模拟器
热度 4 ZSHuang 2012-1-10 23:17
基于知识分析和推理的语义技术(Semantic Technology) 正在成为现代科学跨领域数据分析和知识管理的基础技术。 我很高兴地看到欧洲的FuturICT项目(又被称为活地球模拟器)把语义技术作为其技术基础,来实现这个雄心勃勃的研究计划。我注意到了下面关于FuturICT采用语义技术的介绍: ================================================ 在过去数年里,一种新的数据“语言”浮出水面,这让威尔班克斯的梦想看起来不再那么遥不可及。此语言源自于万维网(World Wide Web )创始人蒂姆· 伯纳斯—李(Tim Berners- Lee)2006 年阐述的若干原则。在这种“链接数据”格式中,信息的输入形式简洁明了:X和Y以某一特定方式相关;这种相关性可以是发布数据的人所想要的任何东西。例 如,如果知识共享组织想要以链接数据的形式发布他们的员工信息,他们可以用一系列“三元组”来提供数据: (triples) , ,诸如此类。 而且,由于世界上不止一个人叫约翰· 威尔班克斯,“领导” 一词也有其他意思,因此这些“三元组”中的每一个元素都包含着一个网络链接,指向一个权威的,或者清晰无误的信息源。例如,“约翰· 威尔班克斯”的链接或许就指向了他的主页,或者是CreativeCommons.org (知识共享组织的主页)介绍他的页面,或者是维基百科(Wikipedia )中关于他的条目。而“领导” 的链接则有可能指向一个标准词汇表,这个词汇表定义了他所起的领导作用的类型。这种关联结构可以让研究者将来自多个源头的数据联系起来,而无须先就一个用以解释各部分之间关系的抽象模型达成一致。这样一来就大大降低了发布数据之前数据准备工作的成本。它同样也提升了这些数据被发布后的价值。 ================================================ 关于活地球模拟器的情况,请看下面 环球科学杂志 的报道: 瑞士物理学家拟10亿欧元打造超级机器预测未来 如果你将有关这个世界的所有数据输入一个黑盒子,这个黑盒子能否变成一个水晶球,可以让你窥见未来——甚至还可以根据你的选择来测试将要发生什么?至少有一个人认为可以,而且他即将获得10亿美元的资金来打造这个黑盒子。   撰文戴维·温伯格(David Weinberger) 翻译张燕晶   在2010年,希腊不得不面对一系列潜在的后果。当然,这些后果不会有人愿意看到。希腊政府削减开支的尝试,2010年的夏季和秋季,希腊的财政危机撕开了全球经济的伤疤。 由于欠下了一屁股永远没有能力还清的债引发雅典街头的暴乱。同时,希腊债务违约的威胁,也给全球金融市场敲响了警钟。许多经济学家都认为,希腊必须退出欧 元区,并让其货币贬值,从理论上说,只有这样才能帮助经济发展。“没错,(希腊)有序退出欧元区将十分艰难,”美国纽约大学的经济学家诺里埃尔。鲁比尼 (Nouriel Roubini )在为英国《金融时报》(FinancialTimes) 撰文时指出:“但是,眼看着希腊的经济和社会缓慢而无序地崩溃,则是更糟糕的事。”   然而,越多的人担心,希腊一旦脱离欧元区,那么西班牙和意大而,没有一个人能够百分之百确定剧情将如何发展。越来利或许也会效仿,这样就会使欧盟的 关键纽带进一步削弱。但是英国著名财经杂志《经济学人》(Economist)却认为,危机会“促使布鲁塞尔(欧洲央行所在地)加强对财政政策的控制,将欧元区变为一个在政治上更加一体化的俱乐部”。这些结果还将进一步带来广泛的影响:申请进入欧盟的移民也许会转而涌入生活费用较为便宜的希腊;旅游人数的下 降,也会使得传染病的扩散受到限制;贸易路线的改变则会破坏当地的生态系统。   其实问题本身非常简单——希腊到底要不要退出欧元区?但问题将会带来的后果却很难预料,其结果过于复杂,即使是世界上最聪明的专家也无法把握这一切将会带来的变化。   德克· 赫尔宾(Dirk Helbing )是一位物理学家,同时也是瑞士苏黎世联邦理工大学的社会学教授,他试图花费10 亿欧元来打造一个计算系统,用以对世界上将要发生的事情作出有效预测。而前文提到的那些问题,恰恰就是刺激他这么做的动机。赫尔宾的系统绝不仅限于用来预 测金融、政策或环境等的某一方面。他的目标非常明确,那就是要预测一切——即这个世界上的所有事情——从而找到决策者面临的最棘手问题的解决方案。这个项 目的核心部分被称为“活地球模拟器”(LivingEarth Simulator),它试图模拟一个全球尺度的系统——包括经济、政府、文化趋势、流行病、农业、技术发展及更多领域——这需要用到巨量的数据流、高级 的算法,以及能让系统运转起来的硬件设施。在赫尔宾的竭力推销下,欧盟委员会被打动了,因此,他们在有6个项目参与的最终角逐中,将赫尔宾的项目排在第一 位,并向他的项目投入10亿欧元。   这个系统是对“巨量数据”最具雄心的表达,在许多科学家看来,此趋势堪与当年望远镜或者显微镜的发明相媲美。美国哈佛大学医学教授、社会学家尼 古拉斯· 克里斯泰基斯(Nicholas Christakis )说,呈指数式增长的数字化信息将计算机科学、社会科学、生物学等通过各种方式结合在一起,这让我们有能力应对那些此前无力解决的问题。克里斯泰基斯举了 一个例子,无处不在的手机可以创造出大量的数据,比如一个人正在前往什么地方,他们在购买什么,甚至可以追踪人们都在思考些什么。很多科学家都相信,只要 将这些数据同其他类型的数据结合起来——比如来自基因组学、经济学、政治,以及其他领域的数据——众多新颖的探索领域很快就会向科学家敞开大门。   “科学上的进步一般都是由仪器来推动的。”戴维· 雷泽尔 (David Lazer )说,他是美国西北大学计算机和信息科学学院的副教授,同时也是赫尔宾项目的支持者。有了工具,任务也就随之而来,如雷泽尔说的那样:“科学就像一个醉汉 在街边的路灯下找钥匙,因为那儿的光线更好。”对赫尔宾的支持者来说(其中包括来自全球的数十位备受尊敬的科学家),10 亿欧元的资金足以获得非常明亮的“光线”。但仍有许多科学家对是否需要将全球的数据汇集到一个中央数据库持怀疑态度。他们认为,更好的方式是通过互联网形 成数据云,然后通过链接来使它们能供所有人利用。这种数据分享格式能让更多人有机会浏览查看数据,然后找到潜在的联系,并为有竞争力的创意创造一个交流场 所。   超级复杂顶级模型   对现代科技而言,寻找各类数据之间的联系实属稀松平常,即使现在这些数据堪称海量,它们之间的关系也相隔十万八千里。例如,美国麻省理工学院人 类动力学实验室主任亚历克斯·彭特南德(AlexPentland )指出,研究者已积累了大量有关人类行为的匿名数据,足以通过分析这些数据,找出诱发II 型糖尿病等“行为方式疾病”(diseases of behavior )的行为学和环境方面的复杂因素。彭特南德说,这种海量数据挖掘的方法使得一项始于1948 年、累计有5 209 名自愿者参与的极具创意的心血管病研究 ,看起来就跟一项小组研究差不多。   然而,赫尔宾的“未来信息通信技术知识加速器”(FuturICT Knowledge Accelerator )以及“危机缓解系统”——这是该项目的正式名称——远远超越了数据挖掘的范畴。该项目包括“全球危机气象台”,四处搜寻危机出现的苗头,例如食物短缺或 者流行病的出现。它还有一个被称为“地球神经系统”的组成部分,能将分布在地球各地的传感器采集到的数据汇总起来。但是, FuturICT 的核心还是要数“活地球模拟器”,它可以对世界上正在起作用的,来自社会、生物、政治以及物理的无数力量进行模拟,并利用它们来获得对未来的认识。 模型的出现已经有大半个世纪了。早在1949 年,一位来自新西兰的工程师及经济学家比尔· 菲利普斯(Bill Phillips )用水管零件和一台拆下的汽车雨刮马达打造了一个模型,向世人展示了英国的经济是如何运转的。此模型基于对消费者开支、税收以及其他经济活动所进行的“假 设”调节,用有颜色的水模拟收入的流动。尽管用今天的标准来看,菲利普斯的模型还相当初级,但它却具备了模拟的基本运作方式:规定各个要素之间的一系列关 系,输入数据,然后观察结果。即使预测效果不准,这种误差本身也能成为有用的信息,可以用于改进模型。   现代社会没有电脑将寸步难行,没有模型也一样难以运作。但是你能时时刻刻都使用足够多的水管与水泵来建模吗?不仅是对火山喷发、短期经济增长的 影响建模,而且还要针对人类行为涉及的所有领域,从教育到疫苗的分配,能做到吗?赫尔宾给出了肯定的答案。他的自信部分源自他已经成功模拟了另一个复杂的 系统——高速公路上的车流。通过在计算机上对车流进行模拟,赫尔宾和同事设计出了一个模型,这个模型显示(同样是在计算机上),如果减小运行中的车辆的间 距,就能消除因汽车走走停停而浪费的时间。非常不幸的是,这个间距实在太过微小,以至于只有机器人驾驶才能做到。同样,赫尔宾还介绍了一个由他充当顾问的 计划,即模拟麦加的朝圣者人流。此计划的结果是花费10 亿美元重新规划建设当地的街道与桥梁,从而避免朝圣者互相踩踏造成大规模伤亡。实质上,赫尔宾把他的FuturICT 系统看作是这些交通模型的一个精心制作的放大版本。   但是,这种模拟只对很少一类情况有效,美国哈佛大学定量社会科学研究所的加里· 金(Gary King )说。在高速公路交通和麦加朝圣者的案例中,每个人(或者每辆车)都是朝着相同的方向前进,而且都希望能够尽可能安全、快捷地到达目的地。反观赫尔宾的 “未来信息通信技术知识加速器”却旨在建立复杂的模拟系统,这些系统内的人可谓形形色色,动机也各不相同;既有各种意外事件,也有无数复杂的反馈,并且可 以通过输入、输出以及反馈回路与其他相关系统相连。例如,一个城市的经济模型就依赖于该城市的交通模式、农业生产、人口统计资料、气候和 研究者计划打造一个能模拟整个世界以预测未来流来支撑。一种效果更佳的知识机器或许将诞生于万维网式的计算系统。然而,模型不够完美,许多研究者认为世界 的复的运作机制,例如互连与争论。这个项目将由研究人员现在随时可用的巨量数据杂性是模型永远也看不懂的。   流行病学情况,当然,这里只提到了其中一部分。除了要面对令人望而生畏的复杂性问题,科学家还列举了一个综合系统所必须征服的一大堆相互关联的 挑战。首先,我们目前还不具备一套完备的社会学理论,而这正是一个系统的起点。加里· 金解释说,当我们拥有一套可靠的关于事物如何运转的理论后,就可以建立起一个能够成功预测结果的模型,比如对物理系统来说就是这样。但是,目前我们所掌握 的无论哪一种社会行为学理论,在预测能力方面都还远远落后于物理学定律。不过,加里· 金指出了另一种可能性:如果我们拥有足够多的数据,我们就可以基于一些关于“规律如何形成的线索”来打造模型,甚至不用去知道规律到底是什么。例如,如果 记录下地球上任意地区的气温和湿度在一年内的变化情况,我们就可以开发出一套相对准确的天气预报系统,而不需要懂得流体动力学或者太阳辐射什么的。美国西 北大学复杂网络研究中心主任阿尔伯托—拉斯洛· 巴拉巴希(Albert-László Barabási)认为,我们已经开始利用数据来梳理一些有关人类系统的规律了。巴拉巴希同时也是FuturICT 项目顾问,他和同事最近公布了一个模型,可以根据人们过去的出行习惯,预测这些人明天下午5 点钟的时候都在什么地方,准确率可达90% 。做出这种预测没有用到任何与心理学、技术或者经济相关的知识。模型仅仅是分析过往数据,并以此作出推断。   但是,有时候为了让这些方法取得较好的效果,所需的数据量远远超过了我们的能力范围。卡内基· 梅隆大学的统计学家科斯马· 沙利兹(Cosma Shalizi )认为,如果你在思考100 种不同互动因素的问题时,想像思考二维问题一样准确,那么需要的数据量近乎天文数字。沙利兹总结说,除非你将就着使用那些无法把握社会行为学整体复杂性的 简单模型,“想要单靠数据打造出精确模型是不现实的”。   FuturICT 不会仅仅依赖于一个模型,不论此模型有多复杂。赫尔宾介绍说,它将把“计算机科学、复杂性科学、系统理论、社会科学(包括经济学和政治科学)、认知科学” 以及其他领域都结合起来。但是,模型的结合也会带来新的问题——复杂程度将呈爆发式增长。“假设天气与交通各有10 种情况,”加里·金说,“如果你想同时知道这两者的情况,需要知道多少事情?答案不是20 ,而是100 。这还不至于让我们感到绝望。它仅仅意味着我们所需的数据量增长得非常快。”   更棘手的是,一个模型的预测结果也将改变它在建模时自身所处的环境——预测结果做出后,它会反过来影响自身的准确性。印第安纳大学复杂网络与系 统研究中心主任、FuturICT 项目首席数据规划师亚历山德罗· 维斯皮尼亚尼(Alessandro Vespignani )说:“这是一个巨大的科学问题”。既然预测结果影响到其自身条件,那么,“我们要怎样才能开发出合适的模型,公共卫生应用钞票与病毒“同流合污” 想象一下,一种致命的流感病毒出现了。它将向何处传播?物理学家和流行病学家已经开始利用巨量的数据来预测流行病,以及怎样做才能阻止病情的蔓延。一些科 学家使用追踪乔治这个项目所提供的数据来模拟2009 年的H1N1 流感病毒在美国的传播状况(该项目跟踪数以百万计的钞票在美国境内的流动轨迹)。其他一些研究者则通过分析航空和陆地交通状况,以同样的方式来进行预测。 这些研究既让我们看到了巨量数据带来的希望,也暴露出其存在的问题:它们准确地预测了流感将传往何处,却严重低估了最终受感染的人数。   钞票在美国境内的流动情况反映了人口和病毒的流动。   使它所含的反馈回路或实时数据监测系统,能够让我们连续不断地改进算法并作出新的预测?”维斯皮尼亚尼说。   这样的模型还必须具备令人难以置信的复杂和详尽程度。比如说,如果你询问一个经济学模型,你所在的城市是否该把一些土地改做他用,而这个模型在 做决策时没有考虑食物链的问题,那么,从经济学角度来讲,它给出的答案或许合理,但对环境来说,可能就是一场灾难。世界上有超过1 000 万个物种,仅仅是了解每一个物种以什么为食,都会复杂得让人无比沮丧。而且,食物方面的相关差异还不仅仅停留在物种这个层次上。美国洛克菲勒大学的环境学 家杰西· 奥苏贝尔(Jesse Ausubel)指出,通过对蝙蝠胃里食物的DNA 进行分析,我们可以弄清蝙蝠都吃了什么。但是居住在某个山洞里的蝙蝠和仅仅数英里之外的同一类蝙蝠,它们的食物源都可能不相同。如果没有踩着那些海鸟粪, 进入一个又一个山洞具体考察,则依赖那些互相关联的模型的专家将有可能遇到不可靠的、会产生一系列连环作用的结果。   所以,虽然从理论上说,即使我们对模型所依据的根本法则一无所知,也能构造那些关于复杂现象的模型,但实际的困难也将呈指数式猛增。总有另外一 个层次的细节,总有另外一种因素在最后的结果中可能被证明是非常关键的。如果我们没有事先了解人们会怎样做,那么我们就不可能知道模型获得的 我们尚不 清楚,人类的是不是最终结果。大脑是否已经在基因组学和天文学等领域,建立在巨量数据上的有能力理解超研究业已取得许多成功,但级计算机给出是,在单一领 域的成功还不足以证明,当我们将多个领它们的答案时域通过高度复杂的方式相互的过程与依据。联系起来的时候,仍能取得成功。也许我们可以一点点地进步,但 也许存在这种可能性:对于涉及人类活动这样复杂的系统,模型的能力天然就是有限的。毕竟,人类系统通常服从于象征着不可预测性的两大理论:黑天鹅理论 (black swans theory )以及混沌理论(chaos theory)。 当预测结果难以理解时   什么模型可以预见到世界范围内每天都在发生的动荡?或者预见到2001 年9月11 日的那场恐怖袭击,以及它带来的深远影响?又或者预见到因特网从研究者专用的一个不起眼的网络,变身为全世界最重要的工具,催生或颠覆了整个行业?纳西 姆· 尼古拉斯· 塔雷伯(Nassim Nicholas Taleb )在他2007 年的畅销书《黑天鹅》(The Black Swan )中阐述道,这就是通俗化的“黑天鹅问题”(black swan problem)。“这个世界总会比模型更加复杂,”奥苏贝尔说,“事实永远如此。 ”   更糟糕的是,赫尔宾想要弄清楚的社会、政治以及经济系统,绝非复杂二字就能形容。这些系统具有混沌的特性。它们中的每一个都依赖于成百上千个独 特因素,相互间的关系非常复杂,而且还深受初始状态影响。在混沌系统中,每件事都有某种起因,或者更准确地说,每件事的发生都有多得不计其数的起因,因此 对事件只能作最普遍、最一般性的预测。例如,美国乔治· 梅森大学的气候学家、全球环境与社会研究院(Institute of GlobalEnvironmentandSociety )主席雅格蒂西·舒克拉(Jagadish Shukla )曾告诉我,虽然我们能提前5天预测天气,“但如果想要提前15 天做出预测,那是不可能的。无论你安置了多少个传感器,初始条件总会有误差存在,而且我们所使用的模型也不是完美的”。舒克拉说:“局限性并非来自技术方 面,而在于系统的可预测性本身。 ”   舒克拉一直小心翼翼地把天气和气候区分开来。我们也许无法预测100 年之后的某天下午是否会下雨,但是我们可以在一定程度上准确预知那时的平均海洋温度。“尽管气候是一个混沌系统,但它仍然具备可预测性,”舒克拉说。对赫 尔宾的模型来说也是如此。“复杂的金融市场运作也许比天气的可预测性更低,”赫尔宾在一封电子邮件中写道,“但事实上,我们可以通过对某些宏观经济数据 (例如,很多年以来,美国人的消费总是比收入增长得更快)的分析,预测出金融危机迟早会发生。 ” 但是,不需要一大堆超级计算机、天文数字般的巨量数据,以及花费10 亿欧元,我们也能获知这些。   如果模型的目的是为了给政策制定者提供有科学依据的咨 询意见(就如赫尔宾在证明10 亿欧元赞助费物有所值时所强调的那样),一些新的现实问题就会冒出来。首先,我们尚不清楚,人类的大脑是否已经有能力理解超级计算机给出它们的答案时的过 程与依据。当模型足够简单时——比如有关英国经济的“水工学”模型——我们可以追溯模型的运作,并意识到个人存款账户的缩水是加税过快而带来的一个意料之 外的后果。不过,那些依赖于大量数据计算,并需要通过结果反馈来加以调整的复杂模型即使能提供可靠的结果,其过程之复杂也是人类大脑所难以理解的。也就是 说我们只能知其然而不能知其所以然。   当我向赫尔宾问到这一局限性时,他停顿了一下,然后告诉我,他认为人脑能够理解的那些基本规律以及公式,最终可能都会浮现出来,因为他在研究交 通时遇到的情况就是这样。但是,汇集了金融系统、社会行为、政治运动、气象学以及地理学的交叉口,其复杂程度远非朝着同一个方向行进的三车道交通能够比 拟。所以,人类也许无法理解,当模型被问到一旦希腊脱离欧元区会产生什么结果的问题时,它凭什么会预言灾难即将到来。   如果无法理解为什么某一行动路线是最佳方案,一个国家的总统或首相就永远不可能据此采取行动——尤其是当这样的行动看上去荒谬可笑时。哥伦比亚 大学的统计学家维多利亚· 斯图登(Victoria Stodden )构想了这样的情景:一位政策制定者获知了“活地球模拟器”的预测,并宣布“为了让全世界摆脱经济危机,我们必须烧掉地球上所有的油井”。如果政策制定者 无法解释这样做的理由,那么这就是一个无法被执行的建议。毕竟,即使科学家事实上已经就气候变化带来的威胁大体上达成共识,政策制定者还是拒绝为每一个严 肃的环境模型所预测的未来做好准备。   网民与网民的争论 赫尔宾现在所描述的FuturICT 是一项巨大且复杂的工程,需要一个中央组织来对它加以管理,因此,也就难免出现这样或那样的实际问题。赫尔宾将负责监督一个包括硬件建设、数据采集、结果返回等工作的全球化项目。   但这不是约翰· 威尔班克斯(John Wilbanks )想要的。威尔班克斯是非营利组织“知识共享”(CreativeCommons )分管科学的副总裁,他和赫尔宾一样热衷于巨量数据,但他的直觉让他把目光投向因特网而不是钟情于建立机构。在威尔班克斯的领导下,一个旨在组建形形色色 的“共享数据”系统(data common),让所有人都可以利用它们的项目正在展开。这个项目旨在让全世界的科学家都加入到一个汇集了各种创意、模型和结果的开放的交流场所中。与规 划一个具备有序输入和高价值输出功能的形式化机构相比,威尔班克斯的方法可谓反其道而行之。   上面的两种方法强调了两种不同的价值标准。数据分享也许不能获得一个封闭系统实行的专业人员审核过滤制所带来的好处,但威尔班克斯坚信,这种方 法通过其“繁殖力”的优势足以地弥补这一缺陷 。例如,互联网允许每个人都参与进来,这就是它为什么能成为一个强大的创新引擎的原因。在威尔 班克斯看来,如果科学家都能利用到尽可能多的数据,如果一切信息都能对所有人开放,并且易于使用,而且这些信息能够实现跨学科、跨单位、跨模型的整合,科 学就能以最快的速度取得进步。   在过去数年里,一种新的数据“语言”浮出水面,这让威尔班克斯的梦想看起来不再那么遥不可及。此语言源自于万维网(World Wide Web )创始人蒂姆· 伯纳斯—李(Tim Berners- Lee)2006 年阐述的若干原则。在这种“链接数据”格式中,信息的输入形式简洁明了:X和Y以某一特定方式相关;这种相关性可以是发布数据的人所想要的任何东西。例 如,如果知识共享组织想要以链接数据的形式发布他们的员工信息,他们可以用一系列“三元组”来提供数据: (triples) , ,诸如此类。 而且,由于世界上不止一个人叫约翰· 威尔班克斯,“领导” 一词也有其他意思,因此这些“三元组”中的每一个元素都包含着一个网络链接,指向一个权威的,或者清晰无误的信息源。例如,“约翰· 威尔班克斯”的链接或许就指向了他的主页,或者是CreativeCommons.org (知识共享组织的主页)介绍他的页面,或者是维基百科(Wikipedia )中关于他的条目。而“领导” 的链接则有可能指向一个标准词汇表,这个词汇表定义了他所起的领导作用的类型。   这种关联结构可以让研究者将来自多个源头的数据联系起来,而无须先就一个用以解释各部分之间关系的抽象模型达成一致。这样一来就大大降低了发布数据之前数据准备工作的成本。它同样也提升了这些数据被发布后的价值。   这种“链式数据”的方式可以使更多人注意到某一特定数据集上,因而增大了某人偶然发现一个有趣的信号的可能性。更多的假说可以被测试,更多的模 型也可以被检验。“网民们的思想需要碰撞,”威尔班克斯说,“他们需要辩论模型中所用的变量和数学是否准确,还有前提假设是否正确。”这个世界非常紊乱, 以至于我们读懂它——比如及时发现潜在的金融危机—— 的最佳机会,就是让尽可能多的人都来对它指手画脚一番。对威尔班克斯和他的团队而言,让数据公开且可以通用是第一步,也是革命性的一步。在参与辩论的各门 各派中必定有一些拥有非凡智慧且打造出了精致模型的机构。但是,要让真相浮出水面,第一个而且最基本的条件还得是争论本身——网民与网民之间的争论。   威尔班克斯和赫尔宾都将“天量数据”看作是一场革新,他们也都期望,能被科学地理解的社会行为比我们前些年设想的要多得多。赫尔宾并没有打算通 过向赞助方描述“活地球模拟器”如何防止国家破产及全球危机以说服他们出钱(如巴拉巴希所言,“如果你试图说服政治家,那你就必须谈论最终产出”),而是 承认FuturICT 将会支持多个彼此间存在竞争的模型。而且,赫尔宾还渴望能完成人类历史上最大规模的一次数据采集,并将它们中的绝大多数公之于众。(其中一些必须保密,因 为它们来自商业机构的有限授权,或者包含了个人隐私信息。) 无论怎样,差异是实实在在的。对赫尔宾以及他的数据架构师维斯皮纳尼来说,确认FuturICT 支持多个模型不会让他们止步不前。“甚至天气预报都是基于多种模型完成的,”维斯皮纳尼说。然后他又说:“把它们结合起来,就可以得到一个有关各种结果发 生概率的统计推断。”对赫尔宾和维斯皮纳尼而言, FuturICT 的价值就在于它可以汇集多种模型,得出一个答案。   当然,数据共享的目标也是向真相汇聚。但它既然采用网络架构,它就承认甚至是鼓励富有成效的意见交锋。科学家可以使用不同的模型、不同的分类标 准、不同的术语,但是他们仍然可以彼此交谈,因为他们可以通过其共享的数据链接回到因特网或者现实世界中的某个已知的联系点。也就是说,他们可以各干各 的,但仍能相互交流甚至合作。威尔班克斯认为,差异不会消失,变成众口同声的一言堂,因为存在不同的文化,不同的出发点,甚至不同的脾性。这种数据大众化 的方法不但意识到差异的长期存在,而且承认甚至鼓励这种存在。   网络重新定义知识   最显而易见的问题也是最实际的问题是:哪种方法将取得更佳的效果?   归根结底,答案也许可以归结为对知识的本质特性的争论。两千多年来,西方一直将知识看作是一个已确定的、始终如一的真理系统。也许这种看法更多 地暴露了知识传播手段而非知识本身的局限性:当知识被不褪色的墨水写在纸上从而被传播和保存的时候,人们就会认为它通过了验证而且不会再改变。然而,新的 知识传播媒介不再是印刷出版物,更多的是通过公开的网络传播。我们可以从数据共享中获取大量知识,但它们随时以这样或那样的方式被修改,因此这些知识就更 像是一种连续不断的论证。事实上,这就是网络时代的知识:永远不会被完全确定,永远不会写完,永远不会彻底搞定。   FuturICT 平台的目标是打造出一个能足够完美地代表地球的机器,我们可以向它提问,并根据它的回答采取行动。这意味着我们可以通过生活中各个领域的逻辑模型来准确无 误地描述世界。而“链接数据”阵营的出现则在一定程度上是对这个观点的挑战。知识也许来自数据共享系统,即使它本身并不能完美地代表这个世界。   当然,除非这场各种观点间的混战——网民与网民间的争论——是对世界的更加完全真实的表述。
个人分类: 科海拾贝|4137 次阅读|15 个评论
语义万维网
jiangdm 2011-11-2 19:00
再看Semantic Web,我认为其应用只能在某些小范围,如图书文献。 不是说语义网没作用,只是太难太难,远景。 问: Semantic Web与明斯基的Frame框架何关系? *** 语义万维网中的大规模推理 黄智生 潘志霖 漆桂林 CCF通讯 ,2010-8 关键词 :推理 逻辑 本体调试与修补 1 引言 现有语义万维网和本体推理技术:基于描述逻辑(Description Logics) 其所面临的 主要困难: 1)海量性(Scalability) 2)非一致性(Inconsistency) 2 语义万维网的易推理技术 2.1 易推理技术概述 易推理技术: 指寻找其计算复杂度为多项式时间完全的(PTime-Complete)或者更低的推理算法,对于大规模语义数据的处理和推理尤为重要 万维网本体语言 OWL 基于OWL2的易推理主要由以下两个层面的技术组成: 1)子语言层面的易推理 2)OWL2-DL层面的易推理 近似的易推理 3 基于OWL2的易推理平台TrOWL TrOWL: http://trowl.eu/ : 基于OWL2的易推理平台,由阿伯丁大学知识技术(Knowledge Technology)课题组开发 3.1易推理技术发展趋势 4 基于描述逻辑的大规模本体调试与诊断 4.1 本体调试与诊断技术概括 本体调试算法 4.2 本体调试优化 4.3 本体诊断 4.4 大规模本体的调试与诊断技术的发展趋势 5 语义万维网中的大规模推理平台开发 5.1 语义数据处理和推理平台 个人点评: 不喜欢本体,过于空,本想一统天下,但难以逾越海量知识和知识内的Fuzzy两障碍 语义万维网中的大规模推理.pdf *** 语义万维网在医疗和生命科学领域的应用 陈华钧 谢国彤 潘越 CCF通讯 2010 关键词 :生命科学 电子医疗 本体 语义万维网 1) XML: 定义定制的标签格式, 2) RDF: 表达数据语义 3) 本体语言OWL: 描述万维网术语的明确含义和它们之间的关系 motivation: 使数据更加便于计算机处理和查找 objective: 使计算机在海量的网络资源中更加便利地找到用户需要的信息,从而将万维网中一个个现存的信息孤岛发展成一个巨大的全球共建的知识库 医疗和生命科学的语义万维网工作组: 突出贡献 1) 一个是关注药物发现的开放互联药物数据(Linked Open Drug Data,LODD)项目 2)另一个是转化医学本体项目(Translational Medicine Ontology Project,TMOP) 价值: 1) 开放数据关联的网络效应促进医疗领域的数据互联 2) 协作流程的自动化提高医学领域的跨域协作效率 3) 知识挖掘自动化促进医学领域的新知识发现 1 医疗与生命科学本体语言 1) 转化医学本体: 由W3C的医疗与生命科学兴趣小组和美国国家生物医学本体研究中心合作开发 2 语义万维网在医疗与生命科学领域的典型应用 3 语义万维网服务和基于语义的医学科学合作 4 基于语义的医学网络挖掘与分析 5 电子病历的语义搜索 Example: 中国一家三甲医院一年就可以产生上千万份电子病历,如何从这些电子病历中找到需要的信息就成了一个很困难的问题,对电子病历的搜索需求亟待解决? 6 基于临床指南的医疗决策支持 7 医学证据的语义搜索 8 总结与展望 个人点评: 针对于 生物信息学的数据挖掘,谈到本体我并不看好,好比巴比伦塔。图挖掘是当前研究热点,结合 Complex Network 和 小本体(语义),还是大有研究和应用前途。 文章 图 在文中没有标明引用。 语义万维网.pdf
个人分类: web service|3638 次阅读|0 个评论
万维网度分布符合幂律分布发现过程: Ronald Rousseau首先发现
热度 4 cosismine 2011-10-17 12:12
1997年Ronald Rousseau首先发现万维网度分布符合幂律分布,其文章发表在开放获取期刊Cybermetrics:International Journal of Scientometrics,Informetrics and Bibliometrics。其文章我上载在这里,有兴趣的同事可以看一看。 v1i1p1.pdf 其所用的样本比较小。1999年,Faloutsos三亲人用一个大样本集合证明同样的分布规律,其文章,我也上载在这里。 sigcomm99 Faloutsos.pdf Barabasi和Albert仅仅就这个现象加了一个preferential attachment的解释,而这一解释不过是成功孕育成功原则的另外一个名词,这个解释是由诺贝尔经济学奖获得者Simon发现的,在科学计量学和信息计量学里,我们一些传统的定律,比方洛特卡定律,齐普夫定律,布拉德福定律其实都阐述这种幂律分布,虽然其对象是词汇、作者生产率等,期刊集中度等。 Barabasi和Albert的文章非常有名,大家很容易就可以发现,无论如何,我还是上载一下,以便大家对比,到底该如何进行论文写作。 509.pdf 了 barabasi和Albert的研究发表在Science上,而且正值大家都对万维网的研究非常感兴趣候。这造就了他们的世界声誉,但很显然,科学上注重首创权,或者首发权,首先发现这一规律的不是barabasi,而是Ronald Rousseau。
2422 次阅读|3 个评论
[转载]万维网诞生20年带来20大巨变:生活无处不网络
rbwxy197301 2011-8-9 10:00
万维网诞生20年带来20大巨变:生活无处不网络 http://www.sina.com.cn 2011年08月08日10:10 新浪科技 !-- div class="moduleParagraph" --    导语:周末是万维网诞生20周年纪念日,美国科技资讯网站CNET列出了万维网给我们生活带来的20大变化。万维网已经全方位进入了我们的生活,改变了我们购物、交友、阅读等各个习惯。       以下为文章概要:   1991年8月6日,蒂姆·伯纳斯-李(Tim Berners-Lee)发布了一个项目摘要,可以用一个超链接网络来组建电脑信息网络,也就是我们今天所熟知的万维网。与此同时,这一项目还作为一项公开服务在互联网上推开。   如今,万维网已经20岁了,并且在各个领域给我们的生活带来了巨大的变化。以下就是万维网给我们带来的20件礼物:    1、即时新闻 即时新闻   谷歌和必应等网站使得我们只需要敲几下键盘,就可以了解最鲜为人知的信息。不需要跑去图书馆翻阅百科全书、打电话给朋友或是费力记忆众多细节。信息是万维网给予我们的最佳礼物。    2、维基百科 维基百科   对于学术论文而言,维基百科并非最佳的信息来源,但它的确可以为多数内容提供全面信息。但需要注意的是:任何人都可以改变该网站上的内容。    3、社交网络 社交网络   马克·扎克伯格(Mark Zuckerberg)创建的Facebook已经改变了整整一代人的沟通方式。Twitter、MySpace、Tumblr和Foursquare也推动了全球各地用户之间的互动。    4、音乐分享 音乐分享   Spotify仅仅是众多音乐分享网站中的一员,使得全世界都能够访问不同类型的音乐。想听波尔卡?萨尔萨?说唱?只要点一下鼠标即可。    5、图片分享 图片分享   在自然灾害等危机发生时,图片分享成为了一种快速而有效获取信息的方式,使得大量人群可以了解现场状况。在线分享照片已经成为了一种保留和分享记忆的方式。    6、即时通讯 即时通讯   AIM几年前取得了成功,而如今,多数社交网站也都配有即时通讯组件,方便用户在全球任何角落相互交流。    7、网络红人 网络红人   蒂拉·特奎拉(Tila Tequila)是众多网络红人中的一个代表。她被人从MySpace上挖掘出来,并成为了真人秀明星。与之类似,贾斯汀·比伯(Justin Bieber)也在YouTube中脱颖而出,并一举成为超级明星。万维网为很多人才打开了成名之路。    8、网上购物 网上购物   亚马逊、Zappos等购物网站帮助人们更为方便地购买服装、图书和饰品。万维网提供的产品比全球任何一家商场都多。    9、亚文化 亚文化   YouTube视频和各种各样的笑话给网民带来了很多娱乐,并且催生了Nyan Cat等很多亚文化。    10、黑客主义 黑客主义   Anymous和Lulzsec等黑客团体令政府苦恼不已,但他们的行为却引发了媒体对一些事件的关注。    11、集合同道中人 集合同道中人   万维网帮助埃及反对派团结一致建立了新政权。    12、网络剧 网络剧   《在线诊疗》(Web Therapy)等网络剧已经吸引了大批观众。    13、网络电视 网络电视   Hulu可以在电视节目首播后几天内通过流媒体视频提供同样的内容。有了这种服务,我们就再也不必因为错过重要情节而懊悔了。    14、流媒体电影 流媒体电影   Netflix使得流媒体电影服务走向大众,也让大学生有了更多的娱乐项目。    15、混音 混音   在万维网诞生前,混音并未流行开来。而如今,只要使用适当的应用,任何人都能当DJ。    16、智能手机 智能手机   最新研究显示,iPhone用户甚至愿意为了他们的手机而放弃云雨之欢。    17、在线交易 在线交易   由于eBay等拍卖网站的诞生,让人们更容易淘到中意的东西。    18、网恋 网恋   现在有很多人都是通过网络建立恋爱关系的。Match.com等婚恋网站更是通过复杂的算法来帮助人们寻找另一半。    19、电子邮件 电子邮件   我们已经跟蜗牛般的传统邮寄方式说再见了。想要发送官方通知、晚会邀请、分手信或是问候信,不必再等上“3至5个工作日”了。    20、GPS GPS   借助GPS或是谷歌地图的帮助,你可以轻松查找世界上的任何地点。(书聿)
个人分类: 文章转载|1915 次阅读|0 个评论
[转载]万维网技术走到尽头 “语义网”将成下一代网络
热度 2 zlhua 2011-8-6 21:53
图为英国雷丁大学信息科学研究中心副主任唐银山博士。刘海英摄 自上世纪七十年代被美国人发明以来,网络的发展超乎所有人的想象,给社会带来了巨大的影响。人们惊讶于如今的网络力量的同时,不禁要问,未来的网络发展方向如何?下一代网络又该是什么样子?为此,《科技日报》记者近日对英国雷丁大学信息科学研究中心副主任唐银山博士进行了专访。 社交网络已是巅峰,万维网技术走到尽头 唐银山指出,网络的产生要感谢美国军方。自1969年美国国防部高级研究计划局(ARPA)提出构想后,经过近20年的努力,网络构想一步步变为了现实。1989年,被称为互联网之父的英国人蒂姆·伯纳斯-李提出万维网(WWW)构想,并于1991年创建了世界上第一个网站http://info.cern.ch/,互联网进入飞速发展阶段,各种网络新应用层出不穷,互联网成了人们相互交流、相互沟通、相互参与的互动的一个平台,它改变了人们的生活方式,改变了经济运行的模式,改变了社会发展的轨道。 唐银山说,在互联网发展史上,社交网络的出现是一件大事,有不少人将其看作是第二代互联网,但实际上这是一个误解。基于Web2.0技术的社交网络,脸谱也好,推特也罢,确实很大程度上改变了社会生态,成为近十年互联网发展的重要一步,但冠之以其“第二代互联网”则显牵强。社交网络是万维网技术的最新应用,实际上也是万维网技术应用的巅峰。自社交网络诞生以来,近十年中再没有值得注目的新的网络应用诞生,这也意味着万维网技术已经走到尽头。 遵循网络发展规律,语义网将成下一代网络 如今人们对网络的依赖如此之大,网民对网络体验的要求越来越高,而万维网技术已发展到极致,无论是网络发展的客观规律,还是网络用户的体验要求,都催生着下一代互联网的研究。 唐银山指出,根据符号学的理论,符号可分三个层次,即符号(Syntactic)、语义(Semantics)和所指(Pragmatics),而网络发展则可以用这三个层次来对应,意即符号网络(Syntactic Web),语义网络(Semantic Web)和语用网络(Pragmatic Web)。万维网属于符号网络,而下一代互联网,则应该是科学家们已经开始着手研究的语义网络。至于语用网络,则是一种完全智能化的网络,那将是人类发展网络的终极梦想。 语义网,顾名思义,就是能够根据语义进行判断的网络,它不仅能够理解人类的语言,且可以使人机交流变得如人与人交流一样轻松。语义网是智能网络,它可以说是脱胎于万维网,但与万维网完全不同,万维网面向的是文档,而语义网面向的则是文档所表示的数据。如伯纳斯-李所言,万维网使得所有的网络文件看起来像一本巨大的书,而语义网则使网络上的所有数据汇总成为一个巨大的数据库。 语义网以一种计算机可以理解的方式来描述事物,它会理解事物之间的关系(如A是B的一部分)以及事物的属性(如体积、重量、年龄、价格)。唐银山举例说,match一词,在万维网中,仅是“火柴”(当然还有如“比赛”等其他意思),而在语义网中,计算机不仅会理解match的“火柴”表面含义,还知道它是一个一端包裹着药料的木制小棒;而到了语用网中,计算机则知道match可以用来燃火,可以用来摆设图形(一种智力游戏)等等实际应用。 语义网研究引关注,投资意愿影响研究进展 唐银山指出,语义网的核心技术是资源描述框架(RDF)和可扩展标记语言(XML),目前研究表明,实际的语义网页的创建已不是难题。欧洲的许多政府组织网站上已有不少的RDF格式网页。虽然目前来看还很难判断发行RDF格式网页的好处,但这正如国家要建设其交通系统一样,RDF格式网页的创建正是第二代网络的基础建设之举。 在万维网联盟(W3C)中,已有许多人开始了语义网的相关研究。唐银山介绍称,W3C中有一个语义网行动组织,其中包括语义网协调小组、RDB2RDF工作组、FDF网络应用工作组、SPARQL(查询语言)工作组等。此外还有许多团队也在进行着语义网的相关研究与推广工作,如OWL (网络本体语言)工作组、规则交换格式工作组、语义网教育延展服务小组等等。 唐银山说,目前谷歌公司正在致力于将RDF编码格式网页融入其搜索结果中。而最近,有报道称美国谷歌、微软和雅虎三大IT巨头联手推出了schema.org,希望以此鼓励包含语义标注的网页的开发,从而使所涉及的页面数据能够被搜索引擎所理解。这一行动表明,语义网已开始引起业界关注,语义网研究将逐步向实际应用方向发展。 唐银山强调说,相比于先进的科学发展速度,语义网的研究进展不是很快。其中一个原因是语义网的开发源于逻辑与人工智能领域的研究人员,不太容易被大众理解,这一认知过程需要时间;另外,投资意愿也影响着语义网的研究开发,少有私营机构愿意投入巨资进行推进,政府部门对此很感兴趣,但与市场渠道相比,其融资能力有限,欧洲的情况即是如此。 智能网络知你心,但不可替代你的大脑 唐银山说,语义网具有智能网络的一些特点,它可知你心,却无法替代你的大脑。那种网络具有思维能力,终有一天会统治世界的想法目前来看只是一个幻想。 智能网络不能比拟人脑的原因,一是在具体结构上,人脑是计算机目前无法比拟的:人脑中拥有大约1000亿个神经细胞、每秒钟会生成100万个新的神经连接,这些都是计算机所无法比拟的。二是较之结构更重要的,人所具有的情感因素是计算机无法拥有的。唐银山说,计算机所拥有的计算能力是一种精确计算,这种经人类编程后的精确认知,带给计算机的是一种优化逻辑,这也是“深蓝”们可以下国际象棋,并战胜人类“世界棋王”的原因;而人类具有模糊计算的能力,可以对复杂事物进行模糊度量、识别、推理,进而抽象,这一点是计算机的精确认知所无法达到的。因为无法抽象,计算机也就不会具有人脑所产生的情感意识,不会因成功而喜悦,因孤寂而悲伤。 唐银山最后指出,如果网络要真正实现智能化,那么其在结构上就需要有一场革命性的变革,需要在化学模型、物理学模型、数学模型以至于哲学模型等方面有革命性的创新。也许有一天,网络终会拥有像人类一样的智能,但这条路依然遥远。 来源:科技日报 转载于科学网
个人分类: 快乐学习|1671 次阅读|3 个评论
[转载]万维网技术走到尽头 “语义网”将成下一代网络
热度 3 Fangjinqin 2011-8-1 16:13
作者:刘海英 来源:科技日报 发布时间:2011-8-1 14:39:05 选择字号: 小 中 大 http://news.sciencenet.cn/htmlnews/2011/8/250271.shtm 万维网技术走到尽头 “语义网”将成下一代网络 图为英国雷丁大学信息科学研究中心副主任唐银山博士。刘海英摄 自上世纪七十年代被美国人发明以来,网络的发展超乎所有人的想象,给社会带来了巨大的影响。人们惊讶于如今的网络力量的同时,不禁要问,未来的网络发展方向如何?下一代网络又该是什么样子?为此,《科技日报》记者近日对英国雷丁大学信息科学研究中心副主任唐银山博士进行了专访。 社交网络已是巅峰,万维网技术走到尽头 唐银山指出,网络的产生要感谢美国军方。自1969年美国国防部高级研究计划局(ARPA)提出构想后,经过近20年的努力,网络构想一步步变为了现实。1989年,被称为互联网之父的英国人蒂姆·伯纳斯-李提出万维网(WWW)构想,并于1991年创建了世界上第一个网站http://info.cern.ch/,互联网进入飞速发展阶段,各种网络新应用层出不穷,互联网成了人们相互交流、相互沟通、相互参与的互动的一个平台,它改变了人们的生活方式,改变了经济运行的模式,改变了社会发展的轨道。 唐银山说,在互联网发展史上,社交网络的出现是一件大事,有不少人将其看作是第二代互联网,但实际上这是一个误解。基于Web2.0技术的社交网络,脸谱也好,推特也罢,确实很大程度上改变了社会生态,成为近十年互联网发展的重要一步,但冠之以其“第二代互联网”则显牵强。社交网络是万维网技术的最新应用,实际上也是万维网技术应用的巅峰。自社交网络诞生以来,近十年中再没有值得注目的新的网络应用诞生,这也意味着万维网技术已经走到尽头。 遵循网络发展规律,语义网将成下一代网络 如今人们对网络的依赖如此之大,网民对网络体验的要求越来越高,而万维网技术已发展到极致,无论是网络发展的客观规律,还是网络用户的体验要求,都催生着下一代互联网的研究。 唐银山指出,根据符号学的理论,符号可分三个层次,即符号(Syntactic)、语义(Semantics)和所指(Pragmatics),而网络发展则可以用这三个层次来对应,意即符号网络(Syntactic Web),语义网络(Semantic Web)和语用网络(Pragmatic Web)。万维网属于符号网络,而下一代互联网,则应该是科学家们已经开始着手研究的语义网络。至于语用网络,则是一种完全智能化的网络,那将是人类发展网络的终极梦想。 语义网,顾名思义,就是能够根据语义进行判断的网络,它不仅能够理解人类的语言,且可以使人机交流变得如人与人交流一样轻松。语义网是智能网络,它可以说是脱胎于万维网,但与万维网完全不同,万维网面向的是文档,而语义网面向的则是文档所表示的数据。如伯纳斯-李所言,万维网使得所有的网络文件看起来像一本巨大的书,而语义网则使网络上的所有数据汇总成为一个巨大的数据库。 语义网以一种计算机可以理解的方式来描述事物,它会理解事物之间的关系(如A是B的一部分)以及事物的属性(如体积、重量、年龄、价格)。唐银山举例说,match一词,在万维网中,仅是“火柴”(当然还有如“比赛”等其他意思),而在语义网中,计算机不仅会理解match的“火柴”表面含义,还知道它是一个一端包裹着药料的木制小棒;而到了语用网中,计算机则知道match可以用来燃火,可以用来摆设图形(一种智力游戏)等等实际应用。 语义网研究引关注,投资意愿影响研究进展 唐银山指出,语义网的核心技术是资源描述框架(RDF)和可扩展标记语言(XML),目前研究表明,实际的语义网页的创建已不是难题。欧洲的许多政府组织网站上已有不少的RDF格式网页。虽然目前来看还很难判断发行RDF格式网页的好处,但这正如国家要建设其交通系统一样,RDF格式网页的创建正是第二代网络的基础建设之举。 在万维网联盟(W3C)中,已有许多人开始了语义网的相关研究。唐银山介绍称,W3C中有一个语义网行动组织,其中包括语义网协调小组、RDB2RDF工作组、FDF网络应用工作组、SPARQL(查询语言)工作组等。此外还有许多团队也在进行着语义网的相关研究与推广工作,如OWL (网络本体语言)工作组、规则交换格式工作组、语义网教育延展服务小组等等。 唐银山说,目前谷歌公司正在致力于将RDF编码格式网页融入其搜索结果中。而最近,有报道称美国谷歌、微软和雅虎三大IT巨头联手推出了schema.org,希望以此鼓励包含语义标注的网页的开发,从而使所涉及的页面数据能够被搜索引擎所理解。这一行动表明,语义网已开始引起业界关注,语义网研究将逐步向实际应用方向发展。 唐银山强调说,相比于先进的科学发展速度,语义网的研究进展不是很快。其中一个原因是语义网的开发源于逻辑与人工智能领域的研究人员,不太容易被大众理解,这一认知过程需要时间;另外,投资意愿也影响着语义网的研究开发,少有私营机构愿意投入巨资进行推进,政府部门对此很感兴趣,但与市场渠道相比,其融资能力有限,欧洲的情况即是如此。 智能网络知你心,但不可替代你的大脑 唐银山说,语义网具有智能网络的一些特点,它可知你心,却无法替代你的大脑。那种网络具有思维能力,终有一天会统治世界的想法目前来看只是一个幻想。 智能网络不能比拟人脑的原因,一是在具体结构上,人脑是计算机目前无法比拟的:人脑中拥有大约1000亿个神经细胞、每秒钟会生成100万个新的神经连接,这些都是计算机所无法比拟的。二是较之结构更重要的,人所具有的情感因素是计算机无法拥有的。唐银山说,计算机所拥有的计算能力是一种精确计算,这种经人类编程后的精确认知,带给计算机的是一种优化逻辑,这也是“深蓝”们可以下国际象棋,并战胜人类“世界棋王”的原因;而人类具有模糊计算的能力,可以对复杂事物进行模糊度量、识别、推理,进而抽象,这一点是计算机的精确认知所无法达到的。因为无法抽象,计算机也就不会具有人脑所产生的情感意识,不会因成功而喜悦,因孤寂而悲伤。 唐银山最后指出,如果网络要真正实现智能化,那么其在结构上就需要有一场革命性的变革,需要在化学模型、物理学模型、数学模型以至于哲学模型等方面有革命性的创新。也许有一天,网络终会拥有像人类一样的智能,但这条路依然遥远。
个人分类: 杂谈评论|2380 次阅读|4 个评论
[转载]谈上网礼节-Netiquette
热度 1 windlight 2011-4-16 06:19
转载自色影无忌 原作为斑竹 curner 】 熟悉Netnews/Usenet的可能都知道Netiquette这个单词,它来自于network etiquette,直接翻译为“网络礼节”,但我觉得翻译成"上网礼节"更合适。 Netiquette起源于早期Usenet Newsgroups从几个学校走向全球的时候,一夜之间从一小群非常紧密的学者聚集的地方变成全世界(北美为主)的学校和大公司的网上社区,尽管还是在一个比较小的圈子力,因为不是所有公司和学校的电脑网络提供Newsgroups。中文里的那句“林子大了什么鸟都有”也在Newsgroups上应验了,谩骂,人身攻击等现象也常常发生。结果还是一帮学者忙活了半天编写了一份《网络礼节》,新上网的理应都要读这篇文章。可惜最早的那篇《网络礼节》已经找不到了。 万维网(world wide web)的诞生把虚拟网络世界带到普罗大众的家里,可以想像网络礼节更成为一个重要问题。与互联网的商业化一样,网络礼节也变成了一个商业机会,有关这方面的书籍也出了不少。 可惜的是这方面的中文资料不多。有感于无忌论坛上的一些行为我挑选了Virginia Shea写的一篇《网络礼节》节选意译出来,以供大家参考。 绥女士的网络礼节很简单,总共有十条: Rule 1: Remember the Human 礼节一:记住人的存在 Rule 2: Adhere to the same standards of behavior online that you follow in real life 礼节二:网上网下行为一致 Rule 3: Know where you are in cyberspace 礼节三:入乡随俗 Rule 4: Respect other people's time and bandwidth 礼节四:尊重别人的时间和带宽 Rule 5: Make yourself look good online 礼节五:给自己网上留个好印象 Rule 6: Share expert knowledge 礼节六:分享你的知识 Rule 7: Help keep flame wars under control 礼节七:平心静气地争论 Rule 8: Respect other people's privacy 礼节八:尊重他人的隐私 Rule 9: Don't abuse your power 礼节九:不要滥用权利 Rule 10: Be forgiving of other people's mistakes 礼节十:宽容 礼节一:记住人的存在 互联网给予来自五湖四海人们一个共同的地方聚集,这是高科技的优点但往往也使得我们面对着电脑银屏忘了我们是在跟其他人打交道,我们的行为也因此容易变得更粗劣和无礼。因此《网络礼节》第一条就是“记住人的存在”。如果你当着面不会说的话在网上也不要说。 礼节二:网上网下行为一致 在现实生活中大多数人都是尊法守纪,同样地在网上也同样如此。网上的道德和法律与现实生活是相同的,不要以为在网上与电脑交易就可以降低道德标准。 礼节三:入乡随俗 同样是网站,不同的论坛有不同的规则。在一个论坛可以做的事情在另一个论坛可能不易做。比方说在聊天室打哈哈发布传言和在一个新闻论坛散布传言是不同的。最好的建议:先爬一会儿墙头再发言,这样你可以知道坛子的气氛和可以接受的行为。 礼节四:尊重别人的时间和带宽 在提问题以前,先自己花些时间去搜索和研究。很有可能同样问题以前已经问过多次,现成的答案随手可及。不要以自我为中心,别人为你寻找答案需要消耗时间和资源。 礼节五:给自己网上留个好印象 因为网络的无名性质,别人无法从你的外观来判断,因此你一言一语成为别人对你印象的唯一判断。如果你对某个方面不是很熟悉,找几本书看看再开口,无的放矢只能落个灌水王帽子。同样地,发帖以前仔细检查语法和用词。不要故意挑衅和使用脏话。 礼节六:分享你的知识 除了回答问题以外,这还包括当你提了一个有意思的问题而得到很多回答,特别是通过电子邮件得到的以后你应该写份总结与大家分享。 礼节七:平心静气地争论 争论与大战是正常的现象。要以理服人,不要人身攻击。 礼节八:尊重他人的隐私 别人与你用电子邮件或私聊(ICQ/QQ)的记录应该是隐私一部分。如果你认识某个人用笔名上网,在论坛未经同意将他的真名公开也不是一个好的行为。如果不小心看到别人打开电脑上的电子邮件或秘密,你不应该到处广播。 礼节九:不要滥用权利 管理员版主比其他用户有更多权利,他们应该珍惜使用这些权利。游戏室内的高手应该对新手枪下留情。 礼节十:宽容 我们都曾经是新手,都会有犯错误的时候。当看到别人写错字,用错词,问一个低级问题或者写篇没必要的长篇大论时,你不要在意。如果你真的想给他建议,最好用电子邮件私下提议。人都是有面子的。
个人分类: make or buy|1287 次阅读|2 个评论
意外的观察: 从万维网之父获得我校荣誉博士学位中看到的
ZSHuang 2009-10-20 23:46
今天是荷兰阿姆斯特丹自由大学(VrijeUniversityAmsterdam)的建校129周年的庆典日。按照惯例,上午举行了一次学术研讨会,下午举行了一次简单的庆典会。今年庆典会中一项引人注目的活动就是给著名的万维网之父TimothyBerners-Lee授予荣誉博士学位,以嘉奖他为人类社会作出的巨大贡献。 在今天的活动中,我却有一些意外的观察。对于在中国文化环境下长大的人来说,这确实是非常意外。对我来说,真应该细细体会其背后的文化内涵。为了不浪费大家的宝贵时间,在这里我先简单地罗列一下我所说的意外(再加上我个人的初步解读。我很想听听你们的不同看法!): 1)到今天,我才知道大名鼎鼎的万维网之父TimBerners-Lee的实际最高学历只是在1976他21岁时在牛津获得的一个物理学的大学文凭。TimBerners-Lee现在是MIT的教授和英国Southampton大学的教授,也是世界万维网联盟的主席。 (一个具有物理学的本科文凭的人,能够在计算机领域做出巨大成就。好像他的成功道路并不坎坷.) 解读:现有科学领域的系统和精细的训练,能够让各个学科的精英推进本领域的逐步发展,但对人类社会产生巨大改变的创造性开拓性的工作,却往往要由来自于临近学科的不知天高地厚而富有想像力的年轻人来完成。万维网的发明思想仅仅发端于超文本链接的思想,这个想法表面上看来没有什么学术深度。这就是为什么那么多的计算机领域的资深教授错过了开创万维网的机遇。 2)在今年上午学术报告会中间半个小时的喝茶休息时间里,这位万维网之父站在近300人的队列里排了很长时间。我没有看到任何人想借此机会同他合影。(这里的学生老师干嘛不珍惜这样难得的机会,与世界名人留个合影,再在博客上贴出来?) 解读:在一个现代文明社会里,人们没有必要通过显示与名人的关系来获得更多的钦佩。在会上找一个名人临时合个影,一点都不能说明他们俩个人的真正关系,倒会让熟悉自己情况的人觉得自己没有多少自信,反而会被他人瞧不起。 3)今天与万维网之父同台报告的有一些著名的学者,同时还有一位来自非洲的文盲农民。(这不是三言两语能够说清楚的,待有时间我细细叙说。) 4)今天上午的学术报告会是以我们阿姆斯特丹自由大学校长ReneSmit先生的总结报告结束的。我在这个大学已经工作了十年,一直不知道我们大学的校长是谁。今天总算见到了。网络上查了一下,他的最高学历好像也只是硕士。这与多年以前我在阿姆斯特丹大学工作期间那里的大学校长也只有硕士学位的情况相似。(这荷兰的大学领导为什么也不赶时髦去搞个博士学位,或者是干脆找个教授来干干?)。 解读:一个正常的大学的管理应该是常规化的,这里面不需要让一个有巨大学术发展前途的科学家来牺牲自己的潜能而把精力花在大量的日常事务管理上面。大学管理层的主要工作就是去筹钱,让那些擅长搞关系在社会上去跑钱的专门人才来为大学服务是比较恰当的。
个人分类: 一家之言|7135 次阅读|6 个评论
语义网逻辑基础演义
ZSHuang 2009-8-27 13:34
语义网逻辑基础演义 第一回:谈古说今论不尽科学方法 纵谈阔论道不完逻辑大观 第二回:本体为纲描述逻辑展头角 概念当先形式方法显风采 第三回:心思开阔描知识不拘一格 畅所欲言说表示各显神通 第四回:问题求解寻算法判定性为先 逻辑推理说论证复杂性作本 第五回:信息浩瀚语义万维网横空出世 语义搜索本体技术域众人瞩目 第六回:本体推理不一性技术令人关注 知识演化有效性方法展现风采 第七回:海量数据语义处理宜为本 知识应用本体技术显身手 有关的PPT请从下列网站下载: http://iws.seu.edu.cn/csws2009/summer_school.html
个人分类: 科海拾贝|7342 次阅读|4 个评论
语义网与本体技术纵横谈之四:为什么我们需要描述逻辑?
热度 1 ZSHuang 2009-6-29 00:55
为了严格地研究本体的实质,我们需要一个形式化的工具,即一个严格的数学语言来描述本体。使用数理逻辑的工具是一个自然的选择。在数学和计算机科学中,普遍被使用的数理逻辑工具是一阶谓词逻辑,它具有一定的本体描述能力,如概念包含关系可以被描述成一阶谓词逻辑中的逻辑蕴含关系,即女人是人的一个子概念,被描述成x(女人(x)-人(x))。如它也能来描述特殊与一般的概念关系,即张某某是一个特定的女人,在一阶谓词逻辑中可被描述成一个谓词与其实例之间的关系:女人(张某某)。但许多本体的性质还不能直接使用一阶谓词逻辑来描述,如部分与整体的概念关系,就需要引入新的谓词来描述,而且还得在逻辑上定义其特定的语义关系。 描述逻辑(DescriptionLogics)就是一种建立在一阶谓词逻辑之上的用于描述本体数学性质的形式化工具。从表面上看来,描述逻辑并不是一阶谓词逻辑的子语言,也就是说它们采用的是不同的语言结构,但实际上描述逻辑从语义上对应着一阶谓词逻辑的一个部分(fragment),我们将要介绍的最典型的描述逻辑,实际上对应着一阶谓词逻辑中的可判定的一个子语言,使得描述逻辑具有很好的数学性质,因为它的可满足性是可以判定的,所以它的推论关系也是可判定的,也就是说存在着一个算法可以在有限的时间内判定一个描述是否是一个前提的一个推论。这样的描述逻辑在应用上就能提供有效实现上的保证。 摘自马张华,黄智生(著)《网络信息资源组织》(第八章本体技术与语义网),北京大学出版社,2007。
个人分类: 科海拾贝|8781 次阅读|19 个评论
第三届中国语义万维网研讨会(CSWS 2009)
ZSHuang 2009-4-6 14:21
第三届中国语义万维网研讨会(CSWS2009) 征文通知 http://iws.seu.edu.cn/csws2009/ 2009年8月29-31日,南京 语义Web(SemanticWeb,语义万维网或语义网)是下一代Web(万维网)的发展方向,它提供一个公共框架,使得数据的共享和重用可以跨越应用系统、企业和社团的边界。语义Web技术使得人们有可能编织起大规模的人类知识网络,并使得这些知识较容易地被计算机理解和处理。语义Web有利于数据的重用和集成,从而使得未来的Web能够提供更好的应用和服务。语义Web的研究吸引了来自人工智能、数据库、软件工程、信息检索、社会网络和Web工程等领域的专家学者和应用开发者的广泛关注。 目前,语义Web的理论基础和技术规范已经基本奠定,而语义Web上链接的数据正在快速发展,这为新一代的Web应用和服务创造了良机。在这样的背景下,第三届中国语义万维网研讨会(The3rdChineseSemanticWebSymposium,CSWS2009)将于2009年8月29-31日在南京举行。本届研讨会秉承前两届研讨会的宗旨,为语义Web领域的研发人员,特别是青年学者,提供一个充分进行学术交流的环境。本届研讨会设置大会特邀报告、论文大会报告、专题讨论、即兴发言、语义Web应用展示等多种论文和成果交流形式,为与会代表提供丰富的交流平台。 会议投稿采用EasyChair系统。会议录用的英文稿件将被安排到国际期刊《WebIntelligenceandAgentSystems》(EI收录)和《东南大学学报》(英文版、EI收录)出版,录用的中文稿件将被安排到《东南大学学报》(中文版)上发表。录用的论文在期刊上出版之前要求到会报告。另外,为了便于会议期间交流,会议论文集将在网上发布。 现发布会议论文征文通知,欢迎踊跃投稿。 一、征文范围 2009年的会议主题是汇聚语义Web人才,编织语义Web数据。投稿论文分为研究论文和应用论文两种类型,应用论文要求阐述一个可在线运行的具有创意的语义Web应用系统。会议的主题包括(但不限于): 1语义Web上的知识表示2语义Web上的推理3本体学习和语义标注 4语义Web上的数据管理5本体匹配与映射6语义Web搜索 7语义Web分析8链接的数据9Web2.0与社会语义Web 10语义Web中的信任11语义Web服务12语义Web应用 二、论文要求 1.论文必须未在期刊和会议上发表过,也不能是已经投到期刊或其它会议的在审论文。 2.会议接收中、英文投稿。只接收PDF格式的电子文档。不规定论文具体格式,可参照EasyChair模板http://www.easychair.org/coolnews.cgi。论文篇幅有一定限制,以EasyChair模板为例,研究论文限定在12页左右,应用论文限定在8页左右。录用论文在正式出版前,需要根据期刊要求对篇幅进行调整。 3.投稿采用在线投稿的方式:http://www.easychair.org/conferences/?conf=csws2009 三、重要日期 1.会议论文征稿截止日期:2009年6月20日 2.会议论文录用通知日期:2009年7月20日 3.会议论文最终稿截止日期:2009年8月20日 四、联系方式 有关会议投稿的问题,请联系程序委员会联合主席: 高志强,东南大学,Email:zqgao@seu.edu.cn 漆桂林,德国卡尔斯鲁厄大学,Email:gqi@aifb.uni-karlsruhe.de 关于会议的详细信息,请访问:http://iws.seu.edu.cn/csws2009/
个人分类: 未分类|6541 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-3 00:46

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部