中国有句古话:三个臭皮匠顶个诸葛亮,是指三个才能平庸的人,若能同心协力集思广益,也能提出比诸葛亮还高明的计策,比喻人多智慧大。还有一个词叫做“众人拾材火焰高”具有相同的意味。现在, 互联网的发展已经将人群的智慧变成了一个有价值的、可随需应变的资源。众人的智慧变得如此强大,如果能将这些智慧通过互联网连接起来,它自身就变成了一个重要的资源。 2011年,面对全球性的大失业现象,麻省理工斯隆管理学院的两位教授Erik Brynjolfsson和Andrew McAfee合撰《与机器赛跑》(Race Against the Machine)一书,提出了一种新的观点,随着技术的高速发展,人类正与机器形成一种对抗,而在这个对抗过程中,人类肯定会输,因为与机器相比,人类需要吃饭、睡眠和休息,有情感需求,厌恶重复性劳动。因此提出, 未来我们需要转换思路,别与机器赛跑,应该与机器合作,适应机器,帮助机器,体现人类对机器的价值,这样人类才可以更好地与机器协同进化,而不是被机器所淘汰。 现在,如果我们将这种想法扩展开来, 人 的智慧不仅仅是自己互联,而且还可以与机器连接起来,建立一种合作关系取长补短,变成一个不可战胜的重要驱动力 。 这个重要的资源,美国卡内基梅隆大学(Carnegie Mellon University)的Luis von Ahn在其博士论文中引入了一个术语,叫 人类计算(Human computation) ,指的是结合人类和计算机的优势来完成某个人类和计算都不能独立完成任务的分布式系统。 同时,伴随着这个词的产生的,还诞生了一个大数据行业经常拿来说事儿的故事,就是我们现在网站登陆注册时所用到的“验证码”,其英文全称是Completely Automated Public Turing test to tell Computers and Human Apart(CAPTCHA,全自动区分计算机和人类的图灵测试)。最初的CAPTCHA图片是由机器生成的,控制程序也知道正确答案,其作用纯粹就是为了防止机器恶意自动注册和机器攻击,用于验证当前正在进行的操作是人类而不是机器。 坦率地讲,许多身份验证机制的产生,是人类与技术之间的内耗,比如机场安检的逐步升级,纯粹善良大众为少数坏人买单,消耗了大量的人力和物力。CAPTCHA显然也是如此。聪明的人总是不满足现状的,既然CAPTCHA消耗了广大网民的时间资源,那么能否利用这些“浪费”的资源做一些有意义的事儿呢?后来出现的reCAPTCHA就是在这方面进行的挖掘,它除了能更好地区分人和机器外,还能“顺便”为文献数字化做贡献。具体如何实现的呢?现在新的文字材料一般都有电子版,但计算机出现之前的大量书籍、报刊等书面资料没有现存的电子化版本,要将其进行电子化显然很有意义,但任务异常繁重。随着OCR的发展,文字自动识别的水平越来越高,但有些文献由于年代久远,字迹开始变得模糊、褪色、污损等,OCR无法识别。但是,这些OCR无法识别的内容由人工辨认却相对比较简单。reCAPTCHA系统中,验证码由两个单词组成,一个是系统设定并知道答案的“control word”(对照词),另一个是来源于OCR无法识别的“unknow word”(未知词),前一个用于验证用户是否有能力识别这些文字,如果答案正确,就认为用户对“unknown word”部分的回答也是可信的。为了增强可信度,同一个的“unknown word”会被分配给多个用户,然后综合这些用户的回答来判定这个疑难字符是否被正确识别了。reCAPTCHA系统以免费服务形式的形式提供给各网站,加速了文献数字化的工作。 这种形式,也有人称之为协同智能(collaborative intelligence)或众包(crowdsourcing)。各种服务现在正在虎视眈眈地看着这些人类认知的丰富资源供应,如维基百科、使命游戏(Games with a purpose)和亚马逊土耳其机器人(Amazon Mechanical Turk)。维基百科,尽管最初人们担心其准确性,但毫无疑问现在它已成为各种基本信息的关键资源。使命游戏中的ESP,专门针对在线玩家,他们在玩一个有趣的游戏过程中,可生成有用的数据(如图像标记)。众包市场的亚马逊土耳其机器人用于协调那些为获得报酬的工人来完成任务。 多邻国(Duolingo)是一个免费语言学习网站和众包文字翻译平台。其设计理念是,当用户逐渐学习课程时,同时也在帮助翻译网站上的内容或文件。这个平台推出后很快成为全球最受欢迎的外语学习神器,是唯一一款曾被谷歌Play Store和苹果App Store都评为年度最佳的教育类应用。也就是说, 在线学习过程,也可以变成一种工作,相反,工作也可以变成一种学习过程,有些人在线工作的时候可以帮助其他人学习新的技能,这可能对未来的工作和教育产生变革性的影响。 基于这种思路,在放射医学领域如何从x射线照片中识别肿瘤是一个非常重要的工作,但现在这样的任务,依靠机器视觉算法还不可靠,然而人类对此擅长。一个放射医生新手刚开始也是观察易于分类的照片进行训练的,而后达到一定的熟练程度后就可以应对更困难的情形,这种进步过程,既帮助了机器,也帮助了他人。 人类计算在科学研究上所体现的非凡成就,最引人注目的当属Fold it项目了。参与者被要求尽可能以最有效的方式折叠虚拟蛋白质。该目标是为了解决分子生物学一个最重要难题:蛋白质折叠是如何这般迅速和有效的?该项目开始后不久,就发现猴免疫缺陷病毒调节蛋白的三级结构,这个问题曾经困扰了该研究群体数十年,如果得到解决可能会找到应对艾滋病病毒的新方法。另外,宇宙动物园(Zooniverse)项目要求公民科学家确定月球上的环形山,帮助翻译旧船的行船日志,在天文图像中确定星系,并发现其他恒星周围的行星,都是利用众包来进行科学研究的重要案例。 信息科学建立在这些早期的成功上,证明推进人类计算系统的潜力可以模拟和解决一些经济、环境和社会政治系统交叉的奇怪问题(那些挑战传统解决问题的方法)。从上我们看到,在过去几年里, 由于众包市场和一些巧妙应用程序的出现,人类开始实现一些之前不可能完成的任务。 通常情况下,这样的应用涉及到人类需要利用人类的智慧执行某些形式的计算,如图像分类、翻译、蛋白质折叠这些问题对目前最先进的人工智能算法来说也是一个几乎难于完成的挑战。 今天,由于计算机科学家、众包先驱者和远见者的努力,创造了研究人类计算的路线图,使我们能从中得到各种答案。人类计算系统已经非常成功地解决一些复杂问题,从确定螺旋星系到组织赈灾。而且,只要人类认知可以在全球范围内有效地利用,他们的潜力仍将变得越来越强大。这些目标都是非常有价值的,但会产生一些重大问题。其中最重要是伦理、法律的本质以及人类计算的社会影响。如何设计这个工作才能允许有意义的和有尊严人类的参与?获得何种结果才能让最弱势人群从中受益?机器与人类之间产生特定结果的最优分工是什么? 你能读懂这段文字吗? 参考文献: Pietro Michelucci, Janis L. Dickinson, The power of crowds. Science, 2016-01-01, Vol. 351, Issue 6268, pp. 32-33 人类计算——众人拾柴火焰高 http://sss.bnu.edu.cn/?research_show/tp/234/lid/272.html Human Computation 杂志http://hcjournal.org/ojs/index.php?journal=jhc Managing Crowdsourced Human Computation. http://www.ipeirotis.com/wp-content/uploads/2012/01/36946.pdf The Emerging Science of Human Computation (http://www.technologyreview.com/view/538101/the-emerging-science-of-human-computation/)
《失控》 Out of Control 副标题: 全人类的最终命运和结局 English: The New Biology of Machines, Social Systems, and the Economic World 豆瓣介绍: http://book.douban.com/subject/5375620/ 原作名: Out of Control: 作者: 凯文·凯利 译者: 东西文库 出版社: 新星出版社 出版年: 2010-12 作者简介: 凯文·凯利(Kevin Kelly,1952~,人们经常亲昵地称他为 KK),《连线》(Wired)杂志创始主编。在创办《连线》之前,是《全球概览》杂志(The Whole Earth Catalog,乔布斯最喜欢的杂志)的编辑和出版人。1984年,KK发起了第一届黑客大会(Hackers Conference)。他的文章还出现在《纽约时报》、《经济学人》、《时代》、《科学》等重量级媒体和杂志上。 凯文·凯利被看作是“网络文化”(Cyberculture)的发言人和观察者,也有人称之为“游侠”(maverick)。1999年的电影《黑客帝国》(Matrix)在某种程度上是对凯文·凯利对网络文化的观察和预言的一种隐喻。《失控》也是该片导演要求主要演员必读的三本书之一。 读书笔记: 序 这是“众包”的方式,自底向上完成的翻译,是“峰群思维”的体现。这批“峰群”的整体意识希望向中国大陆引入这本书,推介这本书! “这本书如今在美国的销量要比它当初发行时的销量还要好。” “坏消息是,在过了二十年后,我们对于如何使大规模复杂事物运作起来的理解仍然少有进展。我很遗憾的告知大家,不论是人工生命还是机器人技术,抑或是生态学或仿真学领域中,并没有出现新的重大思想。” – From KK 《失控》中文版序 ( 本系列读书笔记 最早发布于本人的独立博客 http://www.zhengjie.org ) 第 01 章 人造与天生(The Made and Born) 1.1 新生物文明 – 本书主题 “自然王国和人造王国正在融合;机器正在生物化;生物正在工程化。”1.1 – P3 “The realm of the born—all that is nature—and the realm of the made—all that is humanly constructed—are becoming one. Machines are becoming biological and the biological is becoming engineered.” KK 想深刻探讨的,就是“人造”(The Made)和“天生”(The Born)会融合吗?能互相借鉴吗?乃至于本书的主题: “人造与天生的联姻”1.1-P3 (1.1 节,第3页) “The Marriage of the born and the made.” KK认为,生命的这种“失控”态的“自然之道”是“人造”的必然未来,而生命本身也将融入人类的“技术”!未来的他们会互相联姻,达到一个新生物文明(neo-biological civilization)。 “Our future is technological; but it will not be a world of gray steel. Rather our technological future is headed toward a neo-biological civilization.” 1.2 生物逻辑的胜利 – 本书思路与结构 KK 认为长久以来,人类制造技术是 “钟表工作逻辑”-Clockwork logic ,是“机械的逻辑”- the logic of machine,或是“技术逻辑”- the logic of Technos 提出“复杂系统”complex system 一词。 复杂系统的实例:细胞 Cell,草原 Meadow,经济 Economy,大脑 Brain “除了‘生物逻辑’Bio-logic之外,没有任何一种逻辑能够让我们组装出一台能够思想的设备 ,甚至不可能组装出一套可运行的大型系统。”1.2-P4 “We now see that no logic except bio-logic can assemble a thinking device, or even a workable system of any magnitude.” “生物逻辑” Bio-logic / the logic of Bios 或 “生命法则”the laws of life 的特质有: - 自治 autonomous ; - 自组织 Self-organization ; - 自我维持 self-sustaining; - 自我完善 self-improving; - 自我复制 self-replication; - 自我管理 self-governance; - 有限自我修复 limited self-repair; - 适度进化 mild evolution; - 局部学习 partial learning …… KK 认为: “生物逻辑正在被引入机器,同时技术逻辑也正在被引入生命”1.2-P5 “Yet at the same time that the logic of Bios is being imported into machines, the logic of Technos is being imported into life.” “某一天,所有结构复杂的东西都被看作是机器,而所有能够自维持的机器都被看作是有生命的。”1.2-P5 “all complicated things can be perceived as machines, and all self-sustaining machines can be perceived as alive.” 当以上两者都具备“生命属性”Lifelikeness 时,KK将这些不管是人造的还是天生的(或有机的),统统叫做 “活系统”vivisystem。 由此,KK作为一个科学记者,对这个大统一的仿生学前沿(unified bionic frontier),在后续章节中报道了来自生物界的“活系统”,如: 第02章:社会性昆虫 social insects(蜂群和蚂蚁群的集体智慧、活系统定义、网络无处不在) 第04章:复原生物学 restoration biology (如何把草原恢复成原样) 第05章:地球生态圈与共同进化 Coevolution (盖亚假说、“囚徒困境”游戏) 第06章:自然界的流变(生死循环、稳定性与多样性、负熵、超有机体) 另外大部分章节报道了“人造活系统”(artificial vivisystems)的前沿研究及思想: 第03章:机器人原型机 robot prototypes (机器人科技的前沿) 第07章:控制的涌现 Emergence of Control (反馈、控制到自指、失控) 第08章:复制珊瑚礁 coral reef replicas,组装生态系统 ecosystem assembly,到 生物圈2号Biosphere 2 project 第09章:失控生物学 Out-of-control biology 第10章:工业生态学 Industrial Ecology 第11章:网络经济学 Network Economics 第12章:电子货币 E-Money (加密永胜 encryption always wins、传真机效应、免费模式、收益递增率(拥有者获得)、隐秘经济underground economies) 第13章:虚拟现实世界 Virtual reality worlds (模拟类游戏,联网角色扮演游戏、军事战争仿真) 第14、15、17章:人工生命、人工进化、人工学习、遗传算法 第16章:控制的未来(合成动画角色 synthetic animated character) 第18、19章:进化、进化的进化、学习与进化、后达尔文主义、存在突变、发育和遗传的深入、复杂性原理、人工合成进化 第20、21章:生命的数学、秩序之秘、《GEB》自指和怪圈、网络动力学、自催化、混沌的边缘、《复杂》、进化的趋势与目的 第22章:预测 Prediction (混沌中的秩序、短期预测、战争预测、智能推荐、生长曲线、存在-预测-适应-未来 的关系、全球模型的局限、会学习和预测的系统才能生存) 第23章:讲述了 KK 脑中的“进一步疑惑” 第24章:提出“无中生有、生生不息”的九条“神律”(the laws of god),他认为这些法则是所有自我维持和自我完善系统共同遵循的基本原则。“they are the fundamentals shared by all self-sustaining, self-improving systems.” 从上述章节看到,《失控》一书中,与 互联网 有直接关联的是 第 2、11、12、13、16章,个人认为 第 14、17-22 章是本书的精华所在,在这里真正进入了“高潮”! 1.2 节的结尾,KK 提出“自然还是一个“文化基因库”(meme bank),是一个创意工厂….蕴含着后现代隐喻(postmodern metaphors)。对新生物文明来说,摧毁一片草原,毁掉的不仅仅是一个生物的基因库,还混掉了一座蕴藏着各种启示、洞见和新生物文明(neo-biological civilization)模型的宝藏。”1.2-P6 从这个角度,KK 赋予了 “环境保护”新的意义!! 1.3 学会向我们的创造物低头 通过下面的的例子,KK 形象的描述了未来。 “奶牛和胡萝卜是跟蒸汽机和火药一样的人类发明。只不过,奶牛和胡萝卜更能代表人类在未来所要发明的东西-生长出来而不是制造出来的产物。”1.2-P5 因此,这是一个悖论:当我们未来将生命法则 – “神律”赋予机器时,我就必然丧失了对他的控制,因为“自己是生长出来的”,它的“长”又是“失控”的!所以我们“将不再完全拥有自己最得意的创造物”。 对 KK 来说, 一个“失控”的未来人造世界,是 最美妙的结局 ! (待续。。。)