一个人和一台机器分别呆在两间封闭的屋子里,从外面看不见也听不见什么,另一个人用传真的方式对他和它进行提问,一段时间后,如果提问者没有分辨出哪一个是人哪一个是机器的话,我们就可以认为这台机器能像人一样思考。 这是英国天才数学家阿兰图灵在1950年提出的判断计算机是否具有智能的测试。他预言,总有一天计算机可以通过编程获得与人类竞争的智力。1997年,国际象棋棋王卡斯帕罗夫输给了超级计算机深蓝,没有体力消耗、注意力永远集中、不受任何心理影响,面对这样一个敌手,卡斯帕罗夫心力憔悴。在人类引以为自豪的智力游戏上击败人类,图灵的预言实现了。可难道我们必须要承认这台冷冰冰、硬邦邦的机器是智能的,而且比我们还要聪明? 智力之谜 至少国际象棋是下不赢它了,但可以肯定,面对我那脑筋早已不灵光的老祖母都能听懂的笑话,它会令人扫兴地无动于衷,向它投以爱意的目光也得不到任何的回应。那么凭什么说它是智能的?智能、智力是指什么?当我们说一个人比另一个人更聪明时是什么意思?智力可以量化吗?如果可以的话,是否能够说一只猫比一只蝴蝶更聪明,一只蝴蝶比一只蚯蚓更聪明?如此一来,某种生物应该拥有最少量的智力,这点智力能供它做些什么?而认得镜中的自己,并自信地问出:魔镜魔镜告诉我,我是不是世界上最美的人?又需要多少份的智力? 这些问题令人着迷,不仅因为有趣,还在于猫拥有爬树的能力,但不会思考自己为什么能够爬树,蝴蝶拥有飞翔的能力,但不会思考自己为什么能够飞起来,我们蒙造物之青睐,进化出思考的能力,于是会去思考猫如何爬树,蝴蝶如何飞翔,最终还要不可避免地来思考思考本身:智力究竟是什么?它是如何产生的? 在西方,柏拉图首先认识到智力是由大脑产生的。2000多年后的1904年,一系列认知实验表明,同一个人在不同的认知任务中都会表现的很出色,英国心理学家斯皮尔曼由此提出在我们的智力活动中,有一个通用因素(general factor)发挥着决定性作用。在将这个通用因素量化后,我们得到了评判一个人聪明程度的标准智商(IQ:intelligence quotient)。 虽然以前也可以通过经验对一个人的智力水平做出八九不离十的推断,但现在我们有了更简单的办法给他做一套智商测试题,看看分数如何。仅凭一个分数就对一个人聪明与否下定论似乎显得过于草率,但事实是智商已成为这个世界上继阶级、种族之后又一个将人与人区分出差别的工具,而且不得不承认它很有效。 正如在无数个苹果掉落于地上之后牛顿才发现万有引力一样,从经验上升到理论需要一个漫长的过程。在智商这个评判智力水平的标准大行其道之时,我们对智力是什么以及它是如何产生的却仍然一无所知。当然,这些问题并没有被科学家遗忘,只要时机成熟,他们就要有所作为。 2000年,脑科学家约翰邓肯在用不同类型、不同难度的智商测试题为难受试者时发现,大脑为了完成任务,总是会征召同一块皮层区域侧额叶(lateral frontal cortex)。这似乎表明侧额叶的功能与所谓的通用因素密切相关,换句话说,侧额叶在智力产生过程中起到了关键性作用。从整个大脑到一块皮层,智力的来源范围缩小了,但随后的研究又将这个范围扩大了一些,执行任务者变为一个额叶顶叶网络,其成员包括侧前额叶(lateral prefrontal cortex)、前扣带回(anterior cingulate cortex)和后顶叶(posterior parietal cortices)。后顶叶取代侧额叶成为关键角色,驱动整个网络的运转,并且与智商高低直接相关。天才不是像我们以为的那样,在酝酿奇思妙想时调动了普通人未曾开发过的神秘脑区,而只是更充分地利用了后顶叶来解决问题。 负责智力活动的额叶顶叶网络(红色) 不过智商高就一定是天才吗?天才就一定智商高?智商只有75的阿甘(电影《阿甘正传》的主人公)用他奇迹般的一生质疑了这一点。当然这只不过是个电影,而现实生活中雨人的事迹是无可置疑的,智商一般在35至70之间的他们往往无法握住碗筷吃饭,穿衣叠被困难重重,但却可以在30秒内准确算出2的64次方是多少;在初次听到柴可夫斯基第一号钢琴协奏曲几小时后,将其行云流水般毫厘不差地弹奏出来如果说这是一种异常情况,缺少普遍性的话,正常人中智商不高却有所成就的人物会更具说服力,比如现任美国总统。 看来智商并不代表一切,平日里不大会有人一直在推断一组数字的末尾应该是多少,或是根据前面的图形去决定最后一个的样子,而斯皮尔曼的认知任务和智商测试题却只考虑了这一种能力分析、逻辑、推理。但事实上,我们并不必总是深思熟虑、条理清楚,瞬间的灵光闪现和大而化之的宽容、幽默很多时候会更有效,而这些也都是人类伟大的进化成果,需要被扩展到智力的概念里。 应运而生的是 斯腾伯格 的三元智力理论,他将智商所代表的通用因素归属为分析智力,除此之外还有创造性智力和实践智力。前者包含了灵感、直觉、想象力等,在诸如即兴作诗、给一幅卡通画加上标题时要用到。创造能力主要跟右半球有关,这半个大脑负责音乐、绘画、空间几何以及想象和综合等功能,一部分雨人的天分就是在左脑受损后才意外获得的。后者指的是解决实际问题和做出决定的能力,因此当我们嘲笑小布什的低智商时,不妨考虑下他是否在这方面有过人之处。 从柏拉图时代到现在,人类的进步仅限于把智力的诞生地从笼统的大脑锁定至特定的皮层区域,至于大脑是如何通过智力活动为爱因斯坦、达尔文、秦始皇、毛泽东带来巨大成就的,我们茫然无知。 国际象棋与围棋 自从获得了智慧,人类就一直试图将它以不同的形式表现出来,于是才有了文学、艺术、思想游戏也是之一,其中尤以国际象棋和围棋历史悠久、好者众多,而且分别代表了西方和东方的思维方式、文化特点,因此这两种智力游戏对大脑征用情况的不同,能够说明些问题。 对对弈时的大脑活动进行全程跟踪记录不现实而且没必要,庞杂的数据无法加以区别和分析,弈者不可能自始至终都专注于棋局,总有些时候会注意力发散,大脑一片空白。实验要在达到明确目的的前提下尽量简化,棋手无需下一整盘棋,而是盯着显示屏就可以了,上面每隔30秒会周期性地出现空白棋盘、棋子随机摆放的棋盘、空白棋盘、正常的中盘对局,受试者被要求在对局出现时考虑白棋接下来的走法。空白棋盘和随机棋盘起着参照作用,在将它们所引起的大脑活动从对局时的大脑活动中去除掉之后,留下来的便是纯粹的思考痕迹。 实验结果显示,在谋划应招的过程中,被认为参与智力活动的大脑区域纷纷登场亮相,而顶叶是其中的主角。顶叶与视觉注意的维持和心理景象的产生密切相关,爱因斯坦天才的可能来源之一便是他的顶叶比普通人宽。有趣的是,国际象棋与围棋在对顶叶的重视上保持一致,但在对待左右脑的态度上出现了分歧,前者多利用左脑,而后者更倾向右脑。 虽然都是棋类游戏,都是需要充分调动大脑资源的智力活动,但下国际象棋与下围棋就像做数学题与作诗一样存在着本质的区别,而区别来自于规则: 在国际象棋中,每个子身份不一、本领各异,兵只能步步前进,而马可跳日,相可斜走,后则能控制四面八方。王是胜败关键,一盘棋围绕着如何将死对方的王与如何保护己方的王展开。开局时,双方棋子站在黑白格中列阵以待,交战时,用适当的子走到适当的地方,消灭敌有生力量或占据有利位置。 身份、地位带来了独特的天赋,但同时也带来了限制,对子的使用、选择要以其被赋予的固定价值为依据:是策马从斜刺里跳出,踩踏八方?还是驱车长途奔袭,控制两线?开盘时的列阵布局是初始条件,棋子们必须先排队站好,战役才能拉开序幕。而战役的目标很清楚:刺王杀驾,这为整盘棋带来了明确的最终结果。在一定的初始条件下,率领等级分明、价值固定的手下兵将去追求一个已知的明确结果,国际象棋即是如此。这个过程基本上要依靠逻辑来实现,而逻辑正是左脑所擅长的。 在围棋中,子子相同,全无个性,由围空多少来决定输赢。初始时,棋盘上只有横竖十九条线彼此交错。弈者于交叉点处落子,从无到有,棋局的发展不受布局限制。每子落下,意在与已有之子相互勾连,控制四周道路,扩张势力,压迫对方。棋理重在对全局的整体把握,而非局部的具体得失。 棋子间没有区别、彼此平等使弈者不必费心选择,信手拈来即可。初时棋盘的空无一物更是还人以自由,宏篇妙局尽藏于胸,随棋势发展而逐现。输赢的判定取决于围空多少,但没有明确的终止条件,胜负存乎一心。运筹帷幄,无中生有,少受客观限制,直达人心,围棋的意境在于此。很显然,这需要更多的直觉和灵感,综合与想象,而右脑正是这方面的行家。 规则的背后是文化。西方重视个体,鼓励个性,擅长从一点入手,运用逻辑进行透彻的分析;而东方更在意整体,注重联系,习惯从全局出发,综合各处信息,掌控大势。东西方思维方式间存在如此区别并不令人感到新奇,而现在人们想要再为其添加些来自科学的佐证:直接通过实验数据将这种差异描述出来。 研究人员试图从看待世界的角度上彰显这种差异,他们让欧美学生与中国学生观察同一张图片,图片内容包括突出的前景对象与相应的背景衬托,比如原野上的一只狮子。受试者的眼球活动情况被同时记录下来,以便对照。不出所料,前者的眼睛更快地集中在前景对象上,并对其保持了更为长久的热情,而后者则对背景给予了更多时间的关注。 对图片的视觉偏好揭示了欧美学生可能更热衷于分析狮子的性别、年龄,以及它目前的心情与精神状态,而中国学生也许更想知道在这夕阳西下的黄昏,这头孤独的狮子为何会出现在如此荒凉的地方,它打算做些什么?思维方式的差异不会与生俱来,但可以追溯到孩提时代,一位美国母亲会对她的孩子说:迈克,给你辆小卡车,你看它闪闪发光,还有四个轮子。而中国父亲的说法是:儿子,我把车推给你,你再推回来,小心不要撞到墙,会坏的。 逻辑而已 文化的不同导致了思维方式的不同,思维方式的不同导致了游戏规则的不同,游戏规则的不同导致了棋王的含恨落败。 人们很难对由硅片、各种聚合材料、电子器件、金属线、铁皮外壳组合而成,被锁在柜子里,运行起来嗡嗡作响,重达1.4吨的深蓝报以太多的敬意,但它确实战胜了有血有肉,行动自如,能够微笑说话,体重不到200斤的卡斯帕罗夫。而既然国际象棋是人类发明的,用来一较智力高下的游戏,那么就不得不承认这台机器拥有了智力,甚至已经超过了人类。 但伟大的成就仅限于分析智力,国际象棋的规则决定了这是一个逻辑游戏,而逻辑正是计算机所擅长的。根据每个子的性能、作用为其赋上值(会根据所在位置和棋局所处阶段进行相对调整),比如兵:1;马:3;相:3.5;车:5;后:10;王:100,根据棋子所在位置能够控制的四方格数为该位置赋值,为当前局面下己方子力对对方的威胁程度赋值,为当前局面下己方王所处位置的安全性赋值现在,棋盘上的一切都变成了数字,接下来要做的是对下步棋的可走位置进行彻底搜索,当发现在把某一子落入某一格后,所有相应的赋值加起来最大时,好了,就是这一步。 这就是计算机对国际象棋的理解,而虽然人在玩这个游戏时也要不停地分析、推理,但肯定无法如计算机般绝对理性,当太多的可能性导致逻辑无法胜任时,就只能靠直觉和想象力来帮忙了。另外人对棋局的分析是高效而富有弹性的,在考虑下步棋的走法时,根本不会去分析角落里目前毫无用处的车横移一步可能带来什么结果,但计算机会,因为它用的是最笨、最简单的办法:搜索再搜索,计算再计算。 我们可以嘲笑计算机的笨蛋逻辑,但必须要承认它很有效。依靠这种笨蛋逻辑,计算机下赢了拥有聪明逻辑,更有直觉帮忙的人,而正如卡斯帕罗夫所说:直觉带来的棋往往更好、更巧妙。当然做到这一点是需要代价的,那就是巨大的计算量,巧得很,不知疲倦和速度正是计算机的特长,深蓝每秒至少可以计算2亿步棋,卡斯帕罗夫呢? 事情似乎是这样的:计算机试图在用一种勤能补拙的方式与人类抗衡,通过不厌其烦地将最简单的逻辑重复重复再重复,来完成人类几乎一蹴而就的分析过程。而国际象棋的规则允许了这种可能性:逻辑分析是主角,虽然我们也要用到直觉。因此当计算机的硬件保证了实现这种方式所需的计算量时,忽略铁皮外壳与嗡嗡作响,我们迎来了一个可怕的对手。 计算机的手段实在算不上高明,但在不知道对方是谁的情况下,我们多半会觉得这人极度冷静、理智、思维严谨,是个厉害的高手,智商肯定不低。所以尽管不情愿,也必须要承认这机器是有智力的,虽然仅限于分析智力。知道真相后可能会有些不服气,这么笨的方法!但就算对面是卡斯帕罗夫,如果你清楚了他每一步棋产生的确切经过,恐怕也不会将原有的敬意保留太多。我们的敬畏来自神秘感。 当国际象棋特级大师们对人机大战的未来前景越来越持悲观态度的时候,李昌镐、马晓春们却可能都还意识不到围棋电脑棋手的存在,因为它们现在的水平只够在业余级别的门口徘徊。显然,这种天壤之别可以通过规则来解释,围棋是右脑游戏,是直觉、灵感、想象力的游戏,逻辑在这里不过是个小配角。因此面对落子成势时的随心所欲、把握全局时的模糊理解,计算机运用它的笨蛋逻辑牟足了劲却仍是不知所以然,入不了门。 所以我们大可不必认为深蓝及其后继者的存在是对人类的无情挑战,并因此觉得受到了侮辱或感到沮丧不安。汽车跑得比我们快,轮船游得比我们快,计算器算的比我们快,但没有人会对此忧心忡忡,因为这帮家伙只是在某方面比我们强,更重要的是,它们不过是些工具,谁会去嫉妒锤子和菜刀?前者可比拳头硬,后者要比牙锋利。深蓝的优势是逻辑,但也仅限于此,不还是要乖乖听主人的话?想要赢它也容易,大不了关机,用锤子也行。 计算的宿命 不过,计算机勤能补拙的法宝真的没用了吗?毕竟棋盘就那么大,子就那么多,总有下完的时候。理论上是可以的,如果能在每下一子之前,将其可能放入位置所带来的可能变化,以及对最终结果的可能影响都统统计算个遍,还是有资格坐在李昌镐对面的。但不幸的是,这种算法所需的计算量会使整个宇宙都显得微不足道。 只有退而求其次,不追求完美,而是通过某种算法得到一个差不多的下法就可以了。委曲求全的结果是,在当前所能接受的计算量下,计算机还达不到业余一段的水平。看来要想取得更令人满意的成绩,必须拥有更好的算法和更快的计算速度。事实上这两者都在进步,或许十年后今天的新闻是:一台半个上海大的电脑向常昊挑战围棋,常昊为捍卫人类尊严欣然迎战。但也有可能电子计算机在达到物理极限时的计算速度,仍然无法形成对围棋高手的威胁,那么就需要新生力量来接过重任了,比如量子计算机。 现在好像已经不是规则的问题了,而是计算量的问题。也就是说,只要计算量足够大,运用计算机的笨蛋逻辑也能做到灵感、直觉、想象力做到的事。如果说面对逻辑上超越我们的机器,我们还能坦然自若的话,一台直觉敏锐、充满灵性的电脑恐怕不会再让人放心。而照这个情形发展下去,终有一天,情感也可以通过计算来得到,逻辑成为万能,机器全面超越人类。 逻辑计算真的可以做到一切?越来越多的证据表明事实可能的确如此。神经系统中的神经细胞要在将来自其他神经细胞的所有输入信号进行整合后,做出下一步动作,即通过计算来决定是否发出后继信号;神经细胞用来接收输入信号的树状突起(树突),可以通过其小分支上大量的细刺状突起(树突棘)间的相互作用,完成基本的逻辑操作;生物大分子(如蛋白质)之间在遵循化学和物理规律发生相互作用的过程中,会形成生物电路,这种生物电路具有逻辑运算功能这些发现似乎都在说明一件事:我们的逻辑、理性、直觉、灵感、想象力、创造力甚至情感、情绪等等所有的人之所以为人的属性,归根到底都来自于分子层面的逻辑计算,而这最根本的逻辑计算与计算机正在应用的本质上没有什么不同,既然如此,将来的计算机为何做不到这一切?现在,问题变成了人是哪种计算机? 肖邦天马行空的乐曲与李白才华横溢的诗篇都只不过是机械、精确的计算结果,这个结论令人很不舒服。还好,有个消息可以证明逻辑不是万能的。好消息并不来自生命科学的前沿,而是源于一个上世纪三十年代被发现的数理逻辑定理哥德尔不完备性定理。根据此定理,大脑这个逻辑系统很可能是不完备的。意思是我们总要去思考问题,但总会存在一些令我们头疼的问题,这些问题通过分子层面的逻辑计算根本得不到答案。还有一些问题理论上是能得到明确答案的,但却要花上让你无法承受的时间,比如一百年。 或许你会不以为然:对正在思考的问题,不是总能得出一个结果吗?而且通常也用不了多长时间。对此的解释是:大脑给了你一个近似答案。购物归来,你皱着眉头计算一共花了多少钱,不久之后得出了一个令人绝望的结果;围棋对局中,你在判断下一子落在何处最有利于棋局,思考片刻后,它出现在西北角的空旷地带。前一个问题的答案是明确而唯一的,而后一个则模棱两可,下在东南角也不是不行。存在如此区别的原因就在于,前者对大脑这个逻辑系统来说是可解问题,通过分子层面的逻辑计算能够得到精确解。而后者是不可解问题,或者要花上百八十年才能计算出一个精确答案,于是大脑为了让你不至于一辈子都耗在这步棋上,就给出了一个大概的近似解。我们一般将这个近似解的产生过程描述为直觉。 大脑这个不完备的逻辑系统在面对难缠而又不得不解决的问题时,对其进行了模糊化处理,而这种模糊机制能力超群,效率极高,正是大脑神秘莫测的所在。看来计算机这个同样不完备的逻辑系统想要在围棋上与人一较高下,仅在计算量上下功夫是不够的,还要在计算机制上做文章,以便达到人这台计算机的水平。 事情最终似乎可以这样理解:大脑与计算机都是一个不完备的逻辑系统,它们运用本质上一样的计算去解决问题,对形式上是逻辑的问题能够得到精确解,对形式上是直觉的问题只能得到近似解。计算机在计算精确解上拥有速度优势,而大脑持有更高级的计算机制,能够在短时间内得出更好的近似解。在国际象棋中,逻辑的因素占到绝大部分,在围棋中,直觉的成分处于优势地位。换句话说,在下国际象棋时,会有更多的精确解产生,而在下围棋时,则需要更多的近似解。但在将整盘棋当作一个问题考虑时,两者都只能得到近似解,即不存在必胜的走法。 由于国际象棋偏重逻辑,当前的电子计算机以现有的计算机制,发挥计算速度优势,就能够得出一个不错的近似解,这个近似解可以比人得出的好,即战胜棋王。而围棋的直觉特性使计算机在计算机制上的劣势一显无遗,当前可以提供的近似解与人相差甚远。而如果一味的用勤补拙,想达到人的水平,所需的计算量很可能会超过物理极限,因此必须要对计算机制进行改进。现在,问题的关键被锁定在了计算机制,即计算方式上。 对新计算方式的探求刚开始不久,在多位候选人当中,除了量子计算的叠加态引人注目外,计算机科学家们最看好的是DNA计算。所谓DNA计算的基本思路是:以组成DNA分子链的四种碱基(A、T、C、G)为信息载体(相对于电子计算机中的0和1),通过DNA酶实现对DNA链的四种生物操作:切割、粘贴、插入、删除(相对于电子计算机中的加、减)。 可这还是计算机吗?还是。计算的本质没变,只是物理性质的加、减变成了化学性质的切割、粘贴、插入、删除,计算方式变了。十进制向二进制的转变引发了信息革命,新的转变会带来什么?也许是真正的智能机器,向人类挑战直觉、想象力的机器。 计算机围棋棋手战胜李昌镐们看来是早晚的事了,不过到那时,我们还可以说计算机并没有全面超越人类,因为它没有感情。而想要将感情也加入其中的话,可能需要一个更为理想的计算装置、工作空间。于是,将来的某一天,当我们欣赏自己的终极作品时,会惊愕地发现:它拥有基于DNA计算的发达神经网络系统,以及支持这个网络系统正常运转的呼吸系统、消化系统他,就是一个人!而我们重复了进化曾经做过的事。 在路上,迎面走来一个人,擦肩而过时,你向他点头示意,他微笑相应,你们心中同时在想:真是个和善的人。或许这才是图灵测试的终极含义,人本身不就是一台DNA计算机吗?上帝制造。 但之后呢?谁来负责进化的继续?上帝还是人? 发表于 2007 年 7 月刊《新发现》 参考文献: 1. Atherton M, Zhuang J, Bart WM, Hu X, He S. A functional MRI study of high-level cognition. I. The game of chess . Cogn Brain Res. 2003 Mar;16(1):26-31. 2. Chen X, Zhang D, Zhang X, Li Z, Meng X, He S, Hu X. A functional MRI study of high-level cognition. II. The game of GO . Cogn Brain Res. 2003 Mar;16(1):32-7. 3. Lee KH, Choi YY, Gray JR, Cho SH, Chae JH, Lee S, Kim K. Neural correlates of superior intelligence: stronger recruitment of posterior parietal cortex . Neuroimage. 2006 Jan 15;29(2):578-86. 4. Duncan J, Seitz RJ, Kolodny J, Bor D, Herzog H, Ahmed A, Newell FN, Emslie H. A neural basis for general intelligence . Science. 2000 Jul 21;289(5478):457-60. 5. Sternberg RJ. Cognition. The holey grail of general intelligence . Science. 2000 Jul 21;289(5478):399-401. 6. M. Newborn. Deep Blues contribution to AI . Ann. Math Artif. Intell. 28 (2000) 2730. 7. Kasparov G. Strategic intensity: a conversation with world chess champion Garry Kasparov . Harv Bus Rev. 2005 Apr;83(4):49-53, 132. 8. Chua HF, Boland JE, Nisbett RE. Cultural variation in eye movements during scene perception . Proc Natl Acad Sci U S A. 2005 Aug 30;102(35):12629-33. 图片来源: 图片1来自 http://bbs.sina.com.cn 图片3来自 Lee KH, Choi YY, Gray JR, Cho SH, Chae JH, Lee S, Kim K. Neural correlates of superior intelligence: stronger recruitment of posterior parietal cortex . Neuroimage. 2006 Jan 15;29(2):578-86. Epub 2005 Aug 24. 图片4来自 www.4oto.com 图片5来自 Atherton M, Zhuang J, Bart WM, Hu X, He S. A functional MRI study of high-level cognition. I. The game of chess . Cogn Brain Res. 2003 Mar;16(1):26-31. 图片12 来自 http://bbs.pcbirds.com/pages/25,16163,1,1059549448.html
(按:2002年以来,我开始在国内倡导开展信息哲学研究,先后有不少人通过各种方式,包括网站、电子函件、BBS、博克、写信、撰文、会议讨论甚至直接来访,表达自己的意见和见解。有人认为根本不存在什么信息哲学,有人认为信息的哲学问题已经解决,而有人则声称自己早就发明了信息哲学等等,各种意见不一而足。对于这些意见,我无法做出赞成或不赞成的简单回复。为了使这个极富生命力新学科在我国能够得到健康顺利的发展,根据我对国际哲学界对信息哲学态度的了解,对该学科的问世作一个初步的说明。) 信息哲学(philosophy of information, 简称PI)在国际哲学界问世标志是什么?我们认为,2002年牛津大学的哲学家弗洛里迪(Luciano Floridi)在《元哲学》(Metaphilosophy)上发表的论文《什么是信息哲学?》(What is the Philosophy of Information?)是重要的标志之一。尤其值得注意的是,弗洛里迪在文中称:本文是第一篇企图系统地分析信息哲学性质的文章。在国际哲学界能够出此断言,我以为作者还是经过非常严肃和慎重的思考和研究的。换句话说,此前国际哲学界并没有信息哲学的提法,也没有哲学家进行过类似的论证。该文主要目的便是论述信息哲学作为一个独立的研究领域何以成为可能。信息哲学被定义为批判性研究的哲学领域,它涉及到信息的概念本质和基本原理,包括信息的动力学、利用和科学以及对哲学问题的信息理论和计算方法论的提炼和应用。信息这个概念被事后追认为先驱无疑有其合理性,因为它一方面可以使未来的工作从自发的天真转向自觉的有教养、有师法,与此同时它也可以再造传统,使哲学领域中的旧话题在这个新解释学装置中产生新的意义、染上新的气象、增添新的价值。在这篇文章中,弗洛里迪提出信息哲学是一门成熟的学科,具体理由有三:它代表一个独立的研究领域;它能为传统的和新的哲学话题提供一种创新的方法;它能与其他哲学分支比肩并立,为信息世界和信息社会的概念基础提供一种系统的处理。 另一个标志是弗洛里迪于2001年8月在美国卡奈基-梅隆大学主办的计算机与哲学大会的司马贺计算与哲学讲座(Herbert A. Simon Lecture on Computing and Philosophy)所做的题为《信息哲学的若干问题》(Open Problems in Philosophy of Information)讲演。在这次讲演中,弗洛里迪仿照著名数学家希尔伯特(David Hilbert)于1900年在数学大会上提出23个未解决的数学问题方式,为信息哲学提出了5组18个大问题。位于中心的是核心概念信息,各个问题被归入以下四个方面:语义、智能、自然和价值。根据这次讲演写成的论文《信息哲学的若干问题》即将刊登在2004年4月号的《元哲学》上。这篇文章也被我们译成中文,待英文原文发表后,再发表中文译文。 刊登《什么是信息哲学?》的这一期《元哲学》有一个副标题:《赛伯哲学:哲学与计算的交汇》( CyberPhilosophy: The Intersection of Philosophy and Computing )。显然,信息哲学产生于哲学与计算的交汇点上。因而这门具有交叉科学性质(interdisciplinary)的哲学学科,以一种崭新的方式关照着哲学,其新就在于把计算的工具引入了哲学。这与以往的哲学具有本质的不同,其特征之一就在于是工具驱动(tool-driven)。美国从事虚拟实在研究的哲学家海姆(Michael Heim)甚至将计算机称为形而上学的实验室。 这篇文章实际反映了上个世纪90年代美国哲学界进行的一项重要活动的持续。美国哲学会(APA)的计算与哲学分会(CAP)在90年代中期曾经就计算机如何在改变哲学这一主题做过一次全国普查。普查的结果集中反映在1998年出版《数字凤凰计算机如何在改变哲学》( Digital Phoenix: How Computers are Changing Philosophy )的文集中。在为该文集撰写导言中,计算与哲学分会新老两届会长拜纳姆(Terrell Ward Bynum)和穆尔(James H. Moor)坦承,在哲学的大舞台上有一股新生力量正在崭露头角,其结果便是涌现出一个新的哲学范式。他们说:哲学领域不时会发生一些大的运动。这些运动始于若干简单但却非常丰富的思想这些思想为哲学家提供了审视哲学问题的新透镜。渐渐地,哲学方法和问题得到了提炼并根据这些新观念获得理解。随着新颖而有意义的哲学成果的获得,运动发展成一股蔓延至整个学科的知识浪潮。一个新的哲学范式涌现了 2002年,人工智能、哲学与认知科学领域的著名期刊《心与机器》( Minds and Machines )决定出版一期以信息哲学为主题的专刊。在国际计算与哲学协会(IACAP)的网站上刊出的征稿启示中特别强调:计算为哲学提供了这么一套简单而又令人难以置信的丰富观念计算为传统的哲学活动带来了新的机遇和挑战计算正在改变着哲学家理解那些哲学基础和概念的方式。哲学探究中的这股思潮吸收了根据计算的主题、方法或模式,正稳定地迈向前方。这个新的领域已经被定义为信息哲学。这里特别指出,国际计算与哲学协会首次将哲学这个新的领域与信息哲学联系起来。这个提法无疑肯定了弗洛里迪在《什么是信息哲学?》中提出的哲学主张和基本观点,尽管这篇文章当时还未发表。因而《数字凤凰计算机如何在改变哲学》中所谓新涌现的哲学范式便是指信息哲学。这可以看作是信息哲学问世的另一个标志。 《什么是信息哲学?》这篇文章所阐发的思想和观点曾在国际哲学界进行过广泛的辩论。譬如,1996-1997学术年弗洛里迪在意大利巴里大学就认识论与信息技术这个题目作过系列讲演;然后是19992000年,他作为认识论的访问教授在罗马第三大学教授信息哲学;在《应用逻辑》学术报告会(伦敦大学玛丽皇后和威斯特学院,1999年11月26日);在《计算与哲学计算及其应用以及对哲学研究的影响的哲学含义》学术报告会(伦敦大学国王学院,1999年2月19日);在1999年美国哲学会东区会议由APA委员会安排的关于哲学与计算机的特别会议(波士顿,1999年12月28日);在第四届世界系统论、控制论、信息论多主题年会(佛罗里达奥兰多,2000年7月23-26日)等。 信息哲学的研究纲领在国际哲学界经过数年的论证终于得以确立。我们认为,《什么是信息哲学?》与《信息哲学的若干问题》这两篇文章可被视为信息哲学的基础性工作,前者阐明了信息哲学的基本观点和任务,后者则给出了信息哲学的问题域。
第一个是人工智能的历史(History of Artificial Intelligence), 顺着 AI 发展时间线娓娓道来,中间穿插无数牛人故事,且一波三折大气磅礴,可谓事实比想象更令人惊讶。人工智能始于哲学思辨,中间经历了一个没有心理学(尤其是认知神经科学的)的帮助的阶段,仅通过牛人对人类思维的外在表现的归纳、内省,以及数学工具进行探索,其间最令人激动的是 Herbert Simon (决策理论之父,诺奖,跨领域牛人)写的一个自动证明机,证明了罗素的数学原理中的二十几个定理,其中有一个定理比原书中的还要优雅,Simon 的程序用的是启发式搜索,因为公理系统中的证明可以简化为从条件到结论的树状搜索(但由于组合爆炸,所以必须使用启发式剪枝)。后来 Simon 又写了 GPS (General Problem Solver),据说能解决一些能良好形式化的问题,如汉诺塔。但说到底 Simon 的研究毕竟只触及了人类思维的一个很小很小的方面 Formal Logic,甚至更狭义一点 Deductive Reasoning (即不包含 Inductive Reasoning , Transductive Reasoning (俗称 analogic thinking)。还有诸多比如 Common Sense、Vision、尤其是最为复杂的 Language 、Consciousness 都还谜团未解。还有一个比较有趣的就是有人认为 AI 问题必须要以一个物理的 Body 为支撑,一个能够感受这个世界的物理规则的身体本身就是一个强大的信息来源,基于这个信息来源,人类能够自身与时俱进地总结所谓的 Common-Sense Knowledge (这个就是所谓的 Emboddied Mind 理论。 ),否则像一些老兄直接手动构建 Common-Sense Knowledge Base ,就很傻很天真了,须知人根据感知系统从自然界获取知识是一个动态的自动更新的系统,而手动构建常识库则无异于古老的 Expert System 的做法。当然,以上只总结了很小一部分个人觉得比较有趣或新颖的,每个人看到的有趣的地方不一样,比如里面相当详细地介绍了神经网络理论的兴衰。所以建议你看自己一遍,别忘了里面链接到其他地方的链接。 第二个则是人工智能(Artificial Intelligence)。当然,还有机器学习等等。从这些条目出发能够找到许多非常有用和靠谱的深入参考资料。 然后是一些书籍 书籍: 1. 《Programming Collective Intelligence》,近年出的入门好书,培养兴趣是最重要的一环,一上来看大部头很容易被吓走的:P 2. Peter Norvig 的《AI, Modern Approach 2nd》(无争议的领域经典)。 3. 《The Elements of Statistical Learning》,数学性比较强,可以做参考了。 4. 《Foundations of Statistical Natural Language Processing》,自然语言处理领域公认经典。 5. 《Data Mining, Concepts and Techniques》,华裔科学家写的书,相当深入浅出。 6. 《Managing Gigabytes》,信息检索好书。 7. 《Information Theory:Inference and Learning Algorithms》,参考书吧,比较深。 相关数学基础(参考书,不适合拿来通读): 1. 线性代数:这个参考书就不列了,很多。 2. 矩阵数学:《矩阵分析》,Roger Horn。矩阵分析领域无争议的经典。 3. 概率论与统计:《概率论及其应用》,威廉费勒。也是极牛的书,可数学味道太重,不适合做机器学习的。于是讨论组里的 Du Lei 同学推荐了《All Of Statistics》并说到 机器学习这个方向,统计学也一样非常重要。推荐All of statistics,这是CMU的一本很简洁的教科书,注重概念,简化计算,简化与Machine Learning无关的概念和统计内容,可以说是很好的快速入门材料。 4. 最优化方法:《Nonlinear Programming, 2nd》非线性规划的参考书。《Convex Optimization》凸优化的参考书。此外还有一些书可以参考 wikipedia 上的最优化方法条目。要深入理解机器学习方法的技术细节很多时候(如SVM)需要最优化方法作为铺垫。 推荐几本书: 《Machine Learning, Tom Michell》, 1997. 老书,牛人。现在看来内容并不算深,很多章节有点到为止的感觉,但是很适合新手(当然,不能新到连算法和概率都不知道)入门。比如决策树部分就很精彩,并且这几年没有特别大的进展,所以并不过时。另外,这本书算是对97年前数十年机器学习工作的大综述,参考文献列表极有价值。国内有翻译和影印版,不知道绝版否。 《Modern Information Retrieval, Ricardo Baeza-Yates et al》. 1999 老书,牛人。貌似第一本完整讲述IR的书。可惜IR这些年进展迅猛,这本书略有些过时了。翻翻做参考还是不错的。另外,Ricardo同学现在是Yahoo Research for Europe and Latin Ameria的头头。 《Pattern Classification (2ed)》, Richard O. Duda, Peter E. Hart, David G. Stork 大约也是01年左右的大块头,有影印版,彩色。没读完,但如果想深入学习ML和IR,前三章(介绍,贝叶斯学习,线性分类器)必修。 还有些经典与我只有一面之缘,没有资格评价。另外还有两本小册子,论文集性质的,倒是讲到了了不少前沿和细节,诸如索引如何压缩之类。可惜忘了名字,又被我压在箱底,下次搬家前怕是难见天日了。 (呵呵,想起来一本:《Mining the Web - Discovering Knowledge from Hypertext Data》 ) 说一本名气很大的书:《Data Mining: Practical Machine Learning Tools and Techniques》。Weka 的作者写的。可惜内容一般。理论部分太单薄,而实践部分也很脱离实际。DM的入门书已经不少,这一本应该可以不看了。如果要学习了解 Weka ,看文档就好。第二版已经出了,没读过,不清楚。 信息检索方面,Du Lei 同学再次推荐: 信息检索方面的书现在建议看Stanford的那本《Introduction to Information Retrieval》,这书刚刚正式出版,内容当然up to date。另外信息检索第一大牛Croft老爷也正在写教科书,应该很快就要面世了。据说是非常pratical的一本书。 对信息检索有兴趣的同学,强烈推荐翟成祥博士在北大的暑期学校课程,这里有全slides和阅读材料: http://net.pku.edu.cn/~course/cs410/schedule.html maximzhao 同学推荐了一本机器学习: 加一本书:Bishop, 《Pattern Recognition and Machine Learning》. 没有影印的,但是网上能下到。经典中的经典。Pattern Classification 和这本书是两本必读之书。《Pattern Recognition and Machine Learning》是很新(07年),深入浅出,手不释卷。 最后,关于人工智能方面(特别地,决策与判断),再推荐两本有意思的书, 一本是《Simple Heuristics that Makes Us Smart》 另一本是《Bounded Rationality: The Adaptive Toolbox》 不同于计算机学界所采用的统计机器学习方法,这两本书更多地着眼于人类实际上所采用的认知方式,以下是我在讨论组上写的简介: 这两本都是德国ABC研究小组(一个由计算机科学家、认知科学家、神经科学家、经济学家、数学家、统计学家等组成的跨学科研究团体)集体写的,都是引起领域内广泛关注的书,尤其是前一本,後一本则是对 Herbert Simon (决策科学之父,诺奖获得者)提出的人类理性模型的扩充研究),可以说是把什么是真正的人类智能这个问题提上了台面。核心思想是,我们的大脑根本不能做大量的统计计算,使用fancy的数学手法去解释和预测这个世界,而是通过简单而鲁棒的启发法来面对不确定的世界(比如第一本书中提到的两个后来非常著名的启发法:再认启发法(cognition heuristics)和选择最佳(Take the Best)。当然,这两本书并没有排斥统计方法就是了,数据量大的时候统计优势就出来了,而数据量小的时候统计方法就变得非常糟糕;人类简单的启发法则充分利用生态环境中的规律性(regularities),都做到计算复杂性小且鲁棒。 关于第二本书的简介: 1. 谁是 Herbert Simon 2. 什么是 Bounded Rationality 3. 这本书讲啥的: 我一直觉得人类的决策与判断是一个非常迷人的问题。这本书简单地说可以看作是《决策与判断》的更全面更理论的版本。系统且理论化地介绍人类决策与判断过程中的各种启发式方法(heuristics)及其利弊(为什么他们是最优化方法在信息不足情况下的快捷且鲁棒的逼近,以及为什么在一些情况下会带来糟糕的后果等,比如学过机器学习的都知道朴素贝叶斯方法在许多情况下往往并不比贝叶斯网络效果差,而且还速度快;比如多项式插值的维数越高越容易overfit,而基于低阶多项式的分段样条插值却被证明是一个非常鲁棒的方案)。 在此提一个书中提到的例子,非常有意思:两个团队被派去设计一个能够在场上接住抛过来的棒球的机器人。第一组做了详细的数学分析,建立了一个相当复杂的抛物线近似模型(因为还要考虑空气阻力之类的原因,所以并非严格抛物线),用于计算球的落点,以便正确地接到球。显然这个方案耗资巨大,而且实际运算也需要时间,大家都知道生物的神经网络中生物电流传输只有百米每秒之内,所以 computational complexity 对于生物来说是个宝贵资源,所以这个方案虽然可行,但不够好。第二组则采访了真正的运动员,听取他们总结自己到底是如何接球的感受,然后他们做了这样一个机器人:这个机器人在球抛出的一开始一半路程啥也不做,等到比较近了才开始跑动,并在跑动中一直保持眼睛于球之间的视角不变,后者就保证了机器人的跑动路线一定会和球的轨迹有交点;整个过程中这个机器人只做非常粗糙的轨迹估算。体会一下你接球的时候是不是眼睛一直都盯着球,然后根据视线角度来调整跑动方向?实际上人类就是这么干的,这就是 heuristics 的力量。 相对于偏向于心理学以及科普的《决策与判断》来说,这本书的理论性更强,引用文献也很多而经典,而且与人工智能和机器学习都有交叉,里面也有不少数学内容,全书由十几个章节构成,每个章节都是由不同的作者写的,类似于 paper 一样的,很严谨,也没啥废话,跟《Psychology of Problem Solving》类似。比较适合 geeks 阅读哈。 另外,对理论的技术细节看不下去的也建议看看《决策与判断》这类书(以及像《别做正常的傻瓜》这样的傻瓜科普读本),对自己在生活中做决策有莫大的好处。人类决策与判断中使用了很多的 heuristics ,很不幸的是,其中许多都是在适应几十万年前的社会环境中建立起来的,并不适合于现代社会,所以了解这些思维中的缺点、盲点,对自己成为一个良好的决策者有很大的好处,而且这本身也是一个非常有趣的领域。 统计学习理论与支持向量机 统计学习理论(Statistical Learning Theory,SLT)是一种专门研究有限样本情况下的统计理论 。该理论针对有限样本统计问题建立了一套新的理论体系,在这种体系下的统计推理规则不仅考虑了对渐近性能的要求,而且追求在现有有限信息的条件下得到最优结果。V. Vapnik等人从20世纪70年代开始致力于此方面研究,到20世纪90年代中期,随着其理论的不断发展和成熟,也由于神经网络等方法在理论上缺乏实质性进展,统计学习理论开始受到越来越广泛的重视。统计学习理论是建立在一套较坚实的理论基础之上的,为解决有限样本学习问题提供了一个统一的框架。 同时,在统计学习理论基础上发展了一种新的通用预测方法支持向量机(Support Vector Machines,SVM),已初步表现出很多优于已有方法的性能 ,它能将很多现有方法(比如多项式逼近、径向基函数方法、多层感知器网络)纳入其中,有望帮助解决许多原来难以解决的问题(比如神经网络结构选择问题、局部极值问题等)。SLT和SVM正在成为继神经网络研究之后新的研究热点,并将推动数据挖掘与机器学习理论和技术的重大发展 。 参考文献: 1. V. Vapnik. The nature of statistical learning theory. Springer-Verlag, 1995. 2. V. Vapnik. Statistical learning theory. John Wiley and Sons, Inc., 1998. 3. B. E. Boser, I. Guyon, V. Vapnik. A training algorithm for optimal margin classifiers. In: D. Haussler, Editor, Proceedings of the Fifth Annual ACM Workshop of Computational Learning Theory, 144-152, ACM Press, 1992. 4. C. Cortes, V. Vapnik. Support-vector networks. Machine Learning, 1995, 20, 273-297 5. J. C. Burges. A tutorial on support vector machines for pattern recognition. Data Mining and Knowledge Discovery, 1998, 2(2), 121-167 http://www.support-vector-machines.org/SVM_soft.html SHOGUN - is a new machine learning toolbox with focus on large scale kernel methods and especially on Support Vector Machines (SVM) with focus to bioinformatics. It provides a generic SVM object interfacing to several different SVM implementations. Each of the SVMs can be combined with a variety of the many kernels implemented. It can deal with weighted linear combination of a number of sub-kernels, each of which not necessarily working on the same domain, where an optimal sub-kernel weighting can be learned using Multiple Kernel Learning. Apart from SVM 2-class classification and regression problems, a number of linear methods like Linear Discriminant Analysis (LDA), Linear Programming Machine (LPM), (Kernel) Perceptrons and also algorithms to train hidden markov models are implemented. The input feature-objects can be dense, sparse or strings and of type int/short/double/char and can be converted into different feature types. Chains of preprocessors (e.g. substracting the mean) can be attached to each feature object allowing for on-the-fly pre-processing. SHOGUN comes in different flavours, a stand-a-lone version and also with interfaces to Matlab(tm), R, Octave, Readline and Python. This is the R package.
转载于: http://bbs.byr.edu.cn/wForum/disparticle.php?boardName=PR_AIID=3229pos=12 我经常在 TopLanguage 讨论组上推荐一些书籍,也经常问里面的牛人们搜罗一些有关的资料,人工智能、机器学习、自然语言处理、知识发现(特别地,数据挖掘)、信息检索这些无疑是 CS 领域最好玩的分支了(也是互相紧密联系的),这里将最近有关机器学习和人工智能相关的一些学习资源归一个类: 首先是两个非常棒的 Wikipedia 条目,我也算是 wikipedia 的重度用户了,学习一门东西的时候常常发现是始于 wikipedia 中间经过若干次 google ,然后止于某一本或几本著作。 第一个是人工智能的历史(History of Artificial Intelligence),我在讨论组上写道: 而今天看到的这篇文章是我在 wikipedia 浏览至今觉得最好的。文章名为《人工智能的历史》,顺着 AI 发展时间线娓娓道来,中间穿插无数牛人故事,且一波三折大气磅礴,可谓事实比想象更令人惊讶。人工智能始于哲学思辨,中间经历了一个没有心理学(尤其是认知神经科学的)的帮助的阶段,仅通过牛人对人类思维的外在表现的归纳、内省,以及数学工具进行探索,其间最令人激动的是 Herbert Simon (决策理论之父,诺奖,跨领域牛人)写的一个自动证明机,证明了罗素的数学原理中的二十几个定理,其中有一个定理比原书中的还要优雅,Simon 的程序用的是启发式搜索,因为公理系统中的证明可以简化为从条件到结论的树状搜索(但由于组合爆炸,所以必须使用启发式剪枝)。后来 Simon 又写了 GPS (General Problem Solver),据说能解决一些能良好形式化的问题,如汉诺塔。但说到底 Simon 的研究毕竟只触及了人类思维的一个很小很小的方面 Formal Logic,甚至更狭义一点 Deductive Reasoning (即不包含 Inductive Reasoning , Transductive Reasoning (俗称 analogic thinking)。还有诸多比如 Common Sense、Vision、尤其是最为复杂的 Language 、Consciousness 都还谜团未解。还有一个比较有趣的就是有人认为 AI 问题必须要以一个物理的 Body 为支撑,一个能够感受这个世界的物理规则的身体本身就是一个强大的信息来源,基于这个信息来源,人类能够自身与时俱进地总结所谓的 Common-Sense Knowledge (这个就是所谓的 Emboddied Mind 理论。 ),否则像一些老兄直接手动构建 Common-Sense Knowledge Base ,就很傻很天真了,须知人根据感知系统从自然界获取知识是一个动态的自动更新的系统,而手动构建常识库则无异于古老的 Expert System 的做法。当然,以上只总结了很小一部分我个人觉得比较有趣或新颖的,每个人看到的有趣的地方不一样,比如里面相当详细地介绍了神经网络理论的兴衰。所以我强烈建议你看自己一遍,别忘了里面链接到其他地方的链接。 顺便一说,徐宥同学打算找时间把这个条目翻译出来,这是一个相当长的条目,看不动 E 文的等着看翻译吧:) 第二个则是人工智能(Artificial Intelligence)。当然,还有机器学习等等。从这些条目出发能够找到许多非常有用和靠谱的深入参考资料。 然后是一些书籍 书籍: 1. 《Programming Collective Intelligence》,近年出的入门好书,培养兴趣是最重要的一环,一上来看大部头很容易被吓走的:P 2. Peter Norvig 的《AI, Modern Approach 2nd》(无争议的领域经典)。 3. 《The Elements of Statistical Learning》,数学性比较强,可以做参考了。 4. 《Foundations of Statistical Natural Language Processing》,自然语言处理领域公认经典。 5. 《Data Mining, Concepts and Techniques》,华裔科学家写的书,相当深入浅出。 6. 《Managing Gigabytes》,信息检索好书。 7. 《Information Theory:Inference and Learning Algorithms》,参考书吧,比较深。 相关数学基础(参考书,不适合拿来通读): 1. 线性代数:这个参考书就不列了,很多。 2. 矩阵数学:《矩阵分析》,Roger Horn。矩阵分析领域无争议的经典。 3. 概率论与统计:《概率论及其应用》,威廉费勒。也是极牛的书,可数学味道太重,不适合做机器学习的。于是讨论组里的 Du Lei 同学推荐了《All Of Statistics》并说到 机器学习这个方向,统计学也一样非常重要。推荐All of statistics,这是CMU的一本很简洁的教科书,注重概念,简化计算,简化与Machine Learning无关的概念和统计内容,可以说是很好的快速入门材料。 4. 最优化方法:《Nonlinear Programming, 2nd》非线性规划的参考书。《Convex Optimization》凸优化的参考书。此外还有一些书可以参考 wikipedia 上的最优化方法条目。要深入理解机器学习方法的技术细节很多时候(如SVM)需要最优化方法作为铺垫。 王宁同学推荐了好几本书: 《Machine Learning, Tom Michell》, 1997. 老书,牛人。现在看来内容并不算深,很多章节有点到为止的感觉,但是很适合新手(当然,不能新到连算法和概率都不知道)入门。比如决策树部分就很精彩,并且这几年没有特别大的进展,所以并不过时。另外,这本书算是对97年前数十年机器学习工作的大综述,参考文献列表极有价值。国内有翻译和影印版,不知道绝版否。 《Modern Information Retrieval, Ricardo Baeza-Yates et al》. 1999 老书,牛人。貌似第一本完整讲述IR的书。可惜IR这些年进展迅猛,这本书略有些过时了。翻翻做参考还是不错的。另外,Ricardo同学现在是Yahoo Research for Europe and Latin Ameria的头头。 《Pattern Classification (2ed)》, Richard O. Duda, Peter E. Hart, David G. Stork 大约也是01年左右的大块头,有影印版,彩色。没读完,但如果想深入学习ML和IR,前三章(介绍,贝叶斯学习,线性分类器)必修。 还有些经典与我只有一面之缘,没有资格评价。另外还有两本小册子,论文集性质的,倒是讲到了了不少前沿和细节,诸如索引如何压缩之类。可惜忘了名字,又被我压在箱底,下次搬家前怕是难见天日了。 (呵呵,想起来一本:《Mining the Web - Discovering Knowledge from Hypertext Data》 ) 说一本名气很大的书:《Data Mining: Practical Machine Learning Tools and Techniques》。Weka 的作者写的。可惜内容一般。理论部分太单薄,而实践部分也很脱离实际。DM的入门书已经不少,这一本应该可以不看了。如果要学习了解 Weka ,看文档就好。第二版已经出了,没读过,不清楚。 信息检索方面,Du Lei 同学再次推荐: 信息检索方面的书现在建议看Stanford的那本《Introduction to Information Retrieval》,这书刚刚正式出版,内容当然up to date。另外信息检索第一大牛Croft老爷也正在写教科书,应该很快就要面世了。据说是非常pratical的一本书。 对信息检索有兴趣的同学,强烈推荐翟成祥博士在北大的暑期学校课程,这里有全slides和阅读材料: http://net.pku.edu.cn/~course/cs410/schedule.html maximzhao 同学推荐了一本机器学习: 加一本书:Bishop, 《Pattern Recognition and Machine Learning》. 没有影印的,但是网上能下到。经典中的经典。Pattern Classification 和这本书是两本必读之书。《Pattern Recognition and Machine Learning》是很新(07年),深入浅出,手不释卷。 最后,关于人工智能方面(特别地,决策与判断),再推荐两本有意思的书, 一本是《Simple Heuristics that Makes Us Smart》 另一本是《Bounded Rationality: The Adaptive Toolbox》 不同于计算机学界所采用的统计机器学习方法,这两本书更多地着眼于人类实际上所采用的认知方式,以下是我在讨论组上写的简介: 这两本都是德国ABC研究小组(一个由计算机科学家、认知科学家、神经科学家、经济学家、数学家、统计学家等组成的跨学科研究团体)集体写的,都是引起领域内广泛关注的书,尤其是前一本,後一本则是对 Herbert Simon (决策科学之父,诺奖获得者)提出的人类理性模型的扩充研究),可以说是把什么是真正的人类智能这个问题提上了台面。核心思想是,我们的大脑根本不能做大量的统计计算,使用fancy的数学手法去解释和预测这个世界,而是通过简单而鲁棒的启发法来面对不确定的世界(比如第一本书中提到的两个后来非常著名的启发法:再认启发法(cognition heuristics)和选择最佳(Take the Best)。当然,这两本书并没有排斥统计方法就是了,数据量大的时候统计优势就出来了,而数据量小的时候统计方法就变得非常糟糕;人类简单的启发法则充分利用生态环境中的规律性(regularities),都做到计算复杂性小且鲁棒。 关于第二本书的简介: 1. 谁是 Herbert Simon 2. 什么是 Bounded Rationality 3. 这本书讲啥的: 我一直觉得人类的决策与判断是一个非常迷人的问题。这本书简单地说可以看作是《决策与判断》的更全面更理论的版本。系统且理论化地介绍人类决策与判断过程中的各种启发式方法(heuristics)及其利弊(为什么他们是最优化方法在信息不足情况下的快捷且鲁棒的逼近,以及为什么在一些情况下会带来糟糕的后果等,比如学过机器学习的都知道朴素贝叶斯方法在许多情况下往往并不比贝叶斯网络效果差,而且还速度快;比如多项式插值的维数越高越容易overfit,而基于低阶多项式的分段样条插值却被证明是一个非常鲁棒的方案)。 在此提一个书中提到的例子,非常有意思:两个团队被派去设计一个能够在场上接住抛过来的棒球的机器人。第一组做了详细的数学分析,建立了一个相当复杂的抛物线近似模型(因为还要考虑空气阻力之类的原因,所以并非严格抛物线),用于计算球的落点,以便正确地接到球。显然这个方案耗资巨大,而且实际运算也需要时间,大家都知道生物的神经网络中生物电流传输只有百米每秒之内,所以 computational complexity 对于生物来说是个宝贵资源,所以这个方案虽然可行,但不够好。第二组则采访了真正的运动员,听取他们总结自己到底是如何接球的感受,然后他们做了这样一个机器人:这个机器人在球抛出的一开始一半路程啥也不做,等到比较近了才开始跑动,并在跑动中一直保持眼睛于球之间的视角不变,后者就保证了机器人的跑动路线一定会和球的轨迹有交点;整个过程中这个机器人只做非常粗糙的轨迹估算。体会一下你接球的时候是不是眼睛一直都盯着球,然后根据视线角度来调整跑动方向?实际上人类就是这么干的,这就是 heuristics 的力量。 相对于偏向于心理学以及科普的《决策与判断》来说,这本书的理论性更强,引用文献也很多而经典,而且与人工智能和机器学习都有交叉,里面也有不少数学内容,全书由十几个章节构成,每个章节都是由不同的作者写的,类似于 paper 一样的,很严谨,也没啥废话,跟《Psychology of Problem Solving》类似。比较适合 geeks 阅读哈。 另外,对理论的技术细节看不下去的也建议看看《决策与判断》这类书(以及像《别做正常的傻瓜》这样的傻瓜科普读本),对自己在生活中做决策有莫大的好处。人类决策与判断中使用了很多的 heuristics ,很不幸的是,其中许多都是在适应几十万年前的社会环境中建立起来的,并不适合于现代社会,所以了解这些思维中的缺点、盲点,对自己成为一个良好的决策者有很大的好处,而且这本身也是一个非常有趣的领域。 (完)