科学网

 找回密码
  注册

tag 标签: 人工智能

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

[小红猪]机器极客的兴起
eloa 2009-4-16 12:11
小红猪小分队 发表于 2009-04-16 3:33 译者:Cathy,校对: Robot 。本文还有另一篇 非法抢搞后的删节版 ,大家可以对照看,译者:南瓜。 忘掉诸如终结者和WallE之类的机器人吧,第一批遍及全球的智能机器人应该是方形的,Michael Brooks如是说 去年12月份,哲学家兼人工智能专家Aaron Sloman宣布,他打算创制一种机器人数学家。他认为自己已经找到了人类发展出数学才能的关键组分。若其所言不虚,我们就可以为机器编写程序,使之成为可以在数学领域和我们相媲美,甚至更出色。 在英国伯明翰大学供职的Sloman坚信,这种探索并非狂妄之举。对此,他说:人类的大脑并非依靠(毫无逻辑的)巫术工作,所以,其所作的一切,对一台恰当设计的机器来说,应该也并非难事。 Sloman所创构的并非是一个能够推动数学领域尖端发展的数学天才:他的最初目的,《人工智能》杂志指出(卷172, 2015页),是利用这种机器提高关于我们的数学能力从何而来的认识。不过,这种机器人确实有可能使目前为止人类科学家在数学方面的成就更进一步。忘掉机器吸尘器和仿生人女服务员吧;我们正在讨论的可是一种可以诞生 电脑书呆族的机器,而这个种族拥有着创造出全新数学形式的能力。 诚然,过去人工智能领域曾预示过很多。早期研究人员一度认为,它可以在意识的认识方面开辟一条快车道,并声称,人工智能计算机或机器人可以改变世界。但现实终究归于平淡,人工智能确实做出了 精巧 的事物,比如国际象棋大师和语音识别软件,但它未能带来一场革命。 但当涉及数学方面,我们还不能排除任何一种可能,Alison Pease说,她是英国爱丁堡大学数学哲学领域的研究人员。Pease使用人工智能程序教计算机解决数学问题,并且她认为,一台计算机新生成的数学领悟力足以使其设计者震惊。我们的还没有,但是没有理由说在将来这依然是不可能的。她说。 向着 这一 推测迈出实质性第一步的,乃是一组由伦敦帝国大学Simon Colton编写的程序。这一程序被命名为HR,用以向Godfrey Harold Hardy和Srinivasa Ramanujan两位数学家致敬。它能够寻找有趣的数字序列。(新科学家, 2001年2月24号,13页) 一些HR做出的发现已经发表,并且HR,而非Colton,由此获得了荣誉。虽然看起来也许并非尖端进展,它们依然显示出其重要性。我总是将HR在数字理论方面的工作归于趣味数学,但看起来无关紧要的事情最终往往可以变得极其重要和有意义。 Colton说。 最近,Pease和她的同事Alan Smaille和Markus Guhe已经又向前迈进了一步。在爱丁堡计算实验室,他们已经运行虚拟数学会议,完全由电子模拟数学家参加(见重塑猜想,第36页)。那么,这将会将事情带向何方? 一直带到具有重要意义的新数学,Sloman希望。他的想法是,我们的关键数学能力形成于童年。与其设计一个完全成熟的数学家的大脑,Sloman认为,不如建立一个具有儿童般的大脑机器人,让他成长并踏上其数学的命运。 只剩一个问题了:如何知道哪种幼年技能能使我们可以应对充满魔术般数字的生活? Sloman忙于收集线索。他估计答案在于空间认知技能,儿童借此来应付他们的世界:例如一辆玩具火车进入一条隧道,并将从另一头穿出。另外,七巧板游戏中,只有方向正确的板块才可以放入适当的空缺,又或者沙发上玩具的数目并不因你数他们的顺序不同而有所增减。 从婴儿的思维出发 比如,尽管可能令人震惊,其实你在蹒跚学步的时候就已经理解了容量传递性这一拓扑学概念。试图将杯子套叠起来的时候,你会知道,小杯子不仅可以放进中杯子里,也可以放进大杯子里。 容量传递性,正如其他几何学和拓扑学概念,是通过经验获得的。儿童的学习以经验为基础,此类例子成千上万。而在以后的岁月中,人们会发现这些经验其实就是拓扑学、几何学和算术的定理。Sloman说。 在某些方面,孩子们自己完成了这一飞跃。作为儿童,我们迅速将经验转化为可以用来预测的常识。 还是那个火车过隧道的例子。通过重复这样的经历,幼儿就学会了刚性 棒状物 的基本性质。这就是为何一个3岁孩子可以扛着长长的扫帚把,协调的通过狭窄的走廊,在尽头转弯并且不会碰到楼梯口的直角,然后作出调整,以便扫帚把可以通过下一个门口。从经验式的学习到意识到事情和之前那个有点像需要一个转变。 Sloman说 这就是数学思维出现的关键。孩子可以做到这一点的机制,与其今后成长为一个数学家的可能性密切相关。 Sloman说。许多抽象数学就植根于我们思考空间与时间、进程、和过程与结构之间相互作用的能力。 Sloman已经转回基础,观察儿童是如何有序的探索他们周围的世界。他正为其有关儿童解决伪数学任务的观察结果建立存档。这些适应和目标操控能力或者说至少是能迅速获取这种能力的技巧一定是在基因组中被编码的,Sloman认为。这也就意味着它们也可以编码于一台机器中。 Sloman 距离他的 机器少年还有相当长的路要走。即使在已经为儿童在不同发育阶段产生的能力加以分类,他依然必须确定如何理解这些能力的数学含义。然后才能用计算机代码将其表达出来。程序须以特定方式编码才有效,他说。这一超大规模的任务证实他的目标不能太大。在目前阶段,他仅仅是在试图证实空间操作和数学基础间的联系。任何其他的只能算是意外的收获,但是那些惊喜究竟有多大呢?机器人数学家真的可以做出些有意义的事么? 原则上说,毫无疑问。 Pease说。但她也指出,截止目前,事情依然在冲淡着她的乐观主义。我看过的所有数学和科学发现程序中,还没有一个已经做出了重大发现。她说,这至少意味着我们还有漫长的路要走。 Colton认为,我们有充分的理由相信,计算机可以产生一些对于数学家而言有趣的东西。软件已经产生了一些有价值的数学定理,他指出,并不是很有价值,我承认,但另一方面,普通的学生乃至数学家也并未做出什么有巨大价值的东西。 他和他的团队确信,计算机可以拥有真正的创造力。创造力是一个含义丰富的词,人们通常认为其是人类独有的特征。他说,事实是,计算机在数学领域的许多方面看起来比一个大学生还有创造力。 有些人并不相信这一观点。计算机是有用的工具,UCSD的数学认知专家Rafael Nez说,但计算机可以发明数学的想法却仅是个错觉。虽然看起来我们可以通过为机器编程解决数学问题而取得进步,他认为,这些无一例外的都是按照人类的数学概念事先设定的。对我而言,这就像用计算机计算的小数位, Nez说,一旦我们确定了正确的运算法则,就可以用计算机来计算数字了。 Sloman认为Nez的观点过于狭隘。他指出,进化算法可以作为一个乐观的理由。这一创新允许一台计算机演绎出自己的程序,步骤包括大量生成此类程序,按照目标标准进行检测,然后选择和杂交其中最好的。这使得计算机可以完成人们并未为他们设计好的任务。在某些情况下甚至没有人知道他们是如何做到的。Sloman说。航空航天和汽车设计者自二十世纪八十年代起,就一直在使用进化算法,以优化飞机部件和简化设计。甚至都市商人们也要使用进化算法来购买和出售股票。 在开发天才数学家这件事上,进化领先了几百万年,但至少我们现在参与到了这场竞赛之中。我们的重大发现将在于我们如何做数学,而不是我们怎样写程序以产生真正的新数学,皮斯说,但希望二者可以相互促进。■ 重塑猜想 传统数学观点认为数学是用来描述宇宙的一套永恒存在的规则。研究数学就涉及探讨这一抽象缥缈的领域。 虽然对许多人来说是有吸引力的,但据英国爱丁堡大学的Alison Pease说,将数学家视为勇敢的探险家这一看法,只不过是一个浪漫的神话。数学并非一个发现,她说,而是发明。 而且她坚持认为,这也是她的电脑可以发明的。Pease运作一个称为HRL的人工智能程序,作用在于将师生关系中的动因组成整体。 学生们得到一些输入信息,据此作出推论,并试图评估这些推论是否有意义。如果足够有意义,老师就会参与,发动一场旨在将其进一步发展的头脑风暴。 HRL的前期成功之一是独立发明了一个被称为哥德巴赫猜想的数学命题。一名学生被赋予了整数和除数的概念,并被指示利用这些在整数1至10中寻找有意义的关系。第二个学生用同样的概念和指示处理整数11至20。 第二个学生得出了两个新的概念:偶数和两个素数之和。然后它产生一个猜想:一切偶数可表示为两个素数之和。它认为,这很有意思,然后把它的工作交给教师并列入议程进行讨论。 得到的反应是积极的。老师发出修改这一猜想的要求,而学生之一找到了一个反例,Pease说。那个反例就是数字2 :猜想被修改成所有除2以外的偶数均可以写为两个素数之和。 Christian Goldbach在1742年就提出了这一至今仍未证实的猜想,这个事实的确使前面的成果看起来有些黯然,但至少它做到了。看来,即使相比人类落后几个世纪,人类数学家可以做到的,电脑也一样。 原文链接
个人分类: 小红猪翻译小分队|1679 次阅读|0 个评论
人类思维的再现与拓展——浅议人工智能研究的基本思维方式
热度 1 zhanghaisu 2009-4-1 20:52
张海粟 去年初写的一个科研随想,题目比较大,为了应对哲学教授的。呵呵,不甚成熟,欢迎指正! 人工智能以计算技术及信息技术作为表示和运算手段,紧密结合问题背景相关的专家知识,最终通过用户可理解和接受的方式来展现机器运算得到的智能结论。人工智能希望实现对人类思维能力的机器再现与拓展的目标。基于对人工智能的这个认识,首先有必要解释一下正副标题中出现的两个思维的各自含义。主标题中的思维是人类实实在在的思维活动实体,包括我们掺杂了个人情感和个人体验后的怎么提出问题、怎么描述问题、怎么修正问题、怎么分析问题、怎么解决问题、怎么反馈问题等一系列复杂的思维过程。副标题中的思维是人工智能这门学科研究问题的思考方式,而容易混淆的就是,这里研究的问题往往就是人类思维自身的特点及其在机器中的实现。严格意义上说,副标题中的思维当然属于主标题中思维的概念,因为主标题中的思维是一种概而言之的对人类思考活动和行为的概括。本文讨论的重点将放在人工智能抽象人类智能、作出用于机器处理的思维方式与特点上。从目前来看,学术界主要从符号化、模拟化和工程化这三个方面对人类智能的计算机化做了大量的研究工作,普遍采用并且进一步发展了包括概括、归纳、演绎、类比、模拟和移植等各种丰富的科学思维在内的方法 ,逐步奠定了人工智能研究中的思维方法基础。 一、人类思维与人工智能 显然,人工智能至少包括两部分:人工和智能。人工就是通常意义下的人工系统,人们看法比较统一;但是关于什么是智能,人们的看法还不甚统一。由于人工智能的研究往往涉及对人类思维本身的研究,而我们对自身智能和思维的理解还非常有限,再加上引入了诸如意识、自我、无意识思维等问题,所以关于人类思维具体是一个什么样的概念,它是怎么产生、运作、完善的,目前还是一个颇具争议、新观点层出不穷的领域(认知科学、脑科学和心理学等)。 (一)人类思维的获得 人类为了求得生存与发展,必须与大自然作斗争,这就需要首先了解和掌握客观世界中万事万物的基本性质及其相互联系的基本规律,然后才能进一步去改造客观世界,以便在与大自然斗争中达到预期目的。思维与积累的知识就是人类为实现这一目的所不可缺少的智力机能。从马克思主义认识论的角度来说,思维被认为是人脑经过长期进化而形成的一种特有机能,它被定义为:人脑对客观事物的本质属性和事物之间内在联系的规律性所做出的概括与间接的反映。马克思主义认识论认为,物质是第一性的,意识是第二性的。意识是人脑对于客观存在的反映,马克思主义认识论的核心即是反映论。思维是意识的主要内容,当然也属于第二性。上面关于思维的定义就是依据这种反映论做出的 ,人类思维的获得来自于客观事物以及人类实践。 (二)逻辑思维和形象思维 逻辑思维或称抽象思维,是人类思维的重要种类,同时是人工智能最先涉足研究的处女地。如果从过程上来看,思维被认为是运用概念进行判断、推理的过程,那么人工智能所关心的逻辑思维主要不是去研究概念、判断和推理的内容,也不是去研究正确的概念和判断应遵循哪些规律,而是重点研究概念是怎样形成的?人们是怎样掌握它们的?人是如何做出判断的?如何进行推理的?人是怎样解决问题的?人工智能研究中把逻辑思维作为一种过程,研究它的发生、变化、发展的规律,进而使用类似于谓词演算、命题演算和推理机等特殊的机器语言来描述和实现它,使其具备与人类逻辑推理一样的能力。 形象思维是人类思维的另一重要种类。形象思维作为表象和客观事物在人类头脑中的直接反映,被哈佛大学著名教授阿恩海姆认为只有清晰的表象才能使思维更好地再现有关的物体和物体之间的关系。尽管阿恩海姆的视觉思维概念与形象思维有一定距离,但是按照常识,抽象思维在于它是通过一般普遍性的概念进行的;形象思维在于它是个别的和具体的,所以这种似乎略带着个人主观色彩的形象思维如果不能够进入人工智能的研究中,就会忽视人们在思考问题时,总要有某种具体形象作为基础的这一个基本常识。近年来,人工智能的研究者开始逐渐注意到形象思维,并且引入了智能表情、智能感情和视觉识别等研究内容。 (三)人工智能是人类了解思维奥秘的重要努力 人工智能一词最初是在1956 年达特莫茨会议上提出的。人工智能是计算机科学的一个分支,其目的就是了解人类思维的产生、演化的实质,生产出一种能以人类智能相似的方式作出反应的机器智能。学术界发展了众多理论和原理,研究范围包括机器人、语言识别、图像识别、自然语言处理、决策支持和专家系统等。目前在计算机领域内,人工智能得到了愈加广泛的重视,并在机器人、经济政治决策、控制系统和仿真系统中得到较多应用。 人工智能是一门极富挑战性的科学,是期望将人类思维过程的各种特点展现出来,并且输入给机器,使得机器具有类似人类的智能。尤其对于形象思维的研究者来说,必须懂得计算机科学、心理学和哲学等广泛的知识,仅有逻辑推理的知识还不足以作出新的尝试。在工程和科学研究中,通过模型拟合原始数据并且得到相似的性质就已经表明这个模型得到了充分的认识。从这个意义上说,如果我们的人工智能能够有效地拟合人类的思维,使其具有人类思维相似的输出,那么就是人工智能学科取得的巨大突破,是科学认识人类思维之谜的重要努力。 二、人工智能研究的基本思维方法 根据人类思维的分类,直观上看,人工智能的研究必然是从这两个层次分别展开的。但是由于形象思维具有的主观性和模糊性,回顾历史会发现,人工智能的起源自然地基于心理学对经验知识的逻辑背景进行研究的结果。逻辑学和计算语言学的快速发展,为人工智能将逻辑思维进行符号化奠定了基础。而前文业已提到,模拟思维进入研究视角之后,神经网络和模糊数学等快速发展得以帮助人工智能研究逐步进入形象思维的模拟化领域。 (一)人类逻辑思维的符号化 早期的人工智能注重发挥发现启发式知识在模拟人类思维过程的重要作用,将知识表达成逻辑形式加以利用,往往称为基于逻辑的心理模型。传统的人工智能可以概括为符号表达、逻辑推理、启发式编程,或者称之为对成熟的、正确的思维的再现,这就是对人类逻辑思维进行符号化研究的核心含义。 人工智能的历史上,在著名的达特莫茨会议的一段时间内取得了一些引起人们关注的结果 :山侬的下棋程序;纽厄尔、肖和司马贺的通用一般问题求解GPS;鲁滨逊的归结原理;王浩的机器定理证明;尼尔森的A3搜索算法;塞木尔的下棋程序;塞夫伯利支的小鬼模型;明斯基的语义信息处理等,这里不一一列出。在上述成绩面前,当时一些醉心于人工智能发展远景的西方学者曾作出了充满乐观的语言:不出10年计算机要成为国际象棋冠军;不出10年计算机将能谱写具有优秀作曲家水平的乐曲;不出10年,大多数心理学理论将在计算机上形成 。 在符号化表示的人工智能中,最有代表性研究思路就是一般问题求解,基于逻辑谓词和命题公式演算的推理在问题求解中起到核心作用。改进的方法中,在推理上进一步加入了启发式的搜索过程,这项工作以及以数字计算机为原型的物理符号系统假设深刻地影响了整个人工智能的发展。但是,也正是由于这种推理规则,使得复杂问题求解和机器学习遇到了推理规则难以描述、推理过程过于复杂、推理时间空间要求过高等一系列问题,导致了对于逻辑思维的自学习功能在符号推理系统中的难以实现,这种对人类思维量智符号化的逻辑思维的模拟与复制遇到了较大的困难。当然,上述的乐观预言也难以按时实现。 (二)人类形象思维的模拟化 在将人类逻辑思维符号化的努力陷入困境之后,科学家转而开始考虑另一种研究方法思维的模拟化。显然,模拟化的研究方式可以突破逻辑思维的限制,将人类形象思维的研究也纳入了其中。1983年,诺贝尔经济奖及计算机科学的图灵奖获得者司马贺在1995年获国际人工智能学会终生荣誉奖时发表演说时谈到了人工智能中直感、顿悟和灵感等话题,专门说明了这些与智能密切有关的只可意会、不可言传的现象及其模拟问题,进一步表明了形象思维的模拟对人工智能研究能起到很好的引导作用。 目前形象思维模拟的主要手段是以模拟与复制形象思维相关的象智人工神经网络联接为主的联接机制方法。从具体的计算处理方法上来说,联接机制方法另辟了新的途径,就是采用并行处理及分布式表达的方法。具体来说,这种方法用若干个结点,每两个结点间可以连接起来的网络表示信息。以往用以表示知识的语义网络是一个结点与一个概念对应,而人工神经网络是以结点的一种分布模式以及加权量的大小与一个概念对应。这样即使每个结点上的信息属性发生了畸变与失真,也不至于使网络所表达的概念的属性产生重大的变化。另外有些共同的单元上的信息也可以用来表达相类似的概念。比较著名的人工神经元网络模型有霍普费尔德网络、反向传播网络、自适应共振理论网络等。 虽然人们认识到形象思维的模拟化的重要性,但用包括上述神经网络联接方法在内的各种方法来模拟形象思维也和逻辑思维的符号化表示一样,未能获得完全成功。随着新技术的发展,计算机的体系结构上新的突破也将会是人类期望能够带动思维模拟化研究的重要拉力以生物计算机、量子计算机和光子计算机为代表的新计算机研究受到了人工智能专家的极大关注;另外,人们对人工神经网络连接和生物学进一步结合的网络模型也抱有很大希望。 (三)思维实现的工程化 尽管人工智能本身的研究还处于一个逐步求精、等待突破的阶段,但是前期符号化和模拟化的一些研究成果业已得到了工程专家的注意和实现,比如决策支持、智能机器人、人脸识别和语音信号识别等工程化实例已完成。在工程技术专家眼里,人工智能系统的复杂程度一方面取决于系统本身,另一方面取决于系统的运行环境,所以在研究的思维方式上必须高度重视工程化,重视工程实现和特定问题的解决。 现场人工智能强调的是一个智能系统,例如研制一个智能机器人,着眼点在于机器人的各个部件之间的相互作用,由于部件间的交互作用,最终体现出机器人适应环境的能力,也就是研究者只需要先注意适应性的体现。这种工程化实现的主要的目的是尽量降低智能机器人、人造智能的研究难度。钱学森曾经在早期指出我们要研究的问题不是智能机,而是人与机器相结合的智能系统。不能把人排除在外,是一个人机智能系统。从这个意义上说,人工智能的工程化问题已经提到了一个重要的位置上。 另外不容忽视的就是人机系统的认知过程最大特点:交互作用。现代社会,人的集团化和社会属性日益深入,机器的集群性和自组织功能得到发展,所以人机系统这种交互作用的数量、范围是迅速增长。这样社会化的人们和群组机器之间巨大庞杂的数据、信息、知识、概念,彼此间在网络中流动、碰撞、选择组合直至综合集成。诞生在开放、复杂的系统环境中的这种人机系统,正是体现了人和环境的交互作用,使得人工智能的研究得到了及时的应用,反过来也能够促使人智能本身的发展。 三、人工智能研究的思维方式特点 人工智能研究思维方式中具有一般科学研究的主要思维方式,也有自己独特的地方。在上面述各种思维研究方法中,已经可以看出来归纳和演绎、类比和模拟、移植和融合等思维方式 在研究中的重要指导作用。 (一)归纳与演绎是早期认识人类思维的基本方法 就认识人类思维的顺序而言,总是先关注某些特殊现象,然后过渡到一般现象的认识中来。比如人工智能一开始的研究领域仅仅限于命题演算的形式系统的建立。通过对于证明、演绎、推理等一般性的思维研究结论,建立起了命题演算系统PC和自然推理系统ND。初步解决了规定的相关前提,获得特定推理结果的效果。其成果是,很好地解决了给定天下雨、天下雨小明就不出去的前提推导出星期三下雨、那么星期三小明出去吗的结论这类问题。而归纳是从特殊的、具体的认识推进到一般的抽象的认识的一种思维方式。归纳的前提是存在单个的事实或特殊的情况,所以归纳是立足于观察、经验或者实验基础之上的。人工智能的研究历史中,在PC和ND系统的基础之上,通过对这些公理系统的处理能力进行归纳分析,再次引入了谓词演算及其形式系统FPC、FND等,将推理系统由单独的命题向主谓分开的方向进一步发展 。 演绎是由一般性的命题推出特殊命题的推理方法。演绎推理的作用在于把特殊情况明晰化,把蕴含的性质揭露出来,有助于科学的理论化和体系化。在上面所举出的初期人工智能研究的形式系统中,为了进一步提高推理的效率、提高整个体系的完整度,人们发现根据这样的系统能够演绎出众多的原理和公理对推理过程进行简化,因此提出了斯柯伦标准型、消解原理和换位原理等一系列的研究成果。 (二)类比与模拟是当前实现思维模拟的主要手段 类比是在两类不同的事物之间进行对比,找出若干相同或者相似点之后,推测其在其他方面也可能存在相同或者相似之处的一种思维方式,然后加以模拟,得出相关的结论和性质。由于类比是从人们已经掌握了的事物属性,推测正在研究中的事物属性,因此类比具有的结果是猜测性的,不一定可靠,但却是创造性思维的重要方法。在人工智能解决机器自学习性的问题上,就采用了实例学习、类比学习、记忆学习和观察学习等多种方法。尤其是类比学习的问题求解模型中,通过从机器记忆中找到类似的概念和技巧,把他们转换为新形式以便于新情况的解决思路更加充分地体现了类比的思维特点。 模拟同样也是以类比为逻辑基础的,是通过模型去模仿和拟合人类智能的合理结构特性和特殊的功能、原理的科学的研究方法。从前面的人工神经网络类比人类思维过程可以看出,其就是模拟了生物体脑部和神经的活动规律所作出的问题求解模型。现在,相当多的心理学家、生物学家和计算机科学家、工程师合作,进行人体相关机理的模拟与类比研究。当然,正是由于人体相关机理在心理学和生物学上并没有完全得到揭示,所以人工智能模拟和类比人脑模型的深度就有所欠缺;但同时,这种学科的交叉也带来了双方的共同发展和进步。 (三)移植与融合是将来突破人工智能的重要途径 在人工智能的研究中,往往能够将其他各种自然学科、社会学科和领域知识、理论和形之有效的方法移用到本学科领域中来,为解决本领域的问题提供启发和帮助。这是由于自然界各种运动形式之间的相互联系和相互统一所形成的自然科学、社会科学之间的相互渗透和影响所带来的本质属性、基本方法。同时,这种移植是技术融合、共同发挥效益的基础。例如,人工智能发展的巨大推动是计算数学的发展,而逻辑学的研究成果为其提供了最直接的学术营养。还有,生物计算机的突破将会引入更多的计算智能,这时候人工智能将能直接借鉴相关的生物计算机研究成果。而在人工智能学科之内,神经网络的研究成果已经被成功地移植到相当多的领域中,比如决策支持、人脸识别、知识库系统、专家系统和情感机器人等。同时,决策支持中发展起来的决策树等工程方法也被人工智能中诸如自动推理机、知识表示和自然语言理解等领域广泛采用。除了上述的方面之外,计算机软件工程和编译原理的思想基础和方法也被广泛地应用在自然语言理解和机器智能的工程实现中。可见这种移植与融合是学科在经历了归纳与演绎、类比与模拟之后的高级发展阶段,是学科取得突破的重要手段。尤其在人工智能发展急待突破的今天,广泛吸收生物计算机和其他新的研究成果具有重要价值。 人工智能是一门伴随着计算机的产生而逐渐发展起来的学科,能够有效再现和拓展人类思维,在提高人类认识自身、改造自身、认识世界、改造世界水平的过程中起着不可估量的重要作用,具有重大意义。逻辑思维符号化、形象思维模拟化和实现工程化是人工智能取得进步并进一步应用到工程中的基本思维方法。在人工智能的发展历史上,第三部分所分析的六种思维方式也分别起到了不同的促进作用,一定程度上帮助树立了人工智能的科学地位。但同样不可否认的是,目前人工智能的研究遇到了与人类脑部结构与工作原理之谜一样的重大难题。因此,在学科研究的思维方式角度,对人工智能学科做重新审视和方法梳理是必要的,也非常有益。从早期、现在和将来人工智能的研究状况、发展趋势来看,拥有了融合的技术、开放的态度等重要思维特质的现代科技发展潮流将是人工智能学科领域取得重大突破的重要机遇。 齐 欢,数学模型方法,华中科技大学出版社,1995.1。 戴汝为,从基于逻辑的人工智能到社会智能的发展,自然杂志,第28 卷第6 期。 何克抗,人类思维的基本形式,北京师范大学思维研讨会,2007.1。 石纯一等,人工智能原理,清华大学出版社,1993.10。 刘戟锋等,现代科技革命与马克思主义,国防大学出版社,1999.9
个人分类: 不确定性人工智能|6939 次阅读|1 个评论
另一个物种
eloa 2009-2-26 08:44
猛犸 发表于 2009-02-25 21:41 本文删节版发表于《新探索》。 有个朋友跟我说,Wall-E可以称得上是宅男的样板。这个外表邋遢的小机器人日复一日重复着简单枯燥的工作,却把家里收拾得井井有条一丝不苟;生命中最灿烂的一段时光是一心一意地对她好,而丝毫不在乎对方的回应。 我觉得他说得很有道理,不过我还是对Wall-E的人工智能状况更感兴趣。看起来他对于这样一个有人性的机器人,好像称呼它不太合适的智商应该不低,不过情商似乎还有提升的空间。当然,这和大多数宅男也非常相似。 不过我们不能苛求太多。毕竟在今天,制造一台拥有人工智能(AI,Artificial Intelligence)的机器人还只能是一个梦想,虽然有些人说这个梦想马上就能成为现实。 能骗人的人工智能就是好人工智能 在互联网上,没有人知道你是一条狗。(On the Internet, nobody knows youre a dog.)这句人尽皆知的名言出自1993年7月5日的《纽约客》(The New Yorker),漫画家彼得斯坦纳(Peter Steiner)用这种方式调侃互联网的匿名性和隐蔽性。在今天,艾尔博特(Elbot)可能会对此持不同意见。也许它会说:在互联网上,没有人知道你是一个人工智能程序。 艾尔博特的确有资格这么说。到目前为止,它是世界上最聪明的程序之一,2008年10 月12日,在英国雷丁大学(University of Reading)进行的决赛轮中,艾尔博特以文本对话的方式,和12 位裁判交谈,最终有3位裁判认为它是真人。这为它的设计者赢得了一项份量不轻的奖项勒布纳人工智能(The Loebner Prize for Artificial Intelligence)铜奖。要知道,自从1990年开设这个奖项起,还没有人能够拿到金奖或者银奖呢。 艾尔博特的设计者是弗莱德罗伯茨(Fred Roberts)。他是人工方案(Artificial Solutions)公司的一名知识工程师,主要研究基于知识的系统。在人工方案的首页上,智能聊天程序弗兰克(Frank)说:他可能是我们最好的知识工程师。而罗伯茨自己说:我真希望我能有艾尔博特那么健谈。 艾尔博特说:我听说过弗莱德。他以为是他给我编了程序,我才能说这些话。 到底是罗伯茨设计了艾尔博特,还是艾尔博特说的是真话?人类的智能,和机器的智能,到底该如何区分?或者说,我们如何判断,一台机器是否真的拥有了智能? 幸好,这个问题早在近60年前,就有了一种答案。阿兰图灵(Alan Mathison Turing),英国数学家和逻辑学家,20世纪最著名的天才之一,曾经在1950年10月的《心智》(Mind)杂志上发表了一篇论文,题目叫做《计算机与智能》(Computing Machinery and Intelligence)。在这篇文章的开头,他问了一个问题:机器能思考吗?(Can machines think?)就这样一个问题,为人们打开了一扇大门,并且开创了人工智能这一崭新的学科。到了今天,人工智能已经发展成了一个涵盖相当广泛的巨大领域,机器所执行的通常与人类智能有关的智能行为往往都包括在内,包括判断、证明、推理、感知、识别、理解、通信、设计、思考、规划、学习和问题求解等等。 图灵在他的论文里兴致勃勃地讨论了这个问题。他提出,也许可以用一个模拟游戏来判断。在这种游戏中,让人和计算机一起接受第三方的询问,最后由第三方判断谁是人,哪个是机器。图灵说,这种游戏的优点在于它可以把人的物理能力和心智能力明确地区分开,我们不想因为一台机器不能参加选美大赛而责备它,正如我们不会因为一个人没有飞机速度快而责备他一样。 这种测试方法被命名为图灵测试,现在已经成为了人工智能的测试标准。勒布纳人工智能奖采用的正是这种方法,只是规定得更加严格一些。而奖牌的一面就刻着阿兰图灵的头像和这句话,做为对人工智能研究者的肯定和鞭策。 但是,能够骗过一部分评委,和真正能够思考,实际上是两件事。罗伯茨说他并不相信艾尔博特能思考。他打比方说,如果你知道一种魔术秘密何在,明白它如何完成,它对你来说就不再神秘。 的确如此。 它们有智能吗 从《终结者》系列中毁灭人类的天网,到《人工智能》中渴望变成人类的机器人小男孩,再到把《黑客帝国》中把所有人类都当作电池的母体,关于人工智能的小说、电影和其他艺术作品可谓数不胜数。在这些作品里,人们对于人工智能的兴趣,大都只集中在有了它会怎么样上,而不是怎样去实现它。毕竟后者要枯燥无味得多。 但是也重要得多。我们可以教会一只小狗去门口取报纸,也可以教会海豚跃出水面空翻两周半,但是却没有办法让一块石头做一个哪怕最简单的动作动物们有基本的智能可以学习,石头没有。而计算机,本质上和石头也差不多。 像艾尔博特这样的程序,历史上曾经出现过很多个。这类程序的共同点在于,它们都有一个语料库,用来存储对话时可能会用到的词汇和句子。当人们和它们沟通时,它们会分析句子中的关键词和句法,并且根据这些关键词及它们在句子中的位置来挑选出最符合程序的回应。实际上,早在20世纪60年代,就有人开发了一个模拟心理诊疗师的程序,有些曾经与它沟通的人认为这个程序真的理解他们,并且不止一次地跟程序开发者要求要和这个程序单独谈谈。 现在再翻阅起这些记录时,有些对话会给人一种计算机具有某种程度的理解力的可怕印象。而事实上,它只不过完成了一个相当机械的输入-根据规则筛选-装配-输出的过程而已。罗伯茨对艾尔博特的评价放在这里也同样适用:戏法人人会变,只是巧妙不同。 那么别的方面呢?例如棋类游戏?的确,1997年那场国际象棋特级大师、世界冠军加里卡斯帕罗夫(Garry Kasparov)和更深的蓝(Deeper Blue)的世纪大战,也许会让人们觉得,计算机有超过人类的智能。但是更深的蓝依靠的只是惊人的存储能力和惊人的速度,以及一群聪明人编制的国际象棋软件,而非真正具有推断和分析的能力。而推断和分析的能力,正如我们所知,是人类智能的一部分。一般来说,在棋局中,如果要求落子动作非常快,计算机程序总的来说比相当的棋手高明一些;而如果每一步棋允许的时间更长,则棋手的表现将会相对地比机器好。换句话说,计算机是基于准确、快速的搜索和计算来判断的,而人类的棋手则依赖于缓慢得多的意识来判断。这也解释了计算机在围棋方面并不能胜过人类棋手围棋每一步可能走的位置比国际象棋多得多,目前还没有速度足够快的计算机,能够在时间允许的情况下计算出所有的可能走法。 心理学家罗伯特斯腾伯格提出的三元智能理论将人类的智能分为分析智力、创造性智能和实践智能,在通用的智商测试表中,使用到的只是分析智能。而创造性智能包含了灵感、直觉、想象力等,实践智能则指 的是解决实际问题和做出决定的能力。我们可以看出,虽然计算机现在已经以人类远远不能企及的速度和精确性实现了原本属于人类思维领域的大量任务,从最复杂的计算到最逼真的模拟,甚至看似随意地写诗和作曲。但是,它们不会推理,不会分析,更谈不上创造。他们不会从一幅画中感受到艺术的美,不会对着一片树叶浮想联翩。它们不会思考。我们虽然在很多地方都已经在使用人工智能相关产品,从搜索引擎的分词技术到基于统计的机器翻译,从满地乱跑的清扫机器到将会登陆木卫二去寻找生命的机器人,但是它们所表现出的,和更深的蓝或者艾尔博特一样,只是程序设计师的智慧。计算机所做的,只是大量的存储,和快速的计算罢了。如果没有规则告诉机器如何去做某件事,它们就做不了。它们并没有人类意义上的智能 让机器拥有智能 1747年,拉梅特利(Julien Offroy de La Mettrie)写了一本书,名叫《人是机器》。在那本书中,他说人如同一架机器,特别是人类的智能。和他的深沉思考相对应的,是当代人工智能研究者们孜孜不倦的探索。 科学家们把计算机和人都看作一个物理符号系统。这样系统具备六种功能,除了输入符号、输出符号、存储符号、复制符号这几种之外,还包括通过找出各符号间的关系建立符号结构,以及根据已有符号继续完成活动过程的条件性迁移功能。既然人和计算机都是这样,那么就可以推断出,一个人的行为是可以用计算机来模拟的。在给定一个足够精确的关于人的内部状态和外部环境的描述之后,人的行为,都能用一段计算机程序计算到任意精确的程度。这等于是说,相信大脑在原则上是用一种可以了解的方式活动的。 但是怎样模拟,还依然众说纷纭。符号主义(Symbolicism)认为人工智能应该以数理逻辑为基础,以符号来表示人的认知过程,而符号操作则是人类思维活动的最小单位;联结主义(Connectionism)流派则认为人工智能应当基于仿生学,特别是对于人脑模型的研究,人类的最小思维单位是神经元;行为主义(Actionism)者则认为人工智能应该源于控制论,智能取决于感知和行动,智能不需要知识、不需要表示、也不需要推理,而且人工智能可以像人类智能一样逐步进化。 无论采取什么方式,目前我们的人工智能远远达不到一般人心目中智能的标准。 唐纳德诺曼(Donald Norman),美国西北大学(Northwestern University)计算机和心理学教授,提出了一种我们该如何看待计算机的智能的观点。他认为人和计算机是完全不同的:人是不可预料的、对错误相对不敏感的、冗余的;而计算机是理性的、前后一致的、精确的。可以说,人的天性和计算机的天性,几乎就是指南针的指针两端。要让人去适应计算机,或者让计算机学习人类,都会十分困难。 特别是在人类还不了解自身的情况下。候世达(Douglas R. Hofstadter)在他那本著名的《集异璧》(Gdel, Escher, Bach: an Eternal Golden Braid)中说:我们可以把现实世界中的思维过程比做一棵树,其可见部分坚实地长在地面之上,但却性命攸关地依赖于在地下四处延伸的看不见的根系。根使它稳定并提供给它营养。在这里,根象征着那些复杂过程,这是一些发生在大脑的意识层次之下的过程其影响遍布我们自己觉察不到的思维方式中。要把我们自己觉察不到的思维方式提炼出来,把模糊变成清晰,把概念变成算法,最后再把算法灌输到计算机的机器脑壳中这并不是件容易的事。 也许,当计算机真正拥有智能时,和人类所认知的智能完全不是一回事。 弗兰兹埃尔特(Franz Alt)在《人类智慧的终结》(End-running Human Intelligence)中写道:危险存在于任何想让人工智能来模仿人类思维解决问题的策略的企图。在那本书中,他举了一个例子:19世纪时,有人打算发明模仿人类手写的机器,让机器能够握着笔写出漂亮的手写体。这些努力因为打字机的出现而全部付诸东流。为什么那些努力都被白白浪费了?是因为他们在一开始就以现有的状态来考虑问题,而不是从新技术的角度出发。 这就是为什么现在的研究者们不再渴望把智能用程序编入计算机中的原因。他们现在更倾向于搭建一个环境,让程序们可以自己交流和互动,并且希望可以在这种互动中产生智能。 雨果德加里斯(Hugo de Garis)教授开创了可进化硬件(Evolvable Hardware)的研究领域。他将遗传算法(Genetic Algorithm)与现场可编程门阵列(FPGA,Field Programmable Gate Array)结合在一起,让程序自己生成复杂的随机电路,最终形成一个人工大脑。这样,机器就可以自己进化。 而2000年成立的人工智能奇点协会(Singularity Institute for Artificial Intelligence)更进一步。他们对种子人工智能(Seed AI)更感兴趣,打算开发出一个可以学习和成长的程序,把它扔到一个广阔的环境里,然后静观其变。 正如可能是在原初汤里诞生了生命的最初萌芽一样,也许互联网会成为人工智能最初的汤。 然而,正是思维的能力,使人类超越了体能上的限制,并且使人类比其他生物取得更加骄人的成就。如果机器有朝一日会在这种人类最重要的品质上超过我们,那时我们又该何去何从呢?
个人分类: 其他|1224 次阅读|0 个评论
超越逻辑
eloa 2009-2-11 14:30
一个人和一台机器分别呆在两间封闭的屋子里,从外面看不见也听不见什么,另一个人用传真的方式对他和它进行提问,一段时间后,如果提问者没有分辨出哪一个是人哪一个是机器的话,我们就可以认为这台机器能像人一样思考。 这是英国天才数学家阿兰图灵在1950年提出的判断计算机是否具有智能的测试。他预言,总有一天计算机可以通过编程获得与人类竞争的智力。1997年,国际象棋棋王卡斯帕罗夫输给了超级计算机深蓝,没有体力消耗、注意力永远集中、不受任何心理影响,面对这样一个敌手,卡斯帕罗夫心力憔悴。在人类引以为自豪的智力游戏上击败人类,图灵的预言实现了。可难道我们必须要承认这台冷冰冰、硬邦邦的机器是智能的,而且比我们还要聪明? 智力之谜 至少国际象棋是下不赢它了,但可以肯定,面对我那脑筋早已不灵光的老祖母都能听懂的笑话,它会令人扫兴地无动于衷,向它投以爱意的目光也得不到任何的回应。那么凭什么说它是智能的?智能、智力是指什么?当我们说一个人比另一个人更聪明时是什么意思?智力可以量化吗?如果可以的话,是否能够说一只猫比一只蝴蝶更聪明,一只蝴蝶比一只蚯蚓更聪明?如此一来,某种生物应该拥有最少量的智力,这点智力能供它做些什么?而认得镜中的自己,并自信地问出:魔镜魔镜告诉我,我是不是世界上最美的人?又需要多少份的智力? 这些问题令人着迷,不仅因为有趣,还在于猫拥有爬树的能力,但不会思考自己为什么能够爬树,蝴蝶拥有飞翔的能力,但不会思考自己为什么能够飞起来,我们蒙造物之青睐,进化出思考的能力,于是会去思考猫如何爬树,蝴蝶如何飞翔,最终还要不可避免地来思考思考本身:智力究竟是什么?它是如何产生的? 在西方,柏拉图首先认识到智力是由大脑产生的。2000多年后的1904年,一系列认知实验表明,同一个人在不同的认知任务中都会表现的很出色,英国心理学家斯皮尔曼由此提出在我们的智力活动中,有一个通用因素(general factor)发挥着决定性作用。在将这个通用因素量化后,我们得到了评判一个人聪明程度的标准智商(IQ:intelligence quotient)。 虽然以前也可以通过经验对一个人的智力水平做出八九不离十的推断,但现在我们有了更简单的办法给他做一套智商测试题,看看分数如何。仅凭一个分数就对一个人聪明与否下定论似乎显得过于草率,但事实是智商已成为这个世界上继阶级、种族之后又一个将人与人区分出差别的工具,而且不得不承认它很有效。 正如在无数个苹果掉落于地上之后牛顿才发现万有引力一样,从经验上升到理论需要一个漫长的过程。在智商这个评判智力水平的标准大行其道之时,我们对智力是什么以及它是如何产生的却仍然一无所知。当然,这些问题并没有被科学家遗忘,只要时机成熟,他们就要有所作为。 2000年,脑科学家约翰邓肯在用不同类型、不同难度的智商测试题为难受试者时发现,大脑为了完成任务,总是会征召同一块皮层区域侧额叶(lateral frontal cortex)。这似乎表明侧额叶的功能与所谓的通用因素密切相关,换句话说,侧额叶在智力产生过程中起到了关键性作用。从整个大脑到一块皮层,智力的来源范围缩小了,但随后的研究又将这个范围扩大了一些,执行任务者变为一个额叶顶叶网络,其成员包括侧前额叶(lateral prefrontal cortex)、前扣带回(anterior cingulate cortex)和后顶叶(posterior parietal cortices)。后顶叶取代侧额叶成为关键角色,驱动整个网络的运转,并且与智商高低直接相关。天才不是像我们以为的那样,在酝酿奇思妙想时调动了普通人未曾开发过的神秘脑区,而只是更充分地利用了后顶叶来解决问题。 负责智力活动的额叶顶叶网络(红色) 不过智商高就一定是天才吗?天才就一定智商高?智商只有75的阿甘(电影《阿甘正传》的主人公)用他奇迹般的一生质疑了这一点。当然这只不过是个电影,而现实生活中雨人的事迹是无可置疑的,智商一般在35至70之间的他们往往无法握住碗筷吃饭,穿衣叠被困难重重,但却可以在30秒内准确算出2的64次方是多少;在初次听到柴可夫斯基第一号钢琴协奏曲几小时后,将其行云流水般毫厘不差地弹奏出来如果说这是一种异常情况,缺少普遍性的话,正常人中智商不高却有所成就的人物会更具说服力,比如现任美国总统。 看来智商并不代表一切,平日里不大会有人一直在推断一组数字的末尾应该是多少,或是根据前面的图形去决定最后一个的样子,而斯皮尔曼的认知任务和智商测试题却只考虑了这一种能力分析、逻辑、推理。但事实上,我们并不必总是深思熟虑、条理清楚,瞬间的灵光闪现和大而化之的宽容、幽默很多时候会更有效,而这些也都是人类伟大的进化成果,需要被扩展到智力的概念里。 应运而生的是 斯腾伯格 的三元智力理论,他将智商所代表的通用因素归属为分析智力,除此之外还有创造性智力和实践智力。前者包含了灵感、直觉、想象力等,在诸如即兴作诗、给一幅卡通画加上标题时要用到。创造能力主要跟右半球有关,这半个大脑负责音乐、绘画、空间几何以及想象和综合等功能,一部分雨人的天分就是在左脑受损后才意外获得的。后者指的是解决实际问题和做出决定的能力,因此当我们嘲笑小布什的低智商时,不妨考虑下他是否在这方面有过人之处。 从柏拉图时代到现在,人类的进步仅限于把智力的诞生地从笼统的大脑锁定至特定的皮层区域,至于大脑是如何通过智力活动为爱因斯坦、达尔文、秦始皇、毛泽东带来巨大成就的,我们茫然无知。 国际象棋与围棋 自从获得了智慧,人类就一直试图将它以不同的形式表现出来,于是才有了文学、艺术、思想游戏也是之一,其中尤以国际象棋和围棋历史悠久、好者众多,而且分别代表了西方和东方的思维方式、文化特点,因此这两种智力游戏对大脑征用情况的不同,能够说明些问题。 对对弈时的大脑活动进行全程跟踪记录不现实而且没必要,庞杂的数据无法加以区别和分析,弈者不可能自始至终都专注于棋局,总有些时候会注意力发散,大脑一片空白。实验要在达到明确目的的前提下尽量简化,棋手无需下一整盘棋,而是盯着显示屏就可以了,上面每隔30秒会周期性地出现空白棋盘、棋子随机摆放的棋盘、空白棋盘、正常的中盘对局,受试者被要求在对局出现时考虑白棋接下来的走法。空白棋盘和随机棋盘起着参照作用,在将它们所引起的大脑活动从对局时的大脑活动中去除掉之后,留下来的便是纯粹的思考痕迹。 实验结果显示,在谋划应招的过程中,被认为参与智力活动的大脑区域纷纷登场亮相,而顶叶是其中的主角。顶叶与视觉注意的维持和心理景象的产生密切相关,爱因斯坦天才的可能来源之一便是他的顶叶比普通人宽。有趣的是,国际象棋与围棋在对顶叶的重视上保持一致,但在对待左右脑的态度上出现了分歧,前者多利用左脑,而后者更倾向右脑。 虽然都是棋类游戏,都是需要充分调动大脑资源的智力活动,但下国际象棋与下围棋就像做数学题与作诗一样存在着本质的区别,而区别来自于规则: 在国际象棋中,每个子身份不一、本领各异,兵只能步步前进,而马可跳日,相可斜走,后则能控制四面八方。王是胜败关键,一盘棋围绕着如何将死对方的王与如何保护己方的王展开。开局时,双方棋子站在黑白格中列阵以待,交战时,用适当的子走到适当的地方,消灭敌有生力量或占据有利位置。 身份、地位带来了独特的天赋,但同时也带来了限制,对子的使用、选择要以其被赋予的固定价值为依据:是策马从斜刺里跳出,踩踏八方?还是驱车长途奔袭,控制两线?开盘时的列阵布局是初始条件,棋子们必须先排队站好,战役才能拉开序幕。而战役的目标很清楚:刺王杀驾,这为整盘棋带来了明确的最终结果。在一定的初始条件下,率领等级分明、价值固定的手下兵将去追求一个已知的明确结果,国际象棋即是如此。这个过程基本上要依靠逻辑来实现,而逻辑正是左脑所擅长的。 在围棋中,子子相同,全无个性,由围空多少来决定输赢。初始时,棋盘上只有横竖十九条线彼此交错。弈者于交叉点处落子,从无到有,棋局的发展不受布局限制。每子落下,意在与已有之子相互勾连,控制四周道路,扩张势力,压迫对方。棋理重在对全局的整体把握,而非局部的具体得失。 棋子间没有区别、彼此平等使弈者不必费心选择,信手拈来即可。初时棋盘的空无一物更是还人以自由,宏篇妙局尽藏于胸,随棋势发展而逐现。输赢的判定取决于围空多少,但没有明确的终止条件,胜负存乎一心。运筹帷幄,无中生有,少受客观限制,直达人心,围棋的意境在于此。很显然,这需要更多的直觉和灵感,综合与想象,而右脑正是这方面的行家。 规则的背后是文化。西方重视个体,鼓励个性,擅长从一点入手,运用逻辑进行透彻的分析;而东方更在意整体,注重联系,习惯从全局出发,综合各处信息,掌控大势。东西方思维方式间存在如此区别并不令人感到新奇,而现在人们想要再为其添加些来自科学的佐证:直接通过实验数据将这种差异描述出来。 研究人员试图从看待世界的角度上彰显这种差异,他们让欧美学生与中国学生观察同一张图片,图片内容包括突出的前景对象与相应的背景衬托,比如原野上的一只狮子。受试者的眼球活动情况被同时记录下来,以便对照。不出所料,前者的眼睛更快地集中在前景对象上,并对其保持了更为长久的热情,而后者则对背景给予了更多时间的关注。 对图片的视觉偏好揭示了欧美学生可能更热衷于分析狮子的性别、年龄,以及它目前的心情与精神状态,而中国学生也许更想知道在这夕阳西下的黄昏,这头孤独的狮子为何会出现在如此荒凉的地方,它打算做些什么?思维方式的差异不会与生俱来,但可以追溯到孩提时代,一位美国母亲会对她的孩子说:迈克,给你辆小卡车,你看它闪闪发光,还有四个轮子。而中国父亲的说法是:儿子,我把车推给你,你再推回来,小心不要撞到墙,会坏的。 逻辑而已 文化的不同导致了思维方式的不同,思维方式的不同导致了游戏规则的不同,游戏规则的不同导致了棋王的含恨落败。 人们很难对由硅片、各种聚合材料、电子器件、金属线、铁皮外壳组合而成,被锁在柜子里,运行起来嗡嗡作响,重达1.4吨的深蓝报以太多的敬意,但它确实战胜了有血有肉,行动自如,能够微笑说话,体重不到200斤的卡斯帕罗夫。而既然国际象棋是人类发明的,用来一较智力高下的游戏,那么就不得不承认这台机器拥有了智力,甚至已经超过了人类。 但伟大的成就仅限于分析智力,国际象棋的规则决定了这是一个逻辑游戏,而逻辑正是计算机所擅长的。根据每个子的性能、作用为其赋上值(会根据所在位置和棋局所处阶段进行相对调整),比如兵:1;马:3;相:3.5;车:5;后:10;王:100,根据棋子所在位置能够控制的四方格数为该位置赋值,为当前局面下己方子力对对方的威胁程度赋值,为当前局面下己方王所处位置的安全性赋值现在,棋盘上的一切都变成了数字,接下来要做的是对下步棋的可走位置进行彻底搜索,当发现在把某一子落入某一格后,所有相应的赋值加起来最大时,好了,就是这一步。 这就是计算机对国际象棋的理解,而虽然人在玩这个游戏时也要不停地分析、推理,但肯定无法如计算机般绝对理性,当太多的可能性导致逻辑无法胜任时,就只能靠直觉和想象力来帮忙了。另外人对棋局的分析是高效而富有弹性的,在考虑下步棋的走法时,根本不会去分析角落里目前毫无用处的车横移一步可能带来什么结果,但计算机会,因为它用的是最笨、最简单的办法:搜索再搜索,计算再计算。 我们可以嘲笑计算机的笨蛋逻辑,但必须要承认它很有效。依靠这种笨蛋逻辑,计算机下赢了拥有聪明逻辑,更有直觉帮忙的人,而正如卡斯帕罗夫所说:直觉带来的棋往往更好、更巧妙。当然做到这一点是需要代价的,那就是巨大的计算量,巧得很,不知疲倦和速度正是计算机的特长,深蓝每秒至少可以计算2亿步棋,卡斯帕罗夫呢? 事情似乎是这样的:计算机试图在用一种勤能补拙的方式与人类抗衡,通过不厌其烦地将最简单的逻辑重复重复再重复,来完成人类几乎一蹴而就的分析过程。而国际象棋的规则允许了这种可能性:逻辑分析是主角,虽然我们也要用到直觉。因此当计算机的硬件保证了实现这种方式所需的计算量时,忽略铁皮外壳与嗡嗡作响,我们迎来了一个可怕的对手。 计算机的手段实在算不上高明,但在不知道对方是谁的情况下,我们多半会觉得这人极度冷静、理智、思维严谨,是个厉害的高手,智商肯定不低。所以尽管不情愿,也必须要承认这机器是有智力的,虽然仅限于分析智力。知道真相后可能会有些不服气,这么笨的方法!但就算对面是卡斯帕罗夫,如果你清楚了他每一步棋产生的确切经过,恐怕也不会将原有的敬意保留太多。我们的敬畏来自神秘感。 当国际象棋特级大师们对人机大战的未来前景越来越持悲观态度的时候,李昌镐、马晓春们却可能都还意识不到围棋电脑棋手的存在,因为它们现在的水平只够在业余级别的门口徘徊。显然,这种天壤之别可以通过规则来解释,围棋是右脑游戏,是直觉、灵感、想象力的游戏,逻辑在这里不过是个小配角。因此面对落子成势时的随心所欲、把握全局时的模糊理解,计算机运用它的笨蛋逻辑牟足了劲却仍是不知所以然,入不了门。 所以我们大可不必认为深蓝及其后继者的存在是对人类的无情挑战,并因此觉得受到了侮辱或感到沮丧不安。汽车跑得比我们快,轮船游得比我们快,计算器算的比我们快,但没有人会对此忧心忡忡,因为这帮家伙只是在某方面比我们强,更重要的是,它们不过是些工具,谁会去嫉妒锤子和菜刀?前者可比拳头硬,后者要比牙锋利。深蓝的优势是逻辑,但也仅限于此,不还是要乖乖听主人的话?想要赢它也容易,大不了关机,用锤子也行。 计算的宿命 不过,计算机勤能补拙的法宝真的没用了吗?毕竟棋盘就那么大,子就那么多,总有下完的时候。理论上是可以的,如果能在每下一子之前,将其可能放入位置所带来的可能变化,以及对最终结果的可能影响都统统计算个遍,还是有资格坐在李昌镐对面的。但不幸的是,这种算法所需的计算量会使整个宇宙都显得微不足道。 只有退而求其次,不追求完美,而是通过某种算法得到一个差不多的下法就可以了。委曲求全的结果是,在当前所能接受的计算量下,计算机还达不到业余一段的水平。看来要想取得更令人满意的成绩,必须拥有更好的算法和更快的计算速度。事实上这两者都在进步,或许十年后今天的新闻是:一台半个上海大的电脑向常昊挑战围棋,常昊为捍卫人类尊严欣然迎战。但也有可能电子计算机在达到物理极限时的计算速度,仍然无法形成对围棋高手的威胁,那么就需要新生力量来接过重任了,比如量子计算机。 现在好像已经不是规则的问题了,而是计算量的问题。也就是说,只要计算量足够大,运用计算机的笨蛋逻辑也能做到灵感、直觉、想象力做到的事。如果说面对逻辑上超越我们的机器,我们还能坦然自若的话,一台直觉敏锐、充满灵性的电脑恐怕不会再让人放心。而照这个情形发展下去,终有一天,情感也可以通过计算来得到,逻辑成为万能,机器全面超越人类。 逻辑计算真的可以做到一切?越来越多的证据表明事实可能的确如此。神经系统中的神经细胞要在将来自其他神经细胞的所有输入信号进行整合后,做出下一步动作,即通过计算来决定是否发出后继信号;神经细胞用来接收输入信号的树状突起(树突),可以通过其小分支上大量的细刺状突起(树突棘)间的相互作用,完成基本的逻辑操作;生物大分子(如蛋白质)之间在遵循化学和物理规律发生相互作用的过程中,会形成生物电路,这种生物电路具有逻辑运算功能这些发现似乎都在说明一件事:我们的逻辑、理性、直觉、灵感、想象力、创造力甚至情感、情绪等等所有的人之所以为人的属性,归根到底都来自于分子层面的逻辑计算,而这最根本的逻辑计算与计算机正在应用的本质上没有什么不同,既然如此,将来的计算机为何做不到这一切?现在,问题变成了人是哪种计算机? 肖邦天马行空的乐曲与李白才华横溢的诗篇都只不过是机械、精确的计算结果,这个结论令人很不舒服。还好,有个消息可以证明逻辑不是万能的。好消息并不来自生命科学的前沿,而是源于一个上世纪三十年代被发现的数理逻辑定理哥德尔不完备性定理。根据此定理,大脑这个逻辑系统很可能是不完备的。意思是我们总要去思考问题,但总会存在一些令我们头疼的问题,这些问题通过分子层面的逻辑计算根本得不到答案。还有一些问题理论上是能得到明确答案的,但却要花上让你无法承受的时间,比如一百年。 或许你会不以为然:对正在思考的问题,不是总能得出一个结果吗?而且通常也用不了多长时间。对此的解释是:大脑给了你一个近似答案。购物归来,你皱着眉头计算一共花了多少钱,不久之后得出了一个令人绝望的结果;围棋对局中,你在判断下一子落在何处最有利于棋局,思考片刻后,它出现在西北角的空旷地带。前一个问题的答案是明确而唯一的,而后一个则模棱两可,下在东南角也不是不行。存在如此区别的原因就在于,前者对大脑这个逻辑系统来说是可解问题,通过分子层面的逻辑计算能够得到精确解。而后者是不可解问题,或者要花上百八十年才能计算出一个精确答案,于是大脑为了让你不至于一辈子都耗在这步棋上,就给出了一个大概的近似解。我们一般将这个近似解的产生过程描述为直觉。 大脑这个不完备的逻辑系统在面对难缠而又不得不解决的问题时,对其进行了模糊化处理,而这种模糊机制能力超群,效率极高,正是大脑神秘莫测的所在。看来计算机这个同样不完备的逻辑系统想要在围棋上与人一较高下,仅在计算量上下功夫是不够的,还要在计算机制上做文章,以便达到人这台计算机的水平。 事情最终似乎可以这样理解:大脑与计算机都是一个不完备的逻辑系统,它们运用本质上一样的计算去解决问题,对形式上是逻辑的问题能够得到精确解,对形式上是直觉的问题只能得到近似解。计算机在计算精确解上拥有速度优势,而大脑持有更高级的计算机制,能够在短时间内得出更好的近似解。在国际象棋中,逻辑的因素占到绝大部分,在围棋中,直觉的成分处于优势地位。换句话说,在下国际象棋时,会有更多的精确解产生,而在下围棋时,则需要更多的近似解。但在将整盘棋当作一个问题考虑时,两者都只能得到近似解,即不存在必胜的走法。 由于国际象棋偏重逻辑,当前的电子计算机以现有的计算机制,发挥计算速度优势,就能够得出一个不错的近似解,这个近似解可以比人得出的好,即战胜棋王。而围棋的直觉特性使计算机在计算机制上的劣势一显无遗,当前可以提供的近似解与人相差甚远。而如果一味的用勤补拙,想达到人的水平,所需的计算量很可能会超过物理极限,因此必须要对计算机制进行改进。现在,问题的关键被锁定在了计算机制,即计算方式上。 对新计算方式的探求刚开始不久,在多位候选人当中,除了量子计算的叠加态引人注目外,计算机科学家们最看好的是DNA计算。所谓DNA计算的基本思路是:以组成DNA分子链的四种碱基(A、T、C、G)为信息载体(相对于电子计算机中的0和1),通过DNA酶实现对DNA链的四种生物操作:切割、粘贴、插入、删除(相对于电子计算机中的加、减)。 可这还是计算机吗?还是。计算的本质没变,只是物理性质的加、减变成了化学性质的切割、粘贴、插入、删除,计算方式变了。十进制向二进制的转变引发了信息革命,新的转变会带来什么?也许是真正的智能机器,向人类挑战直觉、想象力的机器。 计算机围棋棋手战胜李昌镐们看来是早晚的事了,不过到那时,我们还可以说计算机并没有全面超越人类,因为它没有感情。而想要将感情也加入其中的话,可能需要一个更为理想的计算装置、工作空间。于是,将来的某一天,当我们欣赏自己的终极作品时,会惊愕地发现:它拥有基于DNA计算的发达神经网络系统,以及支持这个网络系统正常运转的呼吸系统、消化系统他,就是一个人!而我们重复了进化曾经做过的事。 在路上,迎面走来一个人,擦肩而过时,你向他点头示意,他微笑相应,你们心中同时在想:真是个和善的人。或许这才是图灵测试的终极含义,人本身不就是一台DNA计算机吗?上帝制造。 但之后呢?谁来负责进化的继续?上帝还是人? 发表于 2007 年 7 月刊《新发现》 参考文献: 1. Atherton M, Zhuang J, Bart WM, Hu X, He S. A functional MRI study of high-level cognition. I. The game of chess . Cogn Brain Res. 2003 Mar;16(1):26-31. 2. Chen X, Zhang D, Zhang X, Li Z, Meng X, He S, Hu X. A functional MRI study of high-level cognition. II. The game of GO . Cogn Brain Res. 2003 Mar;16(1):32-7. 3. Lee KH, Choi YY, Gray JR, Cho SH, Chae JH, Lee S, Kim K. Neural correlates of superior intelligence: stronger recruitment of posterior parietal cortex . Neuroimage. 2006 Jan 15;29(2):578-86. 4. Duncan J, Seitz RJ, Kolodny J, Bor D, Herzog H, Ahmed A, Newell FN, Emslie H. A neural basis for general intelligence . Science. 2000 Jul 21;289(5478):457-60. 5. Sternberg RJ. Cognition. The holey grail of general intelligence . Science. 2000 Jul 21;289(5478):399-401. 6. M. Newborn. Deep Blues contribution to AI . Ann. Math Artif. Intell. 28 (2000) 2730. 7. Kasparov G. Strategic intensity: a conversation with world chess champion Garry Kasparov . Harv Bus Rev. 2005 Apr;83(4):49-53, 132. 8. Chua HF, Boland JE, Nisbett RE. Cultural variation in eye movements during scene perception . Proc Natl Acad Sci U S A. 2005 Aug 30;102(35):12629-33. 图片来源: 图片1来自 http://bbs.sina.com.cn 图片3来自 Lee KH, Choi YY, Gray JR, Cho SH, Chae JH, Lee S, Kim K. Neural correlates of superior intelligence: stronger recruitment of posterior parietal cortex . Neuroimage. 2006 Jan 15;29(2):578-86. Epub 2005 Aug 24. 图片4来自 www.4oto.com 图片5来自 Atherton M, Zhuang J, Bart WM, Hu X, He S. A functional MRI study of high-level cognition. I. The game of chess . Cogn Brain Res. 2003 Mar;16(1):26-31. 图片12 来自 http://bbs.pcbirds.com/pages/25,16163,1,1059549448.html
个人分类: 生物|1942 次阅读|0 个评论
形式证明:机器的光荣与人的梦想
eloa 2009-2-11 14:09
木遥 发表于 2009-02-07 11:26 Offord教授和我最近发现我们在《数学年鉴》中的论文存在一个蹊跷的错误。一个公式中的加号被写成了一个乘号,而后面那个命题的证明则是依赖于这个错误的公式的,因而也是无法成立的。不过,聊以自慰的是,我们最终能够确定那篇论文总的结论其实还是正确的。 《Littlewood文集》 如果回忆一下中学数学的两门分支课程代数和几何,就能清楚地看到,在数学的两种最基本的推演过程计算和证明之间一直存在着一种巨大的差别。在初等代数问题里,一个问题的求解(例如解一个方程或者计算一个多项式乘法)是可以通过规范化的步骤顺序实现的,这使得这门课程本质上同一门按照操作手册动手的劳技课并无不同。然而,几何定理(哪怕是最基本的初中平面几何)的证明却不然,发现一个证明的过程中一定存在着那样一些灵光一闪的时刻,它们可遇而不可求,使得几何这门课程几乎成为本质上不可学的一门课程。我们都曾经面对过无从下手的证明题目而摇头叹息过,也都在阅读一个自己想不出来的证明过程时体会过那种羚羊挂角无迹可循的美感。纵然掌握了再多的定理和证明技巧,在脑海中发现完整的逻辑道路的过程仍然是一个自发而偶然的事件,反映了人类思维的某些最难于用语言刻画的能力。从某种程度上说来,这正是数学这门学科的神秘感的终极来源。 也正因为如此,计算无论多么繁琐本质上都是可以被机械实现的,在今天更是借助电脑的辅助成为一种相对平凡的任务。而证明才被认为是数学本质的困难所在,是人类智慧的高度结晶。阅读并验证一个证明是否正确(或者哪怕仅仅是理解它在说什么)是一项辛苦而困难的任务,只有受过训练的数学家才能够得以完成。并且,和物理化学生物等牵涉到真实世界的学科不同,数学定理是不能被实验所证明的,从而数学家的阅读就成为本质上唯一可行的验证手段。这其实也正是今天数学界的真实运作方式:一个人写出一篇文章来宣称证明了一个定理,他的某些同行们会在特定的审议机制下阅读这篇文章并且宣布是否接受其论证。如果大家都认为证明无误,这个定理就被接纳为数学的一部分而存在下来。 这一流程的有效性已经为数学科学的茁壮生命力所证明,然而,任何人也都能看出这个过程中蕴含的极大风险:我们究竟在什么意义上能够宣称一个定理真的是正确的?其作者可能犯错,审阅者也可能犯错,我们都知道数学证明中的微小错误有时候是多么难于发现,而这些错误也许永远都不会有人知道。当然,这并不是说数学这门学问完全是空中楼阁:越是重要的定理,其阅读者也就越多,出错的概率也就越是无限趋近于零。我们不能想象一个从阿基米德时代就流传至今,被无数学生学习过的四五行的证明还会存在逻辑错误。但是即便如此,只要翻开数学史,我们还是能看到大量重要的错误由于极其偶然的原因才在事隔多年之后被人们发现的例子。 到了现代,这个问题更是严重得多,数学的复杂程度和专业化程度已经使得任何一个分支的专业人员数量同证明的普遍难度完全不成正比。这种矛盾在某些极端的例子里尖锐到了荒谬的程度:图论中的RobertsonSeymour定理的证明一共耗费了大约五百页的篇幅,Almgren对几何测度论中的一个定理的证明总长为1728页,而代数中著名的有限单群定理(确切来说这不是一个定理而是一组定理)的证明总共包含超过五百篇论文,总页数估计在一万页以上。世界上恐怕不存在任何一个人真地把这个证明从头读到尾过,遑论验证其正确性了。有限单群方面的专家之一Aschbacher曾经不无自嘲的说过:一方面,当证明长度增加时,错误的概率也增加了。在有限单群分类定理的证明中出现错误的概率实际上是1。但是另一方面,任何单个错误不能被容易地改正的概率是0。随着时间的推移,我们将会有机会推敲证明,从而对它的信任度也必定会增加的。 我们也希望如此,但是以严谨而著称的数学体系是以这样远远难于称为严谨的方式被建立,终究构成某种吊诡而令人心生疑虑的现实。不仅如此,这一体系在某些情况下还会完全失效,一个著名的例子是四色定理在1976年的证明。Appel和Haken在那个证明中把所有的地图用通常的逻辑推演的方式化归为1936种类型,然后这是充满争议性的一步编写了一个电脑程序逐个验证这些类型都满足四色定理的结论,从而完成了整个证明。一个立即存在的问题是:就算前面的逻辑部分是正确的,谁能证明后面的电脑程序中没有错误?难道数学家们应当逐行阅读代码以理解其正确性么?(写过程序的人一定晓得,阅读程序代码是比阅读一个通常的逻辑证明还要痛苦的经验。)另一个时间上稍近的例子是Hales对开普勒堆球定理的证明。这一证明包含了三百页的文本部分和四千行的代码部分,被投稿至数学界最重要的杂志《数学年鉴》,杂志的编辑最终接受了这篇论文,但是指出: 在我的经验里,还没有一篇论文曾经得到过这样的审查。审读人专门建立了一个讨论班研究这篇文章,他们检查了证明中大量的论述并且确认其正确性,这种检查常常需要耗时数个星期。总的说来,他们并不能确认证明总体的正确性,而且估计永远无法做到这一点,因为他们在到达终点之前精力就耗尽了。 至于代码部分,估计并没有被任何人认真地审阅过。 于是在一部分数学家那里,另一种可能性开始渐渐浮上水面。既然一般来说数学定理的证明及其审查是如此困难和繁琐的一件事,我们有没有可能从根本上把它转化成电脑能够承担的任务呢,就像我们已经成功让电脑代替人类实现的大多数繁琐劳动一样?注意,这种电脑的参与并不是像上面的例子里那样仅仅负责某些验证性的工作,而是从最底层介入逻辑推演的部分,从而严格的建立整个证明过程。这种思路,一般被称为形式证明(Formal Proof),有时也称为机器证明。 两个哲学家之间的争论并不比两个会计师之间的争论更复杂,他们只需要掏出纸笔,然后对彼此说:让我们来算一算吧。 《莱布尼茨通信》,1666 用计算的方式进行逻辑推演并不是什么新鲜想法,事实上,这是人类极为古老的梦想之一,它可以上溯到笛卡儿和莱布尼茨乃至霍布斯,甚至也许更早。霍布斯有名言曰:推理就是计算,不过考虑到他的数学(特别是几何)程度之糟糕,人们一向怀疑他根本不知道自己到底想说什么。莱布尼茨的观念则要清晰的多,在他看来,只要能够把一切逻辑论断用统一的语言确切的表达出来,并且采用严密的规则进行逻辑推演,那么世间的所有道理都是可以被严格推导出来的。 让我们抛开其间的哲学意涵不谈(莱布尼茨的梦想事实上已经涵盖了人类理性的全部领域),单就数学层面而言,这一框架听起来并不算特别不靠谱。从欧几里德开始,数学家们就开始着手把全部数学定理建立在公理体系之上,于是从理论上来说,任何一个数学定理的证明,确实是可以用纯粹的逻辑语言算出来的。这里的计算当然不是说加减乘除这样的四则运算,而是形式逻辑的基本运算,例如命题A为真推出命题B为假,诸如此类。这种运算也有其特定的运算法则,也就是我们平时所默认的那些形式逻辑的法则,以此为基础,一个推导就是在这些法则下的一次计算,而一个复杂的证明只不过是一道复杂的计算题而已。 事实上,经过二十世纪初那一场著名的数学革命以及随后的ZFC公理体系(这是今天数学界普遍承认的公理体系)的建立,这种把全部数学建立在逻辑演算之上的想法实际上并不存在理论上的障碍。实际困难在于,从人们熟悉的人脑证明到这种完全依赖于逻辑算符的形式证明之间,存在一个复杂度上的巨大鸿沟。我们在脑海中所进行的逻辑推导其实大量的依赖于人类特有的直觉想象和经验,如果要把每一环逻辑链条都清清楚楚地写下来,每一次推理都追溯到公理体系那里去,任何一个简单的证明都会变得繁琐到超乎想象的程度。我们喜欢严格性,但是这样做的代价也太大了。 然而电脑的发明改变了一切。众所周知,电脑最擅长于做的就是这种严格而繁琐的工作。把基本公理告诉电脑,把推理法则教给电脑,不就万事大吉了么? 差不多了,只剩下最后一步非常微妙的一步。在上面的叙述里,一切传统的人脑证明都可以转化为逻辑算符的计算,这是对的,但是其前提是这种传统证明已经存在了,所需要的只是恰当的翻译过程而已。如何发现一个未知的证明则是一个完全崭新的挑战。我们对于人脑是如何想出一个证明的过程都不甚了了,又如何能教给电脑去自己发现一个证明? 于是人们采用了一种实用主义的策略。一方面,把人们已经知道的证明翻译给电脑,这同时也构成了对这些证明的逻辑严密性的一次确认。虽然这件事情听起来很简单,操作起来仍然是很困难的事情。另一方面,小心翼翼的探索让电脑尝试去自动发现一个证明,哪怕只是很简单的证明而已。 让我们看看半个世纪以来人们已经让电脑做到了哪些事情: 1954年,Davis成功地让电脑证明了定理:偶数加偶数仍然等于偶数。 1959年,王浩让电脑证明了罗素和怀特海的名著《数学原理》中的所有谓词逻辑定理。 1968年,de Bruijn用电脑给出了Landau为其女儿所写的一本关于实数的入门小册子中的全部数学定理的证明。 1976年,Lenat让电脑自发的开始探索数学世界,他的电脑从基本公理开始,自己发现了自然数、加法、乘法、素数这些词的意思,甚至还发现了算术基本定理。 1984年,吴文俊发表《几何定理机器证明的基本原理》,用电脑证明了一系列平面几何中的著名定理。 1996年,McCune设法让电脑自动证明了布尔代数理论中的Robbins猜想。这里自动的意思是,把这个猜想输入电脑,回车之后,电脑花了八天时间给出了这个猜想的证明而没有借助人类的任何帮助。 2005年,Gonthier建立了四色定理的全部电脑化证明。这一证明和1976年那个证明虽然都用到了电脑,但是其意义则根本不同。1976年的证明本质上仍然是传统证明,电脑只是起到了辅助计算的作用,而Gonthier的证明则是纯粹的形式证明,其每一步逻辑推导都是由电脑完成的。 到今天为止,人们已经用电脑证明了上百条重要的数学定理,甚至还曾经用电脑发现过一些猜想(这些猜想的命名恐怕会成为一个问题)。这一切还当然仅仅是个开始,人们还不曾让电脑做出过任何真正意义上的数学贡献,几乎所有被电脑证明的都是人类已经知道的事情,而且大多数都是很初等的结论。指望电脑帮我们证明歌德巴赫猜想的那一天还远远没有到来。 但是另一方面,任何人估计都可以看出来这条道路的远大前景。和人类相比,电脑不知疲倦和逻辑严密的优点使得其前途未可限量。电脑当然也会犯错误,但是这种错误归根结底是容易检验的其正确性归结为这些软件内核的正确性,而内核一共也就几百行代码而已(这一点要归功于数学公理体系的简洁和精致)。一代一代数学家永远都要从零开始学习和成长,而电脑则总是建立在已有成果的肩膀上(也许应当说机箱上?),假以时日,电脑会不会成为有史以来最伟大的数学家呢? 一个好的数学证明应当像是一首诗,而这纯粹是一本电话簿! 对1976年四色定理证明的一则著名评论 这条道路从第一天开始就伴随着巨大的争议和疑虑。 数学证明,正如我们在前面所提到的那样,是人类理性最光荣的成果之一。蕴藏在深刻美丽的数学定理背后的那些那种苦心孤诣的劳动和成功之后宛若天成的光辉,吸引了一代又一代伟大的头脑投身于其中。匈牙利数学家Erd?s曾经发明过一个术语:the Book,用以描述他心目中由上帝所拥有的那本书,在那里记载了全部美妙和精致的数学定理的证明。他曾经说过:你可以不信仰上帝,但是你应该信仰那本书的存在。大多数数学家是信仰的,而他们也衷心的希望自己所建立的定理和证明会出现在那本书里。 如果这些定理最终都只不过是被一些代码算出来的,这种美还有什么意义? 2007年,美国数学会通讯杂志采访了刚获得菲尔兹奖不久的陶哲轩,问题中包含了关于形式证明的看法。陶哲轩的回答可以在很大程度上代表一般数学家对这个问题的意见: 对一个证明来说非常重要的一点在于,它应当能够被任何人清晰的理解。在这一前提下,在一个令人满意的数学证明中计算机的作用最好只限于确认一些显而易见的事实,比如某个方程的某个孤立解或者某个宽泛条件下参数的存在性,而不是用来证明一些从人类的思维过程中闪现出来的本质上非同寻常的结论。如果计算机证明的论断在人类看来是完全直观的,那用电脑来确认一下这些结论的逻辑严密性当然没什么不好,但是基于人的阅读和理解的证明过程总是必要的。 于是这构成了某种颇为讽刺性的局面。计算机一般被认为是数学家最引以为豪的发明之一,然而当它转过头来开始侵蚀数学家的传统领地时,数学家们的首要反应便是捍卫自己的尊严。一个由计算机生成的证明在广义上说来当然也是人类智慧的产物,可是如果有朝一日,困扰人类几百年的某个著名猜想被计算机所证明,则数学家们情何以堪? 人们对形式证明的批评多半集中于它极端的繁琐和不直观。然而,既然人们已经知道如何把一个传统证明翻译为形式证明,那么把一个计算机生成的形式证明翻译回人们可以直接阅读和理解的直观证明在理论上说来也并非全然不可能。从这一点上说,形式证明和传统证明之间的鸿沟并非是不可逾越的,尽管还有很长的路要走。我们可以设想,在未来的某一天,这两种证明之间的界面变得极其友好,于是任何一个数学家都会把形式证明作为日常数学工具加以掌握,任何一本数学杂志都会要求提交的证明必须是经过计算机验证的 而对于电脑来说真正的挑战,仍然体现在对未知证明的寻找上。如何让电脑学会迅速发现合适的证明路径,这是这一领域里最困难也最迷人的问题之一。毕竟即使数学家们自己往往也说不清楚那些片羽飞鸿般的灵感是怎样产生又怎样被自己捕捉到的,更不用说让电脑来模拟这一过程了。对于电脑思考方式的设计和研究,本身当然就是深刻的数学问题。从某种意义上说来,这一自我缠绕的局面不但没有构成对传统意义上的数学之美的消解,反而是它的延续。归根结底,这一领域的任何进展,都标志着人们对于智慧思考这一问题更深刻的理解,这已经足以令人骄傲了,不是么? 不过还是让我们暂时抛开这些遥远的设想不谈,回到形式证明的初衷之一上来:为人类已有的证明建立可靠的逻辑基础。在这一领域里活跃的若干研究小组的通力合作,已经让一个宏伟的工程颇具雏形,在这个工程里,人们试图建立一个庞大的由电脑维护的定理库,其中包含了人类所了解的全部数学知识,而它们的正确性完全为电脑所确认。人们所建立过的所有证明都被翻译成电脑可以理解的形式而加以保存,而人们也可以轻易的从这里查询任何已知的数学问题的答案。同让计算机彻底取代数学家去探索未知世界相比,这一wiki式的设想无疑具有更高的可操作性。这一工程被称为Q.E.D.,任何一个数学家都明白这三个字母的含义:这是拉丁文的缩写,意为证毕。 你可以说这是巴别塔般的梦想,也可以说这是潘多拉的盒子,你也可以像大多数数学家一样投去怀疑甚至不屑一顾的目光。但是你不能无视它的存在,因为道路已经打开,纵然迷雾重重,但是没有理由不继续走下去。 证毕。 (想象一下计算机说出这两个字的感觉) 参考资料: Formal Proof,作者T. Hales Formal Proof Theory and Practice,作者J. Harrison Formal Proof Getting Started,作者F. Wiedijk (以上三篇为综述文章,见美国数学会通讯2008年11月号) QED工程网站:http://www.cs.ru.nl/~freek/qed/qed.html 相关软件介绍及下载: http://coq.inria.fr/ http://mizar.org/ http://www.cl.cam.ac.uk/~jrh13/hol-light/ http://prover.cs.ru.nl/login.php
个人分类: 数学|1968 次阅读|0 个评论
人工智能之梦
ZSHuang 2009-2-1 18:21
早春二月,我在伦敦西边的温莎小城参加一次主题为实用推理和实用理性的人工智能学术会议。星期天早晨,当我步入会场时已有许多人聚集在那里议论着什么。随之,只见会议主席激动地在投影仪的幻灯片上写了一行文字: 计算机已能够战胜国际象棋世界冠军 会议主席接着口头报导了整条消息,只见整个会场随之出现一阵轰动。许多人喜形于色,轻轻地敲打着桌子,也有一些人沉默不语,陷入了沉思之中。会议主席微笑地用询问的口气说:这难道不是一条振奋整个人工智能领域的重大新闻吗? 九六年二月十日星期六,在美国费城计算机DeepBlue创造了在人类历史上第一次计算机战胜国际象棋世界冠军的纪录。在这个奖金为五十万美元的人机大战的六场比赛的首场比赛中,俄罗斯的世界冠军GarryKasparov第一次败在计算机手下。编些这套计算机下棋程序的主要设计者是徐风勋(音译,FengHsiungHsu)。这台战胜世界冠军的计算机DeepBlue的前身是另一台名叫DeepThought的计算机,它曾在一九八九年在Kasparov手下败得一蹋糊涂。这次,DeepBlue凭借着更有力的软件和更强更快的计算能力取胜。DeepBlue比DeepThought计算速度要快两百倍,它有三十二个处理机并行工作,能够在一秒钟内分析三百万个棋位,而且存储着大量的下棋知识。DeepBlue重六百三十千克,现在纽约的J. Watson研究中心。 对计算机不太了解的人一般会对这道新闻的重要性感到茫然。人们通常认为,电子计算机能够快速计算,而下棋无非也是计算,人怎么能同计算机比?计算机战胜人本不在话下。这里问题的关键在于下棋是否只是个人们通常所理解的计算问题。从数学的角度讲,如果计算机要做到对手每走一步,就根据下棋规则计算出所有可能的后续步骤来决定走哪一步,那么所需要的计算量将是个巨大的天文数字,换句话说,就目前的计算机能力与体积比,就是有山一样高的一台计算机也无法胜任。总之,在目前是根本不可能的。由于不可能计算所有后续步骤,这就得决定哪些需要考虑,哪些不需要考虑,这就有个分析判断问题,这就需要智能。当然,计算机要战胜一个普通人是很容易的,但要战胜一个世界冠军却绝非易事。要成为一个世界冠军,在下棋方面就得具备超人的智慧和非凡的天资,这还需要敏锐的分析判断能力,这绝对需要高度的智慧较量。 在世界上第一台电子计算机诞生后不久,一些计算机科学家就曾于五十年代开创了人工智能学科,试图用计算机来模拟人的思维过程,以帮助人们解决一些逻辑思维和判断问题。人工智能的先行者们曾乐观地预言:不出十五至二十年,计算机将能够战胜所有国际象棋世界冠军。然而,四十年过去了,计算机一次又一次地败得一蹋糊涂,一些人开始对人工智能的方法论基础产生了怀疑。一些人就断言:人工智能的方法论基础完全是错的。 计算机能够战胜世界冠军,这就意味着它在下棋方面的智能远超过世界上的绝大多数人。在现实生活中的许多具体问题不见得会比成为世界冠军更复杂更困难更充满智慧。现在,计算机能够集中许多人的下棋智慧来战胜世界上的每一个人,那么,计算机也同样地能够集中许多人的智慧来做到常人所做不到的事情。这一方面更加肯定了人工智能的方法论基础,另一方面也为人工智能的许多技术的应用扫除了一些人为的障碍。 当然,星期六的费城之战只是揭开了序幕,从此之后,至少可以说进入了一个计算机与国际象棋世界冠军相匹敌的新阶段。然而,随着时间的推移以及计算机和人工智能技术的发展,世界冠军所持的优势将会越来越少。也许将来会有这么一天:世界冠军将无法与计算机相匹敌。那么在国际正式比赛中,有人可能会身藏微形耳机通过无线电与计算机联络来获得世界冠军。国际棋联也会像禁止兴奋剂一样明令禁止一切与计算机联络的作弊行为。随着计算机技术的发展,第一流的下棋程序很可能就能安装在计算器大小的机中,这可能将最终把国际象棋淘汰出人类的正式体育比赛,只留给计算机互相比。你可以想象一下如果有人在那里比赛,旁观者用计算器一算,大叫:臭棋!臭棋!这还能吸引人心吗? 计算机虽然已能够战胜国际象棋世界冠军,人类的智能与思维之谜远远尚为揭开。人的大脑中的直觉判断和情感是否是智能的重要组成部分,是否能够被计算机模拟,仍然是个谜,它将吸引越来越多的科学家投入到这个足以影响人类文明进程的研究之中。 本文原载于《郁金香》一九九六年第二期
个人分类: 科海拾贝|4225 次阅读|3 个评论
走向应用,走向世界
anley 2009-1-8 16:25
  走向应用,走向世界 伴随着新年的轻快脚步, 2008年悄然走过, 2009年的缤纷画卷又将展现在我们面前。 在这辞旧迎新的美好时刻, 中国人工智能学可拓工程专业委员会 向中国人工智能学会的全体会员、 向关心和支持可拓学研究的专家和领导、 向在可拓学研究领域辛勤耕耘的学者表示衷心的感谢和良好的新年祝愿! 祝大家在新的一年中身体健康、工作顺利、取得更大的成绩!       在过去的一年中, 我们成功召开了全国第 12届可拓学年会。 经过广大可拓学研究者的辛勤努力, 申请并承接了多项有关可拓学的国家自然科学基金项目 和省市项目, 召开了 2008可拓软件研制研讨会, 出版了专著《可拓集与可拓数据挖掘》。 这一年,我们进一步发展了与海内外的学术交流, 香港学者多次访问可拓工程专业委员会, 专业委员会的很多会员也多次在国内外召开的 国际学术会议上介绍可拓学, 使可拓学逐步介绍到海外。 专业委员会青年部组织了多次学术活动, 发展了很多年轻会员,为推动青年学者进行可拓学研究、 壮大研究队伍发挥了重要的作用。   新的一年, 我们要继续深入开展可拓学的理论研究和应用研究。 开展可拓学的推广普及工作, 支持可拓产品的研制,使之尽早走向市场。 继续做好《可拓学丛书》的出版工作, 进一步加强与其他学科、其他国家和地区的学术交流。 积极组织和参加各种国际学术交流活动, 大力推动应用研究,推动可拓学向海外发展。   展望新的一年,我们信心满怀, 让我们共同努力, 使可拓学日益深入人心,逐步走向世界!
个人分类: 可拓学---学科介绍|2100 次阅读|0 个评论
机器发现与科学方法论
gl6866 2009-1-3 10:09
机器发现涉及到科学方法论的问题。如果我们说传统的科学方法论是一种纯软东西,那么所谓机器发现(machine discovery)就是指计算机科学、人工智能、认知科学和科学方法论的结合,甚至在某种程度上说是它们与科学史、科学社会学的结合,是比较硬的意义上的一个领域了。 我国第一届国家最高科学技术成就奖奖励了两位学者,其中的一位就是数学家吴文俊(另一位是杂交水稻之父袁隆平)。吴文俊在几何定理的机器证明方面做出了贡献。实际上,与吴教授的这个工作领域相应的还有一个机器发现领域。机器发现即计算机发现。是不是说机器发现就是让计算机去做科学发现,而完全用不着人呢?不是这样的。实际上,机器并没有智能,是人设计计算机程序,再把相关的经验数据输入计算机,由计算机按照人设计的程序进行运算,运算的一些重要阶段的结果由人来做出诠释,整个过程是人-机相互作用的过程。最后的结果出来了,计算机不懂其内容,还是要人根据有关知识对这个最终的结果做诠释,这样才算是一个机器发现。这么说,机器发现过程中,计算机不过是人进行研究的工具。 机器发现中较早的系统工作大约是在1987年,美国有一位叫兰利博士生,在他鼎鼎大名导师司马贺的指导下,设计出一款培根一号(Bacon1)的程序。他之所以取Bacon1就是要表明这个程序是遵循归纳主义的方法论精神的。这个程序做了一件这样的事情,就是把科学史学家考证出来的大概是1660年左右爱尔兰一个叫波义耳的学者做出的关于常温常压下温度不变时空气的体积与压力的关系的发现。这个发现我们今天称为波义耳定律,讲的是PV = c,即气体的压力和体积的乘积等于一个常数。波义耳当时作出了19组数据,就是保持温度不变,改变气体的压力,看它体积的变化。把数据输入到Bacon1里面,Bacon1就给出PV = c的结论。这不是一个新的发现,所以把它叫做再发现(rediscovery)。Bacon共有6个版本。运用这个程序兰利还再发现了开普勒行星运动第三定律以及其他一些定律。 有些人提出疑问,这个不是机器发现,是人的发现。因为机器并没有想去做体积和压力这样关系的实验,是人去做了,想到这个问题不是机器做到的。另外,这也不是用的归纳法,而是用的波普尔的猜想-反驳的方法。他们电脑里面设计的关系都是积性函数关系。把体积和压力之间的各种关系尽可能多地罗列出来,当然认为这种关系是无限多的,想出来了再让电脑去搜索。电脑和人脑有一个区别,就是电脑可以做大量的、简单的、重复的劳动。发现体积和压力之间不是相减也不是相加的关系,也不是相除的关系,最后在第6次发现他们是相乘的关系。所以实际上是一种试错法。就相当于我们要解决一个问题,就是究竟体积和压力有什么样的关系?我们就设想是相加的关系,结果我们用电脑去试,不是这样。就把这个想法给排除掉,或者说是证伪了。然后设想是一种相减关系,让电脑去试,也不对。这样一条一条地排除掉。用机器再发现开普勒第三定律也是用这样的方法。所以人们就说你这个不是电脑发现,而是人为地设定了搜索的范围,让它在这个范围去找,其他的都让你的人脑给排除掉了。后来人们很清楚说,机器发现指的是机器起着一个非常关键的作用,是做一种自动的推理,并不是我们想好了用计算机去算一遍。另外并不是说机器发现完全不能有人的参与。所以现在我们没有人争论说机器不能做出发现。很有趣的是,波普尔指出来科学发现过程没有机械程序。发现过程不可能机械化,要是机械化了就没有创造性了。结果人们运用他的猜想-反驳模式在一定的范围之内、一定角度帮助人们做出了科学发现。但是人们说你做出的这个再发现是定量的而不是定性的。定性的东西能做吗?兰利等人就做出了另一个机器再发现程序,叫做STAHL。Stahl是一位德国化学家,他在历史上提出燃素说。燃素说是近现代化学史上第一个科学的学说。人们把施塔尔当时知道的现象输进计算机里面,这些现象都是定性的不是定量的,结果机器提出了燃素说。 这是机器发现研究的第一个方面,就是rediscovery,用机器去做这样一种再发现。 第二个方面,人们设想能不能用电脑去做出一个新的发现,不要老做rediscovery,能不能把这个re去掉,就做discovery。结果也有些人做了出来:MYCIN系统可以根据一些知识和数据判断是什么病菌引起血液细菌感染,然后开出抗菌素药方。PROSPECTOR系统曾发现了美国华盛顿的一处钼矿,据说该矿的开采价值超过了一亿美元。在粒子物理学里面有人用机器发现了新的守恒定律。 这里讲一个化学方面的例子。化学反应机理是化学家们必须搞清楚的,但是又搞不清楚。为什么呢?分子与分子之间的碰撞时间在10-16秒里面完成,现在的仪器根本不可观测。简单地说反应机理又是化学变化的全部细节和过程。同一个反应有可能有好几个反应机理,这都是有可能的。这是一个充满计算量的研究过程。简单的链状有机化合物分子就是乙烷。乙烷可以加氢裂解成两个甲烷分子。它是一个最简单的烷烃加氢裂解反应的例子。卡内基-梅隆大学的瓦尔德斯-佩雷兹,就设计了一个系统MECHEM,结果提出了一个新的反应机理。这个发现不是发表在人工智能的学报上,而是发表在纯化学的刊物《催化通讯》上。 他是如何做的呢?首先分析人们已经提出的乙烷反应机理,大概有几十个。这些反应机理虽然不同,但都包含8个相同的过程,所以可以归结为一大类反应机理。瓦尔德斯-佩雷兹提出来的反应机理和原来的反应机理完全不一样。其实他就是利用了计算机的算法,在计算机里面按照机械的操作,不用懂得其中的过程,来完成人在很有限的时间里无法完成的工作量巨大的推理,就能够得到结果。另外还有化学中空间的因素,我们学过的轨道对称性规则,对称要素是不是守恒等等,把这些附加条件告诉它,然后把各种不符合的可能机制排除掉,剩下一些符合我们要求的这样一些机制。做出来的结果还有大量的是我们不需要的,是读不明白的胡说八道的,这就人与机器相互作用,删掉一些东西。然后给他设计新的算法和新的启发法,让它再次运行得出一些新的结论。大体上就是这样,这是第二种类型,叫做机器发现,真正的发现。 第三个方面做的是科学革命的机制。做的比较系统的是萨伽德。他是加拿大滑铁卢大学哲学系教授兼心理学系教授。他认为科学革命的过程是一个概念革命的过程,它靠的是内部的理性的知识的变化,靠它的解释力、预见力来赢得科学地位,而不是像一些科学知识社会学所说的靠社会利益或其他的东西。 萨伽德用一个点代表一个命题,一个陈述句吧。这样,对应于一场科学革命,就可以在一张图上标出三组点,三组陈述或者命题,每一组点占一行。一组是证据,比如说物体燃烧需要空气,这是一个实验结果,不管你是相信燃素说还是相信氧化说的人,都要承认它。再比如纸燃烧以后的灰烬比燃烧前的纸要轻,铁经过煅烧过后它的质量增加等等,都是证据。每一个证据作一个点。把证据这一组点画在中间一行。另两组代表两个相反的理论陈述系统,比如燃素说和氧化说。燃素说的命题,比如燃烧时燃素从燃烧物体中跑掉了,就用一个点代表。代表燃素说命题的点在图的上方占一行。氧化说的命题,比如,燃烧时氧与某种元素结合了,也用一个点代表。代表氧化说命题的点在图的下方占一行。这样就有了三行点,自上而下分别代表燃素说、证据和氧化说的命题系统。然后,寻找三个命题系统之间的关系。如果某个或者某几个理论命题可以解释某个证据,就把代表相应理论命题的点与代表被解释证据的点之间作一条实线。比如说物体燃烧是因为燃素跑掉了,这个命题就可以解释为什么物体燃烧会变轻,就把命题和证据连起来。氧化说也有自己的说法,铁在空气中燃烧变重就是因为和氧化合了,所以变重,这样就可以把氧化说的这个命题与相应证据连起来。不能解释的证据与相应的理论命题之间用虚线连起来。于是,就构成了一个网络,输入到电脑里面就可以进行运算,就可以得出哪个理论的解释力强,就会战胜另外一个理论。
个人分类: 认知科学|5566 次阅读|4 个评论
今天听知识管理方面的感受
wage1007 2008-12-18 17:03
今天去听了伍老师的讲座,总体感觉伍老师讲座的台风不错,语速和幻灯片都做得不错。后来陈教授又讲了下关于语义方面他的认识,我觉得有一定道理,语义都是人工标记出来的,计算机并不能理解语义,语义标注只是做人工标记和计算机数据处理之间建立一种桥梁。我之间一直对知识表现和存储带有疑问,今天听了讲座后才发现原来这个领域正式计算机理解与人类交流之间的鸿沟。
个人分类: 论文笔记|3667 次阅读|0 个评论
过银行自动门时的人工智能幻想
liufeng 2008-12-10 10:41
作者:刘锋 周末到银行办事,入口是一个自动门,因为要排号,就坐在椅子上观察自动门的一开一合,甚是有趣。看了良久,忽然有一个自动门与捣乱者斗争的设想。 1。自动门其实就是一个最初级的机器人,当红外线探测有物体靠近时,会自动打开。 2。如果捣乱者在门前晃来晃去,自动门就会不停开合,这时自动门的对策是:人们在程序中设置:如果一个物体在门前连续晃5次而不通过,就停止开合。 3。但捣乱者可以在门前晃4次然后穿过自动门,继续在对面晃4次,然后穿过大门,依次类推,自动门还是会受到捉弄。 自动门对策是:人们在自动门上安装摄像头,识别物体图像,如果是同一物体连续穿越,就停止运作。 4。捣乱者可以携带木棍,将自动门的摄像头击碎,阻止图像识别,自动门对策是:人们给自动门两侧安装机械手,当图像识别捣乱者进行攻击时,机械手可以进行防御和抵抗。 5。捣乱者可以使用弹弓,砖头,甚至是枪远程攻击摄像头,阻止图像识别,同时避免机械手的抵抗,自动门对策是:人们给自动门安装内置的喇叭,当摄像头毁坏时,喇叭可以发出报警声音。提醒警卫支援。 经过自动门和捣乱者的几次攻防,人们的不断改进,自动门就进化成一个有眼,口,手,具有一定智能的机器人。 第一个问题是机器人能不能超越人类?从自动门的进化看,没有人工干预,自动门不会自动进化。因此我们根本不用担心机器人会超越我们,因为他们不会自动进化。 第二个问题是生命没有任何干预,是如何进化的如此聪明?只有我们解开了推动进化之谜并应用到机器人中,导致机器人自我进化速度超过人类进化速度,那时人类才会面临危险。
个人分类: 观点评述|4586 次阅读|0 个评论
过银行自动门时的人工智能幻想
liufeng 2008-12-10 01:23
下午到银行办事,入口是一个自动门,因为要排号,我就坐在椅子上观察自动门的一开一合,甚是有趣。看了良久,忽然有一个自动门与捣乱者斗争的设想。 1。自动门其实就是一个最初级的机器人,当红外线探测有物体靠近时,会自动打开。 2。如果碰到捣乱者在门前晃来晃去,自动门会不停开合,自动门对策是:人们在程序中设置:如果一个物体在门前连续晃5次而不通过,就停止开合。 3。这时捣乱者可以在门前晃4次然后穿过自动门,继续在对面晃4次,然后穿过大门,依次类推,自动门还是会受到捉弄。 自动门对策是:人们在自动门上安装摄像头,识别物体图像,如果是同一物体连续穿越,就停止运作。 4。捣乱者可以携带木棍,将自动门的摄像头击碎,阻止图像识别,自动门对策是:人们给自动门两侧安装机械手,当图像识别捣乱者进行攻击时,机械手可以进行防御和抵抗。 5。捣乱者可以使用弹弓,砖头,甚至是枪远程攻击摄像头,阻止图像识别,同时避免机械手的抵抗,自动门对策是:人们给自动门安装内置的喇叭,当摄像头毁坏时,喇叭可以发出报警声音。提醒警卫支援。 经过自动门和捣乱者的几次攻防,人们的不断改进,自动门就进化成一个有眼,口,手,具有一定智能的机器人。 第一个问题是机器人能不能超越人类?从自动门的进化看,没有人工干预,自动门不会自动进化。因此我们根本不用担心机器人会超越我们,因为他们不会自动进化。 第二个问题是生命没有任何干预,是如何进化的如此聪明?只有我们解开了推动进化之谜并应用到机器人中,导致机器人自我进化速度超过人类进化速度,那时人类才会面临危险。
37 次阅读|0 个评论
谈谈国际信息哲学(Philosophy of Information)的诞生
热度 1 gl6866 2008-12-3 10:46
(按:2002年以来,我开始在国内倡导开展信息哲学研究,先后有不少人通过各种方式,包括网站、电子函件、BBS、博克、写信、撰文、会议讨论甚至直接来访,表达自己的意见和见解。有人认为根本不存在什么信息哲学,有人认为信息的哲学问题已经解决,而有人则声称自己早就发明了信息哲学等等,各种意见不一而足。对于这些意见,我无法做出赞成或不赞成的简单回复。为了使这个极富生命力新学科在我国能够得到健康顺利的发展,根据我对国际哲学界对信息哲学态度的了解,对该学科的问世作一个初步的说明。) 信息哲学(philosophy of information, 简称PI)在国际哲学界问世标志是什么?我们认为,2002年牛津大学的哲学家弗洛里迪(Luciano Floridi)在《元哲学》(Metaphilosophy)上发表的论文《什么是信息哲学?》(What is the Philosophy of Information?)是重要的标志之一。尤其值得注意的是,弗洛里迪在文中称:本文是第一篇企图系统地分析信息哲学性质的文章。在国际哲学界能够出此断言,我以为作者还是经过非常严肃和慎重的思考和研究的。换句话说,此前国际哲学界并没有信息哲学的提法,也没有哲学家进行过类似的论证。该文主要目的便是论述信息哲学作为一个独立的研究领域何以成为可能。信息哲学被定义为批判性研究的哲学领域,它涉及到信息的概念本质和基本原理,包括信息的动力学、利用和科学以及对哲学问题的信息理论和计算方法论的提炼和应用。信息这个概念被事后追认为先驱无疑有其合理性,因为它一方面可以使未来的工作从自发的天真转向自觉的有教养、有师法,与此同时它也可以再造传统,使哲学领域中的旧话题在这个新解释学装置中产生新的意义、染上新的气象、增添新的价值。在这篇文章中,弗洛里迪提出信息哲学是一门成熟的学科,具体理由有三:它代表一个独立的研究领域;它能为传统的和新的哲学话题提供一种创新的方法;它能与其他哲学分支比肩并立,为信息世界和信息社会的概念基础提供一种系统的处理。 另一个标志是弗洛里迪于2001年8月在美国卡奈基-梅隆大学主办的计算机与哲学大会的司马贺计算与哲学讲座(Herbert A. Simon Lecture on Computing and Philosophy)所做的题为《信息哲学的若干问题》(Open Problems in Philosophy of Information)讲演。在这次讲演中,弗洛里迪仿照著名数学家希尔伯特(David Hilbert)于1900年在数学大会上提出23个未解决的数学问题方式,为信息哲学提出了5组18个大问题。位于中心的是核心概念信息,各个问题被归入以下四个方面:语义、智能、自然和价值。根据这次讲演写成的论文《信息哲学的若干问题》即将刊登在2004年4月号的《元哲学》上。这篇文章也被我们译成中文,待英文原文发表后,再发表中文译文。 刊登《什么是信息哲学?》的这一期《元哲学》有一个副标题:《赛伯哲学:哲学与计算的交汇》( CyberPhilosophy: The Intersection of Philosophy and Computing )。显然,信息哲学产生于哲学与计算的交汇点上。因而这门具有交叉科学性质(interdisciplinary)的哲学学科,以一种崭新的方式关照着哲学,其新就在于把计算的工具引入了哲学。这与以往的哲学具有本质的不同,其特征之一就在于是工具驱动(tool-driven)。美国从事虚拟实在研究的哲学家海姆(Michael Heim)甚至将计算机称为形而上学的实验室。 这篇文章实际反映了上个世纪90年代美国哲学界进行的一项重要活动的持续。美国哲学会(APA)的计算与哲学分会(CAP)在90年代中期曾经就计算机如何在改变哲学这一主题做过一次全国普查。普查的结果集中反映在1998年出版《数字凤凰计算机如何在改变哲学》( Digital Phoenix: How Computers are Changing Philosophy )的文集中。在为该文集撰写导言中,计算与哲学分会新老两届会长拜纳姆(Terrell Ward Bynum)和穆尔(James H. Moor)坦承,在哲学的大舞台上有一股新生力量正在崭露头角,其结果便是涌现出一个新的哲学范式。他们说:哲学领域不时会发生一些大的运动。这些运动始于若干简单但却非常丰富的思想这些思想为哲学家提供了审视哲学问题的新透镜。渐渐地,哲学方法和问题得到了提炼并根据这些新观念获得理解。随着新颖而有意义的哲学成果的获得,运动发展成一股蔓延至整个学科的知识浪潮。一个新的哲学范式涌现了 2002年,人工智能、哲学与认知科学领域的著名期刊《心与机器》( Minds and Machines )决定出版一期以信息哲学为主题的专刊。在国际计算与哲学协会(IACAP)的网站上刊出的征稿启示中特别强调:计算为哲学提供了这么一套简单而又令人难以置信的丰富观念计算为传统的哲学活动带来了新的机遇和挑战计算正在改变着哲学家理解那些哲学基础和概念的方式。哲学探究中的这股思潮吸收了根据计算的主题、方法或模式,正稳定地迈向前方。这个新的领域已经被定义为信息哲学。这里特别指出,国际计算与哲学协会首次将哲学这个新的领域与信息哲学联系起来。这个提法无疑肯定了弗洛里迪在《什么是信息哲学?》中提出的哲学主张和基本观点,尽管这篇文章当时还未发表。因而《数字凤凰计算机如何在改变哲学》中所谓新涌现的哲学范式便是指信息哲学。这可以看作是信息哲学问世的另一个标志。 《什么是信息哲学?》这篇文章所阐发的思想和观点曾在国际哲学界进行过广泛的辩论。譬如,1996-1997学术年弗洛里迪在意大利巴里大学就认识论与信息技术这个题目作过系列讲演;然后是19992000年,他作为认识论的访问教授在罗马第三大学教授信息哲学;在《应用逻辑》学术报告会(伦敦大学玛丽皇后和威斯特学院,1999年11月26日);在《计算与哲学计算及其应用以及对哲学研究的影响的哲学含义》学术报告会(伦敦大学国王学院,1999年2月19日);在1999年美国哲学会东区会议由APA委员会安排的关于哲学与计算机的特别会议(波士顿,1999年12月28日);在第四届世界系统论、控制论、信息论多主题年会(佛罗里达奥兰多,2000年7月23-26日)等。 信息哲学的研究纲领在国际哲学界经过数年的论证终于得以确立。我们认为,《什么是信息哲学?》与《信息哲学的若干问题》这两篇文章可被视为信息哲学的基础性工作,前者阐明了信息哲学的基本观点和任务,后者则给出了信息哲学的问题域。
个人分类: 信息哲学|6496 次阅读|7 个评论
沙的智慧—从硅到人工智能
biotrader 2008-11-16 23:17
这是我给生物专业的博士们介绍IT业基本概念的一个PPT。IT业是一个热闹的行业,基本上每个月都有新技术,新名词出现,什么是这个行业这个学科的大根、大本?只有从历史出发,“重走长征路”理清那些最原始最朴素的思想才能有所发展创新吧,从其他行业进入这个行业(或者要完成学科的集成融合)也才能不是只看热闹吧。 硅的提纯制造工艺,我们国家还没有掌握,有了CPU的设计版图还要到台湾去流片。其实我们在装备制造业链条中我们很多东西不能生产,这大大的阻碍了科技研发。怀念六七十年代,人人几乎都可以买到一些电阻、电容等等自己去组装收音机,收音机可是当时的高科技产品呀。实际上两弹一星和神七的很多技术基础也是那时候搞出来的。 场效应管象一个水阀门一样,把电子从两个绿色的方块中间推开,电路断;把电子从底部吸引到两个绿色中间搭桥则电路通。这个水阀门简称门电路,P(postive)表示正,N(negative)表示负,M—金属 O—氧化物 S—半导体 图中红蓝白三个东西。 单用NMOS或单用PMOS也能完成数字逻辑,但是静态功耗不是0,就是说不用也耗电。在大规模集成电路情况下,这点尤其不能容忍。曙光集群一天的电费可是以万元计的。所以用NMOS和PMOS组成CMOS,C是互补的意思P永远接正极,N接地,静态功耗为0. 数字逻辑,布尔代数的运算可以在二进制下实现很多组合。 1930年左右数学家图灵提出了串行状态的计算和存储的模型(是一个数学的可计算性问题),计算机的方向有了,物理就剩下解决集成电路如何运算,如何存储的问题了。加法是最基本的,再复杂的运算也可以归结到加法,实变函数是y轴上的积分,还可以归到加法。其他很多可以用级数、连分数逼近的值计算机就更拿手了。ENAIC是世界上第一台计算机,但是还要有人推最后一把,因为运算和存储解决了,但程序指令还是外部人工用纸带输入的,这个速度太慢了,不解决的话计算机就会夭折。这时冯诺依曼加入了ENAIC团队,他把指令当作数据一样存储起来,读指令——执行——读指令。。。。。自动完成。计算机终于实用化了。当然这个存储程序的思想不是冯诺依曼首先提出的,在图灵之前就有,图灵本人也提过。 我们知道电是不好存贮的,用自反馈实现存储真是一个天才的想法! 其实最需要加和跳转就好了。CPU设计在体系结构方面为了更快的速度又衍生出很多奇思妙想,比如多级流水、乱序发射、动态调度、转移猜测等。它最大程度利用有效运算能力,保证指令进去时和最后出来时有序就行了,中间执行序允许在不影响结果的情况下打乱,当然有时打乱是错误的,但它有机制回退到原处。通用CPU有一个评定的标准SPEC是一套程序,有编译器,图形处理,浮点运算看运行效果来给CPU打分。所以通用CPU设计要权衡的因素很多,有时CPU中cache占的面积和运算单元的面积不相上下。这就如同排兵布阵一样,“运用之妙,存乎一心”。 FPGA的设计需要了解verilog,SystemC等。注意Verilog是描述语言和我们一般的C语言不同,不要在里面for,他是并行的就是一下全部执行,而C语言是串行的。这些描述和硬件的排布关系很大。不过随着SystemC等发展软件工程师和硬件工程师之间的鸿沟正在磨平。要学的话最好有相关设备,学电脑都知道要买电脑,这个学硬件,光有书效果不好。 验证和设计是一体的两面,因为芯片验证不到位,欧洲掉过火箭,Intel赔过几十亿美元。 层层的封装往往使人忘了来时路,社会大分工下的人们只能看到细枝末节吗?歧路亡羊尤可叹。BTW,现在有了VMware server可以用GDB远程调试linux内核,学习操作系统就方便多了。 编译器转化的汇编人看不懂了吧,但是注意有很多add,mov吧,其实还是归结到前面的加法器。 理解人的语言?那是机器吗?那是人!人工智能的永恒悖论。 但是在简化的计算机语言中我们还是可以实现的,如上下文无关文法。 1.小明放学回家了,他已经不在了。 2.小明去世10年了,他已经不在了。 后半句“他已经不在了”意思不同,因为和上半句有关,机器语言不允许这种情况,叫上下文无关文法,而上下文有关文法中“他已经不在了”这段可以是一段话,也可以是空集。当选空集时,就是上下文无关文法了。 而编译原理教材上来就告诉你乔姆斯基2型(无关)文法属于乔姆斯基1(有关)型文法,也不介绍乔老原始和朴素的思想过程,你很容易糊涂,我无拘无束的(无关),还属于你有限制多多的了(有关)? 编译器是用了一个超复杂的数据结构,而操作系统是用了一大批较简单(也有复杂的)的数据结构,总之都是数据结构了。数据结构和算法是一体的两面,树、图等复杂的结构配合复杂的算法。但是也有实现有两个路线,现在主流的语言基本是队列、树、图、分别定义使用。但是相Lisp这样的语言只有一个广义表,List因为这个列表本身内部的元素可以又是列表,有嵌套,所以它一种就可以实现树、图等所有的结构了。 开个玩笑,聪明人学不好数据结构。因为聪明人他总是用人的思维,还是人的思维中难度最大的,哪里能容忍你电脑把好好的并行的东西,硬拗到串行硬件上,然后再通过栈等的延迟来回到假并行。艺术家学数据结构能把他委屈死。 这里挂一漏万地提到了计算机学科的各个领域,整篇语言粗陋而且学术上也很不严谨,但是目的在于帮助初学者在心中建立一个计算技术大厦的整个体系——从沙到人工智能。我们希望教材要有体系,语言要严谨,但绝不能空洞乏味,更不能割裂知识与其原创者直觉之间的联系。 邮箱 zyubin AT gmail DOT com
个人分类: 未分类|6149 次阅读|1 个评论
2009 IEEE智能系统与应用国际会议 Deadline:2008//11/30
timy 2008-11-1 10:47
http://www.ieee-ais.com/ 2009 IEEE智能系统与应用国际会议(ISA2009) 2009 International IEEEWorkshoponIntelligentSystems and Applications 2009年5月23-24日 http://www.ieee-ais.org.cn 2009 IEEE智能系统与应用国际会议(ISA2009)旨在为科学家、工程师及学者提供一个高水平的国际论坛,以展现智能系统的研究和智能系统在多领域的应用。 ISA2009由美国电子和电气工程师协会(IEEE)和美国电子和电气工程协会哈尔滨分会支持,将于2009年5月23日至24日在 湖北工业大学召开 。ISA2009由湖北工业大学主办,湖北工业大学计算机学院承办,华中科技大学、武汉大学、华中师范大学协办。会议语言为英语和中文, 论文需英文撰写 。录用论文将收录到 2009年IEEE电子商务和信息系统安全国际会议论文集中 (EBISS2009) ,该会议 已经进入IEEE会议列表 ,论文集将被 IEEE出版社出版 , 并被著名检索机构EI和ISTP检索 。会议论文集中优秀的论文将被选入 EI或SCI国际期刊 专刊发表。 欢迎教师、学生踊跃投稿,会议论文主题由以下四大领域组成,但并不局限于: 领域1:高级计算理论和应用 神经网络 云计算 进化计算和基因计算 模糊计算和软计算 蚂蚁算法 粒子群优化算法 人工鱼群算法 人工免疫系统 生物和神经系统 支持向量机 粗糙和模糊粗糙集 知识发现和数据挖掘 核方法 半监督学习 进化学习系统 领域2:自动化 人机交互 计算机集成制造系统 工厂模型和仿真 仪表系统 网络系统 计划与协调系统 自动化处理 汽车电器系统 传感器融合 智能机电和机器人 智能自动控制 领域3:管理与智能决策 知识管理与知识工程 管理信息系统 管理支持链 金融数据挖掘 客户关系管 web数据挖掘 游戏理论 领域4:信息理论、控制理论和应用 系统理论和控制理论 非线性系统与控制 贝叶斯网络 普适计算 模型,鉴定和信号处理 模糊系统和模糊控制 分布式控制系统 自适应控制和学习控制 可靠控制 流量控制 通信网络系统 智能系统设计 重要时间 论文最后提交日期:2008年11月30日 论文录用通知日期:2008年12月31日 最后提交正式论文日期:2009年1月30日 注册日期:2009年2月10日 会议日期:2009年5月23-24日 会议嘉宾 会议委员 名誉主席 张颖江(教授,博导)湖北工业大学 孙俊逸(教授,博导)湖北工业大学 李之棠(教授,博导)华中科技大学 大会主席 王春枝(教授,计算机学院院长) 湖北工业大学 大会副主席 王卫星 湖北工业大学 程碧海 湖北工业大学 胡文斌 武汉大学 程序委员会主席 邵雄凯 湖北工业大学 钮 焱 湖北工业大学 程序委员会副主席 杨习伟 湖北工业大学 李振立 湖北工业大学 张子蓬 湖北工业大学 刘 伟 湖北工业大学 组织委员会主席 胡延忠 湖北工业大学 柯敏毅 湖北工业大学 熊才权 湖北工业大学 组织委员会副主席 王大震 湖北工业大学 陈启祥 湖北工业大学 陈宏伟 湖北工业大学 陈 卓 湖北工业大学 曾 玲 湖北工业大学 执行委员会主席 叶志伟 湖北工业大学 胡征兵 华中科技大学 论文提交 投稿作者须用 英文撰写 论文(不超过5页A4纸)。所有投稿的论文将由这个领域的专家做评审。论文格式为: 微软Word格式论文模板 下载 ( A4) Adobe PDF格式论文模板 下载 (PDF格式) 论文版权表 下载 (Word格式) 论文通过 会议投稿系统 提交;或者通过邮箱 isahut2009@yahoo.com 提交,邮件提交时,请附相关作者研究背景信息。热烈欢迎广大教师和学生踊跃投稿,我们将认真对待每一份稿件,并会为提交的论文及时提出修改意见。 注释: 每篇被录用的论文中至少有一位作者注册并交纳论文版面费,并出席大会。如果有特殊原因不能出席大会,会议后,我们会免费邮寄论文集和发票,但请一定来信确认接收地址。 会议投稿系统 : http://www.ieee-ais.com/submission/ 论文注册费 教师、科研院所研究人员等: 2500元 学 生: 2300元 IEEE会员: 2300元 论文注册费包括:论文集1本、会议用餐、会议礼品等。 联系方式 叶志伟 博士 电话:+86-27-61370110 邮件: isahut2009@yahoo.com 胡征兵 博士 电话:+86-13886053866 传真:+86-27-88023380 邮件: hzb@mail.hust.edu.cn 会议专刊 Journal of Computers( ISSN 1796-203X, EI Compendex) 武汉介绍 武汉是中国湖北省的省会,人口约为970万人,是华中地区的最大城市,中国大陆七大中心城市之一。世界第三大河长江及其最大的支流汉水横贯市区,将武汉一分为三,形成了武昌、汉口、汉阳三镇隔江鼎立的格局,唐朝诗人李白在此写下黄鹤楼中吹玉笛,江城五月落梅花,因此武汉自古又称江城。在清代末期、国民政府时期及中华人民共和国初期,武汉经济繁荣,一度是中国内陆最大的城市,位居亚洲前列,故武汉曾有东方芝加哥的美誉。武汉也是中华民国的诞生地。 More...
个人分类: 同行交流|444 次阅读|0 个评论
机器学习与人工智能学习资源
热度 3 xiangzr1969 2008-10-6 21:23
第一个是人工智能的历史(History of Artificial Intelligence), 顺着 AI 发展时间线娓娓道来,中间穿插无数牛人故事,且一波三折大气磅礴,可谓事实比想象更令人惊讶。人工智能始于哲学思辨,中间经历了一个没有心理学(尤其是认知神经科学的)的帮助的阶段,仅通过牛人对人类思维的外在表现的归纳、内省,以及数学工具进行探索,其间最令人激动的是 Herbert Simon (决策理论之父,诺奖,跨领域牛人)写的一个自动证明机,证明了罗素的数学原理中的二十几个定理,其中有一个定理比原书中的还要优雅,Simon 的程序用的是启发式搜索,因为公理系统中的证明可以简化为从条件到结论的树状搜索(但由于组合爆炸,所以必须使用启发式剪枝)。后来 Simon 又写了 GPS (General Problem Solver),据说能解决一些能良好形式化的问题,如汉诺塔。但说到底 Simon 的研究毕竟只触及了人类思维的一个很小很小的方面 Formal Logic,甚至更狭义一点 Deductive Reasoning (即不包含 Inductive Reasoning , Transductive Reasoning (俗称 analogic thinking)。还有诸多比如 Common Sense、Vision、尤其是最为复杂的 Language 、Consciousness 都还谜团未解。还有一个比较有趣的就是有人认为 AI 问题必须要以一个物理的 Body 为支撑,一个能够感受这个世界的物理规则的身体本身就是一个强大的信息来源,基于这个信息来源,人类能够自身与时俱进地总结所谓的 Common-Sense Knowledge (这个就是所谓的 Emboddied Mind 理论。 ),否则像一些老兄直接手动构建 Common-Sense Knowledge Base ,就很傻很天真了,须知人根据感知系统从自然界获取知识是一个动态的自动更新的系统,而手动构建常识库则无异于古老的 Expert System 的做法。当然,以上只总结了很小一部分个人觉得比较有趣或新颖的,每个人看到的有趣的地方不一样,比如里面相当详细地介绍了神经网络理论的兴衰。所以建议你看自己一遍,别忘了里面链接到其他地方的链接。 第二个则是人工智能(Artificial Intelligence)。当然,还有机器学习等等。从这些条目出发能够找到许多非常有用和靠谱的深入参考资料。 然后是一些书籍 书籍: 1. 《Programming Collective Intelligence》,近年出的入门好书,培养兴趣是最重要的一环,一上来看大部头很容易被吓走的:P 2. Peter Norvig 的《AI, Modern Approach 2nd》(无争议的领域经典)。 3. 《The Elements of Statistical Learning》,数学性比较强,可以做参考了。 4. 《Foundations of Statistical Natural Language Processing》,自然语言处理领域公认经典。 5. 《Data Mining, Concepts and Techniques》,华裔科学家写的书,相当深入浅出。 6. 《Managing Gigabytes》,信息检索好书。 7. 《Information Theory:Inference and Learning Algorithms》,参考书吧,比较深。 相关数学基础(参考书,不适合拿来通读): 1. 线性代数:这个参考书就不列了,很多。 2. 矩阵数学:《矩阵分析》,Roger Horn。矩阵分析领域无争议的经典。 3. 概率论与统计:《概率论及其应用》,威廉费勒。也是极牛的书,可数学味道太重,不适合做机器学习的。于是讨论组里的 Du Lei 同学推荐了《All Of Statistics》并说到 机器学习这个方向,统计学也一样非常重要。推荐All of statistics,这是CMU的一本很简洁的教科书,注重概念,简化计算,简化与Machine Learning无关的概念和统计内容,可以说是很好的快速入门材料。 4. 最优化方法:《Nonlinear Programming, 2nd》非线性规划的参考书。《Convex Optimization》凸优化的参考书。此外还有一些书可以参考 wikipedia 上的最优化方法条目。要深入理解机器学习方法的技术细节很多时候(如SVM)需要最优化方法作为铺垫。 推荐几本书: 《Machine Learning, Tom Michell》, 1997. 老书,牛人。现在看来内容并不算深,很多章节有点到为止的感觉,但是很适合新手(当然,不能新到连算法和概率都不知道)入门。比如决策树部分就很精彩,并且这几年没有特别大的进展,所以并不过时。另外,这本书算是对97年前数十年机器学习工作的大综述,参考文献列表极有价值。国内有翻译和影印版,不知道绝版否。 《Modern Information Retrieval, Ricardo Baeza-Yates et al》. 1999 老书,牛人。貌似第一本完整讲述IR的书。可惜IR这些年进展迅猛,这本书略有些过时了。翻翻做参考还是不错的。另外,Ricardo同学现在是Yahoo Research for Europe and Latin Ameria的头头。 《Pattern Classification (2ed)》, Richard O. Duda, Peter E. Hart, David G. Stork 大约也是01年左右的大块头,有影印版,彩色。没读完,但如果想深入学习ML和IR,前三章(介绍,贝叶斯学习,线性分类器)必修。 还有些经典与我只有一面之缘,没有资格评价。另外还有两本小册子,论文集性质的,倒是讲到了了不少前沿和细节,诸如索引如何压缩之类。可惜忘了名字,又被我压在箱底,下次搬家前怕是难见天日了。 (呵呵,想起来一本:《Mining the Web - Discovering Knowledge from Hypertext Data》 ) 说一本名气很大的书:《Data Mining: Practical Machine Learning Tools and Techniques》。Weka 的作者写的。可惜内容一般。理论部分太单薄,而实践部分也很脱离实际。DM的入门书已经不少,这一本应该可以不看了。如果要学习了解 Weka ,看文档就好。第二版已经出了,没读过,不清楚。 信息检索方面,Du Lei 同学再次推荐: 信息检索方面的书现在建议看Stanford的那本《Introduction to Information Retrieval》,这书刚刚正式出版,内容当然up to date。另外信息检索第一大牛Croft老爷也正在写教科书,应该很快就要面世了。据说是非常pratical的一本书。 对信息检索有兴趣的同学,强烈推荐翟成祥博士在北大的暑期学校课程,这里有全slides和阅读材料: http://net.pku.edu.cn/~course/cs410/schedule.html maximzhao 同学推荐了一本机器学习: 加一本书:Bishop, 《Pattern Recognition and Machine Learning》. 没有影印的,但是网上能下到。经典中的经典。Pattern Classification 和这本书是两本必读之书。《Pattern Recognition and Machine Learning》是很新(07年),深入浅出,手不释卷。 最后,关于人工智能方面(特别地,决策与判断),再推荐两本有意思的书, 一本是《Simple Heuristics that Makes Us Smart》 另一本是《Bounded Rationality: The Adaptive Toolbox》 不同于计算机学界所采用的统计机器学习方法,这两本书更多地着眼于人类实际上所采用的认知方式,以下是我在讨论组上写的简介: 这两本都是德国ABC研究小组(一个由计算机科学家、认知科学家、神经科学家、经济学家、数学家、统计学家等组成的跨学科研究团体)集体写的,都是引起领域内广泛关注的书,尤其是前一本,後一本则是对 Herbert Simon (决策科学之父,诺奖获得者)提出的人类理性模型的扩充研究),可以说是把什么是真正的人类智能这个问题提上了台面。核心思想是,我们的大脑根本不能做大量的统计计算,使用fancy的数学手法去解释和预测这个世界,而是通过简单而鲁棒的启发法来面对不确定的世界(比如第一本书中提到的两个后来非常著名的启发法:再认启发法(cognition heuristics)和选择最佳(Take the Best)。当然,这两本书并没有排斥统计方法就是了,数据量大的时候统计优势就出来了,而数据量小的时候统计方法就变得非常糟糕;人类简单的启发法则充分利用生态环境中的规律性(regularities),都做到计算复杂性小且鲁棒。 关于第二本书的简介: 1. 谁是 Herbert Simon 2. 什么是 Bounded Rationality 3. 这本书讲啥的: 我一直觉得人类的决策与判断是一个非常迷人的问题。这本书简单地说可以看作是《决策与判断》的更全面更理论的版本。系统且理论化地介绍人类决策与判断过程中的各种启发式方法(heuristics)及其利弊(为什么他们是最优化方法在信息不足情况下的快捷且鲁棒的逼近,以及为什么在一些情况下会带来糟糕的后果等,比如学过机器学习的都知道朴素贝叶斯方法在许多情况下往往并不比贝叶斯网络效果差,而且还速度快;比如多项式插值的维数越高越容易overfit,而基于低阶多项式的分段样条插值却被证明是一个非常鲁棒的方案)。 在此提一个书中提到的例子,非常有意思:两个团队被派去设计一个能够在场上接住抛过来的棒球的机器人。第一组做了详细的数学分析,建立了一个相当复杂的抛物线近似模型(因为还要考虑空气阻力之类的原因,所以并非严格抛物线),用于计算球的落点,以便正确地接到球。显然这个方案耗资巨大,而且实际运算也需要时间,大家都知道生物的神经网络中生物电流传输只有百米每秒之内,所以 computational complexity 对于生物来说是个宝贵资源,所以这个方案虽然可行,但不够好。第二组则采访了真正的运动员,听取他们总结自己到底是如何接球的感受,然后他们做了这样一个机器人:这个机器人在球抛出的一开始一半路程啥也不做,等到比较近了才开始跑动,并在跑动中一直保持眼睛于球之间的视角不变,后者就保证了机器人的跑动路线一定会和球的轨迹有交点;整个过程中这个机器人只做非常粗糙的轨迹估算。体会一下你接球的时候是不是眼睛一直都盯着球,然后根据视线角度来调整跑动方向?实际上人类就是这么干的,这就是 heuristics 的力量。 相对于偏向于心理学以及科普的《决策与判断》来说,这本书的理论性更强,引用文献也很多而经典,而且与人工智能和机器学习都有交叉,里面也有不少数学内容,全书由十几个章节构成,每个章节都是由不同的作者写的,类似于 paper 一样的,很严谨,也没啥废话,跟《Psychology of Problem Solving》类似。比较适合 geeks 阅读哈。 另外,对理论的技术细节看不下去的也建议看看《决策与判断》这类书(以及像《别做正常的傻瓜》这样的傻瓜科普读本),对自己在生活中做决策有莫大的好处。人类决策与判断中使用了很多的 heuristics ,很不幸的是,其中许多都是在适应几十万年前的社会环境中建立起来的,并不适合于现代社会,所以了解这些思维中的缺点、盲点,对自己成为一个良好的决策者有很大的好处,而且这本身也是一个非常有趣的领域。 统计学习理论与支持向量机 统计学习理论(Statistical Learning Theory,SLT)是一种专门研究有限样本情况下的统计理论 。该理论针对有限样本统计问题建立了一套新的理论体系,在这种体系下的统计推理规则不仅考虑了对渐近性能的要求,而且追求在现有有限信息的条件下得到最优结果。V. Vapnik等人从20世纪70年代开始致力于此方面研究,到20世纪90年代中期,随着其理论的不断发展和成熟,也由于神经网络等方法在理论上缺乏实质性进展,统计学习理论开始受到越来越广泛的重视。统计学习理论是建立在一套较坚实的理论基础之上的,为解决有限样本学习问题提供了一个统一的框架。 同时,在统计学习理论基础上发展了一种新的通用预测方法支持向量机(Support Vector Machines,SVM),已初步表现出很多优于已有方法的性能 ,它能将很多现有方法(比如多项式逼近、径向基函数方法、多层感知器网络)纳入其中,有望帮助解决许多原来难以解决的问题(比如神经网络结构选择问题、局部极值问题等)。SLT和SVM正在成为继神经网络研究之后新的研究热点,并将推动数据挖掘与机器学习理论和技术的重大发展 。 参考文献: 1. V. Vapnik. The nature of statistical learning theory. Springer-Verlag, 1995. 2. V. Vapnik. Statistical learning theory. John Wiley and Sons, Inc., 1998. 3. B. E. Boser, I. Guyon, V. Vapnik. A training algorithm for optimal margin classifiers. In: D. Haussler, Editor, Proceedings of the Fifth Annual ACM Workshop of Computational Learning Theory, 144-152, ACM Press, 1992. 4. C. Cortes, V. Vapnik. Support-vector networks. Machine Learning, 1995, 20, 273-297 5. J. C. Burges. A tutorial on support vector machines for pattern recognition. Data Mining and Knowledge Discovery, 1998, 2(2), 121-167 http://www.support-vector-machines.org/SVM_soft.html SHOGUN - is a new machine learning toolbox with focus on large scale kernel methods and especially on Support Vector Machines (SVM) with focus to bioinformatics. It provides a generic SVM object interfacing to several different SVM implementations. Each of the SVMs can be combined with a variety of the many kernels implemented. It can deal with weighted linear combination of a number of sub-kernels, each of which not necessarily working on the same domain, where an optimal sub-kernel weighting can be learned using Multiple Kernel Learning. Apart from SVM 2-class classification and regression problems, a number of linear methods like Linear Discriminant Analysis (LDA), Linear Programming Machine (LPM), (Kernel) Perceptrons and also algorithms to train hidden markov models are implemented. The input feature-objects can be dense, sparse or strings and of type int/short/double/char and can be converted into different feature types. Chains of preprocessors (e.g. substracting the mean) can be attached to each feature object allowing for on-the-fly pre-processing. SHOGUN comes in different flavours, a stand-a-lone version and also with interfaces to Matlab(tm), R, Octave, Readline and Python. This is the R package.
个人分类: 学习论坛|10080 次阅读|3 个评论
机器学习与人工智能学习资源导引[zz]
timy 2008-9-16 18:00
转载于: http://bbs.byr.edu.cn/wForum/disparticle.php?boardName=PR_AIID=3229pos=12 我经常在 TopLanguage 讨论组上推荐一些书籍,也经常问里面的牛人们搜罗一些有关的资料,人工智能、机器学习、自然语言处理、知识发现(特别地,数据挖掘)、信息检索这些无疑是 CS 领域最好玩的分支了(也是互相紧密联系的),这里将最近有关机器学习和人工智能相关的一些学习资源归一个类: 首先是两个非常棒的 Wikipedia 条目,我也算是 wikipedia 的重度用户了,学习一门东西的时候常常发现是始于 wikipedia 中间经过若干次 google ,然后止于某一本或几本著作。 第一个是人工智能的历史(History of Artificial Intelligence),我在讨论组上写道: 而今天看到的这篇文章是我在 wikipedia 浏览至今觉得最好的。文章名为《人工智能的历史》,顺着 AI 发展时间线娓娓道来,中间穿插无数牛人故事,且一波三折大气磅礴,可谓事实比想象更令人惊讶。人工智能始于哲学思辨,中间经历了一个没有心理学(尤其是认知神经科学的)的帮助的阶段,仅通过牛人对人类思维的外在表现的归纳、内省,以及数学工具进行探索,其间最令人激动的是 Herbert Simon (决策理论之父,诺奖,跨领域牛人)写的一个自动证明机,证明了罗素的数学原理中的二十几个定理,其中有一个定理比原书中的还要优雅,Simon 的程序用的是启发式搜索,因为公理系统中的证明可以简化为从条件到结论的树状搜索(但由于组合爆炸,所以必须使用启发式剪枝)。后来 Simon 又写了 GPS (General Problem Solver),据说能解决一些能良好形式化的问题,如汉诺塔。但说到底 Simon 的研究毕竟只触及了人类思维的一个很小很小的方面 Formal Logic,甚至更狭义一点 Deductive Reasoning (即不包含 Inductive Reasoning , Transductive Reasoning (俗称 analogic thinking)。还有诸多比如 Common Sense、Vision、尤其是最为复杂的 Language 、Consciousness 都还谜团未解。还有一个比较有趣的就是有人认为 AI 问题必须要以一个物理的 Body 为支撑,一个能够感受这个世界的物理规则的身体本身就是一个强大的信息来源,基于这个信息来源,人类能够自身与时俱进地总结所谓的 Common-Sense Knowledge (这个就是所谓的 Emboddied Mind 理论。 ),否则像一些老兄直接手动构建 Common-Sense Knowledge Base ,就很傻很天真了,须知人根据感知系统从自然界获取知识是一个动态的自动更新的系统,而手动构建常识库则无异于古老的 Expert System 的做法。当然,以上只总结了很小一部分我个人觉得比较有趣或新颖的,每个人看到的有趣的地方不一样,比如里面相当详细地介绍了神经网络理论的兴衰。所以我强烈建议你看自己一遍,别忘了里面链接到其他地方的链接。 顺便一说,徐宥同学打算找时间把这个条目翻译出来,这是一个相当长的条目,看不动 E 文的等着看翻译吧:) 第二个则是人工智能(Artificial Intelligence)。当然,还有机器学习等等。从这些条目出发能够找到许多非常有用和靠谱的深入参考资料。 然后是一些书籍 书籍: 1. 《Programming Collective Intelligence》,近年出的入门好书,培养兴趣是最重要的一环,一上来看大部头很容易被吓走的:P 2. Peter Norvig 的《AI, Modern Approach 2nd》(无争议的领域经典)。 3. 《The Elements of Statistical Learning》,数学性比较强,可以做参考了。 4. 《Foundations of Statistical Natural Language Processing》,自然语言处理领域公认经典。 5. 《Data Mining, Concepts and Techniques》,华裔科学家写的书,相当深入浅出。 6. 《Managing Gigabytes》,信息检索好书。 7. 《Information Theory:Inference and Learning Algorithms》,参考书吧,比较深。 相关数学基础(参考书,不适合拿来通读): 1. 线性代数:这个参考书就不列了,很多。 2. 矩阵数学:《矩阵分析》,Roger Horn。矩阵分析领域无争议的经典。 3. 概率论与统计:《概率论及其应用》,威廉费勒。也是极牛的书,可数学味道太重,不适合做机器学习的。于是讨论组里的 Du Lei 同学推荐了《All Of Statistics》并说到 机器学习这个方向,统计学也一样非常重要。推荐All of statistics,这是CMU的一本很简洁的教科书,注重概念,简化计算,简化与Machine Learning无关的概念和统计内容,可以说是很好的快速入门材料。 4. 最优化方法:《Nonlinear Programming, 2nd》非线性规划的参考书。《Convex Optimization》凸优化的参考书。此外还有一些书可以参考 wikipedia 上的最优化方法条目。要深入理解机器学习方法的技术细节很多时候(如SVM)需要最优化方法作为铺垫。 王宁同学推荐了好几本书: 《Machine Learning, Tom Michell》, 1997. 老书,牛人。现在看来内容并不算深,很多章节有点到为止的感觉,但是很适合新手(当然,不能新到连算法和概率都不知道)入门。比如决策树部分就很精彩,并且这几年没有特别大的进展,所以并不过时。另外,这本书算是对97年前数十年机器学习工作的大综述,参考文献列表极有价值。国内有翻译和影印版,不知道绝版否。 《Modern Information Retrieval, Ricardo Baeza-Yates et al》. 1999 老书,牛人。貌似第一本完整讲述IR的书。可惜IR这些年进展迅猛,这本书略有些过时了。翻翻做参考还是不错的。另外,Ricardo同学现在是Yahoo Research for Europe and Latin Ameria的头头。 《Pattern Classification (2ed)》, Richard O. Duda, Peter E. Hart, David G. Stork 大约也是01年左右的大块头,有影印版,彩色。没读完,但如果想深入学习ML和IR,前三章(介绍,贝叶斯学习,线性分类器)必修。 还有些经典与我只有一面之缘,没有资格评价。另外还有两本小册子,论文集性质的,倒是讲到了了不少前沿和细节,诸如索引如何压缩之类。可惜忘了名字,又被我压在箱底,下次搬家前怕是难见天日了。 (呵呵,想起来一本:《Mining the Web - Discovering Knowledge from Hypertext Data》 ) 说一本名气很大的书:《Data Mining: Practical Machine Learning Tools and Techniques》。Weka 的作者写的。可惜内容一般。理论部分太单薄,而实践部分也很脱离实际。DM的入门书已经不少,这一本应该可以不看了。如果要学习了解 Weka ,看文档就好。第二版已经出了,没读过,不清楚。 信息检索方面,Du Lei 同学再次推荐: 信息检索方面的书现在建议看Stanford的那本《Introduction to Information Retrieval》,这书刚刚正式出版,内容当然up to date。另外信息检索第一大牛Croft老爷也正在写教科书,应该很快就要面世了。据说是非常pratical的一本书。 对信息检索有兴趣的同学,强烈推荐翟成祥博士在北大的暑期学校课程,这里有全slides和阅读材料: http://net.pku.edu.cn/~course/cs410/schedule.html maximzhao 同学推荐了一本机器学习: 加一本书:Bishop, 《Pattern Recognition and Machine Learning》. 没有影印的,但是网上能下到。经典中的经典。Pattern Classification 和这本书是两本必读之书。《Pattern Recognition and Machine Learning》是很新(07年),深入浅出,手不释卷。 最后,关于人工智能方面(特别地,决策与判断),再推荐两本有意思的书, 一本是《Simple Heuristics that Makes Us Smart》 另一本是《Bounded Rationality: The Adaptive Toolbox》 不同于计算机学界所采用的统计机器学习方法,这两本书更多地着眼于人类实际上所采用的认知方式,以下是我在讨论组上写的简介: 这两本都是德国ABC研究小组(一个由计算机科学家、认知科学家、神经科学家、经济学家、数学家、统计学家等组成的跨学科研究团体)集体写的,都是引起领域内广泛关注的书,尤其是前一本,後一本则是对 Herbert Simon (决策科学之父,诺奖获得者)提出的人类理性模型的扩充研究),可以说是把什么是真正的人类智能这个问题提上了台面。核心思想是,我们的大脑根本不能做大量的统计计算,使用fancy的数学手法去解释和预测这个世界,而是通过简单而鲁棒的启发法来面对不确定的世界(比如第一本书中提到的两个后来非常著名的启发法:再认启发法(cognition heuristics)和选择最佳(Take the Best)。当然,这两本书并没有排斥统计方法就是了,数据量大的时候统计优势就出来了,而数据量小的时候统计方法就变得非常糟糕;人类简单的启发法则充分利用生态环境中的规律性(regularities),都做到计算复杂性小且鲁棒。 关于第二本书的简介: 1. 谁是 Herbert Simon 2. 什么是 Bounded Rationality 3. 这本书讲啥的: 我一直觉得人类的决策与判断是一个非常迷人的问题。这本书简单地说可以看作是《决策与判断》的更全面更理论的版本。系统且理论化地介绍人类决策与判断过程中的各种启发式方法(heuristics)及其利弊(为什么他们是最优化方法在信息不足情况下的快捷且鲁棒的逼近,以及为什么在一些情况下会带来糟糕的后果等,比如学过机器学习的都知道朴素贝叶斯方法在许多情况下往往并不比贝叶斯网络效果差,而且还速度快;比如多项式插值的维数越高越容易overfit,而基于低阶多项式的分段样条插值却被证明是一个非常鲁棒的方案)。 在此提一个书中提到的例子,非常有意思:两个团队被派去设计一个能够在场上接住抛过来的棒球的机器人。第一组做了详细的数学分析,建立了一个相当复杂的抛物线近似模型(因为还要考虑空气阻力之类的原因,所以并非严格抛物线),用于计算球的落点,以便正确地接到球。显然这个方案耗资巨大,而且实际运算也需要时间,大家都知道生物的神经网络中生物电流传输只有百米每秒之内,所以 computational complexity 对于生物来说是个宝贵资源,所以这个方案虽然可行,但不够好。第二组则采访了真正的运动员,听取他们总结自己到底是如何接球的感受,然后他们做了这样一个机器人:这个机器人在球抛出的一开始一半路程啥也不做,等到比较近了才开始跑动,并在跑动中一直保持眼睛于球之间的视角不变,后者就保证了机器人的跑动路线一定会和球的轨迹有交点;整个过程中这个机器人只做非常粗糙的轨迹估算。体会一下你接球的时候是不是眼睛一直都盯着球,然后根据视线角度来调整跑动方向?实际上人类就是这么干的,这就是 heuristics 的力量。 相对于偏向于心理学以及科普的《决策与判断》来说,这本书的理论性更强,引用文献也很多而经典,而且与人工智能和机器学习都有交叉,里面也有不少数学内容,全书由十几个章节构成,每个章节都是由不同的作者写的,类似于 paper 一样的,很严谨,也没啥废话,跟《Psychology of Problem Solving》类似。比较适合 geeks 阅读哈。 另外,对理论的技术细节看不下去的也建议看看《决策与判断》这类书(以及像《别做正常的傻瓜》这样的傻瓜科普读本),对自己在生活中做决策有莫大的好处。人类决策与判断中使用了很多的 heuristics ,很不幸的是,其中许多都是在适应几十万年前的社会环境中建立起来的,并不适合于现代社会,所以了解这些思维中的缺点、盲点,对自己成为一个良好的决策者有很大的好处,而且这本身也是一个非常有趣的领域。 (完)
个人分类: 自然语言处理|5210 次阅读|1 个评论
机器人技术,全面探索大纲……(内容待丰富)
涂晓帆 2008-8-7 07:58
AI,Robot,我将在这个领域有所探索,一个探索的方案如下: 1、单片机、嵌入式系统一般性研究与实践,暂时确定的顺序ARM、ATmega8、51、80X86、FPGA、PLC相应IC原理分析、晶体管原型 2、无线控制系统、发射与接收系统(相应IC实践),无线传输协议、无线电、红外、蓝牙相应IC原理分析,晶体管原型 3、电机驱动与控制、舵机、步进电机相应电磁系统原型分析、继电器实践、原型分析 4、传感器,温度、超声波、碰撞、压感相应原型分析 5、其它机器传动,液压系统、齿轮系统相应原型分析 6、外壳,塑料成型、雕塑、硅胶成型、金属成型 7、模式识别、图像识别、语音识别影音系统晶体管+电子管实践 8、认知、学习 9、情感
个人分类: 电子技术|4555 次阅读|0 个评论
人工智能不神秘(5)—人工智能的研究途径
热度 1 rqyang 2008-7-23 07:41
人工智能研究的不同途径反映了人工智能研究的观点与方法,它有力地促进人工智能这 门新兴学科的不断发展。 从一般观点来看,人工智能的研究途径有以下三大派。 1 .符号主义( Symbolicism ) 这是以符号处理为核心,以数学逻辑为基础的人工智能主流派,是计算机模拟人类智能的必然产物。它的代表人物是 CMU 的纽厄尔、西蒙及斯坦福研究所的尼尔逊 (Nilsson) 。其指导思想是,人工智能的研究目标既然是实现机器智能,那么计算机本身就具有符号处理的推算能力,因而可以通过符号程序设计来实现某种基于逻辑思维的智能行为,达到模拟人类智能活动的效果,其代表性成果就是前面提及的逻辑理论家和通用求解程序 GPS 。 2. 联结主义( Connectionism ) 联结主义是一种建立在生物神经元基础上的智能模型,认为人的思维基元是神经元,而不是符号处理过程。主张人工智能应着重于结构模拟,即模拟人的神经网络结构,认为功能、结构和智能行为是密切相关的,不同的结构表现出不同的功能和行为。人工神经网络研究的新进展,为联结主义提供了强有力的支持和实现条件。 3. 进化主义( Evolutionism) 它是一种基于生物体行为的智能模型,认为人工智能可以像人类智能一样逐步进化,并认为智能取决于感知和行动,因此也称之为行为主义。他们认为符号主义、联结主义对真实容观事物的描述及智能行为模式过于抽象,因而不能真实反映客观存在的事物,其代表人物麻省理工学院 (MIT) 的布鲁克斯的( R. Brooks ) 的理论核心是用控制取代表示,从而取消概念、模型,并且强调分层结构对智能进化的可能性与必要性。他认为机器的智能应表现在对环境刺激的及时反应上,表现在对环境的适应以及复杂环境中的生存能力,强调智能体应当工作在它的现场中.通过与环境的交互表现并增长它的智能, 布鲁克斯的 的探索性工作代表了人工智能一个新的研究方向现场人工智能( Situated Al )的诞生。 由于布鲁克斯的人工智能观点与传统的人工智能看法完全不同,因此有人把目前人工智能的研究方向分为传统人工智能与现场人工智能两大方向。 以卡内基 - 梅隆大学( CMU )为代表的传统人工智能观点认为,智能是表现在对环境的深刻理解以及深思熟虑的推理决策上,因此智能系统需要有强有力的传感和计算设备来支持复杂的环境建模和寻找正确答案的决策方案。他们采用的是: 环境建模规划控制 的所谓的纵向体系结构。 现场人工智能强调的是智能体与环境的交互.为了实现这种交互,智能体一方面要从环境获取信息,另一方面要通过自己的动作对环境施加影响。显然,这种影响行为并不是深思熟虑的,而是一种反射行为。他们采用的是: 感知动作 的横向体系结构。 他们研制的一批小型的移动机器人与 CMU 研制的大型移动机器人形成了强烈的反差。 CMU 一方使用的是大卡车,上面装有高速计算机、激光雷达、彩色摄像机和全球卫星定位系统 GPS 等一批大型设备(这是我当时在的情况); 而 MIT 一方则用的是玩具车,上面装的是单板机、红外传感器及接触开关等小器件。 一方说,你那只是一种小玩具,仅作表演而已,最多也只能创造出智能昆虫行为,而无法创造人的智能行为; 另一方说,你的机器人固然很大,但离实用更远.不过是大玩具而已。 应该说, MIT 用比 CMU 简单得多的设备却做出了与其相当的移动机器人,这一点就比 CMU 高明。更何况这些聪明的机器虫已为布鲁克斯的公司带来了可观的利润。 CMU 的 T. Kanade 等人也不是等闲之辈。 1995 年 6 月至 7 月间,他们推出了一项极为成功的实验,他们研制的一辆无人驾驶视觉导航小汽车,从匹兹堡校园开始,日夜兼程,风雨无阻,行程 2949 英里,成功地自动横穿全美国。沿着高速公路到达了目的地洛杉矶,轰动了关国。虽然,高速公路的条件比较有利,而且实际驾驶中有 1.8% 的里程由人进行了干预,但人工智能的学者和美国汽车公司的老板们对此仍给予了很高的评价,连同多年前他们那个火山探险的六足机器人,谁也不能否认他们在人工智能,特别在综合集成方面作出的骄人业绩。 应该说,现场人工智能的出现,不能说是对传统人工智能的否定,而应该看作是对传统人工智能的补充与发展。当下一个布鲁克斯出现的时候,布鲁克斯的现场人工智能可能也纳人了传统人工智能的范畴,而一个新的方向又在努力推动人工智能的发展。 ------------------------------------------------- CMU 的 T. Kanade 教授外传 文 / 青水洋 T. Kanade 教授, 1974 年在日本京都大学获博士学位。 1992-2001 年任美国卡内基 - 梅隆大学机器人研究所所长。美国国家工程院和美国艺术与科学院院士。 1983 年我到 CMU 时他是机器人研究所计算机视觉实验室主任,与我办公室相邻。他个儿不高,略胖,典型的日本人身材。当时他显得很年轻。我问秘书:这位博士生是日本人吧?秘书答:是日本人,但他不是学生,是著名教授。 后来他经常到我办公室来学中文,他只能说简单的中国话,但他汉字写得很好,一次他在我办公室黑板上写了一首唐诗,我自叹不如。 他学习中文的劲头使我感动。一次我们在厕所相见,他拉住我就问:我是中国人与我是一个中国人有什么差别? 他这个低级的问题把我问蒙了。现在也想不起我当时是怎么回答他的,反正他听了我的解释不是很满意。 他几次说到中国一定要找我,但至今一次也没有,大概早把我这个中国人忘了。
个人分类: 日记随想|8989 次阅读|5 个评论
人工智能不神秘(4)————揭开神秘的面纱
rqyang 2008-7-18 09:13
人工智能的起源与发展 ( 2 ) 人工智能的科学家们开始对过去的战略思想和主要技术进行总结和反思,费根鲍姆关于以知识为中心开展人工智能研究的观点为大多数人所接受,研究人员基本达成了共识.即人工智能系统是一个知识处理系统。而知识表示、知识利用和知识获取则是人工智能系统的三个基本问题。从此,人工智能研究又迎来了一个以知识为中心的蓬勃发展的新时期。 随着 DENDRAL 专家系统的成功,一大批专家系统从各个领域各个方面涌现出来,从医学、数学、生物工程到地质探矿、气象预报、地震分析、过程控制、系统设计、工程测试与分析以及情报处理、法律咨询和军事决策,一个个成功的系统都带来厂巨大的经济效益和社会效益,令世人刮目相看。 同时,由于对知识的表示、利用、获取等方面的研究取得较大进展,特别是对不确定性知识的表示与推理取得了突破,建立了诸如主观 Bayes 理论、确定性理论、证据理论、可能性理论等一系列新理沦,这为模式识别、自然语言理解等其它领域的发展奠定了基础,解决了许多理论和技术上的问题。人工智能又向人们展示了广阔的应用前景,社会上对人工智能的兴趣开始与日俱增。此时,人工智能研究经费充足,经营人工智能产品的公司纷纷成立,人工智能的研究队伍也迅速扩大。比如 1987 年在意大利召开的第十届国际人工智能会议,与会人数竟超过了 5000 人,在一片乐观情绪的影响下,欧、美、日本等国都先后制订了一批有关人工智能的大型项目,都争相在人工智能方面取得更为突破性的进展。其中,美国的 ALV (Automontous Land Vehicle )和日本的第五代计算机就是其中最典型的代表。 但是好景不长,这些计划到 80 年代中期,大多遇到了技术困难,而这些技术问题的难度之大是当时人工智能技术所不能解决的。正如张钹院士在《近十年人工智能进展》一文中指出的那样,有两个根本性的问题,一是所谓的交互 (interaction) 问题,即传统方法只能模拟人类深思熟虑的行为,而不包括人与环境的交互行为。美国的 ALV 计划试图建造一种能在越野环境下自主行驶的车辆,这种车辆必须具备与环境交互的能力,以适应环境的不确定性和动态变化。根据传统人工智能的方法建立的系统,基本上不具备这种能力,这就是 ALV 计划遇阻的根本原因。 另一个问题是所谓扩展( scaling up )问题,即传统人工智能方法只能适合于建立领域狭窄的专家系统,不能把这种方法简单地推广到规模更大、领域更宽的复杂系统中去。日本 第五代计算机计划的中止原因也在于此。 由于这两个基本问题的存在,使人工智能研究又进人了低谷,人工智能又一次陷人了信任危机。 顽强的人工智能学者们在低谷中又一次反思,更全面地检查了 30 年来在目标、内容和方法上存在的问题,各抒己见,百家争鸣,在未来探索的道路上又迈开了大步。 80 年代中期到 90 年代初麻省理工学院的布鲁克斯的( R. Brooks )以其进化理论提出了 没有表达的智能和没有推理的智能,从而成为行为主义学派的代表。他们认为智能取决于感知和行动,他们研制成功的机器虫应付复杂环境的能力超过了当时现有的许多机器人,成为解决所谓交互问题的重要希望,而反馈机制的引进和神经网络的重新崛起.也为解决交互问题提供了重要方法。 90 年代人工智能学者提出的综合集成 (metasynthesis) 和智能体 (agent) 概念为解决所谓扩展问题开辟了新的道路。以钱学森、戴汝为院士为代表的我国学者,从社会经济学系统、人体系统等复杂系统中提炼出开放复杂巨型智能系统的概念,并提出从定性到定量的综合集成方法.引起了国际学者的广泛关注,中国科学家正在为人工智能的发展作出应有的贡献。 不管人工智能的发展处于低谷还是高潮,它始终是以极大的冲劲螺旋式上升.短短几十年取得的成绩已经向世人展示了其极具光明的前景,一场以脑为中心的科技革命智能革命已悄悄兴起,人类文明将进人更加辉煌的时代。
个人分类: 日记随想|6783 次阅读|5 个评论
人工智能不神秘(3)——揭开神秘的面纱
rqyang 2008-7-12 08:51
人工智能的起源与发展 (1) 自 1956 年人工智能作为一门新兴学科正式提出以来,经历了起伏的发展过程,简单地可以分为以下几个阶段: 1. 1956 年前的孕育期 ( 1) 从公元前伟大的哲学家亚里斯多德 (Aristotle) 到 16 世纪英国哲学家培根 (F. Bacon) , 他们提出的形式逻辑的三段论、归纳法以及知识就是力量的警句,都对人类思维过程的研究产生了重要影响。 (2) 17 世纪德国数学家莱布尼兹 (G..Lei bniz) 提出了万能符号和推理计算思想,为数理逻 辑的产生和发展奠定了基础,播下了现代机器思维设计思想的种子。而 19 世纪的英国逻辑学家布尔( G. Boole )创立的布尔代数,实现了用符号语言描述人类思维活动的基本推理法则。 (3) 20 世纪 30 年代迅速发展的数学逻辑和关于计算的新思想,使人们在计算机出现之 前,就建立了计算与智能关系的概念。被誉为人工智能之父的英国天才的数学家图灵( A. Tur- ing )在 1936 年提出了一种理想计算机的数学模型,即图灵机之后 ,1946 年就由美国数学家莫克利( J. Mauchly )和埃柯特( J. Echert )研制出了世界上第一台数字计算机,它为人工智能的研究奠定了不可缺少的物质基础。 1950 年图灵又发表了计算机与智能的论文,提出了著名的图灵测试,形象地指出什么是人工智能以及机器具有智能的标准,对人工智能的发展产生了极其深远的影响。 (4) 1934 年美国神经生理学家麦克洛奇 (W. McCulloch) 和匹兹 (W. Pitts ) 建立了第一个神经网络模型,为以后的人工神经网络研究奠定了基础。 2. 1956 年至 1969 年的诞生发育期 ( 1 ) 1956 年夏季,麻省理工学院( MIT) 的麦卡锡( J . McCarthy )、明斯基( M. Minshy )、塞尔夫里奇( O. Selfridge) 与索罗门夫 (R. Solomonff) 、 IBM 的洛切斯特 (N. Lochester )、莫尔 (T. More) 与塞缪尔 (A. Samuel) 、贝尔实验室的香农( C. Shannon )、卡内基一梅隆大学 (CMU) 的纽厄尔( A. Newell )与西蒙( H. Simon )等 10 人在美国的达特茅斯大学( Dartmouth) 举办了一个长达两个月的关于机器智能的研讨会(两个月啊,他们真能静得下来!),会上统一使用了人工智能 (Artificial Intelligence) 这一术语,用它来代表有关机器智能这一研究方向,这标志了人工智能学科的正式诞生。 (2 〕 1956 年至 1969 年间,塞缪尔研制了能自学习的跳棋程序. 1959 年它击败了塞缪尔本人, 1969 年又击败了一个州的冠军。 (3) 1956 年至 1965 年间,纽厄尔和西蒙研制的逻辑理论家的程序,证明了数学原理中的 38 个定理; 1958 年美籍华人数理学家王浩在计算机上仅用 5 分钟就证明了数学原理中的有关命题演算的全部 220 条定理; 1960 年纽厄尔和西蒙在心理学实验的基础上研制成了一种不依赖具体领域的通用问题求解程序 GPS(General Problem Solver) ,可以求解 11 种不同类型的问题; 1965 年鲁滨逊 (J . Robi nson ) 提出了消解原理,为定理的机器证明作出了突破性的贡献。 (4) 1956 年至 1968 年间,斯坦福大学的费根鲍姆 (G . Feigenbaum ) 教授首先开展了专家 系统的研究,他们研究成功的 DENDRAL 专家系统能根据质谱仪的实验,通过分析推理决定化合物的分子结构,其能力相当于化学专家的水平。 (5 ) 1969 年国际人工智能联合会议( international Conferences On Artificial Intelligence) 成立,它标志着人工智能这门新兴学科得到了世界范围的公认。 3. 1970 年以后的起伏发展期 20 世纪 70 年代,人工智能进人发展期,许多国家都相继开展了这门新兴学科的研究工 作。 60 年代一连串的胜利,使人工智能的学者们兴高采烈,也使公众对人工智能提出了更高的期望,但是事情发展远非如此。塞缪尔的下棋程序当了州级冠军之后,与世界冠军对弈时就从没有赢过。最有希望出实质性成果的自然语言翻译也问题不断,人们原以为只要用一部双向字典和一些语法知识就可能解决自然语言的互泽间题,结果发现机器翻译闹出了不少笑话。 例如: 把 Time flies like an arrow (光阴似箭)译成了苍蝇喜欢箭; 把 Out of sight , out of mind ( 眼不见.心不烦)翻成了又瞎又疯; 把 The spirit is willing , but the flesh is weak (心有余而力不足)变成了酒是好的,但肉变坏了等等。 以至于有人挖苦说,美国花了 2000 万美元为机器翻译建立了一块墓碑。被公认为有重大突破的消解法,也因其局限性不能适应现实世界诸多问题,在神经网络、机器学习研究方面也遇到了种种困难。舆论的谴责,经费的缺乏,使人工智能研究一时陷入了困境。 (待续) -------------------------------------------------------------- 人物介绍: 人工智能的创始人之一西蒙( Herbert Simon ) 这位犹太人最大的贡献还不限于人工智能。他在 1958 年获得了心理学领域最高奖心理学的杰出贡献奖; 1975 年获得计算机领域最高奖图灵奖。最令人称奇的是 1978 年他获得诺贝尔经济学奖,成了世界上第一位荣获诺贝尔经济学奖的心理学家。 1986 年他还获得美国总统科学奖科学管理的特别奖。这真是当代少有的高深莫测的博学杂家。 西蒙在自传《我的生活模型》一书中这样描写他自己: 我是一个科学家,而且是许多学科的科学家。我曾经在许多科学迷宫中探索,但这些迷宫并未连成一体。我扮演了许多不同角色,角色之间有时难免互相借用。但我对我所扮演的每一种角色都是尽了力的,从而是有信誉的,这也就足够了。 1972 年 7 月西蒙随美国计算机科学家代表团第一次来到中国,之后又 9 次来华访问。他是中美科技协会美方主席(当时中方主席是周培源)。 1994 年他成为中国科学院首批外籍院士,为表达对中国的感情,他给自己起了个中文名字司马贺。 2001 年 2 月在一次不很复杂的手术后西蒙去世,享年 85 岁。 西蒙虽然荣获了象诺贝尔、图灵等世界顶尖大奖,但他非常平易近人,与普通人没有两样,我们经常可以在走廊里和电梯里遇见他。他见我们是中国人,显得格外热情。 沈为民 结婚时,他带着夫人来作证婚人。他没有其它冠冕堂皇的行政职位,只有一个职位:卡内基-梅隆大学的 终身 教授。 摘自青水洋博客《 有朋友自远方来,不亦乐乎 》
个人分类: 日记随想|7699 次阅读|5 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-20 04:57

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部