哲学驿站分享 http://blog.sciencenet.cn/u/老李 一个行走者的思想历程

博文

盲人如何“看”路?——从知觉缺失情况看认知问题

已有 10369 次阅读 2009-10-5 18:29 |个人分类:生活点滴|系统分类:生活其它|关键词:学者

博主按:这篇文章发表在即将出版的《科学技术哲学研究》2009(5),这是三稿的原稿吧,现在也记不清了,思路形成于2006年下半年,主要工作完成于2007年,2008年4月定稿,耗时接近两年,文字太多后发表很困难,目前手里还有一个稿件也是耗时接近两年搞成的东西,也是太长,没有办法,过些日子只好拦腰截断,以后不准备再写这样耗时的文字了,现在也越发理解了有人把一篇文章拆成几个的原因了,除了个别人自己的原因外,可能还有出版要求的强烈影响,而且这种模式很冒险,一旦发不出来,有可能几年时间就做了无用功,也不划算,所以以后要写就写超短的论文,那样估计会好受一些。大过节的贴这样的文字,有些不合时宜,不过也想说明一下,我们也不全是不务正业,已经有很多朋友告诉我该做点正事了,有道理,借此提醒一下自己。

盲人如何“看”路?

                               ——从知觉缺失情况看认知问题

(上海交通大学 科学史与科学哲学系 上海 200240

摘要: 通过对盲人看路现象的分析,揭示了在知觉缺失状态下人类认知中的领域特殊性问题,并根据福多的心理模块理论探讨了心理表征形成的条件与限制。根据对“图林测试”与“汉语屋”实验的再思考,分析了心理内容的表征问题以及句法与语义之间的结合问题,进而探讨了心理计算理论的结构问题,在此基础上详细剖析了概念性经验与非概念性经验的表征特点,并分析了思想语言假设在解释心理表征中存在的问题。

关键词:知觉缺失,认知,领域特殊性,概念性经验。

中图分类号:B15      文献标识码:A

当代人工智能研究以及认识论研究大多是基于对正常人的正常知觉状态下的认知研究。然而,由于人类大脑工作机制的极度复杂性,使得我们对人脑内部的工作机理始终无法获得准确的把握。如何突破这种黑箱陷阱呢?一般说来,当一个正常人的知觉器官都处于完好运转状态的时候,我们无法从整体的输入—输出中,准确地区分出哪个功能是哪个部位发出的,如果通过观察一个患有知觉缺失症病人的输入、输出状态,与正常人的输入、输出进行比较,则能够极大地帮助我们进行这种区分与探究。为此,本文试图通过对盲人看路过程的分析,阐述如下三个问题:首先,人类的认识是领域特殊与领域一般的联合作用;其次,“图林测试”与“汉语屋”的矛盾揭示出认知表征过程中的思想语言的句法结构依赖问题;第三,人工智能在建构人类认知的解释模式中存在的缺陷。

心理模块、领域特殊性与转换器的功能主义解释

在日常生活中,我们常常能够看到盲人用木棍探路的情况,盲人通过木棍的探测,把路面的信息通过手的感觉传达到大脑,进而做出下一步行走路线的推理与判断,一般来说,这个行动过程与正常人相比慢了许多。另外,我们还知道,通常情况下盲人的听觉特别灵敏,因此在行走过程中,他时刻在用敏锐的耳朵接收道路周围传来的听觉信息,以此来辅助手杖的探路行为。在这个过程中,盲人的看路行为得到了相关感觉器官的支援。现在的问题是,在这种探测的过程中,在盲人的脑中发生了什么?关于这个过程有很多不同的理论解释,相比较而言,笔者更愿意借用福多的心理模块理论来对这个过程进行解释与分析。

1983年美国哲学家福多(J.Fodor)提出了心理模块理论,他认为人类心理过程按照功能可以分三类,分别是传感器、输入系统和中枢系统,输入信息流会依次接触到这些机制。而输入系统的功能就是“让信息进入到中枢加工器;输入系统通过对心理表征的编码来为中枢机制提供操作范围,它们是传感器的输出与中枢认知机制之间的中介。”[1]输入系统就是一种模块。对于这种模块的特性,福多提出了它的七大特性,本文更感兴趣的特性只有两个:输入系统的范围特异性和输入加工的信息封装特性,这两种特性能够很好地说明知觉缺失状态下的认知过程。输入系统的范围特异性,把先天论的观点重新带回到认识论和认知的研究中。福多的证据是哈斯金斯的影响语音分析的知觉系统具有范围特异性。其实,我们可以随意举出很多常见的例子,比如人类的耳朵只对声音刺激发生作用,而对色彩不发生作用。换言之, “特殊的系统完成特殊的任务。最明显的情境是当你有一个计算怪异范围的机制,并且通过独立原则将其模块化了;范围的怪异性使加工的模块合理化,而加工的模块性朝着如何解释怪异范围的高效计算迈进了一步。”[2]其实,模块的范围特异性很好理解,比如各种白痴天才,他们有一些输入模块出现了问题,而另一些模块异常发达,如在音乐方面、美术方面等,正是这些特别发达的模块造就了各类怪异的天才。另外,神经生理学家、心理学家、医生等都在各自领域发现了领域特殊性问题。最近,英国埃默.福德等人把有关这一主题的近期研究论文汇编为一本书:《脑与心智的范畴特异性》(2002年,英文版),在这部书中,通过对一些特殊病人的研究雄辩地揭示了领域特殊性的存在,并探讨了各种相关的理论和模型。他们的总的观点是:“领域特殊性理论取向假定,认知不是被一套能够处理任何认知问题的通用计算机制所调控;相反,心理是由一组专门化的加工系统所构成,每个加工系统都适用于分析某种特定类型的信息。”[3]而且这种领域特殊性是先天的,是人类在漫长进化过程中形成的。联想到语言学家乔姆斯基1965年提出的语言能力/语言表现的区分,已经在认识论中重新复活了一种先天论的观点。现在越来越多的证据表明人是有先天能力的,这从心理学家卡米洛夫-史密斯的研究中也已经得到证明。福多理论存在的问题是,如果各个特殊模块都是范围完全特异的,那么,模块之间进行交流与补偿的可能性也就不复存在了,所有输入模块都成了相互毫无联系的认知孤岛,而这种推论结果与对人类发生的实际行为的观察结果不符。至少在盲人探路的过程中我们发现一些原本各司其职的输入模块之间的相互支援意识。

结合盲人探路的案例,我们可以合理地追问,如果人类认识中存在范围特异的模块,而且相互之间是封闭的,那么对于盲人来说,看路还如何可能?在这里我们需要对盲人进行一些简单的分类:第一类生来就是盲人;第二类,由于后天原因导致失明。对于第一类盲人来说,他的视觉输入系统在出生时就出现了故障,从来就不曾正常工作过,按照福多的心理模块理论,这个盲人将永远无法“看”到路,因为没有相应的“语义记忆”的存储。而且由于各个输入系统各司其职,盲人“看”路将成为不可能的行为。然而实际的情况并不是这样,盲人通过其他心理模块的替代性工作,比如触觉与听觉的协作完成了“看”路的过程,并且在这个过程中,盲人的触觉与听觉在“看”路的过程中两种输入模块的功能还得到了一定程度的加强。对于第二类盲人,由于曾经有过真正“看”的经历,所以即使是在视觉输入模块出现故障的情况下,他依据残存的记忆(语义记忆),并通过其他感觉模块的帮助,依然可以完成对路的“看”的行为。两类盲人所不同的是:先天盲人的“看”没有背景知识的渗透,而对于后天致盲的人来说,他的视觉模块虽然无法工作了,然而,在出现故障的模块内部仍然留有先前看的经验,通过其他感觉器官的协同,他“看”到了路,并且能够想象其间的差别,对于先天盲人来说这是不可能的。目前,神经心理学关于范畴特异性的标准解释是“感觉/功能”理论,在这种理论看来,范畴特异性缺失的发生是因为不同范畴的物体需要不同类型的信息。感觉信息在区分生物时起主要作用而功能信息在区分非生物中起主要作用。对于盲人来说,这两种信息的获得都处于不完善状态,尤其是视觉感觉信息更是完全缺失,因此盲人的表征过程与语义获得过程就更加困难。

就视觉而言,福多认为它的输入系统可能包括:“颜色知觉机制、形状分析机制以及对三维空间关系进行分析的机制。它也可能还包括与视觉对身体运动的引导或者识别同类的面孔有关的、非常精细的,而且具有任务特异性的高级系统。”[4]现在的问题是,通过对知觉缺失症患者的观察,已经能够证明模块并不像福多所说的是完全范围特异的、独立的结构,而是存在着模块之间的一定程度的功能补偿作用。但是这种补偿的功能是有限的,换言之,假定福多关于视觉模块构成的分析是正确的,那么,由于知觉的缺失,有些功能也是无法完全补偿的。如先天盲人,无论怎样努力也无法形成关于颜色的知觉,不过,他可以通过触觉来感知外界物体的形状,能够对部分物体的三维空间形式尝试着进行分析与建构,但不能保证准确地确定三维空间形象,盲人摸象的故事也能间接证明这种三维空间形象的判断补偿程度。另外,需要补充的是,由于视觉知觉的缺失,盲人无法形成有效的深度知觉,深度知觉的一个重要的功能就是借助于它,我们能够对距离进行判断与计算,比如根据迎面开来的汽车的距离以及速度来判断我们是否可以安全通过马路,没有这种知觉,就无法形成相关的判断与计算。目前心理学的实验已经充分证明这点,如Farah的实验揭示出:“由于皮层损伤而造成的视觉功能缺陷会导致相应的意象功能缺陷,颜色知觉的丧失将会导致颜色意象的丧失,明显丧失颜色知觉的病人在被要求想象颜色的实验中同样表现糟糕。”[5]

现代的人工智能研究与认知心理学通常把人类大脑内部的信息加工过程理解为一种计算过程,在这种计算框架预设下,我们来看一下视觉信息加工的路径。最近的心理学研究表明:“视觉信息加工的腹侧化通路由V1-V2-V3-V4-下颞叶逐级传递和加工视觉对象的精细结构分析(识别)。与此并行的视知觉信息加工的背侧通路由V1-V2-V3-V5下顶叶皮层组成,完成空间定位和物体运动知觉功能。”[6] 在这个视知觉运行实验研究基础上,我们再来从模块角度来思考视觉加工过程。福多并没有对模块的信息加工过程进行过多的阐释,那么我们可以把模块的信息加工过程分为如下四个步骤:感觉编码、觉醒激活、门控作用和感觉记忆,这里需要解释的是门控作用,从理论上讲,感觉意识和感觉门控之间有密切的交互作用:“一方面,门控过程通过控制、选择和强化某些感觉信息来调节感觉意识的正常操作及其编码的绩效,而另一方面门控过程的启动、分配与转移也受到感觉意识编码的直接影响。”[7] 从这个流程来看,模块在感觉意识形成过程中的作用就是,对特定输入信息进行初步编码,过滤掉干扰信息。这些经过挑选的信息被编码形成经验,而经验都具有概念性能力,只有形成概念,把信息符号化才是可能的,进而中枢系统的计算加工才能得以完成,这些能力通过表征反映出来。对于盲人来说,由于视觉模块的故障,无法形成有效的编码、激活、门控和感觉记忆,因此,每次“看”路对于盲人来说都是全新的过程,他缺乏能转变为概念化的经验的感觉构件,这样一来,在模块内部发生的表征与推理都存在问题,换言之与视觉经验有关的计算过程无法有效形成以及贯通。现在的问题是,模块在福多那里仿佛只是一种功能装置,至于它如何发挥作用的,福多并没有给出有力的说明。相反,同期的加拿大认知科学家派利夏恩对此进行了有益的探索,他提出了转换器的概念,通过对转换器概念提出各种约定,在此基础上解决了概念表征的前期准备工作。现在的问题是对转换器概念需要进行一些梳理。

派利夏恩对转换器的描述主要是基于功能层面的,它在大脑中的具体存在形态,派利夏恩并没有给予具体的描述,在此笔者愿意相信在本体的层面,转换器和福多的模块是相同的,这也是未来神经生理学的研究任务,本文不过多纠缠于这方面。从功能角度来说,在派利夏恩看来:“一个典型的转换器的功能只是以某种一致的方式将物理的事件从一种形式转换或映满另一种形式。……通过将环境的物理状态的某些类映满一个与计算有关的装置,该转换器完成了一个相当特殊的转化:将与计算有关的任意物理事件转换为计算事件。”[8] 实质就在于把某些非符号的物理事件转变为某些符号系统的操作。其实,这是通过把人脑与计算机的计算功能进行类比的一种强等价的做法。关于强等价的做法总是存在一种超外延的可能性,这有些类似于归纳法面临的情况。在此基础上存在两个很大的疑问:首先,人脑与计算机的强等价是否是外延相同的?其次,是否存在一些无法转换的物理事件?在回答这两个问题之前还是要把派利夏恩关于转换器的一些约束条件进行一些必要的梳理。在他看来,转换器要满足如下三个条件:1转换器执行的功能是原始的,并且其本身是非符号的;2转换器是独立于认知系统运行的一个受刺激约束的部件;3转换器的行为被描述为从物理事件到符号的函数。在次基础上,转换器具有如下几个特点:首先,转换器功能是非符号的,这个特点决定了它在认知形成过程中所处的原始位置,在转换为符号之前,它自身是非符号的,体现了功能建构的主张。其次,转换器的输入必须在物理学语言中表述。这个强制性约束保证了对人类认知的强自然化路径,它的基础是人与世界之间发生的现象都是可以用物理语言或其它自然科学语言来表达的,如果不能用物理学语言表达只有一种情况,即这门学科发展还不完善。之所以这样要求,在派利夏恩看来是因为:“如果我们不认同这一标准,那么我们不大有希望系统地将行为与物理世界的性质联系起来。”[9] 至此,我们了解了转换器在认知过程中发挥作用的解释模式:从物理事件到符号的一个功能。之所以强调转换器对物理语言的依赖,是由于目前物理学提供了描述物理世界的最普遍和最成功的概念,在这个基础上表征才是可能的。问题是,有没有物理语言无法描述的认知事件?如果有,派利夏恩的观点就是存在缺陷的。回到本文盲人看路的话题,通过福多的模块理论我们能够初步确定视觉认知模块具有领域特殊性,而借用转换器假设,我们可以推测,由于视觉刺激的复杂性,转换器可以转换的只能是那些可以用物理语言描述的性质,如物体的长、宽、高等,物理语言描述得越简单,这些性质就越容易被转化为数字符号,我们称这类指标的转化率高,反之,越不容易用物理语言描述的性质,刺激的转化率就比较低,如颜色等,这点很容易在日常生活中见到,如一个有经验的油漆工人可以分辨出几十种红色之间的细微差别,而普通人对红色的描述要模糊得多,这是因为当我们把颜色转换成光波的频率时,频率之间的差别感觉器官很难区别。对于盲人来说,由于模块本身出了问题,相应的转换器功能就无法正常工作,因此,具体视觉的刺激的转换无法有效形成,只有通过其他感觉器官的补偿性替代来完成对路面的转化。由此看来,模块与转化器是同一器官的两个功能侧面。至于前面第一个问题,本文认为计算机与人脑的强等价假设是一种超外延假设,不过,这种超外延对于理解人类的认知还是有启发意义的。现在的问题是被转化的符号如何获得意义,如果无法形成心理表征的意义,那么盲人看路过程就是失败的。

知觉缺失与表征问题

目前关于人类认识达成的一个普遍共识是:从感觉器官传来的信息输入到大脑中枢神经系统并在那里进行整体加工,然后把结果再通过神经系统输出,借此我们完成了初步的认识活动,并在此基础上形成判断与推理。我们暂且认为这种共识是正确的,那么对于知觉缺失患者来说,形成关于外界事物的有效认识就存在一个障碍:即那些缺失的感觉信息如何被表征?基于上面的分析,这里要先排除两种错误的观点:其一,即便患有知觉缺失症,我们通过其他感觉器官获得的信息的补偿功能也能进行完全的表征;其二,如果患有知觉缺失症,则我们永远无法形成相关事物的表征。笔者认为,第一种认识完全否认了我们上面提到的各种感觉器官的领域特殊性问题,如果是这样,大脑内也就不需要各种功能分区,所有的输入系统之间可以完全替代,目前已有的案例已经否定了这种观点。第二种情况虽然强调了各类感觉输入系统的领域特殊性,但是完全割裂了各个感觉输入系统之间的“支援意识”和感觉基质的借用现象。目前已有病例报告证明,部分无法正常工作的输入系统的功能基质被其它输入系统借用的现象,如盲人的听觉系统比较发达就包含这种部分功能基质借用的情况,因此在探索人类认知现象时这两种错误认识要被排除掉。笔者认为,患有知觉缺失症的人,只能部分地表征外界的信息,这是由于模块功能之间的补偿效应的结果。为了更深入地讨论这个问题,首先需要弄清楚什么是表征?根据M.W.艾森克等人的观点,所谓的表征是指:“在实物不在的情况下重新指代这一实物的任何符号或符号集。心理表征处理所储存知识的内容和形式。”[10] 就我们的刺激来源来说,表征可以分为外部表征和内在心理表征,两者有着很多不同。本文只谈外部表征的问题。现在的问题是,如果感觉器官把来自外界的刺激在神经系统转化成一种表征,以此来形成对外界刺激的认识,那么表征的作用有哪些呢?毕竟上面关于表征概念的论述还是有些模糊。对此,分析表征可能具有的功能就是理解表征的重要途径。据莫顿.韦格曼的梳理,表征一般来说具有如下五个功能:“第一,表征从根本上说是一种替代物,一种关于事物本身的代表;第二,它是一组本体论承诺,即我们用什么术语思维世界;第三,它是一种关于由下述三种成分表达的理智推论的零碎的理论:(1)关于理智推理的表征的基本概念,(2)表征所支持的推理集合,(3)表征所推荐的推理集合;第四,它是有实用效果的计算媒介,即是说思维得以完成的计算环境;第五,它是人类表达的媒介。”[11] 韦格曼对表征的五个功能的分析,已经比较全面,本文不再再拓展表征的作用范围。对于本文来说,只需要表征的替代功能、计算功能与人类的表达功能足矣。这样一来,我们就可以把人类认识的内在形成过程的流程揭示出来:各种感觉器官接受外来刺激,通过神经输入系统的分类加工(表征或语义)输送到中枢神经系统,经过中枢神经系统的综合加工,然后输出,形成我们关于事物的认识与行动的推理与判断。基于福多的模块理论,则输入系统就是一种模块,那么可以推测,来自外界的刺激是在模块内部被表征的,这些经过初级表征的刺激被输入到中枢神经系统,在那里进行编码加工,然后输出。我们假定这个流程是正确的,那么现在出现了三个推论:(1)在模块内部,表征是一个信息逐渐过滤的过程;(2)在知觉缺失的情况下,其他模块的补偿功能得到加强;(3)模块中的心理表征涉及语形与语义两种功能的初步结合。现在我们考察一下,来自感觉器官的刺激在模块内部表征的程序问题,换言之,不是任何感觉刺激在模块内部都能够被表征,能够被表征的信息是有限的。心理学家卡米洛夫-史密斯就表征问题提出了表征重述理论RRrepresentational redescription),她的研究显示:“表征重述是心理中的内隐信息以后变成心理的外显知识的过程。这个过程先是在一个领域之内,然后有时在几个领域之间。我假定表征重述过程是作为形成领域内和领域间关系的内部驱力的一部分而自发地发生的。”[12] 在这个原则下,史密斯认为知识的表征和再表征至少有四个水平:内隐(I)、外显1E1)、外显2E2)和外显3E3)。水平I表征中的信息是分类的,因此还不能形成领域内和领域间的联系。包含在水平I表征中的信息因此不能为认知系统中的其他算子所利用。其实,这个特点我们每个人在日常生活中都曾经经历过,各种特殊的刺激都是在第一时间被传导到相应的输入模块内,如香味被传导到嗅觉模块,声音刺激被传导到听觉模块,视觉刺激被传导视觉模块等。但是,这些信息都是低水平信息,等待被加工,这个最初的部分,我们通常意识不到,只能通过反省来追踪这些痕迹。到水平E1阶段,知识的外显特征才开始显现,E1表征是减缩的描述,这个过程很好理解:从水平IE1,许多生动的细节信息被过滤掉了,史密斯的RR模型的精彩之处在于它指出:“只有在超过了E1的各个水平上,意识的通达和言语报告才有可能。它假设在E2水平上表征可通达于意识,但不能言语报告(这只有在E3水平上才可能)。在水平E3,知识重新编码为跨系统的代码。”[13] 生活中有许多这样的场景:在受到强烈刺激的情况下,人们往往表现得目瞪口呆,此时信息就表征为水平I,这个过程我们毫无感觉,等过了一段时间,感到心潮起伏而又表达不出来,而到了能够用语言表达的E3阶段时,已经把最初的许多刺激信息过滤掉了,这时各个感觉器官都因这个表达而出现相应的反应,这是表征跨系统的表现。联想到心理学家弗洛伊德的意识和潜意识的划分,有异曲同工之妙,能够变为意识的部分只是冰山的一角,而大量无法显示的则是巨大的潜意识海洋。为什么潜意识无法显现出来,在弗洛伊德那里是各种文化因素的制约在起作用,如果回到本文的观点则是模块的过滤功能在起作用,而在有效的过滤过程中,节省了结构的存储空间,表征与编码的工作量大大减少,提高了认知的效率。在这个过程中,人类的记忆功能就显得尤为重要,只有把一些输入的重要细节形成记忆,下一步的表征才成为可能,而记忆又是表征的结果,两者相互促进,这也是心理学关注记忆问题的一个重要原因之一。

现在回到知觉缺失时的表征问题,由于先天的知觉缺失,导致表征过程只能处于非正常的补偿过程,也是由于知觉的缺失,导致对相应刺激无法形成有效的记忆,只能由其它模块提供一些替代功能来弥补这种缺憾,而功能分区之间的这种硬性约束,补偿功能是有限度的。因此,使得知觉缺失患者的表征速度严重地降低下来,同时由于无法形成有效经验,进而也就无法形成概念化能力,没有这种能力则无法形成完整的推理链条和指导行动的程序,所以知觉缺失患者经常在同一个问题上屡次犯错误。如一个盲人在行走的前方路面出现了一个坑,他无法通过视觉知觉完成快速表征,这时他通过手杖的探测,发现了前面的路面有坑,手的触觉模块把这些有限信息进行部分表征,输送到中枢神经系统,经过中枢系统的不完全计算加工然后输出,能够部分成功地避免盲人掉进坑里。这个过程比正常人慢了许多,这个现象说明了两个问题:其一,一般来说,图像表征比符号表征传达的速度快,毕竟图象表征依赖于与外部事物的相似,而符号表征系统则是一种语言的约定,符号与事物之间没有必然的联系,这里涉及到复杂的符号与语义赋值问题,所有这些过程都要占用很多时间。其二,可以推论,先天知觉缺失患者是由于相应的知觉模块系统无法工作导致的。在这个基础上还可以得出一个推论,任何模块虽然都是领域特殊性的,但不是完全封闭的,换言之,任何输入模块除了主业以外,还有一些辅助功能:支援意识,只是这些支援意识的功能是有限的,它无法完全替代特殊的功能模块。如鼻子除了是主要的嗅觉输入系统外,它还可以粗略地帮助人辨别温度。对于知觉缺失患者来说,其他的输入模块将联合起来充分发挥模块的辅助支援功能,尽量替代受损的模块形成表征功能,最大程度地避免危险,这也是人类长期进化的结果,比如盲人的听觉、触觉一般都比较敏感,就是这个道理。

关于知觉缺失状况下的表征问题还有一项工作需要梳理,那就是对一个系统行为的解释问题,如果我们把派利夏恩的转换器看成心理模块的一种功能的话,那么二者之间的关系就是一个很重要的问题。在派利夏恩看来,对于系统行为的解释有两条路径:第一种类型的解释诉诸于一个系统的内在性质并对系统如何操作做出了一个系统说明,这是一种类似于工程的进路。第二种类型的解释诉诸于外在性质或诉诸与系统有某一联系的真实世界或想象世界的性质和行为。显然知觉缺失情况下的表征是第二种类型的解释原则。基于这种理解,派利夏恩把认知中的解释分为三个层面:“内涵的(语义的,或知识层面的)原则,符号的(句法的,或功能的)层面的原则和物理(或生物的)层面的原则。”[14] 这里关键是第一层面涉及通过诉诸表征的语义内容能够加以解释的现象。第三个层面是可以用物理语言来解释的,这也是转换器强约束的内在原因,而第二个层面则是转换器的功能。如果把这种功能移到模块理论中,可以看出这是人的一种先天本能,也是认知不可穿透的,或者按照乔姆斯基的说法就是,先天语法结构,通过这两个层面的基础性准备,第一个层面的解释才是可能的。在第一个层面的解释中最为困难的是,语义内容是如何与符号结构结合起来的。只有这个过程得以实现,信息编码与计算才有可能有效完成。

从“图林测试”到“汉语屋”看心理内容的表征问题

关于人工智能(AI)的研究是目前探索人类认知的一个非常活跃的领域,基于自然主义的视角,计算机科学家们目前普遍认为人类认知的基本原理是计算,而且认为这种人-机类比是强等价的。在这方面,早期最著名的例子是图林测试,所谓“图林测试”是英国计算机专家图林(A.Turning,1912-1954)于1950年设计的一个思想实验,它的大意是这样的:通过让机器模仿人回答某些问题,判断它是否具备智能。图林试验采用“问”与“答”模式,即观察者通过控制打字机向两个试验对象通话,其中一个是人,另一个是机器。要求观察者不断提出各种问题,从而辨别回答者是人还是机器。如果这个机器的内存足够大,可以储存许多知识,实验一直进行下去,直到观察者无法判别对话者是机器还是人的时候,就可以说机器具有智能。这个实验是一个伟大的思想实验,它第一次提出了检测智能的标准问题。然而,它存在的问题也是明显的,我们如何知道机器对自己的回答是了解的?小孩子会背诵许多唐诗、宋词,然而他并不理解其中的意思,我们能说小孩子真正理解了他们背诵的文字吗?显然不能。而当他长大以后,他理解了这些文字,其中发生了什么变化,笼统地说,在成长的期间里,他增加了人生的经验,而这些经验恰恰构成语义内容的重要部分,正是语义保证了理解的实现。针对强人工智能的观点,1980年美国哲学家J.塞尔提出了著名的“汉语屋”实验。这个实验的大意是:“设想一些计算机程序设计专家设计出一种能够使一台计算机模拟理解汉语的程序。用汉语向这台计算机提一个问题,它会就这一问题运用自己的存储器,对这个问题给出合适的汉语答案。”[15] 我们能够说这台计算机象一个中国人那样理解汉语吗?显然不能。由此,J.塞尔得出如下结论:首先,语法不足以满足语义;其次,计算机程序是完全以它们的形式化的语法结构来定义的;第三,心具有心理内容,延伸到语言就是说具有语义内容。这样塞尔就从根本上否定了强人工智能所提出的机器智能问题。

客观地说,图林实验与汉语屋实验是矛盾的,即便当下不能武断地说,塞尔直接否定了强人工智能未来发展的可能性,但是可以清晰地看出,塞尔一针见血地指出了人工智能研究中存在的基础薄弱问题。现在的问题是,人工智能无法模拟人类认知的哪些部分?目前无法完成的任务的根源在哪里?笔者认为:如果我们把人类知识的来源分成两部分,即先天部分和后天的经验部分,那么,当前人工智能研究遇到的关键障碍是机器只能部分模拟人类的先天结构部分,而又无法彻底模拟人类的先天结构的活性。同时,人类的后天习得部分的模拟的进展也不尽如人意,这种双重困境就是当下人工智能研究中让人失望的地方。如1977年费根鲍姆提出的“专家系统”以及知识工程等概念,大多是对人类后天经验部分的模拟。如果这个论断成立,那么人类的先天部分都包括哪些呢?后天部分中又有哪些是无法模拟的呢?在剖析这个问题之前需要清理的一个问题是,人们对图林测试的理解存在很大的误解,首先,如Donald Michie指出的:“不要将图林的原意扭曲,那就是图林提出这个测试方法,并不是为了验证机器是否具有与人一样的思维能力,而是为了验证机器是否具有思维能力。”[16] 其实,即便这样强调,还存在一个很困难的问题:某个人拥有的一些难言知识(tacit knowledge)如何表达,如果不能很好表达,那么人机测试有时候就无法分辨。如果患有某些知觉缺失症的病人也无法很好完成这个测试任务,能否说这个患者就没有思维吗?显然不能,所以图林测试本身的构造是存在一些问题的。其次,图林测试就其本质来说,测试的是一种特定的智能,即言语智能。言语智能要求计算机必须具备普通人的常识。在阐述这个问题之前,还需要解决一个关键问题:即心理内容问题。说到心理内容必须和语言结合起来。以往的人工智能研究大多是以符号处理来表征人类的认知过程。这条进路以计算机科学家西蒙和明斯基为代表。他们处理这项工作的思路是刺激必须以符号的形式来处理,只有形成符号才能在语法规则的约束下进行推理。因此哲学家约翰.麦克道威尔认为:“经验是世界对我们的感官造成的印象,是感受性的产物;但是那些印象本身已经具有概念性内容了。(因此)感知经验的内容是概念性的。”[17] 之所以人工智能专家和心灵哲学家倾向于认定经验的概念性能力,是因为一旦假定经验以概念化形式存在,则认知过程中的表征与推理问题就容易处理多了,问题是人类有很多经验是无法形成概念化的,与麦克道威尔观点相对立的是埃文斯的观点,他认为:“主体通过感知获得的信息状态是非概念性的,或者说非概念化的。以这样的状态为基础的判断必然包含概念化。在从感知经验转到关于世界的判断(通常以文字表达)的过程中,我们运用了基本的概念性技巧。”[18]  在关于经验的理解问题上,由于人类存在很多以技能形式存在而又无法准确表述的经验,因此,笔者愿意相信还存在一些以非概念形式存在的经验。那么,如何看待这些以非概念性存在的经验在人类认知中的作用呢?它们如何表征?它们与概念性内容的关系如何呢?在这方面笔者认为,牛津大学的哲学家A.屈森斯在《概念的联结论构造》一文中提出的观点很有启发性,他的基本预设是:认知科学理论的建立就依赖于计算性的人工制品与心理学解释之间关系的概念的形成。而这种关系是以表述理论为中介的。表述本身是一个具有双重特性的物理对象,即具有表述载体的特性和表述内容的特性。由这个预设,我们可以合理地推出,前面之所以如此强调经验的概念性,无非是想为经验找到合适的载体而已,而无法概念化的经验则不容易找到合适的载体来表征的。只有有了合适的载体,心理语义才能得以完成,即适合于内部计算推理的形式化过程也是符号获得心理内容的过程,这也就是福多提出思想语言(LOT)的初衷所在,这种思想语言至少为经典的句法/语义表述理论(S/S)的计算提供了可能性。这里涉及到乔姆斯基在1965年出版的《句法理论的诸方面》一书中的思想的延续,在乔姆斯基那里,“他的观点不是一直坚持认为为了学习一种语言而需要一种语言,而是说为了学习一种语言你需要一种语言获得机制。这就是最初被描述为‘普遍语法’的东西。”[19]Larry Kaye)这是Larry Kaye在最近的一份评价福多思想语言的手稿中提出的看法,那种语言在福多那里就是就是表示心理状态的心理语言(mentalese)。Larry KayeJ.福多的思想语言假设归结为如下五个主题:“1表征实在论,2语言学的思想,3区别,4先天论,5语义完全性。”[20]Larry Kaye)这个划分还是比较准确的,为此,我们可以粗略地知道福多的思想语言的主旨。那么回到非概念化的经验处理上,屈森斯是如何构造这种理论预设的呢?他认为:“概念内容是由概念特性组成的内容,而非概念内容是由非概念特性组成的内容。”[21] 在这个界定中要明确的是非概念内容也是内容,所谓的概念特性主要是指:当且仅当相对于理论来说,它只通过概念典范地被表征,而这些概念是有机体为了满足这一特性所必须具有的。同理,非概念特性则是指有机体所不必具有的。基于这种理解,内容理论在此就分化为两种:概念性内容和非概念性内容,前者可以用福多的思维语言来进行表征,对于后者,屈森斯提出了C3理论即概念的联结论构造(The Connectionist Construction of Concepts)来进行说明,这种说明整体上构成了他的构造理论内容即CTC理论。需要指出的是,屈森斯关于概念内容如何工作的创见很有启发性,他提出了任务域概念,这个概念的重要意义在于:“任务域就是世界的一个概念化区域,它提供了评价某个系统的性能的背景(真/假、输/赢、成功/不成功等)。”[22] 在这个基础上,他把内容分为α内容和β内容,α内容在内容理论中被规定为一种具有确定的真值条件的内容,按照屈森斯的定义,我们可以明确地指出,由于任务域是由概念方式组成的,所以α内容是概念内容。而β内容是在基底域上工作的非概念内容。两者的关系也是一个有趣的问题,大体来说,我们的非概念能力支撑着我们的概念能力,它们不仅仅是转变阶段的一部分。可以说,能够形成完整概念能力的经验是很少的,它漂浮在经验总体的上部,还有一些处于概念与非概念之间的经验(如颜色),以及完全的非概念内容的经验(如疼痛)。其实,这种划分方式,主要是为了解决在心理计算框架下,两种内容理论与两种表征理论之间的联结。换言之,这种努力只是为了更好地解释人类在认知指导下的行动的原因。这就是典型的语义学内容,按照屈森斯的说法:“语义层次与句法层次在解释上是相互独立,就是说人们不必了解语义学理论,就可以理解句法理论在说什么,反之亦然。句法必须顾及语义制约。”[23] 由此,自然可以理解,语义学理论是关于句法条目与概念内容之间的关系理论。所以,概念性内容的经验可以通过句法形式来表征,语义是通过句法实现的,句法在这里充当了内容的载体的角色。那么非概念内容的经验该通过何种载体来表征呢?屈森斯给出了CTC理论,他认为:“CTC内容的表述载体是整体系统能力,但是这些内容也具有计算载体,这些计算载体是整个系统能力的特殊执行方式的下意识的因果基础。自然可以确认两种联结论载体:分布在许多加工单元上的活动模式,和许多加工单元之间的加权联结性的模式。”[24] 如果说以概念性内容存在的经验获得语义内容的保证条件是语义真值条件,那么以非概念性内容存在的经验的语义获得则依赖于系统整体的因果性机制。概念性内容表现为任务域经验中的可获得性,而CTC内容表现为基底域经验中的可获得性。基于这种预设,我们再来分析一下哲学家唐纳德.戴维森的工作,众所周知,在整个二十世纪的科学哲学研究中,哲学家一直关注着如何处理自然语言与人工语言的关系问题,这个问题也是语言哲学的核心工作之一。为了克服自然语言的含混性和语义模糊性,逻辑实证主义者提出了创建人工语言的努力,这种努力被看作是统一科学运动的核心任务。能够构造人工语言,就意味着可以进行形式化处理,由此,推理与演绎的过程得到了有效执行,因为句子或语法上的东西是可以递归地加以规定的。结合上面的考虑,这种形式化的语言就是可以用符号来表征的。然而正如戴维森指出的那样:“对句法给出形式上的递归说明不能用于自然语言,这个论证并不必然地要求放弃提出一种真理理论的努力。因而假定这清楚地表明了英语的深层结构无法表现为具有通常量化结构的形式语言,这也并非意味着我们无法给出一种真理理论。”[25] 戴维森在这里提出了两个重要问题:其一,自然语言与人工语言获得语义内容的方式是有些不同的,通常,一种真理理论应当为句子“赋予意义”。其二,如果我们把真理理论所揭示的结构看作是深层语法,那么语法和逻辑必然联系起来。联想到乔姆斯基的观点,深层语法结构必须具有转换生成表层语法结构的功能。由此我们可以看出,戴维森试图把所有语言获得意义的途径皆归结为塔尔斯基的语义真值论是有些勉强的。那么,我们可以合理地假设,人工语言都是一种符合表层语法结构的形式语言,它更适合于描述那些概念性的经验内容,而深层语法结构则更适合于非概念性的经验内容的组织方式,它获得意义的载体只能是一种整体的因果能力,这部分恰恰是一种先天能力的体现,人工智能存在的问题也恰恰在这里。由此,我们再对比J.福多的工作,他认为:“因此可以假定心理表征具有句法结构,思想的逻辑形式随附在与心理表征一致的句法形式上,心理过程在计算的独有意义上是计算性的,它开启了概念的句法因果驱动的现实。”[26] 福多正确认识到了思想获得语义内容的一种因果动力机制,但是他同样没有能够很好地处理非概念性内容的经验的表征问题,甚至他根本就没有给予两者以区分。不过值得肯定的是他的心理的计算理论(CTM)充分考虑到一种先天论的观点,由此他给出的理论框架就具有三种理论旨趣:“心理的计算理论(=理性主义心理学通过句法过程得到执行)。1思想借助于它们的逻辑形式具有了因果作用,2思想的逻辑形式随附在符合心理表征的句法形式上,3心理过程是计算性的,它的运做限定在心理表征的句法形式上,它们可靠性地保持真在很多情况下存在不确定性。”[27] 基于此,也可以看到心理的计算理论在对经验的处理问题上还是存在很大问题的,不再赘述。需要提及的是哲学家P.S.丘奇兰德早在20年前的一篇经典论文中就已经指出:“假如表征结构不是句子形式的,它们应该是什么样的?假如计算不是逻辑形式的,它们应该是什么样子的?”[28] 她给出的可能解决办法是联结主义的思路,主要借鉴了J.L.麦克莱兰和D.E.鲁梅哈特的并行分布模型(Parallel Distributed Processing,即PDP模式),这种模式也不能令人满意,关于它的利弊,另文讨论。

回到知觉缺失病人的情况,我们可以推断出,由于知觉缺失患者无法形成相应的有效感觉刺激,因而也就无法形成可以快速表征的概念性经验,导致与此相关的计算过程无法完成,因此也就无法形成有效的、符合演绎与推理要求的表征,从而导致演绎推理功能受到限制,但是,作为一种非概念性的经验还是可以形成的,换言之,他具有正常的深层语法结构。日常生活中,我们经常见到盲人无法规避同样的障碍,也无法进行复杂的距离与时间关系的计算,而这种功能在正常人那里是很容易做到的,比如一个正常人横穿马路时能够正确计算远处驶来的汽车与横穿马路需要的时间关系问题,这证明他能够就视觉刺激进行有效的推理与演绎计算,从而表征过程得以完成。虽然盲人无法完成这种有效表征,但他同样能够意识到这个问题,并指导自己的行动,由此,我们还可以推断出“图林测试”只是完成了塞尔意义上的语形识别问题,结合我们的讨论,塞尔强调的这种语形只是表层语法结构,而深层语法结构对于“图林测试”来说也是无法完成的。因此,非概念性问题是计算机无法完成的。那么,对于知觉缺失的病人来说,从概念性经验过渡到非概念性经验,正常人与盲人的表征差别逐渐缩小。除了上面提到的过马路的例子,我们再回忆一下,颜色(中间性概念)再到痛的经验(完全非概念性),两者的表征能力差距逐渐缩小。这个事实也提示我们,如果我们承认福多观点,即把语言视为人类的一种感觉系统,那么完全有理由认为,语言作为感觉系统比其他五种感觉系统具有更高级的认知形态和功能。

综上,通过利用损伤——缺陷——功能推理的方法(这是19世纪神经学者保尔.布洛卡开创的方法,后经20世纪上半叶前苏联神经心理学家亚历山大.鲁利亚的大力发展,以及美国当代神经心理学家卡尔.普里布拉姆的开创性运用,很多猜测已经被证明,如2000年,Suuppes & Han的工作),对正常人与知觉缺失症患者的认知过程进行对比分析,我们能够更好地揭示人类的认知之迷。但是这里存在一个严重困难的问题,即我们如何看待大脑的认知功能,对此,当前,神经心理学家有两派观点,“一派是高级认知机能大脑定位说,另一派是脑功能整体说。”[29]在本文中,我们倾向于认为大脑机能定位说,这与福多的心理模块的领域特殊性的观点不谋而合。基于此,从知觉缺失患者反映出来的表征困难的现象中,能够揭示出两个重要问题:与领域特殊性有关的先天论的观念以及心理内容的表征问题,通过概念性经验内容的表征与非概念性经验内容的表征区别,并借助于知觉缺失现象印证了心理过程的两种表征机制,因果机制与整体联结机制。为了更深入地揭示这种想象,还可以通过心理学家P.M.丘奇兰德的研究,来间接证明本文的观点,他认为对于那些“难以用语言表达的感觉特性”,我们可以采用状态空间的概念来分析。如识别面孔困难者由于特定的右顶骨的损坏,对于辨认人类面孔出现困难。他的解释是这样的:“这里似乎有理由提出一个也许是20维的内部状态空间表述,其中每一维对某个突出的面部特征如鼻子长度、面部宽度进行编码。即使沿每个轴的辨别力只限于五个不同位置,像这样的高维空间仍将具有巨大的容量(520个位置)。”[30]那么我们可以合理推断出,对于盲人来说,他辨别能力将大为下降,假设正常人沿每个轴可以有五个方向,而盲人只有四个方向(甚至更少变为两个方向),那么他的认识容量就仅有420(甚至220),这也说明他无法对概念化经验形成有效表征的原因。因此,通过对知觉缺失状态下的心理表征问题的研究,对于了解人类的认知之迷具有重要的线索性意义。

(感谢我的母亲王淑芝,自2001年她青光眼手术无效后,她的右眼完全失明,左眼有光感。自2005年以来,她给我提供了许多第二类盲人的知觉缺失经验,谨以此文献给我母亲七十岁生日。完成于20084月)

参考文献:

[1][2][4] LA福多.心理模块性.李丽译.上海:华东师范大学出版社,2002 395045-46

[3]埃默.福德、格林.汉弗莱斯.脑与心智的范畴特异性.张航等译.北京:商务印书馆,200712

[5]林涤凡、李大超.“Goldman的模拟理论”一文,摘自《科学、认知、意识:哲学与认知科学国际研讨会文集》,南昌:江西人民出版社,2004230

[6]沈政.意识及其在五维超立体脑空间中的动态模块.转引汪云九等,意识与大脑——多学科研究及其意义.北京:人民出版社,2003129

[7]李量等.“感觉意识形成的四个基本要素:编码、激活、门控和感觉记忆”一文, 转引汪云九等,《意识与大脑——多学科研究及其意义》,北京:人民出版社,2003120

[8][9][14] 泽农.W.派利夏恩.计算与认知:认知科学的基础.任晓明、王左立译.北京:中国人民大学出版社,2007163-164181228

[10] MW.艾森克、MT.基恩.认知心理学.高定国、肖晓云译.上海:华东师范大学出版社,2004361

[11]莫顿.韦格曼.“表征与心灵理论”一文,转引高新民、储昭华.心灵哲学.北京:商务印书馆,2002557-558

[12[13] A.卡米洛夫-史密斯.超越模块性.缪小春译.上海:华东师范大学出版社,200116-1721

[15]约翰.塞尔.心、脑与科学.杨音莱译.上海:上海译文出版社,200623

[16]陆汝矜、杨萍等.“少儿图林测试研究”一文,转引汪云九.意识与大脑——多学科研究及其意义.北京:人民出版社,2003189

[17][18] 约翰.麦克道威尔.心灵与世界.刘叶涛译.北京:中国人民大学出版社,20065051

[19][20] Larry KayeThe language of thought[J].http://hostuniroma3.it/progetti/kant/field/lot.html. 2008

[21][22][23][24][30] 玛格丽特.A.博登.人工智能哲学.刘西瑞、王汉琦译.上海:上海译文出版社, 2006408410426463388

[25]唐纳德.戴维森.对真理与解释的探究.牟博、江怡译.北京:中国人民大学出版社,200774

[26][27]JerryFodorThe mind doesn’t work that way: the scope and limits of computational psychology. Massachusetts Institute of Technology Press 20002219

[28]Patricia Smith , ChuechlandEpistemology in the age of NeuroscienceThe Journal of Philosophy, Vol .84, No.10.  1987544-553

[29]Rom Harre.他们改变了心理学——50位杰出的心理学家[M].刘儒德译,上海:华东师范大学出版社,2007106

作者简介:

侠(1967-),辽宁省辽阳人,上海交通大学科学史与科学哲学系,教授。研究方向:科学哲学、科技与社会。



https://m.sciencenet.cn/blog-829-259890.html

上一篇:科学技术哲学专业研究生必读书目
下一篇:这年头,长寿是多么重要啊!

9 武夷山 张志东 杨玲 刘玉平 吴渝 杨秀海 李宁 王立 zhuchi

发表评论 评论 (7 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-20 23:54

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部