博文

基于知识的智能生成策略及其局限性反思

已有 6413 次阅读 2010-9-1 07:42 |个人分类:智能科学与技术|系统分类:论文交流|关键词:学者

文/黄富强
摘要：本文扩展了以知识为核心的智能生成的策略与思想，强调数据、信息、知识、智能在机器认知生成过程中的阶段性和跃迁性。同时在每个转化阶段中引入正反馈补偿机制来增强模拟计算的可信性与相对完备性。最后从现实出发对智能生成策略进行实证分析及其局限性进行反思。

关键字：知识；智能生成策略；局限性；决策与判断；机器认知计算

随着人工智能科学的不断发展，人工智能技术与产品研发不断走向深入，形成了大量的人工智能领域的人工制品，服务于社会的不同领域。机器人制造业是人工智能领域中一个相对发展迅速的产业，其中衍生出的一些思想、方法、理论可以应用到其它一些智能产品中，带动了一系列智能产品的发展，比如具有决策支持功能的专家系统、设备故障诊断系统、各种智能控制系统等。机器认知能力是这些机器智能系统要不断解决的关键问题，机器认知（Machine Cognition）研究的目的就是探索智能体的智能实现策略、理论和方法，智能体（Intelligence Agent）就是各种软硬件智能制品。智能体的智能水平高低是机器认知研究领域所关注的重要目标，这是科学家与工程师一直努力的方向。智能生成策略问题是机器认知研究的首要问题。
1问题提出及研究意义
人工智能领域长期围绕着“智能体能否思维？”、“智能体能否具有自主决策与判断能力？”“智能体能否实现人的智能行为？”等问题争论不休。问题是科学发展的重要动力。人工智能理论与信仰在发展过程中经历了符号主义（Symbolicism）、联接主义（Connectionism）、行为主义（Actionism)三个研究范式的转换。符号主义要处理大量的规则与逻辑推理问题，根本无法建立统一的形式系统来模拟人的智能行为。进而受到联接主义的诟病与质疑，认为这种机械式的智能模拟思想违背了人类认知系统非线性的特质，人类认知系统是高度复杂、高度并行操作的系统，联接主义主张对大脑进行建模，模拟各种感官的结构和功能。但人脑的结构及其功能异常复杂，我们对其了解太少，建模难度可想而知，况且全脑机制与功能模拟对计算的时间与空间开销有可能难以满足。行为主义面对这种发展困境提出要从智能体与环境的动态交互的角度出发，注重智能体适应工作情境的进化能力，突出环境与智能体的具身性与学习能力。实际上，三个范式的思想与方法各有优缺点，在机器认知研究中可以相互补充。我的智能生成策略是基于行为主义的，秉承知识工程与专家系统之父费根鲍姆（Edward Albert Feigenbaum）[1]的理论与思想，以知识为主，注重知识对智能生成的基础作用。由于现在传感器件的丰富与发展，数据来源渠道与类型丰富，数据作为智能体重要的输入，为信息、知识、智能的产生奠定了重要基础，我进而提出能否从认知处理的对象之流中抽象出数据、信息、知识、智能这四个语境对象来探讨机器智能的生成策略。现有的智能体系统都是针对特定领域的，而且数据来源都是静态单一的，或者说智能体与工作语境的动态交互能力差。弥补动态交互能力差的方法就是引入动态正反馈增益补偿机制，这也就是增强算法的智能性。所以说算法一定要跟上策略的发展。
机器认知研究就是依据人类认知系统工作原理经过合理抽象得到的机器认知系统普适策略模型。服务于各类智能体系统，可以应用这个模型建立智能系统的引擎，人工智能应用中的具体业务规则与流程要做适合引擎要求的编码建构。我的整个智能生成策略遵循由数据经数据转化到信息，由信息经信息转化到知识，由知识经知识转化到智能的非线性路径，不同部分的闭环控制结构互相联接，在加上系统本身的知识库与模式库的支持，就具有一定的智能决策支持能力。知识库存储领域情境的知识元，这个知识元由事实、规测、推理机制构成，这个知识库可以根据认知机器在情境中的自我学习能力得到扩充，模式库可以用来存储方法论性质的知识解决方案。数据到信息、信息到知识、知识到智能是机器认知处理的三个阶段，这三个阶段稳定均衡时都是闭环控制状态，在理想情况下三个阶段由低级阶段到高级阶段是具有跃迁性的，所谓理想情况下是指在无人参与下的或刚开始有人参与的自主机器认知情境。具体如图所示：

2机器认知与智能计算
如何为智能体设计具有一定自主认知能力的结构与功能系统，要结合机器认知的工作情境。人类的认知能力是高度情境化的，认知过程与情境是信号耦合的，“认知、身体、环境是一体的，认知存在于大脑，大脑存在于身体，身体存在于环境”[2]情境是复杂的，丰富多彩的，信号杂多的。与人类认知相比较，机器智能就是智能体对所属情境及情境属性参量的决策与判断能力，这种能力是人类赋予的，情境数据的输入可以由人工辅助完成，也可由智能体自身感知获取。“认知过程本质上就是一种心理计算过程的假设，从而为研究人类认知开辟了一条新路径”[3]通过计算的方法模拟认知过程，前提必须先有机器认知的合理抽象策略，依据策略进行计算模拟。从相互关联的不断递进的数据、信息、知识、智能四个机器认知处理对象来非线性的探讨智能的形成过程，整个机器认知过程是由三类闭环控制组成的多极闭环控制链路与链路网，来模拟人类认知的复杂过程。这种研究思路克服了线性化的思维方法，注重机器认知过程处理环节的阶段性与跃迁性，不断跃迁的过程就是智能生成的过程。
2.1基于知识的智能生成策略理性分析
以知识为核心的智能生成策略是对于以推理为核心的人工智能研究进路的创新。把对知识的自主学习、自主利用作为研究的主旨，实际上，智能体对知识的获取与利用的过程就是智能体智能生成与发挥的过程。然而知识的本质是什么？现在还不十分清楚，有关它的论断也很多。我认为对知识的理解应结合语境，依据语境对知识内容进行分类，对知识形式进行抽象，并采纳一定的逻辑形式与符号进行知识表示，进而为建立知识库和确定知识推理规则打下现实基础。著名哲学家金岳霖在《知识论》中对知识对象的分类思想，“知识底对象大致说来有两种，一种是普遍的，一种是特殊的；前者是普通所谓理，后者是普通所谓事实。”[4]这也就是知识的一种分类思想，把知识分为理性知识与经验知识，具有知识分类的普遍性。按照人工智能符号主义的观点，知识是智能的基础。有关知识的本质、知识的分类学术界还没有一个统一的观点。关于知识的定义，学术界比较认可的说法也是基于描述性的，“一般而言，知识是人们在改造客观世界的实践中积累起来的认识与经验。这些认识和经验的描述，又需要涉及到数据和信息的概念。”[5]按照贝克莱在《人类知识原理》中所说的，“人类知识的对象：人们只要稍一观察人类的知识对象，他们就会看到，这些对象就是观念，而且这些观念又不外三种。一种是由实在印入感官的；一种是心灵的各种情感和作用所产生的；一种是在记忆和想象下帮助形成的。”[6]由此可以看出，人类知识的发生、进化、增长、积累是离不开经验的，经验是知识之源，知识之始。对经验的提炼、抽象、分类形成了广袤的知识海洋。我想对于知识的分类应立足于具体应用语境，根据智能输出的需要针对特定领域细化。知识从那里获取？知识可以从人类专家那里获取，也可以从语境实在中自动获取，这里的知识一般指的是经验知识，经验知识挖掘与获取具有一定的不确定性和模糊性，这是由经验知识本性决定的，这里充满了语境中的主体际性。经验知识的机器化水平制约智能生成的限度。自主决策的智能体首先应具有感知情境的能力，这是机器认知过程的输入部分，由它促动认知与决策过程的发生。经机器认知处理形成智能决策与判断的输出，输出的同时还要把这个决策与判断规则存储到知识库中，知识库是智能体的重要支撑部件，知识库是决策能力生成的基础。智能体智能输出部分又作用于情境，此时认知机器已有了部分智能的储备，可以通过机器内部的比较、判断，依据决策规则与智能算法产生一定的对所属情境的决策判断学习能力。这样经过不断的与情境互动学习使认知机器的智能水平大为提高。在从数据到智能的整个跃迁的进程中，正反馈补偿机制的引入会给下一级机器内部认知对象一个增益，使这一级自身对本级意义表达更贴近情境的真实语义。这样的机器认知研究思路具有一定的普适性，适合各类机器认知系统的构建，比如情感的机器感知、语音的机器感知等。

人类自身的智能认知机制造就了人类知识之流。信息到知识的转化也是多路径的多类型的动态补偿过程，根据所处理信息的意义及属性挖掘出知识的分类、事实、规测、推理方法。由数据到信息的过程可分为吸收数据阶段与释放信息阶段，由信息到知识的过程都可以分为吸收信息阶段和释放知识阶段，这些阶段要处理好环境交互与本体自学习能力。“机器学习研究从观测数据出发寻找规律，利用这些规律对未来数据或无法观测的数据进行预测。”[7]背景知识、假设空间、逻辑演算是智能系统决策的基础，知识转化为智能的表现特征就是自主决策能力的涌现，自学习能力的大幅度提升。现有的知识系统构建基础都是基于形式逻辑与统计逻辑的，知识系统是基于事实、规则、推理的，这种机械式的建构理念是有一定合理性的，同时也起到了不可忽视的作用。有关人类知识发现、知识获取机制研究的初步成果为构建人工智能视域下的智能知识系统奠定了认知论基础，已经诞生了不少服务于不同领域的智能产品与相关理论。比如用于设备故障诊断方面的智能诊断技术是在电子、计算机技术、人工智能技术的发展中产生的一门技术。知识可以分为显性知识与隐性知识，在人类认知系统中，二者具有互相补偿的机制，机器认知系统也要不断吸收隐性的经验知识，可以通过经验案例知识抽取的方法模拟实现，做得好坏取决于知识生成策略算法。
数据感知是机器认知的起点，数据感知是指认知机器通过感知设备或者人为辅助完成数据采集的过程。数据来源于情境属性或情境中对象的属性，数据反映认知机器工作环境的业务状态及相互联系。情境数据类型的多样性也给数据准确采集及有效存储带来不少压力，要求认知机器的数据感知部件具有很宽的接纳口径，还要有支撑数据管理与数据维护的多数据模型直接支持或者间接支持的数据库管理系统。“数据库管理系统是一个通用的软件系统，由一组计算机程序构成。数据库管理系统能够对数据库进行有效的管理，包括存储管理、安全性管理、完整性管理等。数据库管理系统提供了一个软件环境，使用户能方便快捷地建立、维护、检索、存取、和处理数据库中的信息。”[8]

信息是知识的载体，知识是信息的升华，知识的抽象度高于信息，但又必须靠信息编码来表达。1948年，美国数学家、信息论的创始人香农在题为“通讯的数学理论”的论文中指出：“信息是用来消除随机不确定性的东西”。1948年，美国数学家、控制论的创始人维纳在《控制论》一书中，指出：“信息就是信息，既非物质，也非能量。”“信息就是用语言、文字、图片、手势、电码等发出的表示事物存在和运动的信号，信息能够脱离具体的事物而被摄取、传输、存储、处理、交换、掩盖与检测”[9]信息是有意义的数据，数据是信息的载体。由数据经数据转化到信息的过程就是信息获取的过程，数据转化要应用数据挖掘与抽取等数据工程工具和计算方法。信息是对数据纯化过程的结果，信息是对意义抽取过程的结果。数据转化的过程是消除不确定性和产生信息增益的过程。数据到信息的转化过程是多路径的动态正反馈过程。数据挖掘算法是数据转化成信息的人工策略，开发具有自学习功能的智能算法会改进信息的时效性和后期决策的准确性。信息的确定性是需要数据的正反馈效应补偿的。“正反馈具有增补作用，能促进事物的发展。”[10]
2.2基于知识的智能生成策略实证分析
传统的以知识为中心的智能生成策略在人工智能发展的历史上起到了重要的作用。在知识工程的实践中也诞生了不少智能体系统，也就是服务于不同领域的知识系统。由于数据感知手段与智能算法的发展，对智能生成的策略与领域实现起了重要的推动作用，这就要求对传统以知识为核心智能生成策略进行改进，充分利用现有的技术手段来完善，使机器智能自主性增强。还要拓展机器智能决策应用的场合，比如用于信息安全的入侵检测系统的构建，可以设计自主的智能恶意程序收集机制，通过收集恶意程序的特征数据，通过数据挖掘的手段获取特定信息，依据事先存储的判别规则进行恶意程序识别，同时可以在识别中学习，在自主学习中扩充知识库，增强智能识别能力，具有这种能力的入侵检测系统叫做智能入侵检测系统。在实践中摸索智能应用的新途径，随着智能产品的发展，会推动智能生成技术的发展与完善。
3对机器智能生成的局限性反思
智能的生成是基于认知计算主义观点的。认知计算（Cognitive Computing）可以追溯到20世纪50年代，计算机公司开始开发智能计算机系统，那时的大多数这类系统功能太有限，根本不具备情境的自我学习能力，也更没有决策能力、智能分析情境能力、生成解决方案能力，当时科研人员基本失去了信心。之后，随着认知科学的发展，人工智能（AI）领域研究人员又看到了新的曙光。“认知计算是一个新的智能计算方法学研究范式，也是模拟人脑构建自治的具有感知与推理能力的智能系统研究的范式”[11]世界是可计算的，社会是可计算的，认知是可计算的，对这样的论断不能采用简单的肯定和否定的态度，也不能随意的夸大它的的效用，要用实证的方法来研究。随着智能算法的不断发展，丰富了理论计算机科学的研究内涵，但同时也给科技哲学研究提出了崭新的课题，究竟像认知领域这类复杂问题能否应用计算的观点来研究？能研究到什么程度？计算科学的促动作用体现在什么方面？我想不同的学者会有不同的观点。“随着计算机科学的发展各种数值算法的运用，特别是智能算法的发展，使计算和算法己上升为一个哲学范畴，并将其泛化到物质世界。”[12]机器认知是对人类认知的计算模拟，通过计算的方法模拟人类认知的过程。经过上述研究发现，人类认知系统是复杂的、自适应的、自学习的、自主决策的，计算模拟认知的研究方法是可行的，但多大程度上可行？这个问题是不好回答的，取决于认知科学、算法科学、控制理论等学科的进一步发展。计算模拟给我们研究认知领域问题带来了新的拓展路径，同时也带来了现在难以逾越的科学难题，比如隐性知识等方面的表达与应用问题，应用数理计算的方法是否会造成意义表示与表达的缺失问题，语义的完备性如何保证问题是必然存在的，抽象与语义表达的矛盾只能靠人为的调节，这种调节在机器认知领域可以通过多重反馈来弥补，弥补能保证原有意义的准确性与完整性吗？现在看，局部是有适应性的，给我们研究带来了曙光，由局部适应到系统适应还有很长距离，但已取得的进展与成果也为我们研制一些半自主的认知机器带来了可喜的效果。
4结论
机器认知过程的研究可以基于数据、信息、知识、智能的对象层次进行，另外，要在不同层次的转化过程中引入正反馈的补偿机制。计算主义的思想还要吸收多学科的研究成果，丰富智能算法的智能决策策略。图灵计算思维肯定要突破，整个计算架构走向智能化，走向分布式，走向协同，走向自主进化。

参考文献
[1] 吴鹤龄，崔林.ACM图灵奖（第三版）[M].高等教育出版社，2008:205-211.
[2] 叶浩生.具身认知:认知心理学的新取向[J].心理科学进展，2010(5).
[3] 李侠，范毅强.从思想语言到心的计算理论[J].哲学动态，2009(5).
[4] 金岳霖.知识论[M].商务印书馆,1987:导言.
[5] 王万森.人工智能原理及其应用（第2版）[M].电子工业出版社，2007:24-63.
[6] 贝克莱.关文运译.人类知识原理[M].商务印书馆，1973:20-38.
[7] 祁亨年.支持向量机及其应用研究综述[J].计算机工程，2004(5).
[8] 李建中，王珊.数据库系统原理(第2版)[M].电子工业出版社，2008:2-98.
[9] 秦铁辉，王延飞.信息分析与决策[M].北京大学出版社，2001:200-300.
[10]郑维敏.正反馈系统理论[J].系统工程理论与实践，1997(3).
[11]Yingxu Wang.On Cognitive Computing[J].Softare Science and Computational Intelligence,2009(1).
[12]周志刚.计算科学的哲学思考[J].武汉科技学院学报，2008(1).

转载本文请联系原作者获取授权，同时请注明本文来自黄富强科学网博客。
链接地址：https://m.sciencenet.cn/blog-89075-358111.html

上一篇：“物联网”你慢些走,慢些走100811
下一篇：23rd International Conference on Computational Linguistics

收藏分享

计算之智与哲学之慧分享 http://blog.sciencenet.cn/u/huangfuqiang

博文

基于知识的智能生成策略及其局限性反思

当前推荐数：6 推荐人：孙根年 杨正瓴 唐常杰 郑作龙 yinglu dulizhi95

该博文允许实名用户评论评论 (1 个评论)

黄富强

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

计算之智与哲学之慧分享 http://blog.sciencenet.cn/u/huangfuqiang

博文

基于知识的智能生成策略及其局限性反思

当前推荐数：6 推荐人： 孙根年 杨正瓴 唐常杰 郑作龙 yinglu dulizhi95

该博文允许实名用户评论 评论 (1 个评论)

黄富强

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

当前推荐数：6 推荐人：孙根年杨正瓴唐常杰郑作龙 yinglu dulizhi95

该博文允许实名用户评论评论 (1 个评论)