Joshua3769的个人博客分享 http://blog.sciencenet.cn/u/Joshua3769

博文

以脑为师 ——从理解动物智能到实现通用人工智能

已有 1827 次阅读 2023-4-20 13:27 |系统分类:观点评述

以脑为师

——从理解动物智能到实现通用人工智能

 

摘要

揭示智能的关键原理、了解人类智能的潜力和局限、并从智能的角度思考人类的未来,是当代自然科学与社会科学共同关心的话题;向动物智能的神经机制借鉴设计经验,从而促进通用人工智能的开发,是本世纪技术领域最重要的使命之一。动物智能,尤其是人类的智能,主要表现为理解力。大脑为理解过程提供了物质基础,其中复杂的神经元活动既可以表征环境中的事件、物体以及它们之间具体或抽象的关系,也可以表征个体的情感、思维、决策和行动。大脑中丰富的神经表征主要是在后天的经验和学习中产生的,神经元以及突触的可塑性变化是学习得以发生的关键。全面理解神经可塑性变化机制,将是我们揭示大脑智能原理并促进通用人工智能开发的突破口。为了实现这个目标,我们在开展大量的神经科学实验的同时,也需要借助计算机对大脑进行模拟,而对大脑的成功模拟本身就意味着通用人工智能的实现。这两方面的工作不是个人或小团队可以胜任的,需要组建大规模的团队进行协作。协作的过程是持续进行实验、模拟和整合的迭代过程,这要求对大团队进行严谨而合理的组织与分工,它的成败不仅取决于科学家的才干,更取决于团队管理的智慧。

Revealing the critical principles of intelligence, understanding its potentials and limitations, and thinking about the future of human beings from the perspective of intelligence are the commonly concerned topics of contemporary natural and social science. Drawing design lessons from the neural mechanisms of animal intelligence to facilitate the development of general artificial intelligence is one of the most important missions in technology field this century. Animal intelligence, especially human intelligence, is mainly manifested as understanding. The brain provides the physical basis for understanding processes, in which complex neuronal activities can represent events, objects and their concrete or abstract relationships in the environment, as well as individual emotions, thoughts, decisions and actions. The rich neural representations in the brain are mainly generated during postnatal experience and learning, and the plasticity of neurons and synapses is the key for the learning to happen. A comprehensive understanding of the mechanisms underlying the neural plasticity will be a breakthrough for us to reveal the principles of brain intelligence and promote the development of general artificial intelligence. In order to achieve this goal, besides conducting huge amounts of neuroscience experiments, we also need to simulate the brain on computers, and the successful simulation of the brain itself means the realization of general artificial intelligence. The works from these two aspects cannot be qualified by individuals or small teams, but need us to build a big team for cooperation. The course of the cooperation is a continuously iterative process of experiment, simulation and integration, which requires rigorous and reasonable organization and division of labor. Its success depends not only on the talent of scientists involved, but also on the wisdom of the management team.

关键词:人工智能,大脑模拟,类脑智能,突触可塑性,学习,管理科学

Key words: Artificial Intelligence, Brain Simulation, Brain-like Intelligence, Synaptic Plasticity, Learning, Management Science

 

一、引言

 

通用人工智能,是指能够像人一样思考与行动从而代替人类工作的智能技术。当代社会面临许多新问题,迫切需要通用人工智能来解决。比如,先进的医疗技术使得人类的平均寿命不断增长[1],这引起了老年人口比例的上升。据估计,中国在2035年左右将进入重度老龄化阶段,每10个人中会有3个超过60岁[2])。这意味着:在繁忙的工作和养育子女的负担之外,越来越多的青壮年夫妻还需要分出精力照顾家中高龄的老人,这必然会让很多家庭苦不堪言。但如果我们能尽快地发展出具有通用智能的人形机器人,它们就能代替我们照顾老人、陪伴孩童、处理家务甚至对家人进行简单的医疗服务。

 

在过去,开发通用人工智能对大多数人来说是很久以后的事情,因为我们对于智能本身缺乏成熟的认识,尤其是神经科学家还不能详尽地理解人类智能在大脑中的实现机制。但最近,随着人工神经网络的突破性进展,尤其是美国OpenAI公司所研发的ChatGPT和GPT-4,让人们意识到实现通用人工智能并非遥不可及。ChatGPT可以与人类进行对话,而GPT-4不仅有出色的对话能力,还具备了图片理解能力,二者都是通过训练深度网络大模型来实现的。由于人类智能的发生也依赖于大脑中超复杂的网络结构,因此,如果我们能尽快地揭示大脑实现智能的神经机制,并借鉴这些机制去设计人工神经网络,必将推动通用人工智能的快速发展。

 

那么,我们该如何以脑为师、向大脑智能学习设计经验?既然首要的工作是揭示大脑中与智能相关的神经机制,我们应该从哪些方面入手呢?本文将从智能的主要特点出发,以学习以及神经与突触的可塑性变化作为突破口,通过综合最新的研究成果来理解大脑智能的神经机制,并强调了大脑模拟工作对于理解大脑和实现通用人工智能的重要性。本文认为:理解大脑、以脑为师,需要的是大团队密切协作,协作的过程是对生物实验、结果整合、计算机模拟的持续迭代,它不仅涉及庞杂的科学问题,更涉及合理高效的工程管理问题,它其实是一项浩大工程,是简单地通过归纳小团队的碎片化建议所不能替代的。

 

二、智能的主要特点

 

当问起什么是智能时,不同的人会优先想到不同的东西。有的人会优先想到智商,但事实上,智商只是人们发明出来的一个过于简单化的指标,它对于刻画智能是极其片面的,况且不容忽视的是,情商对于刻画智能也非常重要。有的人会优先想到数学,这或许是因为数学涉及对抽象符号的记忆和操作以及精确和创造性的推演,但事实上有的数学天才在人情世故方面是幼稚的,他们的社会智能几乎是畸形发展的,这意味着数学能力只是智能的一个方面而已。有的人会想到适应能力,这种用演化论相关概念来解释某种生物功能的做法在生物学领域屡见不鲜,但就人类而言,我们活着显然不是为了适应和生存,不然中国古人就不会有“舍生取义”的价值追求,况且适应能力本身是相对于某个既定目标而言的,当目标不明确的时候,适应能力就无法被评估。还有的人会想到语言,但语言只是高级智能的一个方面而已,当狼群通过合作的方式围布猎物时,我们不得不承认那也是一种智能,而与人类相比,狼基本上没有语言能力。看来,要对智能有一个公允而准确的定义并不容易。

 

智能的英文单词intelligence源于拉丁文intelligere,与理解有关。根据词源,我们不妨将智能视为理解力,因为这是符合人们的日常判断的。比如,当一个人能理解别人的行为和感受、善于察言观色,或者能理解文学作品和科学专著,或者能理解一件事情该如何计划、如何执行时,我们会倾向于认为这个人比较聪慧,而这些方面的理解力也能帮助他更好地应对日常生活。此外,人类高层次的精神生活也与理解力密切相关。比如,孔子曰:朝闻道,夕死可矣!所谓闻道,即是希望能听闻和理解有关存在和价值的真理。或许孔子最大的满足不是感官之乐,也不是成就之乐,而是理解之乐。再比如,伯牙善于弹琴,而钟子期是少有的能理解伯牙琴声的人,当子期去世后,伯牙悲伤地摔碎了自己的琴,因为他再也找不到知音了。这两个例子反映了人类渴望理解或被理解、并以理解为满足的特点,这一点无疑是现代文明(如太空探索)取得非凡成就的主要原因之一。

 

三、智能的神经机制

 

我们对事物进行理解的过程,其实是大脑中数百上千亿神经元以不同的模式发放电脉冲并相互传输信号的过程。理解过程中所包含的不同成分或不同子过程都是由不同的神经活动来表征的。例如,当我们在斑马线上看到红灯亮起时,我们一般会停下脚步,这时候如果有一个人无视红灯继续横穿马路,我们可能会对这个人产生负面的感受。在这个由红灯亮起所引发的理解过程中,我们的眼睛会像手机摄像头一样持续地将街道场景和其中的人物以电信号传输给我们大脑的视觉系统。视觉系统中有的神经活动负责表征街道场景,有的表征红灯,有的表征那个闯红灯者的面孔或着装,有的表征闯红灯者的移动方向和速度。与此同时,海马中有的神经活动可以表征我们自己当时在街道中所处的位置,有的可以表征闯红灯者与正在行驶的车辆之间的相对关系。当表征红灯的神经活动发生时,会向大脑前额叶传输信号,从而激活前额叶中表征交通规则的神经活动。这两种信号最终能传输到运动皮层,从而影响那些控制我们行走的神经活动。当与闯红灯者有关的神经活动发生时,也会向前额叶传输信号,并在前额叶和那些表征交通规则的神经活动一起激活表征是非判断的神经活动,然后向杏仁核传输信号,激活杏仁核中表征负面感受的神经活动。当然,这里对大脑内神经活动的描述是非常粗略的,但至少能说明:在我们理解事物的过程中,会有不同的神经表征被动态地激活。当越丰富的神经表征被动态地激活时,我们也会有更好的理解体验,这一点可以解释为什么有的人看世界杯时昏昏欲睡,而有的人总能看得津津有味。

 

大脑中各种各样的神经表征以及它们之间的相互联系不是天生的,而是通过我们的日常经验或学习而建立起来的。比如,当一个毕业生在入职以后,会逐渐习得不同业务流程之间复杂的转换关系。与之相应的是,最近一项利用头皮脑电记录技术(EEG)的研究表明,当个体对复杂的转换关系熟悉以后,大脑中会形成转换关系网络的神经表征[3]。再比如,当一个善于社交的人入职一家大公司以后,会逐渐从亲疏关系和业务关系等维度了解公司内的人际关系网络,并且能利用这样的人际网络进行推理,从而为自己的业务创造更多的便利。最近一项利用功能核磁成像技术(fMRI)的研究表明,类似的多维度社会网络能在大脑的海马、内嗅皮层以及眶额皮层等脑区得到表征,这一网络是通过整合片段化的人物关系经验而形成的,而且个体可以基于这一网络来理解自己未曾直接了解过的人物关系[4]。除了上述两个关于抽象关系的神经表征,具体的、最简单的感觉特征的神经表征也需要通过经验来获得。比如成年雪貂的视皮层神经元能对具有不同朝向的图形做出不同的响应,也能对具有不同运动方向的图形做出不同响应,换句话说,这里的神经元能用来表征朝向和运动方向(它们都属于最基本的视觉特征),但对于初生的、刚睁眼的雪貂而言,视皮层中与左右眼相应的朝向表征是未对齐的,而运动方向表征则不存在,这些神经表征都需要雪貂在睁开眼、获得一两周的视觉经验以后才能成熟或出现([5] [6])。

 

这些不同复杂程度的神经表征究竟是如何通过学习或经验而建立起来的?从神经元的角度来说,学习主要体现在神经元动作电位发放特性的改变。以简单的知觉学习为例[7],当猕猴被训练去检测屏幕上噪点中隐藏的一类全局图形时,随着猕猴检测能力的提高,在猕猴的中级视皮层以及腹侧前额叶中,神经元的发放率(每秒发放动作电位的次数)在全局图形和噪音之间的差异与日俱增,这意味着这些神经元能越来越好地区分噪音和目标刺激,与此同时,能够从发放率上显著区分目标图形所在位置的神经元比例也随训练而提高。换句话说,学习导致更多的神经元被用来编码目标刺激,也提高了这些神经元对目标刺激的敏感性。当然,不同的学习内容有可能导致不同的变化模式。比如,在动物经历工作记忆任务(即在感觉刺激呈现以后的数秒时间内,动物需要维持住对它们的记忆,并在后续按照不同的刺激做出不同的行为反应)的训练以后,在任务中数秒的记忆维持阶段,前额叶神经元对不同刺激的区分能力总体上不仅没有提高,反而减弱了,但那些能对刺激做出响应的神经元增多了,它们的响应也增强了 [8, 9],另一些位于多模态皮层的、在记忆维持阶段具有瞬时响应特点的神经元的数目也会随任务表现的提高而增多[10]。在这个学习过程中,神经元方面的变化主要体现在数量方面。但在另一些训练中,变化主要体现为同一批神经元的响应模式重组。比如,当大鼠能熟练地在环形空间中按顺序找到可以获得奖励的位置以后,海马中不同的神经元能够对不同的奖励位置有选择性地响应,即特定的神经元只有在大鼠跑到某个或某几个特定的奖励位置时才会有较高的发放率,这些神经元可以一起表征大鼠当前是否跑到了某个奖励位置。当大鼠在一小时左右以内学习额外的、新的奖励位置时,有的神经元在保留了对旧位置的响应的基础上开始对新位置有响应,有的神经元不再对旧的位置响应,有的只对新的位置响应,还有的神经元旧的响应位置发生了变更。经过反应模式的重组以后,这批神经元既保留了对旧位置的表征,也建立起了对新位置的表征[11]。

 

神经元响应模式的改变,主要是由突触效能的改变引起的。一般来说,每个神经元能通过树突与其他神经元的轴突建立连接,从而形成数千个突触。通过突触,一个神经元(突触后神经元)可以接受来自不同皮层的神经元(突触前神经元)的前馈输入。另一方面,该神经元也可以将自己的轴突连接到那些皮层中的神经元的树突上,形成反馈投射。当突触前神经元有动作电位发放时,会在位于轴突末端的突触前膜释放递质,这些递质能与突触后膜的递质受体结合(一般位于突触后神经元的树突上)引起膜电位的升高或降低,进而对突触后神经元胞体的总体电位产生兴奋或抑制效果。当突触由于经验或学习而发生变化以后,会引起递质传输效能的改变,进而导致突触前神经元对突触后神经元的兴奋或抑制效果被放大或减小。突触的变化可以是短时程的、只维持数十毫秒到数分钟之久(比如突触前胞内钙离子浓度的变化[12]),也可以是长时程的、维持到数分钟到数年之久(比如突触后膜上递质受体密度的变化[13]、树突棘形态或数目的变化[14, 15]),进而使得神经元的响应模式能在不同的时间尺度上发生改变。

 

经验和学习促成突触变化的一种机制是这样的:在某次经验发生时,如果突触前神经元与突触后神经元的动作电位发放时间间隔在某个范围内(一般在数十毫秒以内),则突触传输效能就会变化,但究竟是变强还是变弱以及变化幅度有多大,取决于哪个神经元先发放以及二者的发放间隔长短[16]。这种突触可塑性变化机制被称作脉冲时序依赖可塑性(Spike Time Dependent Plasticity, STDP;在一些研究中由于使用刺激诱发动作电位,因此也会使用Stimulus Time Dependent Plasticity)机制,其合理性在于:在现实世界中,时间上邻近的事件往往高度相关(比如看到闪电不久便听到雷声),事件重复越多次,我们对其相关性越发确信;相应地,当两个神经元的发放在时间上邻近并且这样的现象重复多次以后,神经元之间的关联理应更强。在一些研究中,人们能利用这一机制修改视皮层神经元的朝向偏好或感受野[17, 18],也能在杏仁核中“植入”与恐惧有关的联结[19],这意味着大脑中简单感觉特征的神经表征以及复杂的联结记忆都可能是基于这样的可塑性机制而建立起来的。

 

脉冲时序依赖的可塑性机制有一个明显的缺陷:它可以在任何时候盲目地改变任何皮层中所有在邻近时间内发放的神经元之间的突触,但这不是我们想要的,因为日常经验中有一些意义不大的细节,如果它们都在突触上留下痕迹,我们的大脑就会充满垃圾信息。为了克服这个缺陷,大脑首先引入了受神经调质所控制的可塑性机制,这些神经调质包括多巴胺、乙酰胆碱、5-羟色胺、去甲肾上腺素等[20]。多巴胺是被研究得最多的神经调质,它可以从中脑被释放,并弥散地输送到许多其他脑区,并为大脑提供“什么时候学”的信号[21, 22]。当我们遇到愉快或新鲜的事件时,多巴胺就会被释放,当它到达那些由于此事件而发放的神经元之间的突触时,就可能引起突触的改变,从而强化我们对该事件的记忆。但是,神经调质的释放是弥散的,这导致它对突触可塑性变化的影响会很宽泛。为了将可塑性变化限定到特定的脑区或特定神经元之间的突触,大脑需要利用反馈投射去指导突触的变化,因为一般来说,跨皮层的反馈投射具有局域性,功能上具有特异性[23-26],在组织上具有拓扑对应关系[27]。以运动学习为例:在小脑中,浦肯野细胞的树突一方面会接受平行纤维(即小脑中颗粒细胞的神经纤维)的前馈输入,另一方面会接受来自脑干的攀爬纤维的反馈输入(一条攀爬纤维往往对应一个浦肯野细胞)。在学习过程中,攀爬纤维能将运动误差信号反馈给浦肯野细胞,该信号能控制浦肯野细胞与平行纤维之间的突触变化[28]。在这个例子中,反馈信号是一种运动误差信号,并且是由小脑以外的脑区计算出来的。但在大脑皮层中,尤其是具有层级结构的视觉通路中,与注意、任务要求、行为选择等相关的信号都可以从高级联合皮层自上而下地反馈到较低级的视皮层中[29-31],较高级的视皮层也能对较低级的视皮层施加反馈影响[32]。这些反馈信号是否也能控制突触的变化?当反馈来的不是误差信号时,同一层的神经元是否能利用反馈信号计算出误差信号从而指导自身与上游神经元之间的突触改变?这些问题需要未来更多的实验探索,但目前人们对这些问题持有积极的看法[20, 33]。

 

脉冲时序依赖的可塑性机制的另一个缺陷是:它可应用的时间尺度太小,一般要求突触前后的神经元发放时间间隔在数十毫秒内。但有时候,我们需要将间隔数秒的两件事联系起来,比如打保龄球的时候,大脑需要通过改变突触在抛球姿势和数秒后的撞击结果之间建立联系,这有助于提高我们的表现。针对这种可塑性需求,人们提出了资质痕迹(Eligibility trace)的假说,即突触前神经元的发放(或突触前后神经元的共同发放)能在突触留下资质痕迹,这种痕迹赋予突触在未来数秒内被改变的资格[34] [35]。尽管人们还不能证明资质痕迹对应突触中哪些生化过程及其产物,但一些实验已经间接证明了它的存在[36-38]。比如,小鼠海马CA1中一些神经元原本不具有位置选择性,但它们既能接受来自CA3中有位置选择性的神经元的输入,又能接受来自EC3神经元的指导信号(比如奖励相关信号)。当小鼠经过某个位置时,为CA1提供位置信号的CA3神经元的发放可能使得CA1神经元的树突棘中产生了资质痕迹。数秒后,来自EC3的指导信号(可以由奖励引起)在CA1中引起了集中而快速的发放,这可能启用了资质痕迹,强化了CA3到CA1的突触连接。那么下次小鼠再经过这个位置时,这些CA1神经元就会发放,体现出习得的位置选择性[39, 40]。这里的突触变化体现了间隔数秒的两个事件之间的关联,因此被称作行为时间尺度的突触可塑性(Behavioral timescale synaptic plasticity, BTSP)。在不同的脑区或不同的神经元之间的突触可塑性变化尺度可能不同[41],这种时间尺度方面多样性所遵循的原理有待更多的实验探索。

 

上述的脉冲时序依赖的可塑性变化、神经调质影响、反馈指导以及资质痕迹等机制,能被不同脑区通过不同的方式整合到突触变化过程中,从而为不同形式的学习或经验奠定了相应的生理基础。多样的整合方式源于大脑在不同层面复杂的架构。比如从分子层面来看,上文提到的几种与突触可塑性相关的神经调质受体的密度在不同脑区是不同的,它们在额叶的密度基本上都高于在枕叶的密度,总体上呈现出喙尾梯度差异[42-44],这意味着神经调质对于不同皮层可塑性变化的影响是多样的。再比如从连接层面来看,每个皮层都接受多个皮层的反馈输入,但不同皮层的反馈源存在差异[45, 46],这意味着不同皮层中的突触变化会受到不同的反馈指导。连接层面的架构在个体出生时已经有了雏形[47] [48],由于不同脑区的突触连接随着个体的成长而不断变化,这些架构也会逐渐发育成熟。这种由基因决定的架构在不同物种之间存在着显而易见的差异[49] [50],因此也决定了物种之间学习能力或理解能力的差异。

 

突触连接的改变及其引发的神经元响应模式的变化是在大脑既有架构的支持下发生的,与此相应的是,个体在学习新知识或理解新事物的时候往往也是在既有知识框架的基础上进行的。既有的知识框架被称为心理模型或图式,学习过程则往往涉及将新知识同化到图式的过程。比如大鼠可以在沙地上通过反复尝试习得几个线索气味和不同沙井的对应关系,图式因此被建立起来。这时如果将其中两对联结用新的气味和位置替换,大鼠只需要单个试次就能习得新联结,这得益于对图式的利用[51]。一些研究表明,图式的建立和表征有海马的参与,对图式的利用则有前额叶的参与,整个学习过程与两个脑区之间的相互作用有关[51-58]。大脑通过类似的方式为不同的知识和经验构建图式,从而赋予个体强大的学习和理解能力。

 

四、智能的计算机模拟

 

关于智能在大脑中的实现机制,上面给出的只是粗浅的介绍,当被深入追问的时候(比如:睡眠在不同脑区如何影响突触的可塑性变化?不同脑区对某特定脑区中突触变化的影响方式和程度有何不同?),我们会意识到人类距离真正理解大脑还十分遥远。这意味着神经科学家仍然需要做不计其数的生物实验,分析海量的实验数据,更具有挑战性的是,人们需要评估从实验数据得出的某些神经机制对于大脑运转的必要性或在不同脑区的普适性(有些评估如果通过实验来进行则极为耗时耗力),以及将所有的实验发现整合起来,从而形成对大脑工作方式的完整刻画。克服这一挑战的最佳方式就是构建大脑仿真系统。构建该系统需要基于已经确认的神经机制,而在该系统上进行仿真测试则能评估一些已经提出的神经机制或揭示一些重要的原理,因此,对大脑进行模拟的工程和对大脑进行神经科学实验的过程是相辅相成、相互迭代的。

 

在构建大脑仿真系统时,有一些策略问题是无法回避的,比如:构建系统时是否需要考虑神经元的三维形态?是否需要考虑不同种类神经元在不同脑区的分布?是否需要考虑离子通道和递质受体的分布?涉及的因素越多,仿真系统的构建就会越复杂,对计算机的要求也会越高。由于现有的研究成果远远不足以帮助我们评估这些因素对于模拟大脑的必要性,一种扎实而严格的做法就是在模拟大脑时尽量把不同尺度的因素都考虑进来,未来可以根据仿真表现来确认和剔除那些不必要的因素。由亨利·马克兰姆(Henry Markram)所主导的蓝脑计划(Blue Brain Project)正是有此雄心的计划[59],仿真所需要的强大算力来自于IBM公司提供的超级计算机蓝色基因(Blue Gene)。该项目已经实现了对小鼠一小块新皮层中微环路的重构和仿真[60]。在这个运行在蓝色基因上的微环路中,神经元拥有多样的立体形态,不同形态的兴奋性和抑制性神经元被按照特定的比例和密度混杂安置在不同皮质层中,神经元的形态及其表面分布着的各种离子通道决定其电活动特性,神经元之间的突触设置在树突和轴突密接的位置,突触传递过程由基于受体动力学的模型所刻画。以往实验观测所获得的数据为环路的构建提供了所需的模型参数。在这个环路的基础上,蓝脑计划又构建了小鼠新皮层不同脑区之间的微观连接模型[61],未来可以基于这个模型仿真小鼠的整个新皮层。最近,蓝脑计划提出了基于钙离子的突触可塑性模型[62],这项研究或许在未来有助于将突触可塑性纳入到仿真系统中,从而为模拟的皮层赋予学习的能力。一些学者相信蓝脑计划有望实现对人脑的模拟[59],仿真人脑如果成功,不仅可以被用来指导各类大脑疾病的治疗,而且能直接转化为通用人工智能,其潜在的应用价值不可估量。

 

然而,不是所有科学家都能接受蓝脑计划的模拟策略,因为它考虑的因素太多,需要超强的算力支持。一种候选的方案是:构建一种灵活的大脑仿真平台,允许人们在模拟大脑时灵活地选取所需的尺度和因素。由中科院类脑智能研究中心的曾毅所主持开发的智脉(BrainCog)平台采用的就是这一方案[63, 64]。在该平台,用户可以选择使用比较简单的脉冲神经元模型(如将输入直接整合并输出的Leaky-Integrate-and-Fire模型,简称LIF)或比较复杂的脉冲神经元模型(如考虑到离子通道的Hodgkin-Huxley 模型,简称HH),并选用不同的突触可塑性变化规则(如上面提到的STDP或有奖励调制的STDP),用于精细地模拟一个脑区神经环路,或粗略地模拟整个大脑中的神经元及微观连接,也可以用于构建类脑人工智能去实现各种各样的认知任务。在该平台中进行仿真测试或许有助于我们找到更加经济而有效的模拟大脑的策略。

 

五、相应的大团队协作

 

大脑智能的神经机制极为复杂,为了厘清大脑智能所依赖的最重要的那些神经机制,个人或几十人的小团队穷尽一生也不可能做到。因此,如果人类要尽快实现通用人工智能,必须通过组建数百人的大团队来协同攻关,这涉及到一个关键的问题:对该团队进行组织和管理的最优策略是怎样的?

 

首先,这个大团队应主要包括三个部门:整合部门、实验部门、模拟部门。整合部门主要负责概念系统设计,这高度依赖于对模拟部门和实验部门所提供的数据结果的整合,因此,该部门可以向模拟部门和实验部门分别提出模拟需求和实验需求。实验部门需要向另外两个部门提供实验结果,也需要根据它们的要求开展新实验。模拟部门的模拟工作是基于整合部门的要求以及实验部门提供的数据,当模拟部门的模型基本上实现了大脑功能时,通用人工智能的目标就基本上得到了实现。三个部门的运转过程即是整合、实验与模拟的持续迭代过程。


其次,实验部门不需要实施实验计划,而是将其委托给高校中合适的某个课题组(当然,这需要提供相应额度的资助)。之所以不在实验部门培育不同的实验小组(比如视觉系统小组,记忆小组等),是因为这一方案存在弊端:假如每个实验小组承担各自的实验项目,那么有时候有些小组会由于长期不被整合部门和模拟部门所调用而严重闲置,造成人力资源的浪费。即便所有小组能长期运转,但由于保密协议的限制,他们不能在学术期刊发表实验结果,这会降低小组中的科学家的工作积极性。假如实验小组不是按照课题专长划分,而是按照技术专长划分,即各自承担实验流水线上的不同角色(比如有动物训练小组、手术小组、电生理小组等等),那么当整个团队协作结束以后,这些分工太细的小组成员会面临失业风险。基于这些原因,在实验部门内培育实验小组是不合理的。为了与高校中的课题组合作并鼓励他们的积极性,不仅需要提供充足的经费,还需要允许他们公开发表实验结果。一些人或许会担心这会泄密,但事实上,仅凭一些实验结果,任何个人或组织几乎不可能比本协作团队发展得更快。

 

整合部门在整个团队协作中发挥着引领作用,对整合部门进行合理的划分是整个团队高效协作的基础。划分的方式与我们解析大脑的方式类似,有不同的维度可以考虑:比如按照不同的大脑功能进行划分(视觉、听觉、记忆、情绪等),按照不同的皮层区域划分(布罗德曼分区),按照不同的尺度划分(皮层模块、微环路、神经元、突触受体等),或按照不同的发育阶段划分等。为了方便模拟部门实施模拟,按照结构进行划分比按照功能划分更加合理。在划分结构时,为了避免孤立地研究单个脑区,也为了兼顾功能以及大脑本身的复杂性,有必要将所有脑区按照连接方面的紧密程度进行聚类,聚在一起的脑区视为一个模块,整合部门的小组就是按照不同的模块进行划分。对于每个小组而言,初步的工作可以从三个方面开展:厘清所负责模块的结构特点(比如不同亚区之间的连接、每个亚区中的细胞类型等等);厘清模块内神经元是如何在不同任务态下动态协同从而实现对不同信息的加工的;厘清这些加工过程是通过怎样的突触可塑性变化机制而被建立起来的。此外,不同模块之间的连接可以由一个小组单独负责,由于该小组的工作涉及全脑,因此在整个部门中发挥着协调的作用。

 

整个团队的研究对象应该聚焦于猕猴,这是因为对人类大脑进行侵入式研究非常困难,而猕猴不仅在进化上属于人类的近亲,在行为上也表现出比小鼠更高的智力水平。此外,使用猕猴进行的脑科学研究越来越多,这对整个团队而言意味着更加丰富的参考。

 

六、总结与讨论

 

人类渴望理解并且善于理解,这是智能的主要特点,这一特点源于大脑中数百亿神经元的活动、它们之间的通讯、以及它们之间的突触可塑性变化。目前,我们还未能全面地揭示智能的神经机制,这需要未来更多的实验探索,也需要从大脑模拟工程中获得启发。大脑模拟不仅有助于我们理解大脑的工作机制,也能为脑疾病的治疗提供启发,并且能为迈向通用人工智能的目标铺平道路。基于脑启发的通用人工智能开发不是小团队可以胜任的,必须组织大团队协作攻关,这涉及对团队进行科学合理的组织和管理工作。

 

或许有人激进地认为:发展通用人工智能,只需要计算机科学家不断探索更好的深度网络大模型,不需要向神经科学借鉴经验。诚然,ChatGPT以及GPT-4的出现证明了深度网络的强大潜力,但GPT只不过实现了对话和图片理解,离真正的通用人工智能还有很远的距离,它不能证明挖掘深度网络的潜力是最优的方案。大脑作为地球上最具智能的深度网络,它的设计很显然具有重要的借鉴价值。

 

人类探索对象的复杂性决定了人类协作过程的复杂性。大脑是一个巨复杂系统,如果简单地将其分割为不同的小模块并委托不同的研究人员单独进行生物实验或计算机模拟,容易产生盲人摸象的后果。因此,如何拆分研究对象、如何将不同的研究内容分配给不同的课题组、如何促进他们的协作、如何保证他们的工作能被整合到一起,这些都是极具挑战性的问题,需要严谨而合理的规划,也需要管理科学领域的专家进行管理。因此,以脑为师、向大脑学习,这带给我们的益处将不仅关乎对智能的理解与设计,也关乎人类如何协作、如何在保持个体自主性与创造性的同时被联结成为更有智慧的整体。

 

人类不懈追求理解自我和世界,这使得人类的智能总体上远超过其他动物。这种基于生物系统的智能是否有其发展边界或发展缺陷?人类的智能可否“进化”到更高的水平?有研究发现老鼠在某些图形分类任务中的表现优于人类 [65],这暗示:在进化的过程中,大脑智能不是趋于全能,它不得不舍弃掉一些功能。由于通用人工智能有望使机器拥有和人类一样的智能,那么我们是否能在此基础上设计出智能远超过人类的智能体?我们是否能通过这样的智能体理解终极的、完美的智能(如果存在的话)?这样的智能是否可以用已知的物质实现?人类是否可以通过改变自身的构造方式而达到这样的智能水平?这些问题都有待未来的神经科学探索和大脑模拟工作来解答。

 

参考文献

 

1.          WHO. GHE: Life expectancy and healthy life expectancy. 2020; Available from: https://www.who.int/data/gho/data/themes/mortality-and-global-health-estimates/ghe-life-expectancy-and-healthy-life-expectancy#:~:text=The%20estimates%20confirm%20the%20trend%20for%20longevity%3A%20lifespans,years%20in%202000%20to%2073.4%20years%20in%202019.

2.          人民网. 我国预计2035年左右进入重度老龄化阶段 60岁及以上老年人口将突破4亿. 2022; Available from: http://health.people.com.cn/n1/2022/0920/c14739-32530182.html.

3.          Ren, X., H. Zhang, and H. Luo, Dynamic emergence of relational structure network in human brains. Progress in Neurobiology, 2022.

4.          Park, S.A., et al., Map Making: Constructing, Combining, and Inferring on Abstract Cognitive Maps. Neuron, 2020. 107(6): p. 1226-+.

5.          Chang, J.T., D. Whitney, and D. Fitzpatrick, Experience-Dependent Reorganization Drives Development of a Binocularly Unified Cortical Representation of Orientation. Neuron, 2020. 107(2): p. 338-+.

6.          Li, Y., D. Fitzpatrick, and L.E. White, The development of direction selectivity in ferret visual cortex requires early visual experience. Nature Neuroscience, 2006. 9(5): p. 676-681.

7.          Jing, R., et al., Perceptual learning as a result of concerted changes in prefrontal and visual cortex. Curr Biol, 2021. 31(20): p. 4521-4533 e3.

8.          Qi, X.L., et al., Changes in Prefrontal Neuronal Activity after Learning to Perform a Spatial Working Memory Task. Cerebral Cortex, 2011. 21(12): p. 2722-2732.

9.          Guan, S., et al., Elastocapillary self-assembled neurotassels for stable neural activity recordings. Science Advances, 2019. 5(3).

10.        Zhu, J., et al., Transient Delay-Period Activity of Agranular Insular Cortex Controls Working Memory Maintenance in Learning Novel Tasks. Neuron, 2020. 105(5): p. 934-946 e5.

11.        McKenzie, S., et al., Learning Causes Reorganization of Neuronal Firing Patterns to Represent Related Experiences within a Hippocampal Schema. Journal of Neuroscience, 2013. 33(25): p. 10243-10256.

12.        Zucker, R.S. and W.G. Regehr, Short-term synaptic plasticity. Annual Review of Physiology, 2002. 64: p. 355-405.

13.       Citri, A. and R.C. Malenka, Synaptic plasticity: Multiple forms, functions, and mechanisms. Neuropsychopharmacology, 2008. 33(1): p. 18-41.

14.        Engert, F. and T. Bonhoeffer, Dendritic spine changes associated with hippocampal long-term synaptic plasticity. Nature, 1999. 399(6731): p. 66-70.

15.       Hedrick, N.G., et al., Learning binds new inputs into functional synaptic clusters via spinogenesis. Nature Neuroscience, 2022. 25(6): p. 726-+.

16.        Caporale, N. and Y. Dan, Spike timing-dependent plasticity: A Hebbian learning rule. Annual Review of Neuroscience, 2008. 31: p. 25-46.

17.        Yao, H.S. and Y. Dan, Stimulus timing-dependent plasticity in cortical processing of orientation. Neuron, 2001. 32(2): p. 315-323.

18.        El-Boustani, S., et al., Locally coordinated synaptic plasticity of visual cortex neurons in vivo. Science, 2018. 360(6395): p. 1349-1354.

19.        Nabavi, S., et al., Engineering a memory with LTD and LTP. Nature, 2014. 511(7509): p. 348-+.

20.        Roelfsema, P.R. and A. Holtmaat, Control of synaptic plasticity in deep cortical networks. Nature Reviews Neuroscience, 2018. 19(3): p. 166-180.

21.        Yvette E. Fisher, et al., Dopamine promotes head direction plasticity during orienting movements. Nature, 2022.

22.        Hamid, A.A., et al., Mesolimbic dopamine signals the value of work. Nature Neuroscience, 2016. 19(1): p. 117-+.

23.        Siu, C., et al., A direct interareal feedback-to-feedforward circuit in primate visual cortex. Nature Communications, 2021. 12(1).

24.        Morimoto, M.M., E. Uchishiba, and A.B. Saleem, Organization of feedback projections to mouse primary visual cortex. Iscience, 2021. 24(5).

25.        Federer, F., et al., Stream-specific feedback inputs to the primate primary visual cortex. Nature Communications, 2021. 12(1).

26.        Marques, T., et al., The functional organization of cortical feedback inputs to primary visual cortex. Nature Neuroscience, 2018. 21(5): p. 757-+.

27.        Xu, R., et al., The cortical connectome of primate lateral prefrontal cortex. Neuron, 2022. 110(2): p. 312-+.

28.        Richards, B.A. and T.P. Lillicrap, Dendritic solutions to the credit assignment problem. Current Opinion in Neurobiology, 2019. 54: p. 28-36.

29.        Buffalo, E.A., et al., A backward progression of attentional effects in the ventral stream. Proceedings of the National Academy of Sciences of the United States of America, 2010. 107(1): p. 361-365.

30.        Li, W., V. Piech, and C.D. Gilbert, Perceptual learning and top-down influences in primary visual cortex. Nature Neuroscience, 2004. 7(6): p. 651-657.

31.        Quinn, K.R., et al., Decision-related feedback in visual cortex lacks spatial selectivity. Nat Commun, 2021. 12(1): p. 4473.

32.        Nurminen, L., et al., Top-down feedback controls spatial summation and response amplitude in primate visual cortex. Nature Communications, 2018. 9.

33.        Sacramento, J., et al., Dendritic cortical microcircuits approximate the backpropagation algorithm. Advances in Neural Information Processing Systems 31 (Nips 2018), 2018. 31.

34.        Gerstner, W., et al., Eligibility Traces and Plasticity on Behavioral Time Scales: Experimental Support of NeoHebbian Three-Factor Learning Rules. Frontiers in Neural Circuits, 2018. 12.

35.        Magee, J.C. and C. Grienberger, Synaptic Plasticity Forms and Functions. Annual Review of Neuroscience, Vol 43, 2020. 43: p. 95-+.

36.        Zeng, J., et al., Local 5-HT signaling bi-directionally regulates the coincidence time window for associative learning. Neuron, 2023. In Press.

37.        Bittner, K.C., et al., Behavioral time scale synaptic plasticity underlies CA1 place fields. Science, 2017. 357(6355): p. 1033-1036.

38.        He, K.W., et al., Distinct Eligibility Traces for LTP and LTD in Cortical Synapses. Neuron, 2015. 88(3): p. 528-538.

39.        Grienberger, C. and J.C. Magee, Entorhinal cortex directs learning-related changes in CA1 representations. Nature, 2022.

40.        Bittner, K.C., et al., Conjunctive input processing drives feature selectivity in hippocampal CA1 neurons. Nature Neuroscience, 2015. 18(8): p. 1133-+.

41.        Suvrathan, A., H.L. Payne, and J.L. Raymond, Timing Rules for Synaptic Plasticity Matched to Behavioral Function. Neuron, 2016. 92(5): p. 959-967.

42.        N.Palomero-Gallagher, K.Amunts, and K.Zilles, Transmitter Receptor Distribution in the Human Brain. Brain Mapping, 2015.

43.        Lidow, M.S., et al., Dopamine D2 receptors in the cerebral cortex: distribution and pharmacological characterization with [3H]raclopride. Proc Natl Acad Sci U S A, 1989. 86(16): p. 6412-6.

44.        Sean Froudist-Walsh, et al., Gradients of receptor expression in the macaque cortex. bioRxiv, 2021.

45.        Chaudhuri, R., et al., A Large-Scale Circuit Mechanism for Hierarchical Dynamical Processing in the Primate Cortex. Neuron, 2015. 88(2): p. 419-431.

46.        Kravitz, D.J., et al., The ventral visual pathway: an expanded neural framework for the processing of object quality. Trends in Cognitive Sciences, 2013. 17(1): p. 26-49.

47.        van den Heuvel, M.P., et al., The Neonatal Connectome During Preterm Brain Development. Cerebral Cortex, 2015. 25(9): p. 3000-3013.

48.        Keunen, K., S.J. Counsell, and M.J.N.L. Benders, The emergence of functional architecture during early brain development. Neuroimage, 2017. 160: p. 2-14.

49.        Rilling, J.K., et al., The evolution of the arcuate fasciculus revealed with comparative DTI. Nature Neuroscience, 2008. 11(4): p. 426-428.

50.        Hecht, E.E., et al., Virtual dissection and comparative connectivity of the superior longitudinal fasciculus in chimpanzees and humans. Neuroimage, 2015. 108: p. 124-137.

51.        Tse, D., et al., Schemas and memory consolidation. Science, 2007. 316(5821): p. 76-82.

52.        Tse, D., et al., Schema-Dependent Gene Activation and Memory Encoding in Neocortex. Science, 2011. 333(6044): p. 891-895.

53.        Baraduc, P., J.R. Duhamel, and S. Wirth, Schema cells in the macaque hippocampus. Science, 2019. 363(6427): p. 635-+.

54.        McKenzie, S., et al., Hippocampal Representation of Related and Opposing Memories Develop within Distinct, Hierarchically Organized Neural Schemas. Neuron, 2014. 83(1): p. 202-215.

55.        Audrain, S. and M.P. McAndrews, Schemas provide a scaffold for neocortical integration of new memories over time. Nat Commun, 2022. 13(1): p. 5795.

56.       Zhou, J.F., et al., Evolving schema representations in orbitofrontal ensembles during learning. Nature, 2021. 590(7847).

57.        Samborska, V., et al., Complementary task representations in hippocampus and prefrontal cortex for generalizing the structure of problems. Nat Neurosci, 2022. 25(10): p. 1314-1326.

58.        Brincat, S.L. and E.K. Miller, Frequency-specific hippocampal-prefrontal interactions during associative learning. Nature Neuroscience, 2015. 18(4): p. 576-+.

59.        Markram, H., The Blue Brain Project. Nature Reviews Neuroscience, 2006.

60.        Markram, H., et al., Reconstruction and Simulation of Neocortical Microcircuitry. Cell, 2015. 163(2): p. 456-492.

61.        Reimann, M.W., et al., A null model of the mouse whole-neocortex micro-connectome. Nature Communications, 2019. 10.

62.        Chindemi, G., et al., A calcium-based plasticity model for predicting long-term potentiation and depression in the neocortex. Nature Communications, 2022. 13(1).

63.        Zeng, Y., et al., BrainCog: A Spiking Neural Network based Brain-inspired Cognitive Intelligence Engine for Brain-inspired AI and Brain Simulation. ArXiv, 2022. abs/2207.08533.

64.        Liu, X., et al., Parallel Brain Simulator: A Multi-scale and Parallel Brain-Inspired Neural Network Modeling and Simulation Platform. Cognitive Computation, 2016. 8(5): p. 967-981.

65.        Ben Vermaercke, et al., More complex brains are not always better: rats outperform humans in implicit category-based generalization by implementing a similarity-based strategy. Psychonomic Bulletin & Review, 2014.



https://m.sciencenet.cn/blog-3002905-1384964.html

上一篇:猕猴脑研究应从“以课题为中心”转向“以个体为中心”

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-28 05:43

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部