博文

从生物进化看AlphaGo和人工智能精选

已有 8975 次阅读 2016-3-10 11:58 |系统分类:科普集锦|关键词:学者| 昆虫, 围棋, 社会性, alphago, 黏菌

2016年3月9日，被谷歌收购的英国DeepMind公司的人工智能围棋软件AlphaGo在与韩国围棋职业九段李世石的五番棋较量中以1:0领先，吸引了全世界的目光。在3月10日，更是扩大战果以2:0领先；如果说1天之前专业棋手和非专业人士对AlphaGo的胜利还觉得持保留态度的话，那么在3月10日已经普遍认可了这款软件的棋力。在人工智能的研究中，除了计算机科学和神经科学，其实也还有神经科学以外的仿生学内容，也就是对人类大脑以外的生物有机体结构或行为的模拟，所以其实我们也可以试着从进化生物学的角度来看看这件不寻常的事。

从生物进化的角度来说，智能的形成过程会经过5-6个阶段。第一个阶段，是生物有机体对于外界环境做出趋利避害的反应，这是所有生命现象都具有的基本特征。第二个阶段，是多细胞动物的起源以及神经细胞类型的出现，在此基础上出现神经节和脑的构造。第三个阶段，是一个物种的个体在群集行为的基础上，出现协作行为，并进一步形成分工协作。第四个阶段，是一个物种的世代重叠现象，使得年幼个体有机会直接学习年长个体的生存经验，形成知识的获得性遗传模式。第五个阶段，是符号系统和符号载体的出现，强化了知识的获得性遗传。第六个阶段，是随着物种生存能力的冗余和所形成的物质冗余，形成符号系统和信息介质的不断优化，持续提高知识获得性遗传的效率。虽然人脑是目前自然界中最为复杂的智能系统，但是其实上述不同阶段的生物有机体都有可能成为人工智能仿生学的参考对象。

生物中的人工智能模式

事实上，进入人工智能视野的生物有机体有多个物种，这其中最简单的生命形态是一种被称为多头绒泡菌Physarum polycephalum的黏菌（属于原生生物中的阿米巴Amoebozoa）。这种生物是一种单细胞生物、喜暗怕光，其最有趣的特点是其在平板培养基上的细胞生长路线对于平面交通网络等的设计具有参考价值（图1）[1]。如果将其食物源按照地图上一个国家的城市的位置进行摆放的话，那么黏菌生长路线形成的网络与现实中比较完备的公路、铁路等网络具有很高的相似性。也就是说，虽然从生物学的角度看，黏菌不属于多细胞动物、没有神经细胞分化、没有脑，但是其细胞生长对于食物源化学信号的感知和反应已经可以为人工智能的设计提供参考。为什么黏菌的生长可以从一个食物源开始，以非常接近最短路线的方式到达其它食物源呢？究其原因，单细胞的属性应该是一个方面的因素。作为具有很强变形能力的单细胞（阿米巴也叫变形虫），细胞膜的局部形变突出是对食物源化学信号浓度梯度做出的反应，如果向着某个方向形变感受到的浓度更高就继续生长，如果感受到的浓度更低就保持或退回，和所有基于特定优化原则进行搜索的策略是一样的。相对来说，虽然脊椎动物循环系统、昆虫气管系统在个体发育的形态建成过程中也具有类似的氧气浓度依赖性，但是多细胞的分化方式决定了移除不再有用的结构需要以细胞程序化死亡的方式进行（可以理解为降解掉细胞），而不是像变形虫一样降解掉细胞内部的相关细胞骨架即可。也就是说，无需神经细胞和大脑构造就可以形成高效率的生存策略，趋利避害、知错就改，这其实也就是个体学习的本质。

图1. 黏菌网络与东京铁路网的对照。A表示在限定地图形状区域内的暗环境下自由生长的黏菌网络；B表示以高光照模拟高海拔对黏菌生长进行限制后的黏菌生长网络结果；C表示从B抽象出来的拓扑网络；D表示实际的东京铁路网络；E表示东京铁路站点间的最小生成树（minimum spanning tree, MST）；F表示在最小生成树基础上增加额外连接形成的网络。

当多细胞动物形成之后，一个生物个体在感知外界环境和做出反应的效率等方面都有所提高。需要注意的是，生物学讲的多细胞并不仅是强调一个个体内所含的细胞数量多，而是出现了细胞类型的分化；也就是说，一个个体内的细胞之间存在分工协作的关系，而不只是在空间上的简单聚集、在一起生活。有了神经细胞的细胞类型，才有了形成神经细胞连接、神经节的基础。在两侧对称动物Bilateria中，随着身体前端逐步集中了嗅觉、视觉、听觉等多种感官功能，头部神经节在绝大多数动物中逐步成为身体内最大的神经节，成为后来大脑的雏形。

绝大多数动物为有性生殖物种，出于交配繁殖的需要，大多数动物物种的个体或多或少都群集生活，但是群体性的程度可以相差很多，有的物种的群体性明显更强。在智能程度比较高的生物有机体中，最著名的两类可能是社会性昆虫（蜚蠊目的白蚁，膜翅目的蚁科、蜜蜂科、胡蜂科等）和灵长目动物，它们的个体都具有脑占身体比重高的特点，这个指标往往作为衡量生物有机体智能高低的一个关键指标，这个指标高的生物的确常在智能方面有更复杂的行为和更好的表现，例如软体动物门中的头足纲动物Cephalopoda（章鱼、鱿鱼等）。在脑体比重高这个个体层面的共同点背后，其实还有另外一个更深层次的共同点，那就是这两类动物的种内个体间关系普遍都很复杂（虽然包括人类在内的灵长目动物的社会性与社会性昆虫的真社会性有所区别，但是毕竟都存在复杂的个体间关系）。事实上，脑体比重高和种内复杂个体间关系这两个特点往往相伴而生（例如鲸目动物Cetacea中也是这样），对于两者之间的因果关系，一般普遍认为群体性与个体间协作行为的需求是前提、是基础。在社会性昆虫中，白蚁以取食真菌为主，蜜蜂和胡蜂的运动方式都是飞行，而蚂蚁则是以收集-捕食为主、并且大多在地面爬行运动，相对来说蚂蚁的行为既复杂又容易被观察（图2），为蚁群算法（Ant Colony Algorithms）的提出提供了基础。蚁群算法最早由Marco Dorigo在博士论文工作期间提出[2]，是群智能方法（swarm intelligence methods）的一种，可以为人们解决路径优化的问题提供帮助。

图2. 活动中的蚁群（图片来自维基百科）

在不同的一面，灵长类动物的个体能力要高于社会性昆虫的个体能力，两者分属于生态学上的K对策生物和r对策生物（前者一般繁殖率低、后代个体数量少、个体大、寿命长，后者则相反）。也就是说，虽然社会性昆虫个体的脑体比重在昆虫中是相对高的，但是每一个单独的个体受制于自己脑神经节规模的限制，很难表现出比较复杂的智能行为，只有群体才能表现出协同捕食、筑巢等复杂行为，具有个体数量依赖性。也因此，社会性昆虫会被称为超级有机体（superorganism）[图3]。相对来说，灵长目动物的个体脑容量更大、神经连接的复杂性空间更大，并且从长的寿命和世代重叠的属性中，可以进入新的智能进化阶段，也就是知识的获得性遗传特性。所有的个体之间都可以相互学习，尤其是年幼和年青个体可以直接从年长个体的生存经历中学习经验。

图3. 澳大利亚罗盘白蚁Nasutitermes triodiae的巢可高达5米、历经50年建成（图片来源于网络）

在现生的灵长目动物中，人的脑体比重是最高的、脑的绝对容量是最大的、个体间关系是最复杂的。关于人类大脑容量的进化，最新奇有趣的视角可能是天文学的。有研究显示，人类大脑容量增加并非匀速的，而是与外界环境的周期性密切相关。受引力影响，地球公转轨道的扁率和地轴倾角都会有周期性变动，而人类脑容量增加最显著的时期往往是气候变化最为剧烈的时期（图4）[3]。看来人类智力的进化历史，就是一部人类生于忧患的历史。随着人类大脑的容量和复杂度提高，人类的智能进化相对于其它灵长类动物又进入了新的阶段。人类的语言和文字等符号系统增强了对于外部环境的描述能力、提高了个体间的信息交流效率，而随着将符号记录在岩壁、树皮、草绳的过程，人类对外部环境的认识可以开始不依托于人脑的记录而独立存在，知识的获得性遗传效率由此进一步提升。

图4. 地球运动的不同周期

人工智能与人类智能

随着人类生存能力和物质积累的冗余程度提高，人类中的部分成员逐步发展出更精细而高效的符号系统和知识体系、提升了人类的推演能力和效率，还不断更新了信息载体的形式，使得独立于人类作为生物有机体之外存在的信息量持续增大，而这两方面的结合，使得基于人类已有知识在计算机系统上进行类似人脑思维方式的推演成为可能。由此，计算机的人工智能可以形成对人类智能的所谓超越。

说到人工智能，就必须提到与DeepMind公司同为英国人的图灵（AlanTuring, 1912-1954）和彭罗斯（Roger Penrose, 1931-），前者是人工智能的奠基人（同时也提出了生物有机体发育过程中模式建成的理论），后者作为数学和物理学领域国际顶尖的学者，曾经写过著名的科普读物《皇帝新脑》（The Emperor's New Mind）（看来英国在人工智能领域真是强大）。彭罗斯教授指出，即使人工智能和人脑原理在算法本质上可能没有区别，但是在硬件方面，人脑是一个动态系统。

沿着彭罗斯教授的思路，我们可以看到AlphaGo仍然和人脑有很大不同，因为他还不是一个可以自主运行的系统，还需要人的参与；也就是说，人类的智慧进步过程中，通过输入和输出的持续反馈，人脑的硬件结构会持续做出调整但是并不是直接被外力改变，而人脑的思维（算法）又是依赖于各种细胞和分子构件的硬件，相比之下，AlphaGo可能还不会通过输入和输出的各种反馈而自己改变算法（不知道实际情况是不是这样），而是要依靠人类设计者团队去优化算法。人类的知识进步本来就是拉马克式遗传或者叫获得性遗传（源于人类的长寿命、世代重叠、符号交流，后来各种信息介质的发明不断强化了这一点），因此，至少目前AlphaGo仍然可以被视为人类知识积累在计算机硬件辅助下的一种延伸，而不是一种简单的并行或竞争关系。即使AlphaGo可以有一天自我优化源程序，那么他的数据起点，仍然是源于人类的长期积累（也就是说李世石主要是在和历史上成千上万棋手的共同智慧对弈，以及Alphago基于历史经验通过自我对弈虚拟的众多未来棋手的共同智慧对弈）。

假如这些电脑软件能在围棋联赛和国际比赛中持续胜出，那么应该说生物的大脑仍然具有一个方面的优势，就是能量效率。如果围棋软件使用与人类神经细胞与连接数的规模相当的硬件及算法（如果高于人脑规模那么这本身会是潜在的不公平），人类大脑的耗能在对战过程中肯定还是要低得多。人类成年个体典型的平均功率是100W，其中大脑功率在20W的样子，如果假设用脑时的功率上升50%，那也不过就是30W左右。

由此，通过回顾人类智能在生物进化历程中走过的几个阶段，通过认识人工智能目前对人类知识积累和人工干预的依赖程度，通过了解人工智能与人类智能目前在能量效率和直接面向环境变化等方面的区别，才有利于人们更加全面而理性地思考人工智能与人类智能之间的关系。

另见：谢强. 人工智能中的仿生学[J]. 科技导报, 2016, 34(7): 85-87.

http://www.kjdb.org/CN/abstract/abstract13541.shtml

（进化生物学的教学幻灯片可以参考之前的日志《进化生物学教学幻灯片2015高清版》

http://blog.sciencenet.cn/blog-1292052-862118.html ）

参考文献

[1] Tero A, et al. 2010. Rules for Biologically Inspired Adaptive Network Design. Science 327: 439-442.

[2] Dorigo M. 1992. Optimization, Learning and Natural Algorithms, PhD thesis, Politecnico di Milano, Italy.

[3] Grove M, et al. 2012. Orbital dynamics, environmental heterogeneity, and the evolution of the
human brain. Intelligence 40: 404-418.

相关专题：世纪人机大战：李世石 VS AlphaGo
转载本文请联系原作者获取授权，同时请注明本文来自谢强科学网博客。
链接地址：https://m.sciencenet.cn/blog-1292052-961753.html

上一篇：昆虫中最特化的翅
下一篇：1996-2015的20年间主要序列分子标记在系统发育重建中的使用简况

收藏分享

hypermarket的个人博客分享 http://blog.sciencenet.cn/u/hypermarket

博文

从生物进化看AlphaGo和人工智能精选

当前推荐数：12 推荐人：姬扬 谢平 王从彦 刘洋 罗会仟 陆俊茜 朱朝东 吕乃基 陈南晖 shenlu crossludo ZYHDZ

该博文允许注册用户评论请点击登录评论 (5 个评论)

谢强

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

hypermarket的个人博客分享 http://blog.sciencenet.cn/u/hypermarket

博文

从生物进化看AlphaGo和人工智能 精选

当前推荐数：12 推荐人： 姬扬 谢平 王从彦 刘洋 罗会仟 陆俊茜 朱朝东 吕乃基 陈南晖 shenlu crossludo ZYHDZ

该博文允许注册用户评论 请点击登录 评论 (5 个评论)

谢强

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

从生物进化看AlphaGo和人工智能精选

当前推荐数：12 推荐人：姬扬谢平王从彦刘洋罗会仟陆俊茜朱朝东吕乃基陈南晖 shenlu crossludo ZYHDZ

该博文允许注册用户评论请点击登录评论 (5 个评论)