Mystic Horse: An Elegant Being分享 http://blog.sciencenet.cn/u/gl6866 中国社会科学院哲学研究所研究员

博文

机器战胜围棋世界冠军的反思 精选

已有 6335 次阅读 2016-4-4 13:34 |个人分类:科研备忘|系统分类:论文交流|关键词:学者

一、模拟思想的过程

 

分析哲学家和认知科学家一直在论证,人类大脑类似于计算机句法机器,所有人类的心智活动均可以根据数字计算机过程进行描述。计算机不过就是复杂的机器而已。计算机在处理符号时,仅仅是模拟思想的过程,而非进行思维。人类的认知行为,诸如语义学、从物参照、检索、意义及因果关系,都植根于人类的经验和生活之中。没有生活和经验,这些叙事的元素和知识就都毫无意义。而没有这些叙事元素和知识,句法不过是空动的结构,而非思维本身。但有谁能意识到这一点?

 

二、“三无”机器

 

计算机傻得很,也就是是说,计算机赢了世界冠军,赢在了会做加法上。1920枚CPU,280枚GPU,全部用来做加法。人脑可不仅仅只会做加法,因此,机器的任务很单一。当然,现在图灵机的模式面临被打破的危险,例如,IBM研发的TrueNorth芯片。未来是个什么样子,还很难预料。从目前来看机器所处理的都是就句法层面的符号。因此,机器只有智能没有智慧;只有计算没有算计;只有客观没有主观。这些都是不同的理念。不能放在同一层面讨论。机器之所以能战胜人,在于其强大的计算能力和算法功能,而非其他。但人下棋更多地需要的是直觉、整体把握和心理素质等诸多主观因素。机器无须考虑这些。而围棋主要讲求的就是优胜劣汰。但问题是搞人工智能的专家能从这个角度进行反思吗?他们自然知道这个道理,可普通民众呢?我对此并不乐观。从70年前阿西莫夫提出的四条机器人原则在实践中没有任何效果。因此要从新制定机器人伦理。

 

三、人类自身进行反思

 

由于机器战胜了围棋的世界冠军,让人们为人工智能的成就产生了癫狂的“错觉”,不过还是有专家认为,现在的AlphaGo不过是处于弱人工智能(WAI)水平,认为1、机器达不到人类能力;2.机器没有自己意志;3.机器不会异化;4.机器打不过人类;5.人类可以驯化机器。都是从机器这方面去强调,我并不认为是全面的。毕竟,机器不过是一种人造物。可是,1、人类可以利用机器延伸他们的能力,从而干出令人不可理喻的事情,这在历史上已不鲜见;2、人类可以用自己的意志让机器发挥更大的作用,从这次机器和围棋冠军的对决中,体现的很明显;3、说机器不会异化,这本身就是一种幼稚的说法。实际上,人类早已被机器异化了;4、更可笑的是,机器打不过人类,但却没有想一下,人类却可以利用机器打败他的同类,此类例子不胜枚举;5、人类可以训化机器不假,从这次机器胜人就可以说明,机器是人类驯化出来的结果。但是否想过,人类可以同样利用机器驯化他的同类?我想这是不言而喻的。人们总是从机器的角度进行考虑,而没从人类自身进行反思。


四、进入人文的领域

 

这次人机大战的另一特色是机器放弃了暴力搜索,开发出蒙特卡洛树搜索、神经网络,还有策略网络(policy network)和价值网络(value network)。策略网络策略网络负责选择下一步的走法,会根据棋局看在哪里应该布子,会在下子后分析对手会怎样想,下一步该怎么走。价值网络负责评估盘面的优劣,目前局势是好、是坏,并进行数值性的估计。人工智能发展了后天学习的能力,至于策略价值,分明已经超越科技的范畴,进入人文的领域,这是价值对多种可能性的选择,是人文对科技的选择。世界3通过策略网络和价值网络与世界2和世界1产生了某种程度的结合。从另一个角度看,是从因果决定到目的引导,前者提供事实和规律,提供有根有据可能的多个选项,后者在目的的引导下进行搜索、决策和行动。目的,一定属于某个个体;目的,一定嵌入于特定语境之中。这就是策略网络价值网络。于是,非嵌入的客观知识,世界3,回到现实,与世界1和世界2相结合。这就是下向因果关系。在阿尔法步步前行之时,在其身后的不仅是DeepMind与谷歌的胜利成果,还有西方科技的优越在其中。60年的时间,战胜了4000年的围棋。说明了什么?

 

五、不讲棋风,只讲输赢

 

阿尔法与围棋则大相径庭。阿尔法可以说是浸润于西方文化之中的纯粹的科技,而围棋则是浸润于中国传统文化中的国粹,充满“不可理喻”的意会知识,诸如大局观、美学,有妖刀、飘逸、僵尸,宇宙流等各种“棋风”,进而通过“手谈”来识人和做人。二种文化  西方文化全面渗入中国文化,以诠释往日的大局观、感觉、如诗如画的双飞燕,以及神鬼莫测的悟性,不过是科技,是算法,是程序。阿尔法有属于它自己的“棋风”吗?是厚实,还是轻灵;是捞取实地,还是外势为重?在我看来,它无所谓棋风,不在乎强弱,就是若干套程序,以不变应万变,与阿尔法对弈的无所谓是樊麾、李世石,还是柯洁。唯一可以看得出的一点或许是,遇强则强,遇弱则弱,不求最优,确保赢棋即可,这一点倒有点像中国文化的实用主义。

 

六、清除人类污染

 

赛后,DeepMind甚至打算删除阿尔法中所有人类棋谱,不接受人类先入之见,排除人类思维的“污染”从零开始,从智慧的源头掌握并提高棋力。阿尔法让人们意识到,这些基于有限计算力提炼出的如难以把握的“形”之类的“规律”,未必都是准确的。当计算力有了巨大提升,再加上适当的思考方法,人工智能有可能找到新的规律。我们对世界的理解,对种种问题的认识和判断,即使千年传承,有可能依然只是盲人摸象。通过这次机器的胜利,DeepMind团队未必不能做到这一点。如果真是能做到这一点,这几千年算是白活了。还有,DeepMind也在准备和另一款非常困难的计算机网游进行对决,那就不是像围棋那么简单了,而是与世界上同时在网上的玩儿家进行对决。

 

七、机器人伦理

   

阿西莫夫提出他著名的机器人三(四)定律,来保证机器人会友善待人。虽然最早提出时这只是个文学手法,但是有些人认为这些定律是现成的方案,能挽救我们免于机器末日。那么,阿西莫夫的安保措施成功经历了时间的考验吗?专家的回答是,没有。阿西莫夫预想的机器人过不了多久就会实现。但是在他大部分小说里,看起来人类级别的机器人好像就是机器人学和AI工程的顶峰了。事实看起来并非如此。在抵达阿西莫夫式类人机器人之后,很快超人AI也会成为可能。典型的阿西莫夫未来里,大部分生活都如常——只不过多了些人形智能机器人走来走去而已。但这种未来不太可能实现——或者就算是它实现了,也只会存在很短的时间对人类来说最主要的问题,不是一大群半智能人形机器人所需的道德规范,而是高阶人工智能最终会出现(不管有没有躯体),其功能远远超过人类水平。人类早晚必须要跨过超级智能这个坎。这也是为何开发安保措施如此重要。机器人、仿生人、模拟大脑什么的都无关紧要,我们最多和它们相处一二十年,之后就要面对真正的大问题——为超级智能开发伦理道德。英国剑桥大学物理学家霍金几乎可以肯定,某种重大技术灾难将在未来1000年到10000年间威胁人类生存。特斯拉电动汽车公司与SpaceX老板马斯克也担心人工智能崛起,并将研发人工智能比作“召唤恶魔”。



https://m.sciencenet.cn/blog-105489-967751.html

上一篇:门与窗的选择
下一篇:从小到大与从大到小

9 武夷山 周雁翎 郑永军 姬扬 黄永义 姚小鸥 周可真 文克玲 xiyouxiyou

发表评论 评论 (40 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-27 21:57

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部