黠之大者分享 http://blog.sciencenet.cn/u/pkusjcer 计算传播学

博文

读Holland的《涌现》

已有 7231 次阅读 2009-10-14 18:23 |系统分类:科研笔记|关键词:学者

霍兰这本《涌现》立意很高,表达却很模糊。有的书对于有的人来说,必须天马行空的去读。 ——易黠 引言 经典的对于涌现的阐述是蚁群行动,白蚁个体之间通过内部耦合达到集体的一致性。 钟表的启示,组成钟表的零件和机械原理早已明了,然而钟表的发明的历史很短。霍兰想表达的是什么?钟表的发明也是一个涌现的过程吗?零件和机械原理必须发生交互作用,才可能涌现出钟表的发明,这就是发明家的功劳了,我的这个解释或许是最形而上的了。 高斯分布,个体间的分布或许不是正态的,但宏观变现为正态分布,这是被大数定律所保证的。有了大数定律,统计学才堂而皇之地走出艺术的大门。在这里涉及到统计学的基本假设,我还不是太清楚,比如说独立同分布假设,各个个体是独立的,其分布是独立的,这在现实中必然被诘问。 蝴蝶的翅膀引起的飓风与天气预报,实用主义的思维方法,立足现在,而不是遥远的过去。混沌学的东西在遭遇到这种处理方法之后遭到重创。我们不必去追寻上帝创立宇宙的初始状态的情况,只要根据现在的状态行事即可。类型化的思维方式的帮助也很大,把气流的运动总结为锋面等研究对象,简化了处理的方法。 入题 霍兰分析思路是从神经网络和跳棋中开始的。国际象棋在编程中要考虑每一步之间的相互关系,牵一发而动全身。确定现在的状态和以后的遍历树,之后就可以确定策略。讲跳棋的时候必然涉及到人工智能和重要分子机器学习,学习理论现在得到了长足的发展,徐雷认为学习理论是三对反问题的求解,就是抓主要矛盾,主要结构。霍兰的工作指出这种学习不能立刻得到反馈,跳棋的复杂性是由少数的规则和程序生长出来的。这都没什么新意。 神经网络里讲到赫布定律,即突出依据一些局部事件改变权重,也就是反馈的效果,类似于肌肉经过锻炼而增强。关于神经网络的一个好玩的问题是记忆是如何成为可能的?最基本的假设是环形神经网络的存在。 涌现与非线性的例子还是蚂蚁之间耦合的相互作用的例子。 之后讲受限生成过程,是结合元胞自动机的例子展开的,例如康韦自动机中的滑翔机的现象。指出涌现的三个特征:1、由简单的转换函数生成;2、以交互作用为中心;3、稳定的涌现是复杂涌现的组成部分。之后展开了跳棋和神经网络中的受限生成机制,后面介绍了一点复制猫的东西。 变易一章讲到遗传算法,提出对涌现的进一步理解,即受限生成过程中的机制既能够改变相互作用网络的路径,又能够改变作为网络结点的机制,在易变更的主体网络中国尤其易于产生涌现现象。之后,隐约而朦胧的讨论描述的层次的问题,一个层次的规律可以约束另一个层次的规律,例如原子物理层次的规律约定了元素的化学层次的规律。这和集智俱乐部讨论的观察者问题有点联系,jake等认为人类更易于认识宏观层次的特征,而对于微观层次的问题无能为力。而我们对不同层次上来看世界得到的结果是不同的,例如站在不同高度上来描述地球的形态或者海岸线。复杂性正产生于不同层次间观察结果的断裂,从宏观上看事物总是会忽略很多微观的细节,这些微观细节就是涌现产生的机制之所在。 康韦自动机的例子表明宏观描述使现象模糊,这些现象在更基本的层次上很容易解释。然而,正是宏观描述和宏观规律揭示了涌现现象的本质。滑翔机的本质在于其在没有干涉的情况下,以一定速率沿对角线在空间运动,这种宏观上类似自然运动的表象是又微观受限生成机制决定的。再比如,科学家遇到原子能问题时,必须放弃化学宏观规律,通常机制改变将问题还原为更基本的层次。通常我们描述观察规律时,经常提高一个层次,虽也满足微观机制的约束,但往往通过附加条件使之可以推演,还原的本质在于当这些条件、假设不成立时,我们必须回到微观机制中来。提到层次的概念就不能回避HLM,自从Robinson effect在1950年提出生态谬误概念以来,经典统计学都试图解决这个问题,其方法也无非是综合分析变量在不同层次上的作用。通过这种处理,可以解决阶层组内相关的问题,被一些人认为可以用来弥补抽样不满足随机性的问题(邱皓政,2006),但其类似修补式的处理具有很强的机械性,它仍然会面对很多的argue。 微观的受限生成机制是很重要的。达尔文成功的原因是因为他把收集到的事实纳入了莱尔lyell的地质学理论的框架,使其结论令人信服;而他的祖父Erasmus虽同样富有想象力和洞察力,却没有成功。 但是,过于强调机械化的过程,将忽略想象力和创造力。源模型选定后,就要把源模型转化为目标模型,这需要想象力的指引,霍兰认为一个很重要的方式是隐喻,它可以对特征进行选择、强调、压缩、重组,使思维在不同类的事物间进行转换。隐喻可以指出源模型和目标模型相对应的元素。当然,这种隐喻的使用前提是你经过科学训练,例如钢琴师只有经过长期训练,才能将注意力放在音乐的流畅程度,而不是弹钢琴的指法上。 结题 霍兰归纳了八点: 涌现现象出现在生成系统中;整体大于各部分之和;组成部分不断改变的稳定模式(如驻波中的水分子不断被替换、有机体的细胞的新陈代谢的替换、棋子位置的变化);涌现的稳定模式的功能由环境决定;涌现出的稳定模式间的相互作用带来的约束和检验增强系统功能;稳定模式通常满足宏观规律;不同模式的稳定性的差别来源于背后的机制;更高层次的涌现可以由稳定模式的加强而产生(例如,眼睛是如何产生的问题)。 有必要了解下还原论,这是关于还原论的介绍:http://baike.baidu.com/view/144808.htm 。霍兰所采取的看待涌现的方法自然是还原方法,但不是简单的还原论,而是受限生成机制约束下的还原方法。这其实是还原论面对整体论的折衷。 进一步了解涌现的研究情况,可参考 http://en.wikipedia.org/wiki/Emergence 。涌现背后的机制和生态谬误的关系是怎样的?一方面,xieyu说经典统计给定一个变量的一个共同的系数,其实每个人的这个变量的系数是不一样的,这是经典统计模型最大的问题,即忽略了一部分个体层面的信息。而这种忽略和混淆不同层次的变量的生态谬误是有共同点的。现在的复杂网络的研究发现了一些宏观上的涌现现象的存在,例如均匀的小世界网络和不均匀的无标度网络,后者在宏观上所表现出来的幂律分布和经由经典的大数定律所支持的正态分布之间的差异,促使人们离开宏观的层次,回到微观的层次;另一方面,很多经典统计算法所要求的独立性在一个存在频繁耦合作用的群体里面是不能得到保证的。对个体的互动机制和个体变量的系数的关注将有助于找到从个体到复杂网络的涌现的根源。 在经典统计模型的构建中秩序的出现似乎也是一种涌现,我们在寻找到一个变量的非线性的函数形式之前,整个模型的显著性都不太好,替换为非线性的函数形式之后,显著性在宏观层面上出现;在寻找相乘项或者交互项的时候也存在这种情况。 模型变量选择的过程同样要考虑这种变量间相互控制或者说耦合的作用:控制变量同时也会被验证变量控制;控制变量模型、验证变量模型、完整模型是所得到的东西是不一样的。(完整模型中的一个控制变量的函数形式找到之后,验证变量可能变得不再显著,这个问题如何处理?) 对于取舍变量,lixiaoxu老师的看法是要报告单个变量的置信区间,这个在spss里不知该如何操作。lixiaoxu指出过度拟合概念是不严格的,通常指自由度不足的情况。这也是值得思考的,不应该从这个角度质疑年龄的立方的函数形式,还是应该回归到社会意义中去解读。

读书荐书
https://m.sciencenet.cn/blog-286054-262360.html

上一篇:资本的代际传递——兼谈语言和生活方式
下一篇:社会计算:一个过于乐观的思路

1 艾云灿

发表评论 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-2 19:24

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部