科学网

 找回密码
  注册

tag 标签: 神经网络

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

人工神经网络简介
热度 4 Jeppeyu 2013-6-6 14:06
最近在研究Deep Learning在个性化推荐中的应用,由于DL跟神经网络有很大的关系,索性开篇就介绍下神经网络和自己所了解到的知识。接触ML时间不是很长,难免有描述不当的地方,旨在于交流学习,有啥想法直接后面回复。 在这篇博文中,你将会看到如下知识: 神经网络的基本模型,前向神经网络(Feed-forward neural network),General Feed-forward NN 的组件,优化目标函数,逆向误差传播算法。 “ 根据一个简化的统计,人脑由百亿条神经组成 ― 每条神经平均连结到其它几千条神经。通过这种连结方式,神经可以收发不同数量的能量。神经的一个非常重要的功能是它们对能量的接受并不是立即作出响应,而 是将它们累加起来,当这个累加的总和达到某个临界阈值时,它们将它们自己的那部分能量发送给其它的神经。大脑通过调节这些连结的数目和强度进行学习。尽管 这是个生物行为的简化描述。但同样可以充分有力地被看作是神经网络的模型。 ” 人的大脑是非常复杂的,特别是大脑神经系统,可以说没有它,大脑就是一些组织,细胞而已。在机器学习领域,对神经网络的研究应该是希望从大脑的工作机制和神经系统结构中获得启发,一方面可以设计高效的学习算法,让机器也能够对问题进行大规模学习,另一方面可以从神经元的并行工作方式中得到启发,设计高效的并行计算算法,让机器拥有更强的实时处理大规模数据的能力。 在这里就不介绍生物上的神经网络了,一来是不懂,二来这里的神经网络一概指 机器学习领域的神经网络模型(人工神经网络),如果你对这个生物的神经网络感兴趣的话,可以参考 《A Brief Introduction to Neural Networks · D. Kriesel》 ,这篇文章有讲到不同类型的神经网络,大多数跟生物神经系统的基本结构有关系。在机器学习领域的神经网络一般会指 前向传播神经网络 (Feed-forward neural network),这种模型较为通用。 人工神经网络的基本模型 前向神经网络 上图描述的是一个目前研究最为成熟Shallow 结构的神经网络(只含有单层隐藏层神经元的结构)。第一层为输入层 (input layer ),第二层称为隐藏层 ( hidden layer ),最后一层为输出层( output layer )。神经元之间都是由低层出发,终止于高层神经元的一条有向边进行连接,每条边都有自己的权重。每个神经元都是一个计算单元,如在Feed-forward neural network 中,除输入层神经元外,每个神经元为一个计算单元,可以通过一个计算函数 f() 来表示,函数的具体形式可以自己定义,现在用的较多的是 感知器计算神经元,如果你对感知器有所了解的话,理解起来会容易很多。 可以计算此时神经元所具有的能量值,当该值超过一定阀值的时候神经元的状态就会发生改变,神经元只有两种状态,激活或未激活。在实际的人工神经网络中,一般是用一种概率的方式去表示神经元是否处于激活状态,可以用 h(f) 来表示,f 代表神经元的能量值,h(f) 代表该能量值使得神经元的状态发生改变的概率有多大,能量值越大,处于激活状态的概率就越高。到这部分你已经接触到了关于神经网络的几个基本术语,下面用更加规范的符号来表示,神经元的激活值(activations) f() ,表示计算神经元的能量值, 神经元的激活状态 h(f) ,h 表示激活函数。 激活函数有好几种形式,这里列举两种, General Feed-forward NN 的组件 假设有 包涵有N个样本的数据集 = { (X1,T1) , (X2,T2) , (X3,T3)...... (Xn,Tn)} ,其中T的取值可以根据你的任务不同而不同,比如你要用神经网络进行回归分析,T ( target value)就是一个连续值,如果你面对的是一个回归问题的话,T 的取值就是离散的,比如二分类问题 T = { 0,1 },输入样本的每个观测值(Observation) Xi 都具有相同的维度数量 m ,与之对应的输入层的神经元个数也为 (m + 1)个,包含有一个偏置神经元( bais unit )。 这里采用了Andrew Ng的 Deep Learning tutorials 上的符号系统。n l表示神经网络具有的总层数, 表示最后一层神经网络,下标就是表示第几层,L 1 表示第一层,也就是输入层。低层与高层的神经元之间都是通过带权重的单向边进行连接,(W,b)表示整个神经网络中的参数,W 表示连边的权重,b表示偏置。在上图中(W,b) = (W (1) ,b (1) ,W (2) ,b (2) ),上角标表示第 i 层与(i + 1)层之间的权重系数矩阵(如无特殊说明,下文中的上角标都表示层号,当然对于系数矩阵和神经元来说,上角标的意思是不太一样的), 表示第L层的第 j 个神经元与第 L + 1 层的第 i 个神经元之间的权重系数。在上图的例子中 , 。 该部分采用向量化的表述方式,这个为后面的向量化编程会带来非常大的好处,不用一个一个的去记哪个跟哪个权重系数对应,直接一个矩阵,非常简洁。整个神经网络可以用一个函数 h W,b (x) 来表示。 接着来看下跟每个神经元都相关的符号, 表示第L层的第i个神经元的激活状态(activations),该过程是非线性操作,这个概念非常重要,要牢记。当L = 1的时候,可以认为 就是等于输入神经元的值, 表示该神经元具有的能量值。 到此为止,你已经可以掌握一个神经网络中的基本符号和表示方法,尽快熟悉这些符号,在你的脑子里面神经网络已经不再是抽象的神经元之间的连接方式了,可以通过上述的符号来刻画,这对后面公式的理解会有很大的帮助。 下面来看下神经网络的基本成分( neural network components) 对线性模型 (Linear Model ) 比较了解的人应该非常熟悉这个公式 线性模型可以表示成有限个基函数(basis function)的线性融合,基函数 的形式可以自己定义,举个简单的例子, 可以是关于输入 m 次幂的多项式 x^m(顺便吐槽一下,这里敲公式实在麻烦)。实际上神经网络也可以看成是一些线性函数的叠加,不过中间有了一个激活函数,情况就变得跟线性模型不一样了。还是以FNN(Feed-forward Neural Network)为例对除输入层之外的每个神经元进行 的操作就可以得到神经元的能量值,每个神经元的激活状态就可以表示成 ( 非线性操作 ) ,下面对整个网络进行同样的操作就可以得到 上述过程的向量化表示,这里的f和h函数就都变成了向量函数,如 f( ) = 到该部分,你已经基本掌握了一个神经网络的结构,如何执行得到输出,但是还差如何去训练得到我们的参数 (W,b)。上面都是以单隐藏层的神经网络而且输出只有一个神经元,如果你知道了如何去训练这个简易的神经网络,那下面这个看起来更复杂一些的例子你同样知道该如何去训练。 优化目标函数 这个是在用机器学习方式为问题建模的第二部,确定你的损失函数(Loss Function),也就是你的优化目标。该过程会涉及到一些基本的优化方法,统计学概念以及一些实际的应用经验。当然如果你跟我一样是刚接触机器学习(Machine Learning)不久的话,了解了一些关于梯度优化方法的话,你就能掌控这里的一切啦。 假设我们有m个样本 ,这里采用的是二次平方和最小化 (最小二乘)作为损失函数(关于损失函数的类型可以参考《统计学习方法》- 李航) ,用该公式表示损失函数 ,在实际优化目标函数需要表示成如下形式,比上面的公式多了一个 +好后面的内容,该项也称作 weight decay,该部分是起正则作用,防止过拟合。 之所以采用二次损失函数,我想应该是为了构建一个具有 convex 性质的目标函数,便于使用梯度优化的方法寻找最优值。下图就是在参数(w,b)下的误差曲面(error surface)。 下面公式表示了权重系数更新的方式,也就是为了找到一个使得目标函数最小值的系数 (w,b) 。在整个优化的过程中,最重要的就是如何求解不同 的梯度信息,为了求解这个东西,又要来一个新的概念了,逆误差传播(error backpropagation)学习算法。机器学习的问题总是会这样,找到优化目标以后,就需要相应的学习算法寻找最优值,此时的系数就是我们所要选择的模型的参数了。 逆向误差传播算法 (error backpropagation) 如其名,该方法就是让输出层的y 与 输入 x 的误差往回传播。因为我们在求每个参数的梯度的时候是通过对真值与预测值之间的误差项求导得到的,对于输出神经元还可以做到,但是我们无法获取隐藏层的真值,这就造成了隐藏层的神经元梯度不可求的尴尬局面。还好领域大牛们想到了这种方式,让输出层的误差往回传播,计算出底层神经元的激活状态要为该误差付出多大的责任,也可以理解成该神经元的误差值,用 表示, 表示输出层神经元的误差。 逆误差传播算法执行过程: 1,先执行一次前向传播,计算出每一层的神经元的激活值 ,直到输出层为止 2,对于每一个输出层神经元,采用如下方式计算误差(实际上在Andrew的资料中省略了很多推到部分,该部分我后面会放上,你们先理解个大概过程) 3,对于较低层的神经元的误差用如下公式进行表示, 4,关于不同参数的梯度 下面来看下 项的具体推导过程。 PS:其实要想更好的理解该推导过程可以参考《Pattern Recognition and Machine Learning》中5.3节部分关于估计误差函数梯度的内容,由于里面采用的符号系统跟Andrew的是相反的,我就没有放上来,借用了一个简易的推导过程。 摘自《Deep Learning 教程中文版》--邓侃老师主导,各路英雄好汉共同翻译 下面来看一个利用神经网络拟合不同函数(Linear Regression)的例子,你可以在《Pattern Recognition and Machine Learning》的5.1节中找到。4副图分别对应四个不同的函数,红色的实线表示利用神经网络拟合的函数,圆点表示原函数生成的样本点,虚线表示不同的神经元在对应于不同 x 取值的输出值,几条虚线经过线性添加后得到的就是拟合后的曲线。 总结: 1,简易的神经网络结构并不复杂,但在实际训练一个神经网络的时候是会遇见很多问题的,比如 选择线上梯度下降还是Batch梯度下降 ,隐藏层神经元个数的选择, 是选择多层神经网络还是单层。这些都需要多多实践才行。 2,从理论上来讲,神经网络是可以拟合任何函数,但实际上并非如此。就我个人的实际经验来看,对于某些数据神经网络是失败的。 3,模型不是万能,还需要做很多功课。 #梯度信息在训练 NN 中的使用 #Batch 梯度上升和线上梯度上升的比较 理解了该部分的神经网络知识对后面理解深度神经网络会很大帮助,包括其中的优化方法,能量模型(Energy-based Model),以及RBM(EBM的一个特例) 参考文献: 《Pattern Recognition and Machine Learning》 Andrew Ng's Wiki Page http://deeplearning.stanford.edu/wiki/index.php/Neural_Networks http://www.cppblog.com/billhsu/archive/2008/08/30/60455.html Geoff Hinton's Coursera Lectures https://d396qusza40orc.cloudfront.net/neuralnets/lecture_slides%2Flec1.pdf
个人分类: 机器学习|35604 次阅读|8 个评论
对一篇文章的答复(1)(先附上原文)
wangxinhe1212 2011-5-29 16:51
有人给我一篇文章交流。大致就是从 EPR 佯谬、全息术、脑神经网络等科学问题谈到佛学和中国古代的一些观念,想用上述科学概念和现象佐证它们。原文如下: 在一九八二年时,一件惊人的事发生了。在巴黎大学由物理学家 Alain Aspect 所领导的一组研究人员,他们进行了一项也许会成为二十世纪最重要的实验。你不会在晚间新闻中听到这件事。事实上,如果你没有时常阅读科学期刊,你可能从来没有听过 Aspect 的名字,虽然有些人相信,他们的发现可能会改变科学的面貌。       Aspect 和他的小组发现,在特定的情况下,次原子的粒子们,例如电子,同时向相反方向发射后,在运动时能够彼此互通信息。不管彼此之间的距离多么遥远,不管它们是相隔十尺或十万万里远,它们似乎总是知道相对一方的运动方式,在一方被影响而改变方向时,双方会同时改变方向。这个现象的问题是,它违反了爱因斯坦的理论:没有任何通讯能够超过光速。由于超过了光速就等于是能够打破时间的界线,这个骇人的可能性使一些物理学家试图用复杂的方式解释 Aspect 的发现。但是它也激发了一些更有革命性的解释。例如,伦敦大学的物理学家 David Bohm 相信 Aspect 的发现是意味著客观现实并不存在,尽管宇宙看起来具体而坚实,其实宇宙只是一个幻象,一个巨大而细节丰富的全像摄影相片( Hologram )。      要了解为什么 Bohm 会做出如此惊人的假设,我们必须首先了解什么是全像摄影相片。全像摄影相片是靠雷射做出的一种三度空间立体摄影相片。要制作一张全像摄影相片,物体首先必须用一道雷射光束照射,然后第二道雷射光束与第一道光束的反射产生绕射的图案(两道光束交集的地区),被记录于底片上。底片洗出后,看起来像是无意义的光圈与条纹组合。但是当底片被另一道雷射光束照射时,一个三度空间的立体影像就会出现在底片中(这不同于一般印刷式的所谓全像相片,只有狭窄的角度可见立体影像。真正的全像摄影相片是没有角度限制,而且必须用雷射光才可见影像。)。      影像的立体不是全像摄影唯一特殊之处。如果一朵玫瑰的全像相片被割成两半,然后用雷射照射,会发现每一半都有整个玫瑰的影像。事实上,即使把这一半再分为两半,然后再分下去,每一小块底片中都会包含著一个较小的,但是完整的原来影像。不像平常的相片,全像相片的每一小部份都包含著整体的资料。      全像相片的这种「整体包含于部份中」的性质给予我们一个全新的方式来了解组织与秩序。西方科学的历史多半是基于一种偏见,认为要了解任何事物现象,不管是只青蛙或一阵风暴,最好的方式是分解事物,研究事物的部份。全像摄影教导我们,宇宙中可能有事物不会配合这项假设。如果我们试著把某种全像摄影式结构组成的事物分解开来,我们不会得到部份,而会得到较小的整体。      这项理论使 Bohm 建立了另一种用来了解 Aspect 发现的解释。 Bohm 相信次原子的粒子能够彼此保持联系,而不管它们之间的距离多远,不是因为它们之间来回发射著某种神秘的信号,而是因为它们的分离是一种幻象。他说在现实的某种较深的层次中,如此的粒子不是分离的个体,而是某种更基本相同来源的实际延伸。      为了使人们更容易想像出他的假设, Bohm 提供了以下的描述:想像一个水族箱,里面有一条鱼。也想像你无法直接看到这个水族箱,你对它的了解是来自于两台电视摄影机,一台位于水族箱的正前方,另一台位于侧面。当你看著两台电视监视器时,你可能会认为在两个萤光幕上的鱼是分离的个体。毕竟,由于摄影机是在不同的角度,所得到的影像也会稍有不同。但是当你继续注视这两条鱼时,你会觉察到两者之间有特定的关系。当一条鱼转身时,另一条也会做出稍微不同,但互相配合的转身;当一条面对前方时,另一条会总是面对侧方。如果你没有觉察到整个情况,你可能会做出结论,认为这两条鱼一定是在互相心电感应。但是显然这并非事实。 Bohm 说这正是在 Aspect 实验中的次原子粒子的情况。      根据 Bohm ,次原子粒子之间的超光速连接现象其实是在告诉我们,现实有更深的层次是我们没有觉察到的,一种超过我们空间的更复杂空间,就像那水族箱。而且,他补充,我们会把次原子粒子看成分离的个体,是因为我们只看到它们部份的现实。如此的粒子不是分离的「部份」,而是一种更深沈与更基本整体的片面,这种整体具有全像摄影的结构,就像先前所提到的玫瑰一样无法分割。而且由于现实中的一切都是由这些幻影粒子所组成,于是整个宇宙基本上是一个投影,一个全像式的幻象。      除了这种幻象的性质之外,如此的宇宙也包含著其他更为惊人的特性。如果次原子粒子的表面分离是一种幻象,这表示在现实的更深层次,宇宙中的一切最终都是相互关连的。在人脑中的一个碳原子中的一个电子是连接到太阳表面的一个氢原子中的一个质子,而它们又连接到所有在水中游泳的鲑鱼,所有跳动的心脏,及天上所有星辰的次原子粒子。一切事物都交互贯穿一切事物,而虽然人类的本性是去分类处理宇宙中的种种现象,一切的分类都是必要的假象,而一切的终极本质是一个无破绽的巨网。      在一个全像式的宇宙中,甚至连时间与空间都不再是基本不变的。因为在一个没有分离性的宇宙中,位置的观念会瓦解,时间与三度空间就像电视监视器中的鱼,只是一种更深秩序的投影。这种更深的现实是一种超级的全像式幻象,过去,现在,未来都共同存在于其中。这表示只要有适当的工具,将来有一天会有可能进入这种超级全像式的现实层次中,取出过去古老的影像。      这种超级全像式的宇宙还包含了什么,是一个开放而无解答的问题。为了方便讨论,假设这种超级全像式的结构是宇宙一切事物的由来根源,至少它包括了过去和未来所有存在的次原子粒子 ─ 一切事物和能量的所有可能组合,从雪花到夸粒子,从蓝鲸到加玛射线。它可被视为一种宇宙性的储藏库,包括了所有存在过的一切。虽然 Bohm 承认我们不可能知道在这超级的全像结构中还隐藏了什么,他大胆地说我们没有理由假设它没有包括著更多。如他所言,也许这种超级全像式结构的现实层次只是一道「阶梯」,在它之上还有「无限多的发展」。       Bohm 不是唯一的研究者发现宇宙是一个全像摄影式的幻象。在脑部研究的领域中,史坦福大学的脑神经学家 Karl Pribram 也分别独立地相信现实的全像式本质。       Pribram 研究脑部是如何储存记忆,因而被全像式结构模型所吸引。近几十年来,许多研究显示,记忆的储存不是单独地限于特定的区域,而是分散于整个脑部。在一九二零年代的一连串历史性的实验中,脑部科学家 Karl Lashley 发现不管老鼠脑部的什么部位被割除,都不会影响它的记忆,仍旧能表现手术前所学到的复杂技能。唯一的问题是没有人能提出一套理论来解释这种奇怪的「整体存在于每一部份」的记忆储存本质。      然后在一九六零年代, Pribram 接触到全像摄影的观念,知道他发现了脑神经科学家一直在寻找的解释。 Pribram 相信记忆不是记录在脑神经细胞中,或一群细胞中,而是以神经脉冲的图案横跨整个脑部,就像雷射绕射的图案遍布整个全像摄影的底片上。换句话说, Pribram 相信头脑本身就是一个全像摄影相片。       Pribram 的理论也解释了人类头脑如何能在那么小的空间中储藏那么多的记忆。曾经有人估计人类头脑在人的一生中能够记忆约一百亿位元( bits) 的资料(大约是五套大英百科全书)。相似的,除了其他功能之外,全像摄影也具有惊人的资料储存容量 ─ 只要改变两道雷射照射底片的角度,就可以在同一张底片上记录许多不同的影像。有人示范过,在一公分立方的方块底片上可以储存一百亿位元的资料。      如果脑部是根据全像摄影的原理来操作,我们就比较能了解我们那特殊的能力,能迅速从我们那庞大的记忆仓库中取出所需的任何资料。如果一个朋友要你告诉他,当他说「斑马」这个字时,你会想到什么。你不需要笨拙地搜寻某种巨大的脑部字母档案才能得到一个答案。相反地,一些联想,如「条纹」,「马」,和「非洲野生动物」等会立刻跳入你的脑中。的确,人类思考过程的一项最惊人的特徵是,每一件资料都似乎与其他所有资料相互连接 ─ 这也是全像摄影幻象的另一项基本特性。因为全像摄影幻象的每一部份都与其他部份交互关连著,这也许是大自然交互关连系统的最终极例子。      在 Pribram 的全像式脑部模型的启发下,记忆的储存不只是脑部科学唯一稍获解答的谜。另一项谜题是脑部如何翻译它从感官所得到的大量波动(光波,声波,等等),使之成为我们知觉的具体世界。记录与解读波动正是全像摄影最擅长的。正如全像摄影像是某种镜头,某种传译的工具,能把显然无意义的波动图案转变为连贯的影像, Pribram 相信脑部也有一个镜头,使用全像式原理来数据式地把经由感官收到的波动转变为我们内在知觉的世界。      有大量的证据显示,脑部是使用全像式原理来进行操作。事实上, Pribram 的理论得到了越来越多脑神经学家的支持。阿根廷籍的义大利脑神经研究者 Hugo Zucarelli 最近把全像式模型应用到听觉的世界中。他迷惑于人脑在即使只有一只耳朵有听觉的情况下,也能够不用转头就侦测出声音的来源方向。 Zucarelli 发现全像式原理可以解释这种能力。 Zucarelli 也发展出全像式音响的科技,一种录音的技术,能够几乎真实无误地重新复制出声音现象。       Pribram 相信我们的脑部根据外在波动的输入,以数学方式建立出「坚硬」的现实。这种想法也得到许多实验上的支持。实验发现,我们感官对于波动的敏感度要比我们先前所认为的远为强烈。例如,研究者发现我们的视觉对声波也很敏感,我们的嗅觉是与我们现在称为 oamic 的波动有关,而甚至我们体内的细胞也对很广大范围的波动敏感。如此的发现使我们推论,只有在全像式的知觉领域中,这种波动才能被整理归类为正常的知觉。      但是当 Pribram 的全像式脑部模型与 Bohm 的理论放在一起时,才显现其最令人匪夷所思的地方。因为如果这个世界的坚固只是一种次要的现实,而真正「存在」的是一团全像摄影式的波动,而如果头脑也具有全像式结构,只从这团波动中取出部份的波动,数学式地转换成感官知觉,那么客观现实是什么呢?简单地说,客观现实就停止了存在。正如东方宗教的教义,物质世界是一种 maya ,一种幻象,虽然我们也许以为我们是实质的生物,活在一个实质的世界中,这也是一个幻象。我们其实是漂浮在一个充满波动的大海中的「接收者」,我们从这个大海中抽取出来,并转变成实质世界的波动,只是这个超级全像式幻象的许多波动之一。      这种对于现实的惊人新观点, Bohm 与 Pribram 的合成理论,被称为全像式模型理论( holographic paradigm) ,虽然许多科学家以怀疑的态度看待它,但这个理论风靡了其他人。一小群逐渐增加的研究者相信,这也许是科学到目前为止,关于现实最准确的模型。更有甚者,有些人相信它可以解释许多科学以前未能解释的神秘,甚至使超自然也成为自然的一部份。      许多研究者,包括 Bohm 与 Pribram ,注意到许多超心理学的现象在全像式模型理论下变得较为容易了解。在这个宇宙中,个别的头脑实际上是一个大全像结构的个别部份,而一切都是相互连结的,心电感应其实就是进入了全像式的层次。如果一个分别的个体 A 的意念能够传送到个体 B 的脑中,如果这两个分离的个体原来已经是连接的,这种现象就很容易了解。同样的,以精神力量来移动远处事物的能力( psychokinesis) 也变得比较不神秘,因为在一个具有无限连接的宇宙中,个体与被移动的物体已经是一体的。       Bohm 与 Prigram 也指出,许多宗教或神秘经验,如与宇宙合一的超越体验,或许也是因为进入了全像式领域之中。如他们所言,也许过去许多伟大的神秘体验者所谈论的一种宇宙一体的感觉,只是因为他们知道如何进入他们心灵中一切真正与宇宙合一的那部份。      全像式模型理论也受到其他科学领域的慎重注意。 Stanialav Grof ,马里兰心理研究中心的主任及霍普金斯大学医学院心理学系助理教授,相信全像式模型理论可以解释心理学上许多的无解谜题。 Grof 特别感觉到,全像式模型理论提供了一套模型来了解许多人在知觉转换状态( altered states of consciousness) 中会经验到的怪异现象。      在一九六零年代, Grof 研究使用 LSD (一种迷幻药)做为心理治疗工具的利弊。他有一名女性病人,突然相信她成为了一条史前时代的雌性爬虫。在她的迷幻状态中,她不仅提供了极丰富的详细描述,说明了她被困在这种爬虫身体中的感觉,同时描述了在雄性爬虫身上最具有吸引力的部位是头两侧的一块彩色鳞片区域。使 Grof 惊讶的是虽然那名女人事前没有对这种爬虫的知识,之后他从一位动物学家处得到证实,某些爬虫头部的彩色部位在性的挑逗上的确扮演重要的角色。      那位女人的经验并不独特。在他的研究过程中, Grof 遭遇到的病人们倒退了并代表了几乎在进化史上的所有生物(这个研究发现影响了电影「替换状态」( Altered States ) 中的人退化为猿猴的情节)。还有,他发现如此的经验时常包含了隐晦的动物学细节,而后来证实是正确的。      退化回动物并不是 Grof 研究中唯一令人迷惑的心理现象。他也有病人似乎进入了某种集体的或族群的潜意识中。没有接受多少教育的人突然能详细地描述波斯教的葬礼,和印度教的仪式。在其他的经验中,有人能给予令人信服的灵魂出体报告,或预见未来,或倒退回前世的回忆。      在后来的研究中, Grof 发现在没有使用迷幻药物的治疗会谈中,相同程度的现象也会发生。因为在如此经验中的相同要素是,个体的意识升华超越了平常自我的界限,或时空的限制, Grof 称此现象为「超个人经验」( transpersonal experiences) ,而在六十年代晚期,他创立了心理学的一支,称为「超个人心理学」( transpersonal psychology) ,专注于此类的研究。      虽然 Grof 新创立的超个人心理学得到专业学者的支持,成为受人尊敬的心理学支派,但是这几十年来 Grof 和他的同僚都无法提供一个体系来解释他们所看到了奇异心理现象。但是全像式模型理论的出现改变了情况。如 Grof 最近所言,如果心灵的确是一个整体的一部份,这个整体像一个巨大的迷宫,不仅连接一切心灵,包括过去现在,同时也连接一切原子,一切生物,及时间与空间本身的无限,那么心灵偶尔会涉足于这个迷宫中,产生超个人的经验,就似乎不足为奇了。      全像式模型理论也可以应用到所谓的基础科学 , 如生物学上。维琴尼亚州 Intermont 大学的心理学家 Keith Floyd 指出,如果现实的坚固只是一个全像式的幻象,就不能再说脑部产生意识。而是意识创造了脑部 ─ 以及身体,还有环绕著我们四周的一切,被我们当成实质的世界。      如此对生物结构的观点逆转,使研究者指出医学及我们对于医疗程序的了解也可被全像式模型理论所改变。如果身体的实质结构只不过是意识的全像式投射,那么我们每个人对于自身健康的责任就要超过目前医学知识所容许的。现在我们视之为奇迹式的疾病康复,就可以解释为由于意识的改变,而影响了全像式身体的改变。相同的,令人争议的新医疗技术,如意念的想像,会如此有效,因为在全像式的领域中,意念的影像是与「现实」一样的真实。      甚至在「非寻常现实」( non-ordinary reality) 中的异象与经验,在全像式模型理论之下也成为可以解释。生物学家 Lyall Watson 在他的书「未知事物的礼物」( Gift of Unknown Thing) 中描述他与一位印度尼西亚女巫士的接触,她藉著表演一种仪式舞蹈,能够使一整排树瞬间消失在空气中。 Watson 说他和惊讶的旁观者继续观看女巫士,她使树群重新出现,然后又消失,又出现了好几次。虽然目前的科学无法解释如此的事件,但是如果「坚硬」的现实只是全像式的投影,如此的经验就有理可循。也许我们同意什么是「存在」或「不存在」的,只是因为我们所谓共识下的现实,是架构于人类的潜意识中一切心灵都相互连接的领域。      如果这是真实的,这会是全像式模型理论中最重要的意义所在,因为这表示如 Watson 的经验之所以是不寻常的,只是因为我们没有设计我们的心灵来相信如此经验是真实的。在全像式的宇宙中,我们改变现实结构的可能是无止尽的。我们所知觉的现实只是一幅画布,等待我们著手画任何我们想要的图画。任何事都有可能,从用意念的力量来弯曲汤匙,到人类学家 Castaneda 与亚奎印地安巫士 Don Juan 的奇幻经验。因为魔术是我们的天生权利,并不比我们在梦中创造现实的作法更为神奇。      的确,甚至连我们对现实最基本的看法都成为可疑的,因为在一个全像式的宇宙中,如 Pribram 指出,甚至连随机偶发的事件都可视为是根据全像式原理,因此是经过安排的。同步的或有意义的巧合都不是意外,而现实的一切都可视为一种隐喻,因为连最偶然的事件都隐藏著某种平衡。      不管 Bohm 和 Pribram 的全像式模型理论会被科学界接受,或不名誉地消逝,这还要拭目以待,但是可以确定的是,它已经对于许多科学家的思考产生了影响。就算将来可能发现全像式模型理论并不足以解释次原子粒子之间的瞬间通讯现象,至少,如伦敦 Birbeck 大学的物理学家 Basil Hiley 所言, Aspect 的发现显示我们「必须准备对现实采取革命性的新观点」。         续 作者匿名      超距作用是指在两个 同谋 粒子间,无论互相距离多远,只要改变其中一个粒子的状态,另一个粒子的状态也会立即改变。这种现象早先在 ERP 佯谬 ( EPR paradox ) 思想实现中被提出,于 1982 年由法国物理学家阿斯派克特 ( Alain Aspect ) 的实验首次证实。对此结果人们首先想到的解释是爱因斯坦的光速不变定律被打破了,超光速是存在的。但同谋粒子间互动的即时性和距离无关性仍使人们深深困惑 : 难道两个粒子还能知道彼此的距离并随时调整信息的传播速度 ? 这时,物理学家大卫 . 玻姆 ( David Bohm 1917-1992 ) 给出了独到的解释。       David Bohm 是现代全息理论之父。什么叫全息呢 ? 比如一张照片,里面有一个人像 ; 如果我们把这照片切成两半,从任何一半中我们都能看到原先完整的人像 ; 如果我们再把它撕成许多许多的碎片,我们仍能从每块小碎片中看到完整的影像。这样的照片就叫全息照片。全息论的核心思想是,宇宙是一个不可分割的、各部分之间紧密关联的整体,任何一个部分都包含整体的信息。全息理论很好地解释了超距作用的原理。为了便于理解,玻姆用 “ 鱼缸里的鱼 ” 来做比喻 : 在一个长方体玻璃鱼缸中放进一条鱼,两台相互垂直的摄像机 观察 鱼的活动,图象直接在两台电视机上播放出来。在电视机里我们可以看到, 两 条鱼分别作着方向相反、速度相等的游动。如果其中一条鱼的状态改变了,另一条鱼的状态也立即随之改变。玻姆以此展开对超距作用的解释 : 两个同谋粒子应当被视为同一六维现实的两个不同的三维投影,在三维空间看来,二者没有相互接触,毫无因果关联 ; 而实际情况是,两个粒子之间相互关联的方式,非常类似于上面所说的鱼的两个电视图像之间相互关联的方式。因此普遍地说,隐秩序必须被扩展到一个高维现实,这个高维原则上是不可分割的整体,其包含整个具有其全部 ‘ 场 ’ 和 ‘ 粒子 ’ 的整体宇宙。于是我们必须说,全运动在高维空间中卷入与展出,其维数实际上是无限的。 ” 在玻姆所构想的宇宙的本体论图景中,宇宙真空的高维隐秩序被激发而展开和投影为三维物质世界的显秩序,而这种物质显秩序又不断卷入为宇宙真空中的隐秩序。用简单的话说,就是我们肉眼直接可见的三维物质世界的独立个体,实际上是更高维整体的一个投映,我们由于不能理解更高维度的整体性而误以为我们所看到的一个个人或物是独立的个体。      为了更进一步说明,我们不妨设想一种二维世界的生物,他们所能感知和理解的都仅限于二维世界。同样是上文的那个鱼缸 , 假设有六个二维生物分别处于鱼缸的六个面观察描述鱼的运动。当然,他们不能像三维生物那样,从鱼缸的一个面直接 到另一个面,他们只能沿着鱼缸的表面,从一个面 到另一个面。而且他们感觉不到自己绕了圈子,在他们看来从鱼缸任一面到其它面的空间是平坦的,他们所选择的是最短距离路线。而他们在相距那么远的六个地方所分别看到的鱼,理所当然的,是六条不同的鱼。然后他们发现,在某两个位置观察到的两条鱼之间存在着超距作用 : 其中一条鱼向某个方向游时,另一条鱼就向反方向游 ; 当他们对鱼施加影响,使其中一条鱼突然改变运动状态时,另一条鱼也立即改变运动状态。它们之间似乎有某种看不见的联系。二维生物对此百思不得其解,正在困惑之时,一位能直接看到三维事物的智者 ( 二维生物可能把他称作 : 佛 ) ,出现了。智者决定告诉他们真相,但苦于二维生物无法理解三维事物,所以只能把真相转换成二维世界的语言来表达。智者甚至不能使用 正面 、 背面 、 上面 、 下面 这样的词,因为这实际上已经引入了第三维。对于二维生物来说,虽然 上 、 下 、 左 、 右 这样的概念是可理解的,但这些仅限于二维的 面 中。 面 就是他们所能感知的全部空间,在他们看来,所有空间都是平坦的,诸如 正空间 、 反空间 、 上空间 、 下空间 、 转折的空间 等概念是无法理解的。于是智者只好说 : 你们虽然在不同的地方看到了很多条鱼,但其实那些都是假象,真实的情况 ( 实相 ) 是,鱼只有一条。 在描述鱼的运动时,由于智者不能直接使用三维的语言,为了不以偏盖全,又必须兼顾六个面的观测结果。于是智者说道 : 鱼既是向左游的,又是向右游的 ; 既不是向左游的,又不是向右游的 ; 既是向上游的,又是向下游的 ; 既不是向上游的,又不是向下游的 . 这样的表述让二维生物听得一头雾水,不知所云。但智者也确实没有更好的表达方法。有较聪明的二维生物追问 : 你说的这些既是 ...... 又是 ...... 既不是 ...... 又不是都只是假像吧 ? 真相到底是怎样的 ? 智者只好回答 : 不可说,不可说 。意思是三维的事物是无法用二维的语言准确表达的。            把上面的论述推广应用于三维世界生物,不难发现人类理解和表达更高维度事物存在着同样的困难。准确地说,人类所处的世界并不是三维的,只是人类所能直接感知的领域被局限于三维而已。比如人类对于想象一个六维的物体 ( 注意 : 不是六面体 ) 是无能为力的 ( 科学家说如果能想象出来的,肯定不是地球人 :) ) 。       David Bohm 不仅用他的理论来解释量子跃迁与 EPR 关联等量子力学现象,而且用它来解释宇宙的演化和人类意识等一系列科学与哲学难题。事实上,玻姆本人在发明全息技术前已对佛教华严宗理论有着非常深的造诣,其全息理论正是《华严经》 于一微尘中,悉见诸世界 一句的极好印证。下面笔者就试运用这种理论来揭开东方宗教神秘面纱的一角 :      一、得道高人们的 不可说 境界   所谓 不可说 ,实非没有东西可说,而是高维度的现象无法用低维度的语言文字表达。但如果认为高维度的现象绝对无法表达则是错误的。如同二维生物的语言无法描述三维,但三维生物自己的语言则能准确描述三维世界一样,更高维度的生命绝对可能拥有描述高维度现象的语言。这种语言,准确地说应叫做信息载体,是三维生物难以想象的。比如拈花微笑的典故中 , 佛祖拈花示众,众皆默然,唯迦叶尊者破颜微笑,于是佛祖就将衣钵传给了迦叶。有人会想,佛祖怎么知道迦叶确实理解了他的意思 ? 也许是瞎猫撞到死老鼠也说不定呢 ? 禅宗这种择徒传法的方式也太不严谨了吧 ? 实际上,佛祖并非只是做了一个拈花的动作而已,他同时还向在场众人发出了一条信息,而只有迦叶能接收并解码这条信息,所以迦叶破颜微笑了。佛祖说禅宗 以心传心,不立文字 ,注意一个 字,这表明有三种可能 : 1) 心与心之间传递信息需要一种载体。这种载体是什么呢 ? 就是高维度的语言。禅悟被称为顿法,就是因为它抛弃了低维度的语言文字,直接以高维度的语言作为教学工具,所以它能直契本源、速超胜地就不足为奇了。 2) 禅不需通过媒体,而直接利用超距作用传授。 3) 以上两种方法并用。      二、神   为方便起见,以下把神、仙、佛等都统称为神。神实际上是一种高维度的生命体,一 神和一 人在数量级上有着极大的差距。某科幻小说对此有段精彩的比喻 : 一个人死后见到了神,他问神 : 你是一个吗 ? ,神说,我难以回答你这个问题,就如一个单细胞的绿藻问一头有上亿细胞的大鲸 : 你是一个吗 ? ,大鲸该怎么回答它呢 ? 神的分身和化身能力亦可由此得到解释 : 把神想象成一个超高维度的生命体,则其千千万万的分身和化身就是其本体在不同的三维空间上的投影 ; 三维空间对于三维生命体来说就是全部,但对于更高维度的生命体来说只是高维度空间的一个 面 ,就如同三维立方体的一个二维平面一样。在高维度的层次上看,神的分身只是一个投影,是虚幻不实的 ; 但对三维生命体来说,每个分身都是绝对真实的。      神也有高下之分,不同层次的神处于不同的维度,他们的神通能力和分身化身的个数与其所处维度数成正比。低维度的神也很难理解高维度的神,就象二维生物难以理解三维世界一样。《法华经》云 : 诸佛智慧,甚深无量,其智慧门,难解难入,一切声闻、辟支佛、所不能知 即此义也。      三、满天神佛的大宇宙图景   神并不是大宇宙的最高存在,在他们之上还有他们无法完全理解的 ( 中国称之为 道 ,印度称之为 梵 ) ,一切众生都是从 化生的。据此我们可构想出一个 的大宇宙图景。从究极意义上说,只有居于最高维度的 是唯一真实的本体 ( 实相 ) ,所有神、魔、人、鬼等都是 在较低的不同维度上的投影。所以东方宗教说 假、空 ,说一切都是假幻,是不存在的 ; 但又说 真空不空 ,即宇宙并非什么也没有,一切假幻都来自一个相同的、最高的本体。东方宗教还说 无我 、 无生 、 无死 ,意即 我 只是 的一个投影、一个假象,无论 我 如何改变、如何生生灭灭,本体的 是不生不灭的。这就是归一论和一神论的依据。有关于此的比喻很多,如宇宙是大海,众生是海面的波浪 ; 宇宙是个大生命,众生是其肢体等等。      由于 与众生之间相距的维度数接近无穷大,三维世界众生的行为看起来是完全独立、毫无关联的,但事实上,无穷多个众生的各种运动是 的一个运动在三维世界的无穷多个投影,只因数量级过于巨大,众生无法理解其一致性。为便于说明,我们再回到鱼缸的例子 : 当处于鱼缸顶的二维生命看到鱼向右游时,位于鱼缸右侧面的二维生命将看到鱼 变大了 。这两种观察结果并不具有明显的相反或相似性,因而很难找到它们之间的内在关联。如果进一步,把六面体的鱼缸换成正二十面体的鱼缸,则 鱼 的数目和运动方式也随之增加到二十。一般来说,相邻的两个面观察结果相近 ; 相对的两个面观察结果相反 ; 既非相邻又非相对的两个面的观察结果则可能看起来是完全独立、毫无联系的。把正 N 面体的面不断增加,同时考虑鱼不是水平或垂直游动,而是以任意角度向任意方向游动的情况,则既不相邻又不相对的两个面的观察结果的差异将变得更大。最后当 N 达到无穷大时,正 N 面体变成了一个球体。这时二维世界的面都变成了球体表面上的无穷多个点,从无穷多个点观察到的鱼的运动有无穷多种,而要得知一切运动背后蕴藏的真相,必须把无穷多个观察结果汇总起来做统计分析,这几乎是不可能的。处于高维度的智者基于对不同 的观察创立了多种学说、编写了不同的教材,于是出现了五花八门的宗教门派和汗牛充栋的经书典籍。各教派的理论既有相同点又有相异点,甚至同一派系的经书也有互相矛盾的地方,二维生命们为此争论不休,莫衷一是。只有极少数勇于探求真理者仍不满足于浩如烟海的典籍,他们得到了智者的真传。智者对他们说 : 来吧,跳出你们所处的世界,到更高层次的世界来,你们就能看到一切的真相。 经过不懈的努力,他们成功了,挣脱了二维世界的束缚,直接看到了三维世界的事物。这时出现在他们面前的,是一个球体鱼缸,而在鱼缸里游动的,只有一条鱼。      四、修行的目的   对超距作用的深入了解,更有助于我们理解东方宗教鼓励人们修行的真正目的。超距作用的一大奇妙特点是,对同谋粒子之一施加影响使之状态改变,另一粒子的状态也会立即改变。即改变高维度物体在低维空间的某个投影的状态,也会改变另一个投影的状态,并对高维度的本体产生微妙的影响。从这个意义上说,低维度的投影也有其真实性。因此佛教又说 : 宁起有见如须弥山,不起空见如芥子许 。众生都是 的投影,所以改变众生之一的状态,也会改变其它众生的状态,并对 的状态产生微妙的影响。古之所谓 一念善,则天地间多一分祥和 ; 一念恶,则天地间添一分凶戾 、 一人得道,鸡犬升天 、 一人成佛道,九祖得超生 即超距作用之体现是也。如果绝大部分众生都趋向于同一种状态,那么毫无疑问地, 将受众生的影响而向某个确定的方向运动。这便是东方宗教鼓励修行的本质原因 : 仙佛背负的使命,是通过教化众生,使众生一起向一个方向努力,从而最终把大宇宙的本体 调整到某种最佳状态。得道者越多,对 的影响力就越大,剩下的众生就越容易被 拉向 正确的方向 , 甚至可以不经由自己的努力而回归到 ,最后达成一切众生同成佛道的理想。由此可知,那些出家修行的人、闭门读经的人,他们绝非如凡夫所说的对社会毫无贡献的寄生虫,而是无私的先行者,他们改变自己身心状态的同时,也使其他众生的身心状态发生了微妙的变化,使越来越多迷途的人心灵中感受到 的召唤。他们是可敬的人。      作者: Michael Talbot http://www.douban.com/host/songshuhui/discussion/23578919/
3901 次阅读|0 个评论
科学的教育理念漫谈:父母该为孩子做些什么?
yangjunchao 2011-1-10 09:23
大概不会有父母不为孩子着想的,这是在进化中形成的一种本能并在个体出生后在社会 文化的熏陶中又进一步强化。但是如何为孩子着想呢?在和平发展的时代里,让孩子健康成长基本是每一个家庭都能做到的。除此之外,我想很多家长都有一个愿望 希望自己的孩子出类拔萃,将来能有一个比较好的发展,有一份愉快而有意义的人生。 对大量同卵双生子(遗传因素一模一样)的长期跟踪研究的统计结果表明一个人的智力、能力大约40-50%与遗传因素有关,其它部分由后天环境决定。这40-50%的遗传因素,其实主要体现在刚出生时对外界信息的吸收和情绪调控、行为模式的选择性优势,如果没有合适的外界环境,最后的结果往往也大相径庭。用狼孩的故事打个比喻,如果一个小孩的遗传素质很好,放到狼群里,他大概会被抚育成一个出色的狼孩。 孩子出生后的家庭、学校、社会环境决定了孩子未来发展的走向。可以把这种环境类比 为一个信息场,学过物理的知道电磁场和引力场是怎么回事儿,信息场通过光、声、味、触抚等物理化学信号,环境信息与孩子的神经系统的感受器发生作用并把相 应的信息编码在他的神经网络中。从较长期的过程来看,信息场的构造或矢量强度决定了孩子心理发育也就是他的神经网络的构造速度和构造模式,而他的这个有着 复杂内部、外部反馈关系的神经网络的构造及其支配的腺体和肌纤维的活动,就是孩子未来的个性、素质、能力、动机和情感取向、意志力或者说智商和情商的全 部。父母可以为孩子选择更好的学校、经常带他到有意义的环境,但孩子的婴幼儿时期,是形成最初的发展蓝图的决定性时期,家庭给与的信息量和信息结构的影响 是决定性的。随着孩子对自身和周围环境的自我意识、认知习惯和行为习惯的建立,这种初始的心理结构会作为基础进一步发展,在对更多更复杂结构的信息元素的 吸收和积累中,会有两三次的不同层次的结构性突现,并对不同的方向也就是兴趣取向呈现出很大的选择性优势。随着孩子的自我或自觉意识逐步强大,家长、老师 的影响力逐步减小,孩子按前期建立的动机程式也就是适当的思维模式和行为规则自己寻求合适的信息,就像饿了渴了会主动去找喜欢的食品和饮料一样。有的人说 养孩子就像训练小猫小狗学知识、技能,训练鹦鹉说话,这很正确,只是动物的基础神经系统怎么训练也不能达到人的程度,器官的构造、神经元的容量和初始调控 关系都不一样,但机制或道理是一样的。 家长对孩子提供的信息环境决定了孩子早期的发展,这包括家长对孩子的态度和情感交 流以及言传身教或自己行为习惯的示范作用,这大致或潜在地决定了孩子未来的一生。而家长对孩子未来发展的明确的或潜在的预期,都会在日常生活和为孩子信息 环境的配置中不自觉地体现出来。所以,特别是在孩子的早期教育中,也就是决定着孩子心理发展的初始蓝图、发展效率和发展方向等等方面,家长对孩子有效信息 环境的配置和行为方式的引导规范至关重要。具体地说就是每天的每时每刻你让他看到什么、听到什么、玩什么、和对他的行为方式或与他人的交流方式的引导和规 范,对每个家庭和每个孩子来说真实的微观过程就是这样。如果真的具体到每时每刻或每一天,这会让问题没法讨论,所以只能粗略分门别类加以说明。 还应该注意一点的是孩子认知的速度,也就是对外界信息吸收的速度,最初的过程很缓 慢,但会是以指数(有些阶段以指数的指数)的方式增长的,到一定阶段会大致以线性方式增长,到中年以后增长的速度下降,并逐步稳定下来,直到老年以后基本 不再增长,并可能会因为出现神经的生理性病变而失忆或某些行为能力的丧失。这个过程会有很大的个体差异,但大致的情况是这样。 另外,信息是有结构的和相互关联的,这与科学的统一性和事物的统一性这个基本原则 有关。这不仅是指科学、技术,也包括商务、文学、艺术甚至家政和个人或公共关系,比如社交、恋爱和婚姻。如果你为孩子配置的是最核心的、最基本的信息,比 如直接体现那些最广泛、最基本的规律的信息,他从有限的信息里就可以直接获得一般性的规律,而在以后的动机程式中就可以对环境信息作出正确有效的反应。如 果配置的信息是散乱的甚至是误导的,那么这种规律就很难呈现出来或者根本不能形成。所以,可以预见,虽然孩子天生的学习能力几乎是相同的,但孩子认知和行 为能力也就是我们说的智商和情商的分化会是以级数的速度进行的,在学生时代面对的环境差别不大,可能还显示不出差异来。但到了大学或社会上,自己独立自主 以后,立时就会有数量级的差别。 首先是孩子对自我和周围环境的认识,并在遗传形成的基本行为方式的基础上行为和习 惯的扩展或建立。这是从对线条、颜色、形状、质感、气味、触觉、质感、物体、运动、自我等信息在不知不觉之中逐级认知并实时与支配腺体分泌激素调控情绪和 支配行为的效应器整合在一起形成的。这个阶段没有家长的引导孩子都可以自己完成,这种能力是天生的,也就是在进化中决定的在发育中形成的由基础神经系统决 定的,或者就是上面说的遗传因素。遗传因素的不同这个阶段完成的快慢和对不同信息的兴趣取向不同。如果这时他吸收了较多的好听的声音、好的画面或色彩组合 方式,并且和他自己的直接尝试结合起来,并在以后不断强化,他对音乐、绘画等艺术方面的天赋就会被激发出来。但如果没有足够的吸收,也就是孩子没有对音 乐、绘画的足够的感受、理解或欣赏、鉴别能力,而只是机械或形式化的训练,那么可以肯定结果只能是走向家长希望的反面,孩子很快表现出烦躁、没有耐心并且 不配合。如果家长过于严厉要求,往往损害的是孩子的自尊心、自信心和并可能激发他的逆反意识。 很多家长希望孩子在音乐、绘画、舞蹈方面有所发展,但往往忽略了必要的吸 收,孩子可能学会了一些机械的技术,但乐感、想象力没有足够的底子,很快就没有进一步发展的可能性。相反,如果有足够的吸收,即是没有音乐、绘画技能的任 何训练,他对艺术的品味同样可以达到很高的境界。技能的训练有助于达到这种境界,但不是效率很高的一种方式。而如果以此为职业或兴趣爱好,那当然技能训练 是必不可少的。一个网友说起他的两个孩子,相差两岁,大的四岁开始学钢琴,几年下来越来越没有耐心。看老大很费力也学不进去,于是就不让老二学了。可很意 外,老二反而经常跃跃欲试,显出很大的兴趣,经常希望自己能一显身手似的。老二无意中跟着老大的学习吸收了很多,又没有机械训练的枯燥,兴趣可能就激发出 来了。如果能以自己的兴趣作为动力,家长有这个条件,就是有足够的经济后盾作保障,又有心栽培,倒不妨可以着意培养。但这是一种极难被认可的职业,即便对 于自娱自乐,也是一种极难达到一定程度的爱好。因为你只有和历史上以前的艺术家比较,历史上已经有太多的高峰矗立在那里,只有非凡的天才才有可能达到这样 的高度,你只有达到了或超越了他们达到了新的高度你才可能会被认可。即便对于儿童时期就表现出很浓厚的兴趣、很有天赋的,这也会是个漫长而要付出极大努力 和代价的过程,涉及到的技术和机遇方面的因素很多,与能否得到名师的指点和引导从而以很高的效率快捷的达到某种境界关系很大。如果他的老师就不具备相当的 高度,那么孩子有可能被误导,或流于平庸,不太可能自己发展起来。对生活在音乐、绘画等艺术世家的儿童来说,成功的几率也不是很高,毕竟已不是那个全民热 爱艺术、艺术主导社会的时代了。对一般的家庭,必要的环境和条件基本不具备,成功的机率就微乎其微了。当然,如果是仅限于技能达到某种程度而作为一种一般 性的职业,或作为一种陶冶情趣的爱好甚至社交的一种方式,那或许是比较容易的,但在现代社会里这显然这不是很有优势的一种选择。孩子如果没有兴趣不能投 入,仅仅是浪费了家长和孩子的时间,但真正感兴趣全身心的投入又怎样呢?对于孩子来说,那是他的一种生活方式或人生追求,但对于家长来说,很多时候像陷入 一场恶梦。我的一个朋友从小跟着父亲学画画,画得相当有灵气,对文学的感觉也非常好,后来读了清华美术学院,我看过她的一些作品,相当不错了,比市面上很 多作品水平要高,但数量不多。真正热爱艺术的,会有一个自我要求,不会粗制滥造。她后来还是放弃了画画或相关职业而改行做了别的。从投入产出来说就非常的 不合算了。我曾对她说,如果我有小孩了,跟你学画画吧。她说,教他没有问题。不过你可要想好了。如果我有孩子将来要画画,左手画,剁左手,右手画, 剁右手。看她平时温文尔雅而这时候一幅恶狠狠的样子,我自己都出一身冷汗!可见艺术职业生涯的艰辛!用一生最富有活力和创造性的一个阶段为代价达到了相 当的程度而又不得不放弃的那种感觉不是常人可以体验和理解的。如果家庭条件足够好,真正热爱艺术,可以养孩子大半生或一生,那另当别论。中国社会发展很 快,现在,中国有不少这样的家庭可以支撑起孩子玩艺术。但在十年前,还不太可能。我的一个朋友家庭条件在当时的中国算是非常优越了,从小受艺术的熏陶,自 己也很聪明、有灵气,对文学和表演艺术有相当的品味。到了大学时代,父母已经由对女儿的欣赏、自豪变为担心了,很担心她成为一个文学青年。可她呢,出 乎父母的意料,觉得文学还不够,要做艺术,去拍电影,而且真真切切的成为了一个艺术青年。为此给父母带来了极大的困扰,和家庭到了决裂的地步。后来, 她还是坚持了自己的追求,在国内读了电影方面的研究生,后来去了巴黎。她未来的路仍会极度的艰辛和漫长。一个艺术家在成名之前,是只有投入没有产出的。而 越是有深度的艺术家,往往越超前时代,越难获得社会公众的理解、欣赏和认可。当然,我说的故事是中国九十年代末的,后来国内艺术品市场很活跃,很多艺术家 的作品获得了市场的认可,变得很富有了。但相对于众多长期全身心投入的庞大的基数,这些被市场认可的仍是极少极少的一部分。很多人在早期,不得不把现在价 值几百万元的作品以几万块钱的价格卖掉以维持自己最低限度的生存和再生产。相对于其它任何职业,包括科学,艺术之路是最艰辛和漫长的。家长在希望孩子学艺 术的时候,很多时候只看到了成功艺术家身上的光环,其实非常有必要了解艺术家成功背后的艰辛和孤寂。 对于其它的方面,比如科学、技术、商业、金融、法律、医学、媒体等等,也是一样的 情况或过程。除科学的基础理论和艺术类似外,其它的都可以归结为一类技能或技能组合的训练,学校教育提供了对未来大部分职业要求必须具备的一些素质和能力 的训练,但学校的东西往往是滞后于社会的发展的,而且几乎对所有的孩子都一样。如果希望孩子出类拔萃,孩子到某种年龄后的自主能力、自学能力、自己对环境 分析判断并作出正确选择和对自己的发展进行合理规划的能力是必不可少的。当然这个能力越早形成越好,家长也会越省心。这个能力是抽象的,但却是通过某些实 际的具体过程形成的。那么,家长对孩子心理变化的观察分析并适时提供合适的信息就显得异常重要,这只能对具体的情况具体分析。孩子的遗传因素、已经形成的 兴趣取向、家长的预期很大程度上起决定作用。 我们对Charles的 方案最初是针对国内应试教育希望他在对付读书方面能有一两年的提前量,可以让他入学后轻松对付考试并能有一些余力扩大知识面。同时在英语方面附加一些额外 课程,以弥补国内英语教育的不足。他从两岁左右开始阅读图画故事,虽然一天一般不会超过半个小时,但几年下来的积累已经很可观了。除了行为规范、情绪情感 自我调控的内容外,主要是关于自然和自身的科普读物,这些东西帮他确立一个关于自然、自身行为的基于因果逻辑或者理性的基本的心理框架。我们也默许、甚至 鼓励他自己在有安全保障情况下的完全的自由和随意性,这有助于他主动性、自我意识、独立性的形成。而对有意义的实践探索,比如观察研究公园水管喷头、到香 港后深度探索轨道交通、沉浸在通过玩具营造的世界里自由驰骋、无穷无尽的对周围事物的探寻发问,都给与充分的支持、配合和鼓励。书本提供的对自然、自身的 解释和他自己实际体验的相辅相成,相互促进,他对读书有选择性但基本上不怎么排斥,现在经常会自己拿一本书随意翻翻。其实孩子只要能从书本中得到有意思的 东西,他就会喜欢读书。而通过读书是可以让孩子尽快成长的捷径,也是人一生发展的捷径。现在毕竟是科学主导社会发展,所以我们一开始就有意识的强化他对科 学的理解和领悟,对他大规模地冒出来的各种问题都尽可能给出准确的答案。要么就不给出答案,因为并不是所有的问题都可以给出他能理解的答案的。这需要他自 己有一定的知识基础。现在的一个瓶颈是,如果没有原子、分子的概念和相互作用的基本图景,他可以扩展知识而不太能进一步深入和提高了。所以爸爸一直留心为 他买适合孩子阅读习惯的物理、化学读本。有了一定的物理、化学基础之后,他的认识的空间就可以彻底打开了。比如就可以准确回答诸如核糖体是干什么的、 为什么洗洁精能杀死细菌、图像如何进到照相机里一类的问题了。 写这么多,是因为前两天爸爸终于买到比较合适的物理、化学读本了。这是台湾出的一 套中学生科学读本,总书名《中学生必读的图解科学教科书》,分为《寻找生活中的科学原理》、《挖掘物质世界的秘密》、《发现生命与宇宙的奥秘》、《揭开能 量与能源的秘密》、《发掘大气和水的循环原理》几个分册。以漫画的形式让孩子进入情境状态并导入问题,然后给出解释。有些内容并不是很好,因为还是现象描 述而没有给出背后的准确的机理,但爸爸看重其中两册关于物理和化学的部分。还有一本是《化学趣味教室》,韩国人编写的,也是漫画的形式,通过物态变化、原 子、分子结构和相互作用解释一些常见现象。另外,还买了一套《Super小学堂》,包括《探险动物世界》、《自然植物的百种样貌》、《宇宙奇观大秘密》、《我要成为科学试验王》、《地理冒险队》、《惊奇生活体验记》、《人体这么奇妙》共七本小学生的科普读物。Charles早已经达到甚至超过了这后一套书的水平,不过这套书也是以漫画的形式给出情境,然后分析解答问题,写得很有意思,可以从不同的角度进一步丰富开阔一下视野。除此之外,还买了三本一套的《小学生一定要注意的30种细节》、《小学生一定要养成的30种习惯》、《小学生一定要做的30件事情》。这套书也没有太大的新意,很多内容Charles都 知道了。但这套书也是很有意思的漫画,只不过想让他在不知不觉的情况下通过不同的信息环境进一步强化巩固小孩的必要的习惯和行为规范。还有一本是《唐 诗》,可惜只买到了下册,台湾出的,专为孩子设计的,配有插图和浅显的适合孩子口味的解释。这方面台湾做的最好,但数量不多。香港这方面书很少。内地太多 但大都粗制滥造,偶尔也有好的,但极少,几乎碰不到。爸爸在北京留意了很长时间没有买到合适的。买的一套是许渊冲编译的从汉魏到唐宋明清的多卷本古诗词读 本,有拼音和英语对照的成人读物,篇目选择和英译也不是很好,但这次回北京逛了好几个书店实在找不到更好的版本了。国内编书的很不敬业,太多粗制滥造的 了。爸爸以后有空自己主编一套。 特别说一下,唐诗或中国古典文学是中国文化的精华所在,它通过意象、意境的感悟而 与西方文化截然不同的方式理解自然、社会和人生中的复杂现象或过程,可以或更容易达到更高更深入的程度。中国人有着把中西文化兼容并包的得天独厚的优势。 而让西方人学中国文化,就困难的多了。还没有看到有西方学者对西方科学文化达到很高的境界而同时对中国文化也达到很高境界的人。黑格尔、莱布尼茨、海德格 尔算是西方的高人,对中国哲学也只是蜻蜓点水了解一点,但已经非常心悦诚服了。他们自己的哲学体系和老子、易经的哲学体系差得很远,但西方的优势在于通过 逻辑和实证逐步细化到了事物的最基本的量子化结构的层面了,可以精确的描述和预测。中国却仍停留在现象的层面,经常被庸俗化教条化而变为大忽悠。Charles现 在进入了英文为主的国际学校,英文按部就班的跟下去,每天再读十分钟二十分钟的,不太会成为问题了。于是最近开始强化对中国文化的吸收,希望他再过一两年 能自己自觉地每周背一两首唐诗而不用爸爸的辅导了,并能开始自己阅读古典文学的通俗读本。希望他到小学高年级的时候,可以自己自觉读书学习,而爸爸的角色 也转入辅导他的中英文写作方面。看在美国生活的网友的孩子,华人家庭,妈妈多做辅导,11岁就写出了很不简单、中国大学生也写不出来的英文。我自己大学同学中,如果父母是老师的,往往发展就很全面。有一个跳过几次级,十四岁进了大学。 (2009年12月发在搜狐博客,2011年元月转贴于科学网博客)
个人分类: 儿童教育|5906 次阅读|0 个评论
[转载]遗传算法的应用MCM培训7
sobolev 2010-12-2 21:29
见附件 遗传算法应用
个人分类: 未分类|2406 次阅读|0 个评论
[转载]神经网络座谈会
liuyanjun 2010-10-3 18:34
神经网络座谈会在桂林举办,目前国内比较不错的会议。 2011 International Symposium on Neural Networks May 29 - June 1, 2011, Guilin, China http://isnn2011.mae.cuhk.edu. hk/
个人分类: 生活点滴|2642 次阅读|0 个评论
ISNN2011:2011 International Symposium on Neural Networks
derongliu 2010-8-29 00:16
Call for Papers 2011 International Symposium on Neural Networks May 29 - June 1, 2011, Guilin, China http://isnn2011.mae.cuhk.edu.hk/ Important dates: Special session proposals due: November 1, 2010 Paper submission deadline: December 1, 2010 Notification of acceptance: January 1, 2011 The 8th International Symposium on Neural Networks (ISNN 2011) will be held in Guilin, China, as a sequel of ISNN 2004–2010. Guilin has a long history as the most beautiful place in China. It is famous for its wonderful scenery, rivers and karst peaks covered in lush greenery. ISNN 2011 aims to provide a high-level international forum for scientists, engineers, and educators to present the state of the art of neural network research and applications in diverse fields. The symposium will feature plenary lectures given by world renowned scholars, regular sessions with broad coverage, and some special sessions focusing on popular topics. Prospective authors are invited to submit full-length papers (6-8 pages normally and 10 pages maximum) by the submission deadline through the online submission system. All papers accepted by and presented at ISNN2011 will be published by Springer as multiple volumes of Lecture Notes in Computer Science which will be indexed by EI and ISTP. Selected papers will be published in special issues of several SCI journals. ISNN 2011 paper submission website is already open: http://isnn2011.mae.cuhk.edu.hk/econfpal/author/ Potential organizers are invited to enlist five or more papers with cohesive topics to form special sessions. Please contact Special Sessions Chair "Jinhu Lu" jhlu@iss.ac.cn for more details if you would like to organize special sessions.
个人分类: 会议|4610 次阅读|0 个评论
中小学生该学一些什么
gzchengzhi 2010-8-26 11:00
小学生年纪大约7到13岁,处于皮亚杰认知发展理论所界定的具体运算阶段。该阶段的特点在于小学生能够借助符号来进行思维。而中学生年纪大约13岁至19岁,处于皮亚杰认知发展理论的形式运算阶段 。这一阶段的特点在于儿童能够进行抽象思维,思维的灵活性更大了。 当然皮亚杰只是针对一般智力水平的儿童进行的阶段划分。通俗地说,就是智商在100左右的学生群体具备这样的一个统计规律。如果是智力超常的儿童,则会明显表现出超前的状况。另外也有学者的研究指出,在特殊的教育环境中,也有可能会对皮亚杰的理论有所突破 。 随着对这一课题的不断深入探讨,人们发现实际的情况也许比这更加复杂一些。例如在亚洲属于儒家文化圈的国家中,家长对子女中小学教育的一种近乎偏执的重视情况来看,反映出大多数人觉得在这一阶段基础知识学习以及良好成长环境的重要性。这种重视基础知识学习而忽视学生能力培养的现状,又一直受到广泛的批评。目前还不清楚这种学生成长的方式是否会导致学生的生理成长受到伤害,但中国学生的近视率高也是一个事实。 至于这种教育教学的方式是否会影响到杰出人才的成长,也似乎没有足够的数据。例如东亚地区确实没有出现伽利略、牛顿、爱因斯坦、达尔文等杰出人才。但是从最近几年,日本的科学家以及英美的华裔科学家频繁获得诺贝尔奖的情况来看,似乎又能够说明儒家文化氛围中的这种教育教学方式对于促进杰出人才的成长还是很有效的。 这种重视基础知识传授的方式也开始引起了一些政界人士的注意。比如美国奥巴马总统在上任之初,就提出美国基础教育的改革应该向东亚的一些国家学习。 这就给我们提出了一个问题,我们的中小学生究竟应该学些什么才是比较合适的? 从神经网络的层次来对皮亚杰的儿童认知发展阶段进行解释和分析 ,可以让我们对这一问题有更清楚的认识。 图1 生理生长阶段认知发展的特点 从图1中看出,对应小学生认知发展的时期为具体运算期。其具备的特点在于大脑神经元数量和认知模式在迅速增长。认知模式的增加,意味着儿童对外部世界的认知开始不断丰富起来。说明小学阶段的学习任务主要还是促进学生认知模式的增加方面,适当记忆一些材料是有助于促进认知模式增长的。在小学阶段比较适合于学习诸各种知识性的内容,如语言、地理知识、各种自然现象知识等。这一时期应尽量避免学习一些需要很强的抽象思维能力的内容。 这一阶段神经网络的学习复杂性在迅速增加,这意味着儿童具备了在某些方面发展的潜力。但是从图中可以看到这一阶段小学生的认知深度增加的速度就要缓慢多了。造成这一现象的原因在于能量供应的不足,导致儿童的进一步思考能力还不强。比如让小学生脱离实际的事物和符号,思维的逻辑性就差一些了。但小学生还是可以借助符号来描述外界的事物、进行逻辑推理并解决很多数学问题的。 当然知识的积累也可以在一定程度上增加认知深度,但效果应该不太明显。因此在小学阶段的主要任务还是尽可能地促进小学生神经网络系统的发展,提供更加丰富的信息刺激,满足神经元系统的顺利成长。值得注意的是,从图中还可以看出,由于这一时期,神经网络的计算复杂性快速增长,儿童的认知深度发展还是有潜力的。通过合理的教育方式,应该可以为儿童今后的认知发展打下一定良好的基础。 进入中学以后,中学生在生理上逐渐趋于成熟,反映认知水平的很多参数都开始达到一个最大值。比如大脑中的神经元数量、认知模式等。 认知模式逐渐达到最大值,意味着在这一时期,中学生的发展方向是多样化的,中学阶段也是一个确定今后人生发展方向的重要阶段。但是这一时期认知模式增长速度减慢直至停止,也意味着,中学生的学习应该逐渐避免那些需要大量记忆的内容。 这一时期大脑神经网络学习复杂性迅速增加,并达到最大值,意味着中学生的可塑性最强,具有最大的发展潜力。这时候可以给中学生提供很多需要空间和抽象思维能力的问题,尤其是数学和物理等方面的内容。同时提供中学生进行科学研究的机会。 不过我们也应该看到,在这一时期,虽然中学生的认知深度开始迅速增加,但是相对于后面的各个时期,这一认知深度还是不够的。这说明中学生虽然具备了抽象思维的能力,但是思维的深度还不够。 因此中学生的主要任务还是学习,增长知识。如果中学生的知识积累越充分,对其以后的认知深度成长会越有帮助。 当然知识总是承前启后的。比如中学时候学习的微积分等知识可以为今后学习更深入的数学知识打下基础。而相信文学方面知识的积累对于今后解决更复杂的数学问题帮助就不会那么明显。因此,同小学生相比,在尽可能接触所有人类文明成果的同时,中学生的知识积累还是应该逐渐朝着某些特定的方向发展。 表1 中小学各阶段的认知特点以及适合于学习的内容 阶段 特点 适合学习内容 小学 具体运算期。大脑神经元数量和认知模式迅速增长。神经网络的学习复杂性迅速增加,小学生的认知深度增加速度缓慢,但认知深度发展有潜力 适当记忆一些材料。适合于学习各种知识性的内容,如语言、地理知识、各种自然现象知识等。尽量避免学习需要很强的抽象思维能力的内容。可以进行逻辑推理并解决很多数学问题。提供更加丰富的信息刺激,满足神经元系统的顺利成长。通过合理的教育方式,为儿童今后的认知发展打下一定良好的基础。 中学 生理上逐渐趋于成熟,反映认知水平的很多参数都开始达到一个最大值。认知模式增长速度减慢直至停止, 大脑神经网络学习复杂性迅速增加,并达到最大值, 中学生的认知深度开始迅速增加,但是认知深度还不够。 确定今后人生发展方向。逐渐避免学习那些需要大量记忆的内容。解决数学和物理等需要空间和抽象思维能力的问题。提供进行科学研究的机会。 主要任务还是学习,增长知识。中学生的知识积累逐渐朝着某些特定的方向发展。 PIAGET J. Piaget's theory . Carmichael's manual of child psychology, 1970, 1:703-32. 何克抗. 时代网络呼唤教育理论创新 (上)对皮亚杰 (J Piaget)儿童认知发展阶段论的质疑 . 电化教育研究, 2002, 010): 7-15. 程智. 基于神经网络理论的认知发展模型的构建及其在教师专业发展中的应用 . 中国科技论文在线, http://www.paper.edu.cn/index.php/default/releasepaper/downPaper/201006-43/1 . 2010,6.
个人分类: 研究心得|5400 次阅读|0 个评论
电脑人心 之 引言(六)AI的成长:历史版
luocun 2010-7-20 13:41
牛皮版好写,因为跟实际发展相比,牛皮总是过于清晰,而真正的历史总是千丝万缕的交叠。 好在我们主要关注电脑人心的可能性,这里就用最粗的线条,勾勒最主要的轮廓,漫画历史一把吧。 AI的成长,大致可以分为下面几个阶段。 50、60年代之间的AI大致是一出生就是个思想者。它成天忙着的就是如何解决逻辑、数学、科学和一般性的推理问题。这个时期的代表性工作,有1956年达特茅斯会上,西蒙和纽厄尔演示的他们和肖(J. C. Shaw)研制的逻辑理论家(Logical Theorist)──专心于证明怀特海和罗素的《数学原理》里面的定理;以及随后的通用问题求解程序(GPS: General Problem Solver;不是全球定位系统那个GPS: Global Positioning System)。它在推理之外的娱乐活动大致就是下棋,下国际象棋、国际跳棋(checkers)等等。(这样的童年也够可悲的!)连模仿人脑的神经网络研究,如麦克科洛赫和皮兹的,也专注于如何实现基本的逻辑函数。 如果要给这时候的AI塑个像的话,大体上把罗丹的思想者搬过来恶搞一把,前面摆张黑板,有时换成棋盘,就差不多了。不过由于写在黑板上的符号、公式,棋盘上的棋局等等都很容易用计算机内部的符号来代替,黑板和棋盘似乎也有些多余。 这期间的核心理论进展是启发法(heuristics)和搜索的结合。大概意思就是说,如果你不在乎答案是不是最优的话,就可以用一些大致的条件来帮你从所有可能答案里筛选若干可能足够好的来加以仔细检查,最后找到足够满意的答案。 如果说最初的AI像个思想家的话,那么60至80年代之间的AI则大体上可以说是像个书呆子和书袋子。 推理搞了一阵子之后,大家很快认识到一般而言的智能,不光是要能使劲想,还要以知识为基础来思考,于是开始关注知识表示(knowledge representation)。大家很快又认识到知识的情景性的和领域性的重要性,于是提出各种方式来加以对付,包括麦卡锡的基于谓词逻辑(predicate logic)的情景演算(situation calculus)、语义网、明斯基的框架(frame)、温罗格拉德(Terry Winograd)的程式(procedure)、香克(Roger Schank)的脚本(script)等等,并由此发展出针对特定领域的专家系统(expert systems),比如进行细菌感染诊断的MYCIN。 这些年里的AI之所以像个书呆子和书袋子,是因为这些系统的知识表示大体上都是从符号到符号,符号进符号出,而并不实质性地涉及符号如何成为符号,并不说明系统如何自主地协调这些符号跟这些符号所关涉事物之间的关系。虽然,后期关于所谓常识库(commonsense knowledge base)的研究,比如前面提到的Cyc,试图超越传统知识表示的领域特定性,但还是在符号里兜圈子。 不过,这个时期,知觉的研究(比如David Marr的工作)和机器人的研究(比如Shakey)也逐渐蓬勃开展起来了。 到了80至90年代,AI可以说是变成了一个好好学习、天天向上的娃娃。随着所谓传统符号AI(Symbolic AI)的局限性浮出水面,关于学习尤其是通过知觉进行学习的研究也逐渐走入了AI的核心。机器学习(machine learning)这一领域得以确立;以学习为核心特征的神经网络(neural networks)重新兴起;机器人研究如火如荼,比如前面提到对的Cog,以及从匹兹堡开车斜穿美国到圣迭戈的ALVINN自动驾驶系统。 这里有必要暂停叙事,以说明一下AI发展的一个特点。大约直到90年代,几乎所有的AI系统都只是展示程序(demos)──主要的例外恐怕得算那些下棋程序了。从GPS到MYCIN到Cyc,从Shakey到Cog和ALVINN,大抵都是做展示用的原型(prototype),表示一定的设计思想、方案大致是可行的;而做完展示,他们作为具体系统的历史使命大抵也就结束了,而并不会真正投入使用。 这里的情景,很有点像另一个关于墨子的故事(《韩非子:外储说左上 说一》):话说墨子做木头老鹰,做了三年才做成,可是才飞了一天就毁败了。他的徒弟们说:师父你好能耐啊,能让木头老鹰飞起来。墨子说:其实我不如做车轮子的师父能耐,他们只用些尺把长的木头,不到一个早晨的功夫,就做出能够载重三百斤,走很长距离,用很多年的轮子。跟他们相比,我的木头老鹰,三年才做成,飞一天就毁败了。 墨子的木头老鹰,大概也就是个原型,就像绝大多数AI系统那样,做起来很难,要花很多功夫,而完成后演示一下,看看过瘾,这系统的生命大抵也就到头了。而Apache Web服务器那样的软件系统则更像是做得经久耐用的轮子,能够可靠地让我们走得很长很远。 90年代以来情况有不小变化。总的说来,就是AI终于开始在它生活的广阔的世界里面动手动脚了。 这里至少有两方面的历史背景。第一是计算机软硬件的发展,可以允许前所未有的容量、速度和系统架构与系统复杂性。第二就是互联网的发展给人工智能技术的实际应用提供了广阔空间(比如搜索引擎的学习和适应能力、当当网背后的数据挖掘、垃圾邮件的过滤等等)。有人说谷歌是个AI公司。当然,谷歌自己不这样称呼自己,不过请注意:目前最流行的AI教科书《人工智能:现代门径》(Artificial Intelligence: A Modern Approach)的两位作者之一Peter Norvig就是谷歌的研究主管。 理论上的发展则重点在于两个方面。一是通过佩尔(Judea Pearl)等人的开创性工作,以概率理论,尤其是贝叶斯理论为基础的AI方法得到很大发展,可以说席卷了 从推理到神经网络到机器人的AI的各个领域。这一发展又刚好与互联网为背景的统计应用相契合。 第二,在系统方面,智能体(intelligent agent)或理智能动体(rational agent)这一视角得到广泛接受。这一理论视角大致是把AI系统明确理解为具有一定的整体性,这就是它存在于特定的环境里面,基于一定的感知和动作来按照一定要求,或者说理性地,完成特定的任务。这样一来,智能就被理解成系统的组织和活动方式,而这些方式既不是独立于环境、感知、动作或者目标的,又是要受到一定条件制约的(理性地或者按照一定要求达到目标)。翻译一下,大意就是说,造AI系统不必是造人,而是造那些能够从聪明地完成人在特定环境里、基于特定的感知和动作能力能够聪明地完成的事情:比如下棋,比如开车,比如照顾病人,比如翻译,比如打酱油。
个人分类: 电脑人心|3334 次阅读|2 个评论
认知成长的滞后性
gzchengzhi 2010-6-20 10:32
与其他的动物不同,人的认知成长过程要明显滞后于生理成长。这是与人的大脑神经网络具备更加复杂的结构有关的。 从目前已有的资料来看, 这种现象在动物身上表现得不是很明显。 认知过程包含了两个重要的参数,分别是认知广度和认知深度。将这两个参数综合在一起,构成了人的整体认知能力。 用公式表示出来就是: 认知能力=认知广度+认知深度 一个系统的复杂程度跟系统中所包含的因素数量有关。对于神经网络系统,所包含的神经元数量越多,则这个神经网络系统的复杂程度越高。复杂程度越高,反映了神经网络系统所具备的认知模式越多。这对应了认知的广度。 认知的深度则反映了就某些问题进行深入思考的能力。任何一个认知过程,都需要足够的能量来进行维持。而神经网络获得的能量又需要分配给不同的认知模式。这就导致在神经网络系统比较复杂的时候,认知模式的增加,在一定程度上会影响到认知深度的增加。而在神经网络中神经元数量减少的时候,认知模式开始减少,这时候反而有利于整个系统将能量集中于剩下的一些认知模式中,从而引起认知深度的增加。一般情况下,认知广度达到了高峰值,认知深度却不一定能够达到高峰。这显示出认知深度在一定程度上的滞后性。 从人的生理成长过程来看,人的生理成熟大约在30岁左右。这时候在大脑神经网络中,神经元的数量达到了一个顶峰,意味着此时认知广度也可望达到顶峰。然而这并不意味着一个人的认知发展从此以后就开始步入能力下降的轨道,其原因在于,在这一时期,人的认知深度并没有达到顶峰,人的整体认知能力仍在成长。 人在生理衰退期的认知成长过程主要表现在认知深度仍在迅速发展,一个人对事物的认识更加透彻了。 如果以上的分析是正确的,那么可以给出的建议就是,随着年纪的增大,一个人的兴趣范围应该逐渐减少,这样可以充分发掘这一时期的认知能力。使得自己一生都能够不断获得成长。 通常我们提倡的活的老、学到老,似乎表明人的年纪越大,越应该学习新知识。这则是反映出了一种生活方式,当然也反映出了一个人希望不断成长的良好愿望。我给出的建议就是,这种生活方式毫无疑问是值得提倡的。如果在自己的认知广度不断减少,而认知深度仍有可能增长的前提下,所接纳的新知识能够跟自己的兴趣紧密结合在一起,尽量避免无关因素的干扰,相信取得成就的可能性会更大。
个人分类: 研究心得|5318 次阅读|0 个评论
BP神经网络的隐藏层数目
热度 2 lj1202 2010-3-14 21:19
BP神经网络的隐藏层数目 大家好!由于最近在思考离散反馈神经网络的稳定时,联想到了BP神经网络的隐藏层神经元数目这个问题。我目前所想的一个方法是能知道隐藏层神经元数目的最少值和相应的隐藏层层数,而且对于异或问题的BP神经网络的隐藏层层数和每层的神经元数目也满足这个方法(只需一层隐层,且神经元数目为2)。由于我所工作的单位数据库极其有限(包括中文的),外文的几乎不要想了,再加上很少关注这个方向,所以不是很了解,想请教: 1. 有个博士说这个(BP神经网络的隐藏层数目)已经过时,不知是否如此? 2. 目前对BP神经网络的隐藏层数目都有些什么样的结果?最好的结果是什么? 谢谢大家!
个人分类: 科研|16658 次阅读|3 个评论
几个专业术语的搞怪称呼
susheng 2010-3-6 23:54
研究中总有一些专业术语,喊得多了总想加点花,比如: 基于神经网络的***------基于神经病网络的***** 基于规则的******--------基于潜规则的******* 全球暖化对******的影响分析 ---------- 全球老化对*****的影响分析 IEEE--------IEEEE(I3个E的杂志一般比I两个E的要强,想着有没有4个E的,后来I两个E的玩不下去了,换了个马甲,现在叫IET) 忘了一个,现在智能电网满天飞,和个同事也开玩笑叫了个挺主旋律的名字和谐电力系统。
个人分类: 科研笔记|4673 次阅读|0 个评论
利用AMSR-E被动微波数据反演地表温度的神经网络算法
maokebiao 2009-12-7 19:40
摘要 - 结合对地观测卫星 AQUA 多传感器 / 多分辨率的特点,研究了利用AMSR-E被动微波 数据反演地表温度的神经网络算法。 MODIS 地表温度产品(LST)被作为地表温度实测数据,对应的平均温度被用来当作对应 AMSR-E 像元的实际地表温度,从而克服由于 AMSR-E 像元尺度太大和云的影响而难以获得地表实测数据的难点。反演结果分析表明,利用神经网络能够被用来精确地从 AMSR-E 中反演地表温度。 当使用 5 个频率 10 个通道作为反演通道时,反演精度最高,说明使用更多的通道能更好地消除土壤水分、粗糙度、大气和其它因素的影响。相对于 MODIS 温度产品, 反演的平均精度大约 2 K。 在文中,作者提到了关于参数反演和气候变化研究的两个个人观点,供大家参考: 对大尺度参数反演: 由于大尺度像元基本上都存在混合像元问题,很难准确地用方程描述出来。因此,从大尺度复杂的混合像元中准确地反演地表参数,需要我们做到:第一从物理的角度观察自然现象;第二用数学的方法去描述物理现象;第三从工程(优化)的角度解数学方程组。这样才能更好地提高大尺度参数反演的精度。 气候变化研究: 最近几年来,极端气候变化事件越来越多。 2008 年年初中国南方雪灾, 2009 年中国北方旱灾以及 2009 年中国南方频繁地大暴雨。遥感在灾害监测中起的作用越来越重要,但个人认为在加强遥感地表参数研究的同时,我们需要发射其它遥感卫星监测地球和观测太空中其它行星位置的变化而引起引力场和磁场的变化。因为极端气候变化事件很可能是由于其它行星或者天体靠近或者远离地球导致磁场和引力场发生变化,地球上的各种物质和密度都不一样,从而引起局部变化不一致,比如地球上空云和水汽以及地壳岩浆运动异常,导致发生灾害。这一现象可以从灾害周期性发生分析得到,比如地震是若干年周期发生,伴随着干旱发生,这主要是由于天体周期运动引起的。另外由于天体之间的引力变化导致磁场变化,从而引起大气的异常变化,这点可以从地震发生前后天空出现云彩异常得到证实。将来的气候变化研究,需要气候学家和天体物理学家,地球物理学家以及地学的其他科研工作者大力合作,才能弄明白这些问题(极端气候事件且包括地震)。在将来的气候变化研究中,考虑天体运行的规律是非常有必要的。 1. 毛克彪, 王道龙,李滋睿,张立新,周清波,唐华俊,李丹丹,利用 AMSR-E 被动微波数据反演地表温度的神经网络算法,高技术通讯, 2009 , 19 ( 11 ): 1195-1200. PDF下载
个人分类: 星星点灯|3833 次阅读|0 个评论
基于人工神经网络的三维矿床模型研究
hldcyx 2009-8-31 06:00
矿床地质模型是用计算机进行矿山设计和开采的基础。自上世纪 60 年代以来,人们主要致力于建模理论和方法的研究, 形成了几种主要的方法,包括三维规则网格法、 TIN 表面法、四面体法以及综合法等。 但不论采用哪种方法构造矿床地质模型,其核心工作就是根据地质勘探程度、钻孔分布情况,以及矿床赋存条件的复杂程度,选择适宜的估值方法。常用的地质模型中的地质变量估值方法有克立金法、距离幂次反比法,对地质界面采用趋势面法、曲面样条插值等方法进行曲面拟合。 用这些传统的估值方法建立地质模型,在一定程度上满足了实际生产的需要,但由于描述矿床赋存条件的地质变量 ( 几何信息、质量指标 ) 具有空间局域性、随机性、连续性、各向异性,并且在一定范围内呈现出非线性相关的特性,因而需要足够的样本空间,并且估值外推能力差,产生的边界误差较大,而新兴的人工神经网络方法擅长处理连续的、随机的、非线性问题,为建立矿床地质模型提供了一条新的途径。 1 三维矿床的神经网络模型 人工神经网络( ARTIFICIAL NEURAL NETWORK ,简称 A.N.N. )是模拟人脑的思维方式和组织形式而建立起来高度非线性与线性运算复合而成的数学模型,是由若干处理单元相联结而形成的 一种大规模并行分布处理 网络系统。 具有很强的自适应、自学习、联想记忆、高度容错和并行处理能力,使得神经网络理论的应用已经渗透到了各个领域。 基于神经网络的三维矿床地质模型数据模拟预测由网络训练和模拟预测两个过程组成,即: (1) 选择合适的网络结构和学习规则与算法,建立神经网络模型,利用钻孔地质资料数据构成训练样本,加入到相应的网络中,对网络进行学习训练,建立模拟预测的网络模型; (2) 用训练好了的网络模型模拟矿床模型。 本文 选择 在实际应用中最为成熟,也使用最为广泛的反向传播网络( BP 网络) 来建立三维矿床模型。 1.1 BP 网络结构与学习算法构成 神经网络的两大要素是网络的结构 ( 网络的层数、各层神经元数、神经元间的连结方式 ) 和学习规则与算法。 BP 网络属于层状连接网络,它由输入层、输出层和若干个隐层组成。该网络采用误差逆传算法,即通过信息正向前馈和误差反传这两个过程不断调节各神经元间的权值和阈值,使得输出值与期望值的均方误差最小化而获取权系数,并将其作为知识用于未知样品参数预测或判别分类。 1.2 实际 BP 网络的设计 以建立煤层底板的 BP 网络模型为例,来说明实际的 BP 网络设计。煤层属于层状分布,由其钻孔数据描述它的分布情况,所以用在神经网络中的就是这些钻孔数据,以这些钻孔数据为样本来训练神经网络。钻孔数据中的煤层底板的地理位置坐标 ( , , ) 是建立煤层底板神经网络的基础数据。在实际操作过程中,采用神经网络法建立底板模型时,其网络结构是较复杂特殊的。实践中发现,如仅以 、 变量作为输入层的输入信息,以 作为输出的 3 层 BP 网络难以收敛,其中一个重要原因在于输入模式太单调,没有提供足够的信息供网络学习识别,相当于三维趋势回归分析。 为此可将 、 适当组合,这样就把原来的模式表达变换为另一个具有更高维的增强表达式。即输入层由 4 个神经元 ( =4) 构成,其值分别对应于 、 、 、 ;选择两个隐层,第一个隐层神经元数 ( ) 可取为 15 ;第二个隐层神经元数 ( ) 可取为 15 ;输出层设为 1 个神经元 ( =1) ,对应于要输出的模拟值或预测值,所采用的 BP 神经网络结构如图 1 所示。鉴于各种储层参数都有其变化收敛范围,为了保证整个网络具有较好的映射能力,其网络隐层和输出层的作用输出函数可选 型函数,即 (1) 此外,建模时要求有稳键较快的迭代算法,否则采用传统的 EBP 算法学习较为困难,训练时间长。在实际训练时,在对样本层点的输入输出值作规一化处理后,可使用变学习率与变冲量算法来加速收敛,求取可靠的权系数解。这样所求得的网络各层神经元间的权重值 、 和 加上网络结构本身就构成了三维地质数据的预测估值数学模型。用于煤层底板网格顶点的高程值的模拟时,仅需给输入层的各神经结点赋以相应的具体变量值,并将各结点间的权系数值代回网络中进行输入、输出正向运算,对输出值进行反规一化即可获得煤层底板的神经网络模型。 输入参数 输入层 隐层 1 隐层 2 输出层 输出参数 2 矿床地质模型建模应用实例 用钻孔的地质资料作为输入,相应的高程作为输出,对上面的神经网络进行训练,得到训练好的神经网络模型。用这个网络对钻孔范围内的四边形网格的顶点进行模拟,模拟的结果就是该层煤底板的三维模型。以某露天矿某煤层钻孔的底板资料为例,在这些资料中,有 638 个钻孔,提取某煤层底板的 ( , ) ,计算出相应的 和 , 作为神经网络的输入,以 H 作为神经网络的输出,用这 638 个样本对网络进行训练。训练过程图 2 所示。表 1 所示的是任意地从用来检验网络精度的样本中选出的 10 个样本的检测结果。 表 1 样本检测结果表 Tab.1 Sample test result 样本 输入参数 模拟结果 实测结果 绝对误差 X Y ln( X 2 + Y 2 ) 1 2 3 4 5 6 7 8 9 10 -2908.1992 -2737.4902 -2579.1191 -4046.8008 -3536.5000 -4271.6309 -3583.2891 -4285.1191 -5417.3691 -4649.1504 1351.0625 1244.7188 1149.8828 1385.3438 1091.7188 1073.7891 677.5469 750.3203 1020.4688 613.8906 7.0121 6.9563 6.9017 7.2624 7.1367 7.2878 7.1238 7.2770 7.4827 7.3423 3206.7104 3007.1877 2823.8425 4277.3560 3701.1731 4404.5264 3646.7834 4350.3135 5512.6440 4689.5054 596.7981 639.2612 629.1387 544.1174 571.5871 536.5503 577.8984 572.5274 526.9225 537.0306 596.7899 639.2999 629.0499 544.1200 571.5900 536.5499 577.9000 572.5300 526.9199 537.0300 0.0082 0.0387 0.0888 0.0026 0.0029 0.0004 0.0016 0.0026 0.0026 0.0006 用经过训练的网络,对在钻孔范围内的划分的四边形网格的顶点进行模拟。图 3 所示的是对某矿的煤层底板由神经网络进行模拟的结果,图上的小点为钻孔点,网格是按 50m 间距形成的。图 4 所示的是由神经网络模拟的该煤的三维立体图。 图 2 神经网络的训练过程 Fig.2 Training process of neural network 图 3 神经网络模拟的煤层底板网格 Fig. 3 Simulation result of coal floor with ANN 图 4 神经网络模拟的煤层顶底板三维图 Fig. 4 3D map of coal seam with ANN 3 结语 应用人工智能中的神经网络原理进行地质建模,充分考虑了地质变量的空间局域性、连续性、各向异性以及高度的非线性关系,这是传统的数学地质方法所不具备的。本文基于钻孔数据,设计并建立了矿床模型的 BP 神经网络结构,实现了用 BP 神经网络对矿床进行模拟,建立矿床的神经网络模型。利用某矿的实际数据建立了矿床的神经网络模型,并对矿床模型进行了三维显示。 图 1 煤层顶板的 BP 网络结构图 Fig.1 BP network structure of coal seam
个人分类: 未分类|4043 次阅读|0 个评论
一个基于SOFM网络模型的遥感图像分类方法
maokebiao 2009-5-31 17:57
摘 要:遥感图像分类一直是遥感研究方面的一个热点问题,也是遥感图像数据挖掘方面的一个重要方面。针对传统神经网络分类的弱点,先根据土地利用图对典型地物的像元值进行取样,然后用监督分类对纯净像元进行提取,最后利用自组织神经网络对剩余混合像元进行分类,从而避免了对纯净像元的误分,而且克服了传统神经网络的不足。利用SOFM网络模型对民乐县的遥感影像进行了分类并和传统的神经网络分类以及对应的土地利用图做了比较,用SOFM网络模型有效地提高了分类精度。为了保证分类精度,对地形和大气做了精校正。 1. 毛克彪 , 覃志豪 , 张万昌 , 一个基于 SOFM 网络模型的遥感图象分类方法 , 遥感技术与应用, 2003, 6:399-402. PDF下载
个人分类: 星星点灯|3186 次阅读|0 个评论
一个从MODIS数据同时反演地表温度和发射率的神经网络算法
maokebiao 2009-5-29 08:22
摘 要: MODIS的三个热红外波段29、31、32建立了三个辐射传输方程,这三个方程包含了5个未知数(大气平均作用温度、地表温度和三个波段的发射率)。用JPL提供的大约160种地物的波谱数据对MODIS三个波段(29/31/32)发射率之间的关系和用MODTRAN4对大气透过率和大气水汽含量之间关系进行模拟分析。分析结果表明地球物理参数之间存在着大量的潜在信息。由于潜在的信息难以严格地用数学表达式来描述,因此神经网络是非常适合被用来解这种病态反演问题。利用辐射传输模型(RM)和神经网络(NN)反演分析表明神经网络能够被用来精确地同时从MODIS数据中反演地表温度和发射率。地表温度的平均反演误差在0.4℃以下;波段29/31/32发射率平均反演误差都在0.008以下。 1. 毛克彪 , 唐华俊 , 李丽英 , 许丽娜 , 一个从 MODIS 数据同时反演地表温度和发射率的神经网络算法 , 遥感信息 , 2007,92(4):9-15. PDF下载: 一个从MODIS数据同时反演地表温度和发射率的神经网络算法
个人分类: 星星点灯|3519 次阅读|0 个评论
一个用神经网络优化的针对ASTER数据反演地表温度和发射率的多波段算法
maokebiao 2009-5-29 08:20
摘 要: 提出了针对ASTER数据同时反演地表温度和发射率的多波段算法。即利用ASTER数据的第11~14热红外波段建立热辐射传输方程,并同时对相应波段的发射率建立近似线性方程,得到6个方程6个未知数,从而形成了针对ASTER数据的同时反演地表温度和发射率的多通道算法。利用3种方法求解方程:①先分类,然后进行数学计算;②利用最小二乘法;③利用神经网络方法。利用辐射传输模型MODTRAN4模拟数据进行反演及验证分析,结果表明,神经网络能够提高算法的精度和实用性,反演的地表温度平均误差为0.5℃,反演的发射率平均误差分别在0.007(11、12波段)和0.006(13、14波段)以下。 1. 毛克彪 , 唐华俊 , 陈仲新 , 王永前 , 一个用神经网络优化的针对 ASTER 数据反演地表温度和发射率的多波段算法 , 国土资源遥感, 2007, 73 (3): 18-22. PDF下载: 一个用神经网络优化的针对ASTER数据反演地表温度和发射率的多波段算法
个人分类: 星星点灯|3363 次阅读|0 个评论
类脑计算机研究
shizz 2009-5-13 17:58
经过60多年的发展,计算机的运算速度达到几百万亿次,但是其智能水平极为低下。研究机器的高性能与人的高智能相结合,成为探索信息处理的高效能的有效途径。开展 类脑计算机的研究 并取得突破性进展,将对我国经济和社会可持续发展,国家安全和国防建设,信息产业的提升等带来重要的推动作用。 心智(mind)是人类全部精神活动, 包括情感、意志、感觉、知觉、表象、学习、记忆、思维、直觉等, 用现代科学方法来研究人类非理性心理与理性认知融合运作的形式、过程及规律。心智模型是用于解释个体为现实世界中之某事所运作的 內 在认知过程,是外在现实的 內 部标志或表示方法。如果神经网络是脑系统的硬件,那么心智模型就是脑系统的软件。 认知计算的关键想法是通过大脑的结构、动力学、功能和行为的逆向工程,建立脑系统的心智模型,进而在工程上实现类心智的智能机器。
个人分类: 生活点滴|4990 次阅读|1 个评论
遗传神经网络
ruanjunhu 2009-3-9 16:14
(河北工程大学 管理科学与工程 阮俊虎) 1. 神经网络 神经网络在神经生理学、神经解剖学的范畴里,指的是生物神经网络 (Biological Neural Networks) ;在信息、计算机科学等领域内,指的则是向生命学习而构造的人工神经网络 (Artificial Neural Networks) 。如同生物学上的基本神经元,人工的神经网络也有基本的神经元。每个神经元有特定数量的输入,也会为每个神经元设定权重( weight )。权重是对所输入的资料的重要性的一个指标。然后,神经元会计算出权重合计值( net value ),而权重合计值就是将所有输入乘以它们的权重的合计。每个神经元都有它们各自的临界值( threshold ),而当权重合计值大于临界值时,神经元会输出 1 。相反,则输出 0 。最后,输出会被传送给与该神经元连接的其它神经元继续剩余的计算。图 1 给出了单个神经元的基本结构。 图 1 神经元结构 本文仅以 BP 神经网络为例。 BP 神经网络是一种多层前馈网络,它是利用误差逆传播算法进行误差校正的神经网络,所谓误差逆传播算法 (Error Back-Propagation Training) 是利用实际输出与期望输出之差对网络的各层连接权由后向前逐层进行校正的一种计算方法。图 2 是一个三层 BP 网络模型。 这是一个三层 BP 网络,一般来讲, BP 网是一种具有三层或三层以上的多层神经元网络,它的左、右各层之间各个神经元实现全连接,即左层的每一个神经元与右层的每个神经元都有连接,而上下层各神经元之间无连接。在 BP 网络中,当一对学习模式提供给网络后,其神经元的激活值将从输入层经各中间层向输出层传播,在输出层的各神经元输出对应于输入模式的网络响应。然后,按减少希望输出与实际输出误差的原则,从输出层经各中间层,最后回到输入层逐层修正各连接权。随着这种误差逆传播训练的不断进行,网络对输入模式响应的正确率也不断的提高。由于 BP 网络有处于中间位置的隐含层,并有相应的学习规则可循,可训练这种网络,使其具有对非线性模式的识别能力,特别是它的数学意义明确、步骤分明的学习算法,更使其具有广泛的应用前景。 2. 遗传算法 遗传算法( Genetic Algorithm )是一类借鉴生物界的进化规律(适者生存,优胜劣汰遗传机制)演化而来的随机化搜索方法。它是由美国的 J.Holland 教授 1975 年首先提出,其主要特点是直接对结构对象进行操作,不存在求导和函数连续性的限定;具有内在的隐并行性和更好的全局寻优能力;采用概率化的寻优方法,能自动获取和指导优化的搜索空间,自适应地调整搜索方向,不需要确定的规则。遗传算法的这些性质,已被人们广泛地应用于组合优化、机器学习、信号处理、自适应控制和人工生命等领域。它是现代有关智能计算中的关键技术之一。 遗传算法( Genetic Algorithm ,简称 GA) 是根据达尔文的自然界生物进化思想,将其灵活运用到优化运算领域而产生的一种寻优算法。遗传算法是从代表问题可能存在解集的一个种群 (population) 开始的,而一个种群则由经过基因 (gene) 编码的一定数目的个体 (individual) 组成的。遗传算法常用来解决最优化问题,首先应对可行域中的点进行编码 ( 一般采用二进制编码 ) ,然后在可行域中随机挑选一些编码组成作为进化起点的第一代编码组,并计算每个解的目标函数值,也就是编码的适应度。接着利用选择机制从编码组中随机挑选编码作为繁殖过程前的编码样本。选择机制应保证适应度较高的解能够保留较多的样本;而适应度较低的解则保留较少的样本,甚至被淘汰。在繁殖过程中,使用交叉和变异两种算子对挑选后的样本进行交换,产生下一代编码组。 简单遗传算法可以形式化定义为一个 8 元组: SGA=(C , E , Po , M ,,,, T) ; 式中: C 表示个体的编码方法; E 表示个体的适应度函数; Po 表示初始种群; M 表示群体大小;表示选择算子;表示交叉算子;表示变异算子; T 表示遗传运算终止条件。 遗传算法的主要计算过程: (1) 对问题的可行解进行染色体编码; (2) 产生初始种群; (3) 对种群内的各个个体进行适应度评价; (4) 根据个体的适应度进行选择操作,然后交叉、变异产生新的群体; (5) 返回到 (3) ,对该组群体解码进行新的评价; (6) 若当前解满足要求或进化过程中达到一定的进化代数,计算结束,否则转 (3) 继续进行。 3. 遗传神经网络 BP 算法具有简单和可塑的优点,但是即算法是基于梯度下降的方法,这种方法的收敛速度慢,且常受局部极小点的困扰。遗传算法是一类借鉴生物界自然选择和自然遗传机制的随机化搜索算法,由于其主要特点是群体搜索策略和群体中个体之间的信息交换,搜索不依赖梯度信息。该算法从多点出发开始搜索,加上交叉作用,所以该算法不容易陷入局部最小误差。 图 3 局部最大和全局最大 目前有关遗传算法与神经网络相结合的应用研究工作主要包括三个方面: (l) 利用遗传算法进化神经网络的连接权; (2) 利用遗传算法进化神经网络的结构; (3) 利用遗传算法进化神经网络的学习规则。 以利用遗传算法进化神经网络的连接权为例说明利用遗传算法优化神经网络。神经网络的权值训练过程实际是一种复杂函数优化问题,即通过反复调整来寻找最优的连接权值。神经网络权值的整体分布包含着神经系统的全部知识,传统的权值获取方法是采用某种确定的变化规则,在训练中逐步不调整,最终得到一个较好的权值分布。但是目前广泛使用的 BP 网络,是基于梯度下降方法,因而对网络的初始权值异常敏感,不同的初始权值会导致完全不同的结果,而且在训练过程中,有关参数 ( 如学习速率 ) 的选取也没有理论指导,完全凭借经验来确定,一旦取值不当,就会引起网络振荡而不能收敛,即使收敛也会因为收敛速度慢而导致训练时间长,同时又极易陷入局部极值而无法得到最好的权值分布,最终影响网络的泛化能力。用遗传算法进化神经网络的连接权可以有效克服这些问题,进化连接权过程如下: (l) 采用某种编码方案对一权值 ( 阀值 ) 进行编码,随机产生一组分布,它就对应着一组神经网络的连接权 ( 阀值 ) ; (2) 输入训练样本,计算它的误差函数值,以误差平方和倒数作为适应度 ; 若误差越小,适应度越大,反之适应度大。以此来评价连接权 ( 阀值 ) 的优劣; (3) 选择适应度大的个体,直接遗传给下一代; (4) 再利用交叉,变异等操作对当前群体进化,产生下一代群体; (5) 重复 (2)- (4) ,这样初始确定的一组权值 ( 阀值 ) 得到不断进化,直到训练目标满足条件为止。 4. 适用范围 神经网络和遗传算法都是人们仿效生物处理模式的方法,并从中获得的用于处理复杂问题的方法。然而,随着神经网络和遗传算法研究的不断深入发现,在许多学科的应用研究中,神经网络技术己渗透到各个领域,在智能控制、模式识别、计算机视觉、非线性优化、连续语音识别、信号处理等方面取得了巨大的成功和进展,但是有关网络模型结构的确定,初始权值的确定以及 BP 算法收敛慢等问题,人工神经网络方法本身还没有很好的理论指导和解决办法,而遗传算法虽然对于寻优问题有很好的自适应优化搜索能力,但是它不具备自适应学习能力,难以单独有效地作为一种控制方法研究,又由于遗传算法能够收敛到全局最优解,且遗传算法的鲁棒性强,将遗传算法与神经网络结合起来是很有意义的。不仅能发挥神经网络的泛化映射能力,而且使神经网络具有很快的收敛性以及较强的学习能力。将它们结合起来,取长补短,寻求更有效的方法,用于解决复杂问题,越来越受到人们的重视。这样可以更好的发挥神经网络的泛化映射能力,并使神经网络具有很快的收敛能力以及较强的学习能力。 5. 推荐学习资源 ( 1 )书籍: 神经网络理论与 matlab7 实现 初学这入门还是挺不错的,看过了,就对 matlab 神经网络工具箱有教好的了解 神经网络设计 讲理论不是很多,看过之后就会对神经网络的原理有更好的了解 神经网络结构设计的理论与方法 对提高网络的泛化能力的一些方法做了讲述,并且书后有程序,对网络结构的设计应该是挺有帮助的。 ( 2 )论文: 李晔 基于一种改进遗传算法的神经网络 太原理工大学硕士论文集( 2007 ) 杨婷 基于遗传神经网络的汽车故障率预测 上海交通大学硕士论文集( 2008 ) 赵振勇 基于遗传 BP 神经网络的股市预测 贵州大学硕士论文集( 2007 ) 吴 涛 用遗传算法优化神经网络权值 张庆红 基于遗传算法的神经网络性能优化 刘 勇 基于 GA 的神经网络学习规则的发现 邱 俊 基于遗传算法的循环神经网络在销售预测中的应用 储诚山 基于遗传算法和 BP 神经网络的用水量预测 Nachol Chaiyaratana Time-Optimal Path Planning and Control Using Neural Networks and A Genetic Algorithm S. H. Ling An Improved Genetic Algorithm Based Fuzzy-Tuned Neural Network Gary G. Yen Hierarchical Rank Density Genetic Algorithm for Radial-Basis Function Neural Network Design Gary Yen Hierarchical Genetic Algorithm For Near-Optimal Feedforward Neural Network Design 书籍能帮助你系统、快速地理解基本原理,论文能帮你理清思路,进行创新! ( 3 )网站资源 http://www.jgchina.com/ednns/ednnsbk/ednns2.htm 数字神经网络系统 介绍神经网络的生物原型、系统模型、数学推理等 http://www.ymlib.net/ MATLAB 资源网 教程、源码、工具箱程序等 http://www.ilovematlab.cn/ MATLAB 中文论坛 http://bbs.bc-cn.net/forum-216-1.html MATLAB 编程论坛 http://www.matlab-download.cn/default.aspx Matlab 免费源码 免费提供各领域的 Matlab 源码
个人分类: 管理科学方法|6871 次阅读|0 个评论
人工神经网络的发展及其哲理
kinglandom 2008-10-30 11:48
【 作 者 】张德富/殷正坤 【作者简介】张德富,华中理工大学计算机学院;殷正坤,华中理工大学哲学系湖北 武汉 430074 张德富,华中理工大学计算机科学与技术学院博士。 殷正坤,华中理工大学哲学系教授。 【内容提要】人工神经网络是二十世纪科学技术所取得的重大成果之一,是人类认识自然道路上的又一座里程碑。90年代以来,国际学术界掀起了研究人工神经网络的热潮,但是探讨其哲学思想方面的研究相对薄弱。我们知道,任何一门影响巨大、意义深远的科学技术,其发展过程必然揭示了科学技术发展的基本规律以及影响其发展的主要因素。有鉴于此,本文对人工神经网络的产生背景、发展及前沿领域进行了详细的阐述,并对其蕴含着的丰富哲理发表了一些独到的看法。 【关 键 词】人工神经网络/非线性科学/认识论 【 正 文 】 中图分类号:TP387 文献标识码:A 1 人工神经网络产生的背景 自古以来,关于人类智能本源的奥秘,一直吸引着无数哲学家和自然科学家的研究热情。生物学家、神经学家经过长期不懈的努力,通过对人脑的观察和认识,认为人脑的智能活动离不开脑的物质基础,包括它的实体结构和其中所发生的各种生物、化学、电学作用,并因此建立了神经元网络理论和神经系统结构理论,而神经元理论又是此后神经传导理论和大脑功能学说的基础。在这些理论基础之上,科学家们认为,可以从仿制人脑神经系统的结构和功能出发,研究人类智能活动和认识现象。另一方面,19世纪之前,无论是以欧氏几何和微积分为代表的经典数学,还是以牛顿力学为代表的经典物理学,从总体上说,这些经典科学都是线性科学。然而,客观世界是如此的纷繁复杂,非线性情况随处可见,人脑神经系统更是如此。复杂性和非线性是连接在一起的,因此,对非线性科学的研究也是我们认识复杂系统的关键。为了更好地认识客观世界,我们必须对非线性科学进行研究。人工神经网络作为一种非线性的、与大脑智能相似的网络模型,就这样应运而生了。所以,人工神经网络的创立不是偶然的,而是20世纪初科学技术充分发展的产物。 2 人工神经网络的发展 人工神经网络的研究始于40年代初。半个世纪以来,经历了兴起、高潮与萧条、高潮及稳步发展的远为曲折的道路。 1943年,心理学家W.S.Mcculloch和数理逻辑学家W.Pitts 提出了MP模型,这是第一个用数理语言描述脑的信息处理过程的模型, 虽然神经元的功能比较弱,但它为以后的研究工作提供了依据。1949年,心理学家D.O.Hebb提出突触联系可变的假设,根据这一假设提出的学习规律为神经网络的学习算法奠定了基础。 1957 年, 计算机科学家Rosenblatt提出了著名的感知机模型,它的模型包含了现代计算机的一些原理,是第一个完整的人工神经网络,第一次把神经网络研究付诸工程实现。由于可应用于模式识别,联想记忆等方面,当时有上百家实验室投入此项研究,美国军方甚至认为神经网络工程应当比原子弹工程更重要而给予巨额资助,并在声纳信号识别等领域取得一定成绩。1960年,B.Windrow和E.Hoff提出了自适应线性单元, 它可用于自适应滤波、预测和模式识别。至此,人工神经网络的研究工作进入了第一个高潮。 1969年,美国著名人工智能学者M.Minsky和S.Papert编写了影响很大的Perceptron一书,从理论上证明单层感知机的能力有限,诸如不能解决异或问题,而且他们推测多层网络的感知机能力也不过如此,他们的分析恰似一瓢冷水,很多学者感到前途渺茫而纷纷改行,原先参与研究的实验室纷纷退出,在这之后近10年,神经网络研究进入了一个缓慢发展的萧条期。这期间,芬兰学者T.Kohonen 提出了自组织映射理论,反映了大脑神经细胞的自组织特性、记忆方式以及神经细胞兴奋刺激的规律;美国学者S.A.Grossberg的自适应共振理论(ART );日本学者K.Fukushima提出了认知机模型;ShunIchimari则致力于神经网络有关数学理论的研究等,这些研究成果对以后的神经网络的发展产生了重要影响。 美国生物物理学家J.J.Hopfield于1982年、1984年在美国科学院院刊发表的两篇文章,有力地推动了神经网络的研究,引起了研究神经网络的又一次热潮。 1982 年, 他提出了一个新的神经网络模型hopfield网络模型。他在这种网络模型的研究中,首次引入了网络能量函数的概念,并给出了网络稳定性的判定依据。1984年,他又提出了网络模型实现的电子电路,为神经网络的工程实现指明了方向,他的研究成果开拓了神经网络用于联想记忆的优化计算的新途径,并为神经计算机研究奠定了基础。1984年Hinton等人将模拟退火算法引入到神经网络中,提出了Boltzmann机网络模型,BM 网络算法为神经网络优化计算提供了一个有效的方法。1986年,D.E.Rumelhart和J.LMcclelland提出了误差反向传播算法,成为至今为止影响很大的一种网络学习方法。1987年美国神经计算机专家R.HechtNielsen提出了对向传播神经网络,该网络具有分类灵活,算法简练的优点,可用于模式分类、函数逼近、统计分析和数据压缩等领域。1988年L.Ochua 等人提出了细胞神经网络模型,它在视觉初级加工上得到了广泛应用。 为适应人工神经网络的发展,1987年成立了国际神经网络学会,并决定定期召开国际神经网络学术会议。1988年1月Neural Network 创刊。1990年3月IEEE Transaction on Neural Network问世。 我国于1990年12月在北京召开了首届神经网络学术大会,并决定以后每年召开一次。1991 年在南京成立了中国神经网络学会。 IEEE 与INNS 联合召开的IJCNN92已在北京召开。 这些为神经网络的研究和发展起了推波助澜的作用,人工神经网络步入了稳步发展的时期。 90年代初,诺贝尔奖获得者Edelman提出了Darwinism模型,建立了神经网络系统理论。同年,Aihara等在前人推导和实验的基础上,给出了一个混沌神经元模型,该模型已成为一种经典的混沌神经网络模型,该模型可用于联想记忆。 Wunsch 在90OSA 年会上提出了一种AnnualMeeting,用光电执行ART,学习过程有自适应滤波和推理功能,具有快速和稳定的学习特点。1991年,Hertz探讨了神经计算理论, 对神经网络的计算复杂性分析具有重要意义;Inoue 等提出用耦合的混沌振荡子作为某个神经元,构造混沌神经网络模型,为它的广泛应用前景指明了道路。1992年,Holland用模拟生物进化的方式提出了遗传算法, 用来求解复杂优化问题。1993年方建安等采用遗传算法学习,研究神经网络控制器获得了一些结果。1994年Angeline等在前人进化策略理论的基础上,提出一种进化算法来建立反馈神经网络,成功地应用到模式识别,自动控制等方面;廖晓昕对细胞神经网络建立了新的数学理论和方法,得到了一系列结果。HayashlY根据动物大脑中出现的振荡现象,提出了振荡神经网络。1995年Mitra把人工神经网络与模糊逻辑理论、 生物细胞学说以及概率论相结合提出了模糊神经网络,使得神经网络的研究取得了突破性进展。Jenkins等人研究光学神经网络, 建立了光学二维并行互连与电子学混合的光学神经网络,它能避免网络陷入局部最小值,并最后可达到或接近最理想的解;SoleRV等提出流体神经网络,用来研究昆虫社会,机器人集体免疫系统,启发人们用混沌理论分析社会大系统。1996年,ShuaiJW等模拟人脑的自发展行为, 在讨论混沌神经网络的基础上提出了自发展神经网络。1997、1998年董聪等创立和完善了广义遗传算法,解决了多层前向网络的最简拓朴构造问题和全局最优逼近问题。 随着理论工作的发展,神经网络的应用研究也取得了突破性进展,涉及面非常广泛,就应用的技术领域而言有计算机视觉,语言的识别、理解与合成,优化计算,智能控制及复杂系统分析,模式识别,神经计算机研制,知识推理专家系统与人工智能。涉及的学科有神经生理学、认识科学、数理科学、心理学、信息科学、计算机科学、微电子学、光学、动力学、生物电子学等。美国、日本等国在神经网络计算机软硬件实现的开发方面也取得了显著的成绩,并逐步形成产品。在美国,神经计算机产业已获得军方的强有力支持,国防部高级研究计划局认为神经网络是解决机器智能的唯一希望,仅一项8 年神经计算机计划就投资4亿美元。在欧洲共同体的ESPRIT计划中, 就有一项特别项目:神经网络在欧洲工业中的应用,单是生产神经网络专用芯片这一项就投资2200万美元。据美国资料声称,日本在神经网络研究上的投资大约是美国的4倍。我国也不甘落后,自从1990 年批准了南开大学的光学神经计算机等3项课题以来, 国家自然科学基金与国防预研基金也都为神经网络的研究提供资助。另外,许多国际著名公司也纷纷卷入对神经网络的研究,如Intel、IBM、Siemens、HNC。神经计算机产品开始走向商用阶段,被国防、企业和科研部门选用。在举世瞩目的海湾战争中,美国空军采用了神经网络来进行决策与控制。在这种刺激和需求下,人工神经网络定会取得新的突破,迎来又一个高潮。自1958年第一个神经网络诞生以来,其理论与应用成果不胜枚举。人工神经网络是一个快速发展着的一门新兴学科,新的模型、新的理论、新的应用成果正在层出不穷地涌现出来。 3 人工神经网络的发展前景 针对神经网络存在的问题和社会需求,今后发展的主要方向可分为理论研究和应用研究两个方面。 (1)利用神经生理与认识科学研究大脑思维及智能的机理、 计算理论,带着问题研究理论。 人工神经网络提供了一种揭示智能和了解人脑工作方式的合理途径,但是由于人类起初对神经系统了解非常有限,对于自身脑结构及其活动机理的认识还十分肤浅,并且带有某种先验。例如, Boltzmann机引入随机扰动来避免局部极小,有其卓越之处,然而缺乏必要的脑生理学基础,毫无疑问,人工神经网络的完善与发展要结合神经科学的研究。而且,神经科学,心理学和认识科学等方面提出的一些重大问题,是向神经网络理论研究提出的新挑战,这些问题的解决有助于完善和发展神经网络理论。因此利用神经生理和认识科学研究大脑思维及智能的机理,如有新的突破,将会改变智能和机器关系的认识。 利用神经科学基础理论的研究成果,用数理方法探索智能水平更高的人工神经网络模型,深入研究网络的算法和性能,如神经计算、进化计算、稳定性、收敛性、计算复杂性、容错性、鲁棒性等,开发新的网络数理理论。由于神经网络的非线性,因此非线性问题的研究是神经网络理论发展的一个最大动力。特别是人们发现,脑中存在着混沌现象以来,用混沌动力学启发神经网络的研究或用神经网络产生混沌成为摆在人们面前的一个新课题,因为从生理本质角度出发是研究神经网络的根本手段。 (2)神经网络软件模拟, 硬件实现的研究以及神经网络在各个科学技术领域应用的研究。 由于人工神经网络可以用传统计算机模拟,也可以用集成电路芯片组成神经计算机,甚至还可以用光学的、生物芯片的方式实现,因此研制纯软件模拟,虚拟模拟和全硬件实现的电子神经网络计算机潜力巨大。如何使神经网络计算机与传统的计算机和人工智能技术相结合也是前沿课题;如何使神经网络计算机的功能向智能化发展,研制与人脑功能相似的智能计算机,如光学神经计算机,分子神经计算机,将具有十分诱人的前景。 4 哲理 (1)人工神经网络打开了认识论的新领域 认识与脑的问题,长期以来一直受到人们的关注,因为它不仅是有关人的心理、意识的心理学问题,也是有关人的思维活动机制的脑科学与思维科学问题,而且直接关系到对物质与意识的哲学基本问题的回答。人工神经网络的发展使我们能够更进一步地既唯物又辩证地理解认识与脑的关系,打开认识论的新领域。人脑是一个复杂的并行系统,它具有认知、意识、情感等高级脑功能,用人工进行模拟,有利于加深对思维及智能的认识,已对认知和智力的本质的研究产生了极大的推动作用。在研究大脑的整体功能和复杂性方面,人工神经网络给人们带来了新的启迪。由于人脑中存在混沌现象,混沌可用来理解脑中某些不规则的活动,从而混沌动力学模型能用作人对外部世界建模的工具,可用来描述人脑的信息处理过程。混沌和智能是有关的,神经网络中引入混沌学思想有助于提示人类形象思维等方面的奥秘。人工神经网络之所以再度兴起,关键在于它反映了事物的非线性,抓住了客观世界的本质,而且它在一定程度上正面回答了智能系统如何从环境中自主学习这一最关键的问题,从认知的角度讲,所谓学习,就是对未知现象或规律的发现和归纳。由于神经网络具有高度的并行性,高度的非线性全局作用,良好的容错性与联想记忆功能以及十分强的自适应、自学习功能,而使得它成为揭示智能和了解人脑工作方式的合理途径。但是,由于认知问题的复杂性,目前,我们对于脑神经网的运行和神经细胞的内部处理机制,如信息在人脑是如何传输、存贮、加工的?记忆、联想、判断是如何形成的?大脑是否存在一个操作系统?还没有太多的认识,因此要制造人工神经网络来模仿人脑各方面的功能,还有待于人们对大脑信息处理机理认识的深化。 (2)人工神经网络发展的推动力来源于实践、 理论和问题的相互作用 随着人们社会实践范围的不断扩大,社会实践层次的不断深入,人们所接触到的自然现象也越来越丰富多彩、纷繁复杂,这就促使人们用不同的原因加以解释不同种类的自然现象,当不同种类的自然现象可以用同样的原因加以解释,这样就出现了不同学科的相互交叉、综合,人工神经网络就这样产生了。在开始阶段,由于这些理论化的网络模型比较简单,还存在许多问题,而且这些模型几乎没有得到实践的检验,因而神经网络的发展比较缓慢。随着理论研究的深入,问题逐渐地解决特别是工程上得到实现以后,如声纳识别成功,才迎来了神经网络的第一个发展高潮。可Minisky认为感知器不能解决异或问题, 多层感知器也不过如此,神经网络的研究进入了低谷,这主要是因为非线性问题没得到解决。随着理论的不断丰富,实践的不断深入, 现在已证明Minisky的悲观论调是错误的。今天,高度发达的科学技术逐渐揭示了非线性问题是客观世界的本质。问题、理论、实践的相互作用又迎来了人工神经网络的第二次高潮。目前人工神经网络的问题是智能水平不高,还有其它理论和实现方面的问题,这就迫使人们不断地进行理论研究,不断实践,促使神经网络不断向前发展。总之,先前的原因遇到了解释不同的新现象,促使人们提出更加普遍和精确的原因来解释。理论是基础,实践是动力,但单纯的理论和实践的作用还不能推动人工神经网络的发展,还必须有问题提出,才能吸引科学家进入研究的特定范围,引导科学家从事相关研究,从而逼近科学发现,而后实践又提出新问题,新问题又引发新的思考,促使科学家不断思考,不断完善理论。人工神经网络的发展无不体现着问题、理论和实践的辩证统一关系。 (3 )人工神经网络发展的另一推动力来源于相关学科的贡献及不同学科专家的竞争与协同 人工神经网络本身就是一门边缘学科,它的发展有更广阔的科学背景,亦即是众多科研成果的综合产物,控制论创始人Wiener在其巨著《控制论》中就进行了人脑神经元的研究;计算机科学家Turing就提出过B网络的设想;Prigogine提出非平衡系统的自组织理论,获得诺贝尔奖;Haken研究大量元件联合行动而产生宏观效果, 非线性系统混沌态的提出及其研究等,都是研究如何通过元件间的相互作用建立复杂系统,类似于生物系统的自组织行为。脑科学与神经科学的进展迅速反映到人工神经网络的研究中,例如生物神经网络理论,视觉中发现的侧抑制原理,感受野概念等,为神经网络的发展起了重要的推动作用。从已提出的上百种人工神经网络模型中,涉及学科之多,令人目不暇接,其应用领域之广,令人叹为观止。不同学科专家为了在这一领域取得领先水平,存在着不同程度的竞争,所有这些有力地推动了人工神经网络的发展。人脑是一个功能十分强大、结构异常复杂的信息系统,随着信息论、控制论、生命科学,计算机科学的发展,人们越来越惊异于大脑的奇妙,至少到目前为止,人类大脑信号处理机制对人类自身来说,仍是一个黑盒子,要揭示人脑的奥秘需要神经学家、心理学家、计算机科学家、微电子学家、数学家等专家的共同努力,对人类智能行为不断深入研究,为人工神经网络发展提供丰富的理论源泉。另外,还要有哲学家的参与,通过哲学思想和自然科学多种学科的深层结合,逐步孕育出探索人类思维本质和规律的新方法,使思维科学从朦胧走向理性。而且,不同领域专家的竞争与协调同有利于问题清晰化和寻求最好的解决途径。纵观神经网络的发展历史,没有相关学科的贡献,不同学科专家的竞争与协同,神经网络就不会有今天。当然,人工神经网络在各个学科领域应用的研究反过来又推动其它学科的发展,推动自身的完善和发展。 【参考文献】 ①胡守仁.沈清.神经网络应用技术.长沙:国防科技大学出版社,1993. ②王永骥,涂健.神经元网络控制.北京:机械工业出版社,1998. ③Veelenturf L P J. Analysis and Application ofArtificial Neural Networks. Prentice Hall,1995. ④郑积源.跨世纪科技社会可持续发展.北京:人民出版社,1998.
个人分类: 技术前沿|11534 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-29 17:57

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部