科学网

 找回密码
  注册

tag 标签: 模式识别

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

人脸检测之三: 贝叶斯公式.概率分布
热度 1 wanglin193 2011-3-7 10:46
设计一个模式识别系统需要确定两件事:第一件,用什么模式特征进行比较?提取那些能有效区分类别的特征,让同类样本在特征空间中尽量挤在一起,而让不同类别的样本间距离尽量远。(这里的“距离”根据不同的测量方法而有所不同,但总是希望通过某些方法把特征变换到线性空间中,毕竟欧式距离是比较直观的观察方法。)比如,在一个锅里炒黑豆子和白豆子(不止两颗),要想把他们分成黑豆和白豆两堆,比较好的特征是颜色;把大白菜和甘蓝菜分成两堆的特征是形状。如果白菜的“圆度roundness”是一种度量测度,用一个坐标轴表示,那么白菜们的这个特征在坐标轴上的位置应该是扎堆(clustering)的。如果有多种特征,每个特征对应一个坐标轴,组成的一个特征空间,它可能是很多维的高维空间。 第二件事,设计分类器。在特征空间中画一条线,线左边是大白菜,右边是甘蓝菜,这条线就是分类器。困难在于,两类模式在特征空间中的交界并不总是很明显。两类样本尽管聚类,比如呈现出高斯分布,但边界的地方两类是混在一起的。如果特征选择得不够好,这种不可分的情况就更加不可避免。模式分类问题其实都可以归结为"分大白菜哪点事"。 对于人脸检测问题,两类目标分别为人脸(正样本'+')和非人脸(负样本 '-'),也需要经过对图像提取特征和设计分类器两个串行步骤,现有的部分方法可以列一个表,比如: 特征 | 分类器 ———————————— pca降维 | AdaBoost 小波分解 | NN(神经网) Haar-like小波| SVM(支撑向量机) HOG | 贝叶斯分类法 LBP | ...... | ...... 原则上左右两边任选两项都可以组成一个图像识别系统,学术期刊(国内的更多些)上多如牛毛的文章几乎就是这么任意组合来的。实际上这也仅仅是一小部分,每种方法都能衍生出许多变化。经常听到某人听说某人的系统用了“神经网络”,这话提供的信息实在有限,因为他没有说他用的是什么特征,还有是什么神经网,是RBF网,还是BP网,如果是BP网那么有几层,每层都什么配置。久而久之,“神经网”,“SVM”这些词的滥用让它们都有被妖魔化的趋势。 我们的方法可以这样准确地描述,“Viola-Jones的Haar-like小波,加上经过Boosting的Naive Bayes组合分类器”,可真够罗嗦的。Haar-like小波特征我们在上节有介绍,用matlab计算比较方便,比如我们有若干24×24的样本图像组成一个3D矩阵samples, xy方向是图像平面,沿着它的z方向可以遍历所有样本,比如samples(:,:,7)表示第7个样本。所有样本的积分图像(积分数组)分两步计算: cumsam = cunsum(cunsum(samples,1),2); 对所有样本计算一个矩形特征的方法也可以利用矩阵特性批量进行,假设矩形由a,b,c,d四点组成: f1 = cumsam(ay,ax,:)+cumsam(dy,dx,:)-cumsam(by,bx,:)-cumsam(cy,cx,:); 另一个矩形特征为f2,则一个Haar小波特征为 fv = f1 - f2. 以上是对上一节特征提取具体计算方法的补充。接下来,因为上边提到的特征数目太多(10万多),希望从大量的特征feature pool)中选取有效的特征,原则是两类样本在这个特征轴上的分布尽可能离得远些,越远越好。“训练(training)”过程是个离线的过程(离线又是个什么东西?离线offline是相对于“在线online”说的,表示这种过程是在生产线下完成的,可以不计时间代价,“我可以等!”。训练好的模型,是需要用在实际检测中的,所以需要越快越好,叫“在线”。),就是从这个pool中打捞有用的特征,它们单个的分类能力尽管有限,但它们的组合,可以很强大。如何评价每个特征分布的好坏?用Bayesian 把每个都试一试看,看看哪个特征两类的分布差距最大。 贝叶斯公式,据我粗浅的认识应该是指:类别对于特征的后验概率正比于该类别在这些特征分布下的条件概率(就是上述特征分布)乘以该类的先验概率(比如世界人口的男女比例)。用公式表达: P(wi | f1,f2,...fn ) = p(f1,f2,...fn | wi ) * p(wi),wi表示很多类中的第i类,f1,...,fn表示。它的意思是,在给定特征值 f1,f2,...fn的情况下,属于类别wi的概率是多少。比如我们有m个类别,对于每个wi,i=1...m,都可算出一个概率,选其中最大的,对应的那个wi就是最终的类别,这个唤作“最大化后验概率(MAP)”。对于每个类别,都可以根据采集到的样本实现知道特征分布函数p(f1,f2,...fn | wi ),有几类就有几个这样的分布函数,叫概率分布函数(pdf)。对于人脸检测这样的两类问题(w+和w-),贝叶斯分类器可以用两类后验概率的比值表示, f(f1,...fn) = P(w+ | f1,f2,...fn )/P(w- | f1,f2,...fn ) , 这个值越大,越倾向于正样本,通常用一个阈值决定是'+'还是'-',另外p(w+)和p(w-)的比值可以认为是固定的和特征无关,最终分类器表示为条件概率的比值的形式: f(f1,...fn) = p( f1,f2,...fn | w+ ) / p( f1,f2,...fn | w- ) 对于组合特征f1,f2,...fn 的分布函数p( f1,f2,...fn | w+ )进一步简化的方法是,在假设n个特征统计无关的情况下,可以用每个特征的特征分布的连乘的形式来表达: p( f1,f2,...fn | w+ ) = p( f1 | w+ ) × p( f2 | w+ ) ×... × p( fn | w+ ) ; 这部分具体可参考概率论相关书籍。所谓统计意义的不相关,是指每个特征呈现的分布不是由其他特征决定的,是独立的p(f1|f2,...,fn) = p(f1), 这样的独立性假设是保证每个特征对分类的贡献都不受其他特征影响,它的反面则是指它提供的信息是冗余的。就象在班会上,程老师让大家发表对某项班级活动的看法,在老薛发言之后,我站起来说:“我完全同意薛同学的看法“。这样我的意见就不包含任何有用的信息(除了暴露了我其实并不关心这样的活动),是高度冗余的。 虽然实际上f1,f2,...,fn之间并非总是相对独立的,但还是假设上式勉强成立,这个一般叫做Naive Bayes(Naive 这个字源自法语,Too simple, sometimes naive.)。实际上,我们提到的AdaBoost方法就是尽量去除数据之间的相关性的。这样分类器表示为: p( f1 | w+ ) × p( f2 | w+ ) ×... × p( fn | w+ ) f(f1,...fn) = ------------------------------------------------------ p( f1 | w- ) × p( f2 | w- ) ×... × p( fn | w- ) 上式左右两边取对数,这样讨厌的乘除法就变成加减法了: ln(f(f1,...fn)) = + ....+ ; 其中ln(p( fj | w+ ))是某个特征的概率分布函数p( fj | w+ )的对数形式,p( fj | w+ )如果用参数化的形式表达成比如高斯分布或者混合高斯分布的形式的话,那么只用若干参数就可以表达了,但是它们并不是服从高斯分布的,所以通常用非参数的方法表达,那就是直方图。把ln(p( fj | w+ )) - ln(p( fj | w- )) 表示成一个直方图,表示每个特征的置信度,那么人脸检测就变成这样一个过程: 1 在输入的一个图像区域里,计算若干特征; 2 根据每个特征查表,在直方图里找到对应的置信度值; 3 把这些特征对应的置信度值求和,用一个阈值Th决定输出为‘+’或‘-’。 实际上不论用什么特征,什么分类器(神经网,SVM),它们最终的形式都可以表示成一组特征数据的加权和,以及一个最后的判决阈值Th的形式: if ( SUM ( H(fj) ) Th ) , j = 1, .. .., n, n个特征 wi = face; else wi = nonface; 下节将介绍特征分布的直方图是如何被用来选取特征,并最终组合成分类器的。 以上方法都不是我想出来的,我只是用白话写写我的理解。参考文献如下: 边肇祺, 《模式识别》 Tom M.Mitchell, Machine learning (《机器学习》 ) Bo WU, Haizhou AI, Chang HUANG, Shihong LAO, Fast Rotation Invariant Multi-View Face Detection Based on Real Adaboost, In Proc. the 6th IEEE Conf. on Automatic Face and Gesture Recognition (FG 2004), Seoul, Korea, May 17-19, 2004. http://media.cs.tsinghua.edu.cn/~imagevision/publications.htm
个人分类: 人脸检测|8336 次阅读|0 个评论
[转载]通信网络领域世界顶级会议思考
热度 1 heweisong 2011-2-27 14:35
综合各方面消息,通信网络的顶级会议有SIGCOMM, SIGMETRICS, Infocom,MobiHoc......,接受率一般都是在15%左右徘徊,有时甚至会降到8%以下。主要原因可能是做网络研究的人太多了,竞争太激烈。有的人是EE或CS出身,一门心思做网络;也有的是以前做图象处理、自动控制、模式识别、应用数学......发现网络中有用武之地,便也跑来凑热闹。圈内研究人士分析的结果:就是一定要发展一个自己的强项,这个强项必须是在研究中起奠基作用,能够用于着手解决很多种问题。比如概率与随机过程(尤其是Markov Chain),线性代数,最优化方法,泛函分析等等。编程似乎也算--某国外BOSS当年就是靠一个60,000行的大程序两年发表12篇论文,同时拿到了JSAC的年度最佳论文奖,然后找到了教授职位。
个人分类: 顶级会议|4455 次阅读|1 个评论
明明知道错了却改不过来——错觉中的语义附加
热度 1 hongkunhui 2011-2-27 10:57
明明知道错了却改不过来——错觉中的语义附加
人类知觉模式识别中发生的错觉现象已经被发现和研究得很多了,那么,这样的心理现象在信息加工理论中如何解释呢?我认为还是信宿在获取外部信息时激活了自身的记忆库,从中提取了一部分与输入信息相关的记忆信息汇入感知觉系统造成的。这是信宿获得的间接实得信息加入到整个实得信息集合中,对实得信息附加了自己的语义。一般情况下,实得信息是由外部输入的直接实得信息和信宿主体自身记忆库中提取的间接实得信息二部分构成的。人类知觉模式识别是对外部输入信息和主体内部提取信息的联合感知。在比较极端的情况下,主体获得的间接实得信息及其语义附加可以将来自外部的信息作比较大的失真性的修改,形成知觉中的错觉现象。在一定条件下知觉中错觉的形成是必然的,不可避免的。有的感知觉明明知道是错的,却想改也改不过来。下面是比较典型的视错觉图像: 缪勒莱耶错觉 二根线本来是一样长的,但看上去一根长一根短,形成错觉 线条明明是直线但看上去却是弯的 两个眼睛明明是平行的,看上去却是上下错开的 说明:在错觉的形成中,客观信息图像的输入激活了与这些图像有关的主体内部的记忆,这些记忆信息的提取作为间接实得信息附加到知觉中,附加的信息甚至干扰或歪曲了图像的原来的语义,使主体的识别发生错误,与客观信息差别较大。不用语义附加理论解释不了错觉的产生。下面的二根线段明明是一样长,但看上去右边的线段要长一些
个人分类: 信息科学|3709 次阅读|2 个评论
人脸检测之二:提取特征
热度 2 wanglin193 2011-2-26 20:31
人脸检测之二:提取特征
在著名英语教材新概念英语第四册里,有一篇关于回声定位的文章,提到:根据回声的模式,不光能定位鱼群,而且可以知道鱼群的种类,比如青鱼,还是鳕鱼。(With experience, and with improved apparatus, it is now possible not only to locate a shoal but to tell if it is herring, cod, or other well-known fish,by the pattern of its echo.)对于深海捕鱼的实际环境,定位鱼群唯一可资利用的信息就是回声信号的pattern,对鱼群的定位和识别,实际上变成对回声模式的定位和识别。对于人脸检测和识别问题,针对人脸图像pattern来进行分析是比较廉价和实用的方法。信号模式作为原始数据,要经过特征提取和特征分类两个步骤才能得到最终结果。对信号提取有代表性的信息,即特征,把pattern从数据空间转换到特征空间进行分类是模式识别一般的工作方式。 对于图像来说,除了提取均值方差等统计学里比较常用的信息之外,更多地还要利用信号处理领域常用的卷积(模板不动就是内积)方法。图像处理教材中关于图像滤波(去噪),差分(边缘提取)等方法,以及DCT变换,傅立叶变换和小波变换等都可以看作是二维卷积方法的具体应用。比如PCA方法中使用的KL变换,就是用若干模板和图像进行内积计算(点乘),每个内积结果可以看作一个特征,它的作用是方便地提取图像的能量成分,优点是全局性好,倾向于图像表达,因为根据这些特征值很容易重建原始图像。想想视频编码所用的和KL变换相似的DCT变换吧,它们的目的在于重建而非识别。另外基于全局的方法需要每个图像点都参与计算,对一个8×8的图像来说,一次内积的计算量为64次乘法和63次加法。 所以,基于局部计算的小波(wavelet)特征的优势就比较明显了:只计算有可能产生分类效果的局部特征,如果用很少的特征能把两类模式区分开,就不必需要全体图像的参与。比如最简单的Haar小波算子,或称模板:{-1,1},它的作用是计算两个图像点的差。如果要计算两个区域的差算子可以是这样:{-1,-1-1,-1,1,1,1,1},它的作用是一个区域的和减去另一个区域的和,对于一个8×8的二维区域也需要64+1次加(减)法,如果这样的特征出现在图像的不同位置,计算量也是很大的。实际上,用积分数组可以很容易的计算。 积分数组是指一个和原始信号相同尺寸的数组,对一维信号来说,它的每个点存储的都是左边的原始信号的和。Matlab中的cumsum()函数作用就是计算积分数组。 x=rand(64,1); xc=cumsum(x); plot(x),hold on,plot(xc,'r'); 信号x和它的积分数组xc结果如图: 积分数组xc的作用是如果对x中任意一个区间(a,b]求和,只要计算xc上ab两点的差即可。例如计算点15到35点间的和: sum(x(15:35)) ans = 10.7401 xc(35)-xc(14) ans = 10.7401 对于一个2D图像im求积分数组,只要沿着图像x,y方向做两次cumsum:imc=cumsum(cumsum(im1,1),2); im=rand(64); imc=cumsum(cumsum(im,1),2); imshow(im, ); 这样要求im中矩形对应的面积的话,只要在imc中计算 a+d-b-c 即可,也就是说任意大小区域的求和,只要3次加法即可实现。在 viola-jones的论文 中,特征定义为相邻两个(也有3个或4个)区域面积的差,称为Haar-like小波特征,可以用积分数组算法快速求得。对于一个24*24的图像样本,在不同位置计算不同尺寸、方向的Haar-like小波,这样可能的特征的数目在10万数量级。可以用一个程序穷举出文章描述的特征的各种配置(见附件),每种配置包含Haar小波的种类1-5(特征可能有2到4个矩形组成,2个和3个矩形的特征各有水平竖直2种方式),特征矩形左上角在样本中的位置的坐标,特征中单个小方块的长宽,这样每个特征需要5维矢量进行描述。10万个特征种类,我们可以事先计算好,用10万×5的矩阵存储下来。具体方法如下: ft=generate_featuretype(24, ,1,1, ); size(ft) ans = 162336 5 显示其中的若干行: ft(2000:2006,:) ans = 1 5 6 5 1 1 6 6 5 1 1 7 6 5 1 1 8 6 5 1 1 9 6 5 1 1 10 6 5 1 1 11 6 5 1 第1列表示两矩形的水平haar特征,2,3列表示左上角在24×24样本中的坐标,4,5列是一个矩形的尺寸。 实际上根据文章提供的特征描述的启发下,我们可以扩展出更多的类似两个矩形之间面积差的特征来。如果我们不限制两个矩形是“相邻”的话,需要有另外两个数来表示两个矩形之间的相对位置,这样的组合爆炸可以得到更多的特征表达。 上面提到用10万×5的矩阵存储一个表,每行是一个特征的描述,有10万个可能的特征,我们用每个特征的描述在24×24样本上都可以计算出一个特征值。假设我们有正负样本各5千,这样每个样本可以得到10万个特征值;对于单个特征类别每个特征在样本集上计算可以同样得到一个特征矢量。也就是说有这样一个表,可以把所有样本的所有特征值存储起来: 从水平方向看,它的每行对应一个样本;纵向看,它的每列对应一个特征种类在所有样本上的表现,是具有统计意义的。所谓训练,就是要利用这样庞大的2D数据,把那些能将两类样本加以区分出来的特征找出来,也就是说,从上面所说10万特征中,得到一个子集,它们最能体现出两类样本的差别。假设为了保留尽可能多的信息,我们用double型表示每个特征,那么存储量为8*1e9/1024/1024 = 7629.4 MByte,实际上可以先将数据量化,比如表示成8位unsigned char的形式,那么存储量就只有原来的1/8。另外,如果设计的最终分类器是分层结构的(应该是这样的),每层只需要提取很少的几个或几百个有用的特征,那么完全可以减少候选特征的数量;更进一步,样本数目也可以进一步减少(这样做也是有科学依据的,5k个分布均匀的样本可能和w个样本具有相同的代表性),这样上面这个表的水平竖直维数都可以大大减少,从而减少存储量。 相关文献: Viola-Jones论文 Robust Real-time Object Detection 附件: generate_featuretype.m 穷举出特征计算参数配置的程序。在Viola-Jones论文中,第4页注释2提到特征数为45396个,他们的特征位置为样本图像的奇数点,所以只有全部的1/4左右。
个人分类: 人脸检测|9443 次阅读|1 个评论
说是就是,说不是就不是——知觉中的语义附加
热度 1 hongkunhui 2011-2-23 13:57
说是就是,说不是就不是——知觉中的语义附加
一、无中生有的信息附加 语义附加的典型例 1 : 从云图中看出人像( 无中生有的信息附加) 语义附加的典型例 2 :火星上的面孔(无中生有的信息附加) 2 该图片如旋转 90 度后,被人们识别为面孔的概率减少很多, 语义附加的典型例3 : 主观轮廓的产生 覆盖在在上面的白色三角形的轮廓是主观自生的 说明:图片提供的客观信息是一个,但在人对图的识别中,由于主观心态的不同,对背景和对象的理解不同,和视觉扫描的重点、起点不同,可以产生出内容完全不同(信息语义不同)的图像识别和感知觉,原因是在识别过程中它们获得的间接实得信息不同,主观的语义附加内容不同,所以产生内容不同的感知觉,有的图像信息是无中生有,说是就是,说不是就不是。
个人分类: 信息科学|3741 次阅读|1 个评论
中国科学院自动化研究所2011年度招聘启事
talentblog 2011-2-22 16:02
中国科学院自动化研究所成立于1956年,是我国最早成立的自动化领域国家级科研机构。1999年,自动化所成为首批进入中国科学院知识创新试点工程的研究所之一。现设有二个基础实验室,三个工程中心,其中模式识别实验室是国家重点实验室,复杂系统与智能科学实验室是中国科学院重点实验室,专用集成电路设计工程中心是国家级工程中心。 自动化所五十余年的历史中为我国国民经济建设、社会进步、科技发展和国家安全做出了重要的贡献。自 1970年以来,自动化所共取得科研成果500余项,获得省部级以上奖励140余项。进入21世纪以来,自动化所又多次荣膺国家科技奖项,如“手写体汉字识别技术”荣获国家科技进步一等奖,“大规模断层数据的分割和三维重建及其应用”荣获国家科技进步二等奖,“虹膜图像获取与识别技术”、“小动物多模态光学分子影像成像方法与系统”荣获国家技术发明二等奖等等。 自动化所作为国立研究所还肩负着为国培养人才的重任,研究所现具有控制理论与控制工程、模式识别与智能系统和计算机应用技术三个专业的博士和硕士学位授予权。 目前,自动化所主要科技骨干均具有博士学位,并拥有一批海外留学归国人员,现科研部门负责人中70%具有海外留学背景。由于工作需要,现面向社会诚聘英才。 联系方式 地址:北京市海淀区中关村东路95号自动化所人力资源处(100190) 电话:010-82614518 邮箱:zhaopin@ia.ac.cn 网址: http://www.ia.cas.cn/ 部门:模式识别国家重点实验室 实验室始建于1984年,1987年8月正式对外开放,同年12月通过国家验收,是由国家计委首批投资成立的国家重点实验室之一。 近年来,实验室已获准和申请专利100余项,获国家自然科学二等奖1项,国家技术发明二等奖1项,国家科技进步二等奖1项,北京市科学技术奖一等奖1项,中国科学院自然科学二等奖2项,其它部委级三等奖4项,国际发明金奖与世界知识产权专项奖各1项。 主要研究方向: 实验室以模式识别基础理论、图像处理与计算机视觉以及语音语言信息处理为主要研究方向,研究人类模式识别的机理以及有效的计算方法,为开发智能系统提供关键技术,为探求人类智力的本质提供科学依据。 主页链接: http://www.nlpr.ia.ac.cn 科研方向: 模式识别基础 岗位要求: 1、 获得模式识别与智能系统、计算机应用或电子工程及其相关专业博士学位; 2、 具有扎实的数学基础、熟练的计算机编程能力和英语交流能力; 3、 具有很强的团队合作精神和一定的项目组织管理能力; 4、 研究能力突出,在本领域高水平国际学术期刊或顶级国际会议上有论文发表。 简历请发至: nlpr_hr@nlpr.ia.ac.cn 科研方向: 语音语言技术 岗位要求: 1、 获得博士学位; 2、 具有扎实的数学基础、熟练的计算机编程能力和英语交流能力; 3、 具有很强的团队合作精神和一定的项目组织管理能力; 4、 具有自然语言处理、语音识别或语音合成方面的研究背景,在本领域高水平国际学术期刊或顶级国际会议上发表过论文;或者有开发实用系统的经验,有较好的编程能力。 简历请发至: nlpr_hr@nlpr.ia.ac.cn 科研方向: 计算机视觉与图形学 岗位要求: 1、 获得博士学位; 2、 具有扎实的数学基础、熟练的计算机编程能力和英语交流能力; 3、 具有很强的团队合作精神和一定的项目组织管理能力; 4、 具有较强的三维几何处理研究背景,特别是计算机图形学、图像分析和模式识别结合方面,对大规模和复杂场景的建模与绘制技术,以及相关图像合成算法有充分的了解和实践经验; 5、 有国外学习或工作经历,在国际顶级刊物或会议上有论文发表者优先。 简历请发至: nlpr_hr@nlpr.ia.ac.cn 科研方向: 图像处理与多媒体 岗位要求: 1、 获得博士学位; 2、 具有扎实的数学基础、熟练的计算机编程能力和英语交流能力; 3、 具有很强的团队合作精神和一定的项目组织管理能力; 4、 图像处理、模式识别、或计算机应用相关背景,有较强的工程背景。 简历请发至: nlpr_hr@nlpr.ia.ac.cn 科研方向: 生物识别与安全 岗位要求: 1、 模式识别与智能系统、计算机应用或电子工程专业,博士学位获得者; 2、 具有扎实的数学基础、熟练的计算机编程能力和英语交流能力; 3、 具有很强的团队合作精神和一定的项目组织管理能力; 4、 有模式识别或图像/视频处理与分析的研究背景,在本领域高水平国际学术期刊或顶级国际会议上发表过论文。 简历请发至: nlpr_hr@nlpr.ia.ac.cn 科研方向: 网络数据理解与安全 岗位要求: 1、 获得模式识别与智能系统、计算机应用或电子工程及其相关专业博士学位; 2、 具有扎实的数学基础、熟练的计算机编程能力和英语交流能力; 3、 有模式识别、图像/视频处理与分析或计算机应用的研究背景,具有很强的团队合作精神和一定的项目组织管理能力; 4、 有网络搜索、网络内容分析、网络内容安全保护等研究经验者优先。 简历请发至: nlpr_hr@nlpr.ia.ac.cn 科研方向: 计算医学 1、 获得博士学位; 2、 具有扎实的数学基础、熟练的计算机编程能力和英语交流能力; 3、 具有很强的团队合作精神和一定的项目组织管理能力; 4、 具有精神疾病学、神经病学、神经科学、脑影像学、计算机、模式识别等领域的研究经历,在本领域高水平国际学术期刊或顶级国际会议上发表过论文。 简历请发至: nlpr_hr@nlpr.ia.ac.cn 部门:复杂系统与智能科学实验室 实验室1994年经中国科学院批准正式对国内外开放。 实验室现任学术委员会主任为戴汝为院士,主任为王飞跃研究员。 主要研究方向: 实验室以复杂系统和智能科学的理论与应用为主要研究方向,利用网络化环境,充分发挥多学科交叉优势,立足自动化和系统工程技术,以智能科学的理论和方法解决工程、社会、经济和国家安全中的复杂系统建模、分析、控制和优化等问题。 主页链接: http://compsys.ia.ac.cn 科研方向: 社会计算 岗位要求: 1、获得数学、计算机或相关专业博士学位; 2、信息具有丰富的交叉学科研究背景和较强的适应能力; 3、具备良好的科研素质,善于分析和解决问题; 4、具有扎实的复杂网络、数据挖掘、推荐系统、应急管理等方面的专业知识; 5、能独立地设计研究方案并进行研究工作,取得了具有一定创新性的研究成果,并在与该领域相关的国际期刊上发表过学术论文; 6、具有国家级科研项目经验者(如国家自然科学基金、863、973等)优先; 7、了解本领域国内外研究现状和发展趋势,有一定的项目组织管理能力,并能指导初级研究人员开展研究工作。 简历请发至: fenglin.li.casia@gmail.com 社会计算工程实现 岗位要求: 1、获得数学、计算机或相关专业硕士(含)以上学位; 2、有较强的编码和调试能力,并具有良好、规范的编程习惯和文档编写习惯; 3、具备信息检索相关知识,对主题提取、复杂社会网络等进行过深入研究,对自然语言处理尤其在命名实体识别方面有深入研究和开发经验者优先; 4、对人工智能、决策支持系统、数据挖掘、复杂网络理论有一定理解; 5、具有创新精神、独立工作能力和团队协作精神,工作踏实勤恳,责任心强; 6、具有良好计算机素养,具有较强的英文阅读和理解能力。 简历请发至: fenglin.li.casia@gmail.com 科研方向: 平行农林业 岗位要求: 1、计算机、应用数学相关专业博士学位获得者; 2、具有独立从事科研工作的能力; 3、熟练掌握C++编程; 4、有植物生长建模研究背景者优先; 5、较强的理论与实际工作的能力; 6、良好的沟通能力、团队协作精神; 7、良好的英语听说读写能力。 简历请发至: mzkang@nlpr.ia.ac.cn fenglin.li.casia@gmail.com 科研方向: 平行控制 岗位要求: 1、获得自动控制或管理、电力、应用数学、自动化、计算机等相关专业博士学位,具有良好的数学功底、熟悉近代控制理论和非线性控制理论,熟悉神经网络理论; 2、具有本学科扎实的基础知识和专业知识,了解本学科国内外现状和发展趋势,有严谨的工作作风和良好的语言沟通能力,具有较强的创新意识和创新能力,具有宏观思考和跨学科研究能力,学术态度端正,工作勤奋认真; 3、具有较强的专业学术背景,具备独立从事科研工作的能力,能适应开展国际合作交流的需要,熟练运用英语撰写相关学术论文,能够熟练运用英语进行国际学术交流。 简历请发至: fenglin.li.casia@gmail.com 平行控制系统研发 岗位要求: 1、具有计算机、自动控制、通信、电子工程及相关专业硕士以上学位; 2、具有扎实的光学、图像处理、视频监控及相关知识; 3、有做国际一流研究的志向和潜力; 4、性格开朗,具有良好的沟通能力、团队合作与协调能力; 5、具有图像处理软硬件系统经验; 6、具备良好的学习能力和强烈的工作责任感。 简历请发至: fenglin.li.casia@gmail.com 科研方向: 平行管理 岗位要求: 1、计算机、自动控制、通信、电子工程及其相关专业博士或硕士毕业工作2年以上; 2、有高水平文章发表或实际项目开发经验,具有扎实的数学基础和熟练的计算机编程能力; 3、有较强的团队合作意识与组织协调能力; 4、良好的英语听说读写能力。 简历请发至: fenglin.li.casia@gmail.com 平行管理系统研发 岗位要求: 1、计算机专业硕士及以上学历; 2、主要承担工业平行管理系统的架构设计,开发和应用,要求具有五年以上的C#开发经验,至少具有三年以上的C#项目设计经验; 3、了解软件开发流程,有良好的沟通、逻辑分析、文档书写和开发能力; 4、责任心强,具备良好的沟通能力和团队合作精神,能承担一定的工作压力; 5、能够在保证质量的前提下按时完成上级交付的工作任务。 简历请发至: fenglin.li.casia@gmail.com 科研方向: 分子影像/医学影像 岗位要求: 1、获得分子影像、医学影像或相关领域博士学位; 2、具有本学科扎实的基础知识和专业知识,了解本学科国内外现状和发展趋势; 3、具有较强的专业学术背景,具备独立从事科研工作的能力; 4、具有较强的团队意识和奉献精神; 5、具有相关领域海外工作经验者或博士后工作经验优先考虑。 简历请发至: Xin.yang@ia.ac.cn 科研方向: 工业机器人仿真及系统设计 岗位要求: 1. 工业机器人相关专业毕业,工学博士学位; 2. 动手能力强,具有工业机器人仿真经验,熟练掌握机械设计理论与技术; 3. 在国际期刊上有1篇以上论文发表。 简历请发至: Jianhua.su@ia.ac.cn 科研方向: 机器人视觉技术及其应用开发 岗位要求: 1、 工学博士学位; 2、 机器人视觉相关专业,具有多年机器人视觉方向的研究背景; 3、 较强的人际交往和机器人应用开发能力; 4、 在国际期刊上有1篇以上论文发表。 简历请发至: Jianhua.su@ia.ac.cn 科研方向: 机器学习 岗位要求: 1、博士学位,数学相关专业毕业; 2、要求具有数学、信息、机器人交叉研究背景; 3、较强的项目申请、撰写经验; 4、在国际期刊上有2篇以上论文发表。 简历请发至: Jianhua.su@ia.ac.cn 科研方向: 智能机器人 岗位要求: 1、 机械学或机械设计相关专业; 2、 有从事机械设计和开发的经历; 3、 熟悉机械设计的工具软件; 4、 工作刻苦努力、踏实勤奋,有团队合作精神。 简历请发至: Xuezhen.zhang@ia.ac.cn 科研方向: 智能机器人(2) 岗位要求: 1、 自动控制或自动化专业; 2、 有从事手术机器人研究和开发的经历; 3、 熟悉控制、电路的工具软件和硬件; 4、 刻苦努力、踏实勤奋,有团队合作精神,有参加国家项目的经验。 简历请发至: Xuezhen.zhang@ia.ac.cn 科研方向: 智能机器人(3) 1、博士及以上学历, 计算机、电子、自动化相关专业; 2、熟悉ARM、DSP、FPGA等嵌入式系统设计、编程及电路版图设计; 3、熟悉C/C++、VHDL/Verilog语言,熟练使用相关EDA工具,有相关项目经验; 4、具有扎实的控制理论基础,熟练掌握matlab/simulink算法仿真; 5、具有在机电一体化、机器人控制等相关方向的科研经历,并在国家级项目中承担主要任务; 6、有较强的责任心,良好团队协作能力、沟通能力、谦虚踏实。 简历请发至: zzl@compsys.ia.ac.cn 科研方向: 智能机器人(4) 1、计算机科学、自动控制相关专业,硕士及以上学历; 2、具有丰富的机器人控制系统软件系统的开发经验,扎实的数学基础,严谨的逻辑思维和一定的创新能力; 3、精通数据结构, C/C++,Matlab等开发工具;精通LINUX、UC-OS-II或VxWorks等嵌入式实时操作系统; 4、精通经典及现代控制理论、智能控制理论,有较强的英语沟通能力; 5、较强的解决问题和独立工作、决策的能力,有较丰富的研发项目管理经验,能领导团队合作开展工作,协调能力强。 简历请发至: zzl@compsys.ia.ac.cn 科研方向: 模式识别与智能系统 岗位要求: 1、模式识别与智能系统相关专业博士学位获得者; 2、具有综合集成及模式识别的知识与经验; 3、具有图片分类、目标检测的研究背景与经验; 4、参与过项目研究及成果转化; 5、具有较强的独立研发能力和良好的团队合作精神。 简历请发至: Chunheng.wang@ia.ac.cn 国家专用集成电路设计工程技术研究中心 该中心是国家级的专用集成电路分析和设计基地,主要从事集成电路设计和分析方法学研究,同时自主地进行民用集成电路研制和分析工作。目前,该中心已正式成为国家专用高性能集成电路项目的承担单位。 主要研究方向: ⇒高性能数字信号处理器设计技术 ⇒集成电路分析方法学研究 ⇒集成电路分析系统开发与应用 科研方向: 集成电路设计 1、微电子计算机相关领域硕士研究生以上学历; 2、较好的数学、编程和电路基础; 3、熟练的集成电路前后端设计能力和丰富的EDA工具使用经验; 4、很强的团队意识和创新意识。 接收简历邮箱:zhigang.yin@ia.ac.cn 科研方向: 集成电路分析 1、数学软件相关领域硕士研究生以上学历; 2、较好的编程能力和图像处理算法设计能力; 3、很强的团队意识和创新意识。 接收简历邮箱: zhigang.yin@ia.ac.cn 科研方向: 集成电路测试 1、电路计算机相关领域研究生以上学历; 2、较好的编程能力动手能力; 3、很强的团队意识和创新意识。 接收简历邮箱: zhigang.yin@ia.ac.cn 部门:高技术创新中心 该中心是所级综合性信息与自动化研发机构,以智能识别和智能控制技术以及两者的有机结合和集成应用为主要的科研和开发方向。 主要研究方向: ⇒语音语言信息处理 ⇒网络内容计算与服务 ⇒交互媒体技术 ⇒视觉伺服和运动控制 ⇒智能服务机器人技术与系统 科研方向: 视频/音频内容分析 岗位要求: 1、获得视频/图像处理和语音识别或相关领域博士学位,35岁以下; 2、具有本学科扎实的基础知识和专业知识,了解本学科国内外现状和发展趋势; 3、具有较强的专业学术背景,具备独立从事科研工作的能力; 4、具有较强的团队意识和奉献精神。 简历请发至: pding@hitic.ia.ac.cn 视频内容分析处理 博士后 岗位要求: 1、获得视频/图像处理或相关领域博士学位,博士毕业2年以内; 2、具有本领域扎实的基础知识和专业知识,了解本学科国内外现状和发展趋势; 3、具有较强的专业学术背景,具备独立从事科研工作的能力; 4、具有较强的团队意识和奉献精神。 简历请发至: pding@hitic.ia.ac.cn 海量和分布式计算 博士后 岗位要求: 1、获得分布式并行计算/分布式检索或相关领域博士学位,博士毕业2年以内; 2、具有本领域扎实的基础知识和专业知识,了解本学科国内外现状和发展趋势; 3、具有较强的专业学术背景,具备独立从事科研工作的能力; 4、具有较强的团队意识和奉献精神。 简历请发至: pding@hitic.ia.ac.cn 科研方向: 大规模教育测量与评估 1、获得博士学位,30岁以下; 2、模式识别与智能系统相关专业毕业,具有语音识别和语言评估的研究经验。 简历请发至: pgao@hitic.ia.ac.cn 科研方向: 计算机图形学 1、计算机图形学相关方向博士学位获得者; 2、熟悉GPU(Graphic Processing Unit)技术、数字几何处理、计算机动画、大规模场景渲染等; 3、具有较强的专业学术背景,具备独立从事科研工作的能力; 4、具有较强的团队意识和奉献精神。 简历发送至: xshuang@hitic.ia.ac.cn zhengwang@hitic.ia.ac.cn 科研方向: 3D获取与人机交互技术 1、计算机视觉相关方向毕业,博士学位获得者; 2、具有最优化算法研究经历; 3、具有较强的专业学术背景,具备独立从事科研工作的能力; 4、具有较强的团队意识和奉献精神。 简历发送至: xshuang@hitic.ia.ac.cn zhengwang@hitic.ia.ac.cn 科研方向: Web3D技术 1、计算机相关专业博士学位获得者; 2、熟悉Web3D技术如WebGL、O3D、Html5等,熟悉Soa架构体系; 3、具有较强的专业学术背景,具备独立从事科研工作的能力; 4、具有较强的团队意识和奉献精神。 简历发送至: xshuang@hitic.ia.ac.cn zhengwang@hitic.ia.ac.cn 科研方向: 计算机网络研发 1、计算机相关专业硕士学位获得者; 2、熟悉信号的传输原理、网络架设或云计算体系、熟悉Tcp/Ip协议、精通C++; 3、具有较强的专业学术背景,具备独立从事科研工作的能力; 4、具有较强的团队意识和奉献精神。 简历发送至: xshuang@hitic.ia.ac.cn zhengwang@hitic.ia.ac.cn 科研方向: 口语云翻译 1、机器翻译及其相关领域博士学位获得者; 2、具有很强的并行编程能力。 简历发送至: xshuang@hitic.ia.ac.cn 科研方向: 高性能嵌入式视觉系统 1. 工学博士学位获得者; 2. 熟悉计算机视觉算法与应用程序研制开发; 3. 拥有3年以上进行FPGA和DSP应用程序的开发经验,完成过2个以上应用系统; 4. 熟悉基于ARM的LINUX嵌入式操作系统应用开发。 接收简历邮箱: kui.yuan@ia.ac.cn 科研方向: 现代网络服务科学 1、网络信息安全、电子商务、网络内容挖掘等相关方向博士毕业两年以上; 2、具备网络内容挖掘与信息安全、电子商务认证技术、信息内容分析等相关知识,从事过相关的研发工作,具备独立研发能力; 3、有严谨的工作作风和良好的沟通能力,学术态度端正,工作认真踏实,具有较强的团队意识和奉献精神。 接收简历邮箱: shuwu.zhang@ia.ac.cn 现代网络服务科学 博士后 1、网络信息安全、电子商务、网络内容挖掘等相关方向博士毕业; 2、熟悉网络内容挖掘与信息安全、敏感目标检测过滤、舆情分析、电子商务认证技术等相关知识,从事过相关的研发工作; 3、有严谨的工作作风和良好的沟通能力,学术态度端正,工作认真踏实,具有较强的团队意识和奉献精神。 接收简历邮箱: shuwu.zhang@ia.ac.cn 科研方向: 数字家庭服务 1、计算机应用、多媒体技术、模式识别、软件体系架构等相关方向博士毕业; 2、具备音视频内容分析挖掘、媒体内容集成管理、音视频转码适配或软件体系架构设计方面的相关知识,从事过相关的研发工作,具备独立研发能力; 3、有严谨的工作作风和良好的沟通能力,学术态度端正,工作认真踏实,具有较强的团队意识和奉献精神。 接收简历邮箱: shuwu.zhang@ia.ac.cn 软件工程师 1、计算机、软件等相关专业本科以上学历; 2、熟悉java\c\c++等编程语言,具有较强的编程能力; 3、具有多媒体相关系统软件的开发经验或从事过相关技术测试工具软件研发工作; 4、工作认真踏实,具有较强的团队意识和奉献精神。 接收简历邮箱: shuwu.zhang@ia.ac.cn 数字家庭服务 博士后 1、计算机应用、多媒体技术、模式识别、软件体系架构等相关方向博士毕业; 2、在多媒体内容挖掘管理、标准符合性测试或系统集成验证等方面有相关背景; 3、有严谨的工作作风和良好的沟通能力,学术态度端正,工作认真踏实,具有较强的团队意识和奉献精神。 接收简历邮箱: shuwu.zhang@ia.ac.cn 科研方向: 数字版权保护工程 1、获得计算机相关专业博士学位; 2、具备数字出版、数字版权保护、数字水印、信息安全、多媒体信息检索等领域的相关知识,从事过相关的研发工作,具备独立研发能力; 3、了解软件体系架构设计方面知识,具备进行大型软件的架构设计的能力,具有大型软件工程项目的架构设计的申请者将予以优先考虑; 4、有严谨的工作作风和良好的沟通能力,学术态度端正,工作认真踏实,具有较强的团队意识和奉献精神。 接收简历邮箱: shuwu.zhang@ia.ac.cn 研发工程师 1、计算机相关专业本科以上学历,获硕士以上学历者优先; 2、熟悉c\c++或java等编程语言,熟练掌握Visual Studio、Eclipse等开发工具; 3、具备较强的编码和调试能力,良好、规范的编程习惯和文档编写习惯; 4、具有电子书、数字图书馆、多媒体、数字版权管理等相关系统软件的开发经验; 5、工作认真踏实,具有较强的团队意识和奉献精神。 接收简历邮箱: shuwu.zhang@ia.ac.cn 数字版权保护工程 博士后 1、即将或刚获得计算机等相关方向博士学位,研究方向为计算机应用、多媒体技术、数字版权保护等相关方向; 2、对数字出版、数字版权保护、数字水印、信息安全、多媒体信息检索等领域有深入的了解,有独立从事科研工作的能力和较强的英语交流能力,在国际主要期刊或会议上发表过高水平论文的申请者将予以优先考虑; 3、参与过实际应用的工程项目,具备相关研发经验; 4、有严谨的工作作风和良好的沟通能力,学术态度端正,工作认真踏实,具有较强的团队意识和奉献精神,服从团队安排。 接收简历邮箱: shuwu.zhang@ia.ac.cn 部门:综合信息系统研究中心 该中心成立于2004年,主要从事智能信息处理、智能控制与集成技术的研究和开发。中心下设综合信息部、智能控制部、智能视觉部、虚拟现实部、科学艺术研究中心、RFID研究中心、彩票安全技术研发中心等部门。 主要研究方向: ⇒控制技术研究与开发 ⇒智能视觉研究与开发 ⇒网格技术研究与开发 ⇒RFID技术与应用 ⇒语义信息处理与知识服务 ⇒彩票系统测试与安全监控技术 ⇒综合信息处理系统的开发与应用 ⇒多媒体与虚拟现实应用技术研究与开发 科研方向: 飞行控制系统 岗位要求: 1、 获得控制/飞行控制或相关专业博士学位; 2、具有智能信息处理、知识管理及运用相关理论、方法的研究能力; 3、具有较强的系统工具软件开发能力; 4、具有较强的团队意识和奉献精神。 简历请发至: Zhenglan.xu@ia.ac.cn 科研方向: 综合信息系统 岗位要求: 1、获得相关专业博士学位; 2、具有智能信息处理、知识管理及运用相关理论、方法的研究能力; 3、系统工具软件开发能力; 4、具有较强的团队意识和奉献精神。 简历请发至: Zhenglan.xu@ia.ac.cn 科研方向: 物联网与工业感知 1、 获得计算机、电子工程、自动化或相关专业硕士及以上学位; 2、具有本学科扎实的基础知识和专业知识,了解本学科国内外现状和发展趋势; 3、具有较强的专业学术背景,具备独立从事科研工作的能力; 4、具有较强的团队意识和奉献精神。 简历请发至: Jie.tan@ia.ac.cn 科研方向: 三维动画与虚拟现实 岗位要求: 1、获得计算机图形、图像、虚拟现实方向博士学位; 2、具有较强的编程能力; 3、具有较强的团队意识和奉献精神。 简历请发至: Zhenglan.xu@ia.ac.cn
3473 次阅读|0 个评论
树或挂满人头的树——双义图知觉识别中的语义附加
热度 1 hongkunhui 2011-2-22 14:11
树或挂满人头的树——双义图知觉识别中的语义附加
语义附加指在信息处理过程中信宿主体对来自外部输入信息的语义内容进行主观内容的添加。语义附加现象大都发生于复杂系统的信息处理中(如人的知觉模式识别),简单系统的信息处理不会发生语义附加现象。有二类语义附加,一是知觉模式识别的语义附加,(时间比较短, 0.3 —— 0.5 秒可完成。二是联想性语义附加,时间可更长一些,直到被其他内容的信息输入所打断。 知觉语义附加的信息不是来源于现实的外部输入信息,而是来源于信宿主体原来就存在的记忆信息,是信宿主体在外部信息输入(自下而上的信息处理)的刺激下,激活了主体内部与此外部输入信息有关的记忆,又从这些被激活的记忆信息中提取了一部分信息,通过自上而下的处理汇入感知觉系统或人的显意识空间中形成的。 知觉信息的语义附加,使被人知觉到的信息内容除了有客观性的一面,也有信宿的主观性的一面。知觉到的信息内容是主观信息与客观信息的统一。语义附加有改变信息客观性的一面,导致客观信息的“失真”产生错觉,不利于客观地处理信息。但语义附加在大多数情况下有非常正面的作用。它是高级智能的表现,语义附加不是凭空附加,实际上语义附加的信息,大多与输入信息是有关的,是被输入激活的记忆集合中的信息。知觉的信息附加附加了信宿主体曾经在历史上对此对象或与这个对象相似的“类”对象的,稳定的,多次的“平均认知”所记录下来的信息,语义附加实际上使人类的知觉更逼近真实的对象,更逼近对象本质的、稳定的存在。知觉的整体性、恒常性、组织性都与语义附加有关。 语义附加是人类知觉识别中普遍存在的现象。双义图的识别,一部分错觉的形成就是例子。下面的图是一个典型的双义图。 客观图像包含着二副内容不同的图像,当信宿不同,或信宿的心态不同时,或信宿扫描对象的起点,注视点,背景和对象的区分,轮廓的加工不同时,该图像可以被知觉识别为不同的对象: 1 图:当此图较小时,被人识别为一棵树的概率比较高。一般情况下,在没有语言提示的情况下,此图被识别为树的概率要高。 2 、当放大此图时,一些细节被知觉到,从中可以看到一对一对的人头挂在上面,仔细看还会发现更多的正面的反面的人头 ,(这些都是信宿主体语义附加在起作用) 这是一个花瓶和人脸对面的双义图:当以黑色为背景时,此图像被知觉为一个花瓶,当以白色为背景时,图像被知觉为两个面对面的人脸。形成原理与树头双义图相同。 这是一个坐着的少女或一个男人头像的双义图。
个人分类: 思维科学研究|11561 次阅读|14 个评论
[转载]美国名校的与机器视觉相关的研发中心网址
fxsimon 2011-2-6 07:11
最近简单整理了一下美国在2010年进入英国泰晤士报全球排名前100的名校中的图像处理、机器视觉研究中心,其中可能包含人脸检测与识别、人体检测、模式识别等的链接网址。 1 美国哈佛大学 2 美国斯坦福大学 http://vision.stanford.edu/research.html 含人体运动分类,人的抽取 lifeifei 3 美国耶鲁大学 http://noodle.med.yale.edu/ 4 美国加州理工学院 http://www.vision.caltech.edu/research.html 有做关于模式识别的 5 美国加州大学伯克利分校 http://www-video.eecs.berkeley.edu/ (视频图像处理实验室) pcb 检测 、 3D 建模 http://robotics.eecs.berkeley.edu/wiki/pmwiki/pmwiki.php (机器人与智能机器实验室) 7 美国麻省理工学院 http://groups.csail.mit.edu/vision/welcome/ 人工智能、统计建模 9 美国加州大学旧金山分校 10 美国哥伦比亚大学 http://www.cs.columbia.edu/CAVE/ 11 美国密歇根大学 http://ai.eecs.umich.edu/ 是人工智能的 12 美国加州大学洛杉矶分校 http://vision.ucla.edu/ 含人体运动匹配, 13 美国宾西法尼亚大学 http://www.cis.upenn.edu/~jshi/humanact/ 有人体检测 shijianbo 14 美国杜克大学 15 美国普林斯顿大学 19 美国康奈尔大学 http://www.via.cornell.edu/ 侧重于医学图像处理 20 美国芝加哥大学 22 美国西雅图华盛顿大学 http://icsl.ee.washington.edu/ 23 美国加州大学圣地亚哥分校 ( http://vision.ucsd.edu/projects ) 24 美国约翰斯霍普金斯大学 27 美国德州大学奥斯丁分校 28 美国威斯康星大学麦迪逊分校 http://www.cs.wisc.edu/computer-vision/ 30 美国明尼苏达大学 33 美国圣路易斯华盛顿大学 35 美国 西北大学 37 美国匹兹堡大学 39 美国纽约大学 40 美国宾西法尼亚州立大学 41 美国北卡罗来那大学 http://www.cs.unc.edu/Research/ProjectIndex/GraphicsImage.html 45 美国马里兰大学 http://www.cfar.umd.edu/ 也做识别, 51 美国科罗拉多大学 http://www.cs.colostate.edu/~vision/ 做人脸与生物信息方面 54 美国南加州大学 http://iris.usc.edu/iris.html 56 美国布朗大学 59 美国加州大学圣巴巴拉分校 62 美国密歇根州立大学 http://www.cse.msu.edu/prip/ 主要是手写字 指纹 人脸识别, 3D 识别, 65 美国波士顿大学 http://www.cs.bu.edu/groups/ivc/ 有几个中国人 但是基于 3D 的人体检测有的 66 美国范德比尔特大学 67 美国罗切斯特大学 75 美国卡内基米隆大学 http://www.cs.cmu.edu/~cil/vision.html 网页很久没有更新了 77 美国德克萨斯 AM 大学 http://live.ece.utexas.edu/ 80 美国弗吉尼亚大学 86 美国普度大学 http://cobweb.ecn.purdue.edu/RVL/Research/Research.html 人的运动行为检测 http://cobweb.ecn.purdue.edu/~ips/research/Index_cur.html 93 美国艾莫利大学 95 美国凯斯西保留地大学 99 美国马萨诸塞大学 http://vis-www.cs.umass.edu/projects.html
2714 次阅读|0 个评论
[转载]寻找生命的平和----记石青云院士
fxsimon 2011-2-6 06:34
她叫石青云。 沿着乡村的石板路走来,她没能平步青云。但她的确从四川家乡的小小乡村学校脱颖而出,走进了北京城,走进了北大数学系,走进了北大信息科学中心,走进了“模式识别”这个当今令人眩目的高科技领域。 她主持的科研项目从模式识别、图像数据库,到计算机视觉、数学形态学、图像压缩技术,纵横国家七五、八五、九五攻关战役;她领衔突破的 “指纹自动识别系统”不仅于90年代初曾在国际市场一举夺标,而且又在国内实现了产业化,被公安系统应用于破案后,使数千名作恶多端的罪犯落入法网;她在 科技的前沿阵地,带出了47个获硕士和博士学位的学生;她获得过国家科技进步二等奖、国家教委科技进步一等奖、国家重点实验室先进个人金牛奖、光华科技基 金一等奖、何梁何利基金科技进步奖、教育部科技进步二等奖等重要奖项;她是咱全中国屈指可数的数百名“中科院院士”中42位女院士中的一位。 虽然不幸她身患癌症,动过两次大手术,挺过20多次可怕的化疗、放疗,如今,她仍然指导着学生,痴迷于她魂牵梦绕的教学和科研工作。 人们惊叹她的聪慧她的才华她的专注她的慎密她的清纯她的执著她的顽强,她那熊熊燃烧的生命。 然而当我走近石青云,印象最深的,却是她生命中的一份平和…… 生命中的1993,石青云在喜忧参半中微笑 躺在洁白的床上,四周是洁白的墙壁,望着洁白的天花板,眼前晃动着洁白的人影…… 1993年10月11日,石青云从手术的半梦半醒中苏醒。医生从她的肚子里取出了一个恶性卵巢瘤,又切除了阑尾、大网、大淋巴结。手术 中,她的身体失去了知觉,脑子却录下了医生和护士的对话:瘤子体积16.7×16×9立方厘米,抽腹水100毫升,出血400毫升……这位北大数学系的高 才生在手术台上,也保持着对数字的那份敏感。因为从1953年她走进北大的那一天起,她就一直生活在数字的世界里。 她慢慢地转过头来,眼光落在床头柜上,晶莹剔透的花瓶里,插着一大捧鲜红的玫瑰。身上插着数根导管的她,望着那片燃烧的色彩,她笑了。 石青云不善言辞,却非常爱笑。“她总是笑眯眯的。”这是她的老师、同学、朋友和她的学生共同的“石青云印象”。 石青云的笑真诚、自然,甚至带着一份永远的天真。而此时此刻,她的笑令连日来担惊受怕的老伴黄槐成轻松了几分。黄教授太熟悉妻子那张发自内心的笑脸,他知道,只要妻子还能笑,就一定还有希望。 病情刚刚缓解,石青云就在病床上拿起了纸和笔。在她醉心的模式识别领域,她还有好多事要做。 什么是“模式识别”?通俗地说,就是让计算机像人那样拥有视觉和听觉功能。“石青云告诉我。而当年她从数学领域跨进这道门槛,却说不清究竟是偶然还是必然。 “文革”后期,石青云从干校回到北京。原本在数学专业任教的她,被工宣队一下子分到了信息教研室。“转到信息科学领域,这可不是我自己的选择。”石青云坦言。 但的确是“歪打正着”! 步入模式识别领域,石青云的第一项研究,是与一位在中科院生物物理所工作的学友合作完成的关于癌细胞识别的形状特征。这个颇有见地的成果 于1980年12月在美国迈阿密举行的“第五届国际模式识别大会”做了报告。后来老同学们来看她,她打趣说,“看来癌细胞挺想报复我。”然后是哈哈一笑。 然而1993,正是石青云事业的高峰期啊! 过去的十多年来,她一直在模式识别的前沿阵地摸爬滚打、冲锋陷阵。 她建立了一类适于景物分析的属性扩展图文法;提出和实现了属性与随机树文法的高效误差校正句法分析算法及其对英文字符识别的应用;给出了一类语义与句法引导的形式语言翻译模式并运用于图像处理,从而以高维属性文法实现了统计模式识别与句法模式识别的有效结合。 在国家自然科学基金的连续资助和国家七五科技攻关中,她主持模式识别图像数据库的研究项目,取得4项具有国际先进水平的成果。基于她提出的新型图像数据结构“CD表示”研制的地理信息系统,有很强的综合信息检索和空间数据信息的复合功能;还研 制了体现最新技术思想的图像数据库管理系统和可视化图像查询语言,实现了图像操作和数据操作的统一处理。 在她主持的科学基金项目中,对数字图像的离散几何性质进行了深入研究,创造了从指纹灰度图像精确计算纹线局部方向,进而提取指纹特征信息 的理论与算法。随后,在她主持的七五科技攻关项目中,研究成功适用于民用身份鉴定的全自动指纹鉴定系统和适于公安刑事侦破的指纹鉴定系统,1990年在美 国战胜日本NEC和北美Morpho两个著名公司的产品,一举中标进入国际市场。 在指纹自动识别技术的进一步研究中,石青云基于指纹方向图,给出了快速纹型分类和准确提取指纹中心、三角、形态和细节特征的全套新算法,以及统一处理无中心和有中心情况的高效指纹匹配算法。 在国家八五科技攻关专题中,她主持研究成功指纹自动鉴定第二代实用系统并在国内实现了产业化,拥有100多家用户,破获了几千起案件。仅 珠海一地,就每年直接破案近200起。在反查中,又串出别的案子,甚至一个串出十好几个。广州用户创造了在30万人的大容量的指纹库上8分钟破案的纪录。 云南方面曾测试指纹比对速度,达到1秒钟比对15000指。 国际上指纹识别系统价格昂贵,一套卖几百万到上千万美元,而石青云主持和研究的系统只需几十万到几百万人民币。她的发明为国家节约了很多钱。 …… 1993年7月,石青云出差到美国两三个星期。一回国,朋友们就发现她胖了一圈儿。 “当真是美国的水养人啊!”大家玩笑着。 然而有一天,一直专注于研究的石青云突然发现肚子里有一个硬块。经医院检查,诊断为卵巢癌,需尽快手术治疗。捧着那张“宣判书”,她还是 那样平静。抓紧去医院前的几天时间,她忙着整理她研究的指纹识别核心算法的软盘和有关材料,安排正在攻关的课题。与人交谈,她依然面带微笑。 “既来之,则安之,有病就治呗。” 她的丈夫黄槐成却笑不出来……等石青云成功地做完手术,他已“人比黄花瘦”。 病榻上,传来石青云被评为中科院院士的消息,石青云笑了,淡淡的,但黄槐成读出了她发自内心的快慰。 术后的化疗令她吃尽苦头。第一次全身化疗,她吐了3天,每天10来次。一个疗程下来,体重猛然下降了4公斤,头发掉光了,人也一脸菜色。 “但术后的化疗是必要的,只能挺过去,从小就吃苦走过来,没事儿。”她说。 11月,丈夫又把两个喜讯送到石青云的床头,“你获奖了,由国家科委颁发的'国家科技进步二等奖'和由国防科工委主持的'光华科技基金一等奖'。” “是吗?”妻子又笑了,黄中泛青的脸颊上荡起一阵浅浅的红晕,像一个羞涩的小女孩。但很快,它就悄悄地散去,石青云又陷入沉默。黄槐成知道,她的思绪又坠入了数字、公式和图像的万里长河…… 被选为中科院院士,查出癌症住院动手术,获“国家科技进步二等奖“、“光华科技基金一等奖“,几件大事喜与忧、忧与喜皆发生在石青云生命 中的1993。如此的一喜一忧、喜喜忧忧将掀起一个平常人多么难以想象的情感波澜?可石青云皆报以平静的会心的微笑,淡淡的像那一池碧水中渐渐荡开的涟 漪。 究竟是一份怎样的生活积累,给了她这令人回味的沉静与平和…… “命运“的“宠儿“从来不会抱怨生活 四川省合川县张家乡,那是石青云的家乡。在缺医少药的贫困中,爹妈先后生了9个孩子,却只养活了她一个。从她的名字,就不难想见,她的家人该是怎样地期盼她“平步青云“,扶摇直上。 9次10月怀胎的梦想,似乎都担在了她稚嫩的肩膀上。 抗战时期,20几岁就守寡的奶奶带着小孙女住在乡下。慈祥和蔼、略识文化的奶奶是她人生的第一任老师,教她认字,念歌谣,“红帐子,麻屋子,里面睡了个小胖子……” 小青云在奶奶用数不清的民谣和疼爱编织的“竹篓“中渐渐地长大了,果然聪明灵秀,十分逗人喜爱。家境虽然贫寒,但奶奶坚持要让孙女上学。 入学那天,走过长长的田埂路,奶奶亲自把孙女送到镇上。青云蹦蹦跳跳地进了张家乡中心小学,坐在破庙改建的教室里,她看到奶奶仍然站在对面的高坡上,像一 尊慈眉善目的佛。 天资聪颖的小青云记忆力特好,读课文几乎是过目成诵。加减乘除,更是运算神速。每次考试,总是名列前茅。贪玩儿是孩子的天性,小青云也不例外。有一次快期末考试了,她带着两个好朋友到山林里去抓蛐蛐。结果,她仍然考了100分,可那两个小伙伴却没考及格。 青云心灵手巧,她用竹条做的小青蛙,一摁一跳,可好玩了;她用棕榈叶编的蚱蜢、小鸟和蝴蝶,活灵活现。为了贴补家用,懂事的她小小年纪就 学会了挑花,飞针走线,一坐就是好几个小时。也许正是这银色的针、五彩的线,织就了她做事的纯情和专注,以及做人的不急不躁。为此,她竟受益终身。 小学毕业时,她考了全校第一。毕业典礼上,校长送给她一件礼物,一个漂亮的硬壳笔记本。打开一看,扉页上挤满了全校每个老师的签名。奶奶翻阅着那小小的笔记本,抚摸着教书先生的亲笔,眼睛笑成了豌豆角。 让奶奶开心,那是小青云最愉快的童年时光。 考中学,石青云又以第三名的优异成绩,考上了当时的国立合川女中。到县城去住校就读,食宿费、学费、校服费……是一笔不小的开支!在奶奶的坚持下,全家倾其所有,凑足了第一学期的费用。 石青云在12岁那年第一次离开了家。山路弯弯,蜿蜒着穿过树林绕过山坡,通向20多里外的合川县城。石青云一步步朝前走去,脚下的步子一点也不轻松,因为背上简朴的行囊中,盛满了全家人眼巴巴的期望。 开学典礼上,一位斯文秀丽、身穿藏蓝色旗袍,年龄在20多岁的女老师走上台来讲话。石青云目不转睛地盯着那张她12年来所见过的最漂亮最富有魅力的脸,她没有料到,这位叫胡述英的女校长,是中共地下党员;她更没有想到,女校长竟会成为她终身的恩师。 石青云身材瘦小,在全校几百个学生中并不起眼,胡述英校长是从学生入学和期中、期末考试成绩单上先知石青云其名,然后才识其人的。这个特别聪明、成绩拔尖的小女孩给校长留下了深刻的印象。 奇怪的是,到了第二学期,石青云却突然从优秀名单中消失了。女校长赶紧到班里一问,才知道这个女孩子因家境贫困,被迫辍学了。胡校长心里很难过。一连几天,石青云聪慧灵秀的身影总是浮现在她的眼前,挥之不去。 “怎么能让这么有天赋的孩子埋没在乡村的泥土中呢?!“胡校长决定负担这个女孩上学的所有费用。石青云被找回了学校,命运的马车就这样在一夜之间被神奇地易道改辙了。 没有辜负胡校长一双慧眼,石青云果然一路优秀。 初中毕业后她上了四川省西南工专。有一次三角课考试,老师扶了扶眼镜,高声宣布:“我们今天以竞赛形式尝试三角课的考试方法,一共25道题,要求在90分钟内完成,同学中的最高分为满分。“ 考题一发下来,教室里叫苦声一片。25道题,不仅量太大,难度也很大。不一会儿,就把同学们折腾得汗流浃背。石青云没有吭声,她头也不抬地伏案演算。结果,她做对了24道。如果以她的成绩96分为满分,其他同学则无一人及格。最后,老师只好将第 二名的56分提为满分,这才有不少同学得以及格。 在西南工专念了一年,由于高校院系调整,她被转到校址在泸州的四川化工学院读预备班。距1953年的全国高考还有一个月了,突然接到教育 部通知,预备班要参加统一高考,好多同学一下子慌了手脚。石青云不慌不忙地想报工科,物理老师却鼓励她改报理科,“考北大数学系吧!”他建议说。 如愿以偿,石青云被北大录取了。来不及回合川老家,她从泸州经重庆便直奔北京。“北方天气凉。“在重庆轮渡公司做工的叔叔硬把自己的中山 装棉袄塞进了石青云空荡荡的行李包。至今,许多同届的老同学还记得那个当年身材矮小,却穿着肥大的深蓝色立领中山装棉袄的川妹子,而那件大棉袄,帮助石青 云抗过了北京的两个严冬。 一直靠助学金读书的石青云生活上非常节俭。能吃饱饿不着,有衣穿冻不着,就行。那时,花5分钱的门票进颐和园去玩个痛快,就算是石青云周 末的奢侈了。记得大学一年级时,有一个星期天,石青云到颐和园去游玩。雕梁画栋的长廊,波光潋滟的昆明湖,殿宇错落的万寿山……石青云像“刘姥姥进了大观 园“目不暇接。站在石船上眺望湖光山色,她忽然看见一个熟悉的身影,多么像她朝思暮想的胡校长。她紧追过去,越看越像。可最终,这个从乡下初进京城的小姑 娘还是怯生生地没有敢认。直到1993年她被 选为院士,老家合川一中的校长闻讯托人打听,与石青云通信,石青云才得知胡校长是一位地下党员。怪不得,解放那年,老师们带着学生上街扭秧歌,扭得最起劲最投入最好看的,就是胡校长。而她真的就在北京,在中央党校工作。 1994年春,刚刚与胡校长电话联系上的石青云顾不上手术和化疗后正在康复治疗,头发还没有长起来的她,戴着头套拉着老伴就奔了胡校长的家。摁响门铃后,石青云的心竟怦怦乱跳。 门,轻轻地打开了。是她,是胡校长,40多年过去了,风韵犹存的她,依然是那么文静,那么秀美,那么朴素。 “胡校长,我是石青云,您在合川女中的学生,那个来自张家乡当年没钱读书的女娃娃……”石青云动情地拉着胡校长的手,做了近40年老师的她见了自己的老师,依然必恭必敬。 78岁的胡述英曾任中央党校办公室主任,她终身未嫁,离休后与她领养的孩子住在一起。她把石青云夫妇让进门来,听了石青云的工作和成就,她微笑着,一脸的欣慰。 “如果不是您的帮助,我今天可能只是一个普通的农家妇女。“回忆往事,石青云万分感慨。她说她是“命运“的“宠儿“,她一直都在感谢生活而没有一丝一毫的抱怨。 飞扬的柳絮在晶莹的雨丝中缓缓飘落,春雨润物…… 1953年秋天,一辆满载旅客的列车隆隆驶出武汉火车站,朝首都北京飞驰。考上北大后从重庆乘船再转乘火车的石青云就坐在车上,窗外是沉甸甸的一片秋色。在这离开家的时候,她却想起了两年前一段“回家的故事”。 1951年冬季的一天,山城重庆飘着毛毛细雨。沿着奔流不息的嘉陵江,一条通往合川的公路蜿蜒着伸向前方,消失在蒙蒙烟雨中。 两个学生模样的小姑娘脚步匆匆地行走在公路上。一身泥浆,一脑门汗珠。她们往前走啊走,不敢停歇,因为她们要“回家”,她们知道家在何方,却不知道家有多远。 这正是15岁的石青云和她的同窗学友。就读于西南工专的她俩在寒假没钱买船票回家,却又挡不住“回家”的诱惑,“咱们走回去!“石青云提议。于是两个小姐妹兴奋地上了路。她们确信,沿着嘉陵江走,没错! 长路漫漫,阴雨绵绵,吃苦耐劳的乡村女儿始终没有停步。 第一天,走了90里。第二天,公路到头了,山路泥泞难行。走着走着,路没了,一座尺许宽的独木桥飞架山涧,浑浊而湍急的山水在脚下哗哗奔流。怎么办?小姐姐胆大,先走了过去。这下可难为了胆小的石青云。朝前走吧,怕得要死;往回走吧,又似乎没有 退路。回家的路已走了一大半,怎么可能再退回去呢? 一步,两步,她试了几次都吓得退了回来。“走啊,过来呀!“小姐姐在桥那边急得手足无措。 最后,狠了狠心,她终于战战兢兢地蹭了过去。担着惊吓和疲倦,她们一口气走了90里山路,走到太阳落坡,合川县城关镇鳞次栉比的灰色建筑群已遥遥在望。 夕阳把远处的山峦镶上金边,波光粼粼的江水绸缎般地飘荡着穿过麦苗泛青的农田,点缀着几座竹林掩映的农家小院,几缕炊烟……石青云第一次发现,家乡这幅图画,咋个会有这么美! 15岁那年走过那座独木桥,在求学和求知的人生路上,石青云再也没有胆怯过。她相信,再苦再难,只要走过去,前面就有一个天。 …… “老师们,同学们,现在向大家报告一个好消息:今年全国高考的前三名都进入了北大。第一、第二名在数学系,第三名在物理系……”播音员兴奋的声音,回荡在静谧幽雅的校园。这是1953年当石青云跨进燕园后所感受到的第一层“氛围”。 “高手云集,得努力呀!”她对自己说。 上课专心听讲,下了课到饭堂简单吃点东西,就赶到图书馆去“抢位子”。那时的图书馆并不大,去晚了就没位子。凭着聪慧和专注,石青云的面前几乎没有什么“难题”。 课堂上,她常常超前地找到老师解题的思路,触摸到数学抽象的神经。 北大数学系师资精良,素以严谨治学、学术民主、气氛活跃享誉中外。那时全面学习苏联,尤重因材施教。从入学到毕业,每门课程都是口试,颇像今天的电视竞赛。考试前,老师准备几十份考签,由学生抽签作答,答不出时,进“准备室”,准备好了再答。 有的同学甚至被“关”了几个小时。而老师,自然是“陪关”到最后,直到学生穿云破雾,豁然开朗。 石青云也被关过“准备室”。 那是一次复变函数考试,石青云抽到的考题中,有一题要求举个反例,她一下子愣住了。陈杰老师一视同仁,没得说,“关”准备室。 咬着笔头,望着天花板,石青云非常后悔。陈老师讲反例的那天,她恰恰开小差没注意听,课后又没认真看书……她憋呀,想呀,怎么也想不起来。最后,她只好另辟蹊径,自己构思了一个反例,硬着头皮走出了准备室。 石青云的创造性见解,受到陈杰老师的鼓励。石青云得到了满分,更悟出了一个道理:作学问,容不得半点马虎! 石青云写过许多科研论文,并多次登上国际讲台。但她的第一篇论文,她至今记忆犹新。 申又振教授早年获哈佛大学博士学位,是我国微分方程的开拓者。大学三年级时,石青云在申教授的指导下学习特征值理论。她的论文颇有新意,申先生倍加赞赏,还给了她站在讲台上宣讲推导的难得机会。当她捧起经申先生审阅过的论文,惊奇地看到,申先 生不仅帮她梳理了思维的严谨,而且,从头到尾字斟句酌地掂量了用词的贴切,并将文字上的每个错误,从语法到标点符号,都统统“蓖”了一遍…… 石青云非常感动,她在图书馆里把老师改过的论文看了又看,不觉得已到了闭馆的时间。走出大楼,外面正飞洒着霏霏细雨。路灯下,还可以看到飞扬的柳絮在晶莹的雨丝中缓缓飘落。 春雨润物…… 1957年毕业,正好遇到“反右“,不少同学因此耽误了毕业论文,可石青云提前一学期就完成了,并被全国数学年会采用。出色的她被留在了北大数学系任教。 机遇不是一个孤立的事物,它常常在人与人的交错和碰撞中产生。石青云在“文革”后期被分到信息教研室。后来,我国模式识别的开拓者之一的程民德教授,将石青云领进了这个领域,又把她推到前沿枪林弹雨地锻打一番。这才有了石青云在这个领域的海阔 天空。 1979年,国际著名的模式识别权威、美籍华人傅京孙教授到中国讲学,这是他第一次将模式识别介绍到中国。程民德和傅京孙是朋友,于是,程先生就把石青云介绍给了傅京孙教授。 听了石青云步入这个领域才几个月就写出的《关于癌细胞识别的形状特征》,傅教授非常感兴趣。很快,石青云就被邀请到了傅教授所在的美国普渡大学做访问学者。而那里的模式识别研究室,正是这个领域世界性的“前沿”。 在那里,石青云亲眼看到傅京孙教授是怎样才华横溢,又是怎样勤奋地面对科研和工作。周六和周日也很少休息的他,有一次和大家参加完一个博士生的婚礼,别人趁着喜兴酒兴都回家了,可他还是回到办公室工作,直到深夜。 在那里,每周都举行的学术讨论会上,博士生和访问学者轮流报告工作进展,探讨学术见解,交流科技信息。不同的研究课题,不同的研究方法,不同的研究领域,最前沿最精尖最富有创见的思想和方法在一起碰撞、穿梭,电闪雷鸣般地令石青云感到震撼。 在那里,石青云除了吃饭睡觉,全天候地呆在实验室里,在一年半的时间内实现了模式识别研究的三个突破,她写出的三篇学术论文均在该领域国际权威性的学术刊物上发表了。 正是在那里,在外国,她看到了中国在这个领域的落后。面对一篇硕大的白纸,她迫不及待地要飞回来,为自己的国家画上一幅最新最美的图画。面对傅京孙教授的挽留,她作出了选择,因为她知道,她的事业在中国。 步出北京机场,迎面吹来的,是早春二月的风。 做老师就得尽职,从学术到人品 不记得有多少个大年的初一初二,石青云都是在计算机前度过的,但每年春节,石青云一定会到程民德老师家拜年,直到老师于1998年去世。程民德教授把她领进了“模式识别”,她一辈子也不会忘记。 一个对自己的老师始终充满感激之情的老师,知道应该怎样做老师。 1982年2月,石青云回到北京,回到了北大。在科研和教学上,展开了她生命中黄金般粲然的一页。 认准了“图像数据库的理论与方法“的研究价值,回国后的石青云带领学生们向新的目标冲刺,她要把学生领到学术研究的“前沿”去摔打。 她把普渡的学术讨论会带回了北大,每周一次的讨论班上,她和学生们把世界最前沿的研究课题和自己学习研究的成果介绍给大家,以集思广益,刺激每一个人的创造力。 石青云带领她的学生们长期在数学与信息科学的交叉点上进行研究,特别注意从视觉信息处理中提出新的数学问题,进而发展相应的理论和方法,并带来技术上的突破。 她指导学生在由线画图定量恢复三维形态的充分必要条件和构造性算法,数字空间中的数学形态学理论及应用,小波变换、吴方法及其在图像压缩和计算机视觉中的应用等方面,都取得了丰硕的成果。 她把自己的优势,毫无保留地转化成了学生的优势。在她所钟情的模式识别领域,如今,她的学生们在国内和国外各领风骚,大显才华,形成了两大方面军。 石老师爱花,逢年过节,学生们去看老师,都要买上一大束五颜六色的鲜花。1993年元旦,同学们相约去老师家,结果石老师不在家。“她一大早就去了机房。”黄老师说。 当同学们捧着花儿赶到信息中心的计算机房,发现石老师正在那里埋头编程序。几个同学一进去,用机器和玻璃隔出的小小工作间便拥挤得磨不开身。 “石老师,新年好!” 接过鲜花,石青云笑着说,“真漂亮,谢谢你们。“她转身把花放在旁边的机器上,就接着说:“那你们回去吧!” 几个同学一下子不知道说什么才好,他们真的就走了,走得很尴尬。后来好半天才回过神来,“把老师留在计算机房,我们倒走了,嗨,咱怎么就这么傻?!” 石青云在患癌症前,一年忙到头,周末、节假日常常把自己关在计算机房。可她患癌症后,一恢复工作照样没有节假日。“石老师都这么玩儿命,我们没有理由偷懒。“学生和老师一样,编程序,编着编着就把自己给“编”进去了。往计算机面前一坐,只觉得 时光飞逝。多少次,猛一看表,不知不觉已过去七八个小时;多少次,从编程的“梦”中“醒”来,发现东方已现出鱼肚白…… 1994年8月,石青云恢复工作后,开始还乖乖地遵循“少出差、不出国”的原则,可后来,发现工作起来精神感觉很好,加之相继主持航天 863项目、九五科技攻关专题、国家自然科学基金重点项目、973的课题等科研和教学工作,校外学术活动也非常忙,就忽视了必要的身体检查和治疗。这一大 意,1999年院士查体,就发现并确诊了复发。2000年10月,石青云住院做了第二次手术。 就在她住院期间,博士生韦长江收到石老师从医院带来的两页手写的稿纸,上面密密麻麻写满了有关图像压缩的矩阵方法,这是老师在病床上写下后,提供学生上机编程序的。韦长江非常感动。 癌症复发后,石青云带的博士生有3个2000年要毕业,同时,她还得到医院定期地做化疗。躺在病床上,她坚持看论文、把关,逐字逐句地斟酌、修改。该上新一轮化疗时,正好遇上博士论文答辩。石青云二话没说,把化疗时间推迟了一个月。 “做老师就得尽责,从学术到人品都要严格要求。”她说。 “石老师脾气特好,涵养特好,从没见她发过火,虽然有时候说话直截了当地令我们感到汗颜。”同学们说。博士毕业后留校、现任北大“信息科学中心“副主任的“大师兄”封举富则说起了一件“燕园旧事”。 1992那一年,他刚硕士研究生毕业留校不久,住在单身宿舍。那阵子,学校里手机罕见,用呼机的不多,宿舍里也没安电话。一日,因头天晚上开了夜车,他早晨快9点才起床。踢踏着板鞋到水房里洗漱,回屋时,发现有个人影站在门口,仔细一看,原来是石老师。 “知道你爱熬夜,起得晚。“石老师笑着,没有一句责备。“我有件急事要找你……” 什么急事,封举富早已忘了,可这个镜头,却留在了记忆中。 “您怎样看待人才的外流,看待'海外兵团'?”我曾问石青云。 “我有个非常优秀的博士生,在毕业论文的基础上写了专著,喜欢学术研究,也很有创造性,完全可以培养成学术带头人。他后来出国去了公司,很可惜。但我很理解学生们到海外发展和做研究的选择,人各有志;在国外可以充电,这也不是坏事;而且,我对 他们的爱国之心是不怀疑的。”石青云平静地回答。她说在学生希望推荐的时候,她总是支持他们。她说她期待有一天,流走的人才会再流回来。 她相信那一天不会太远。 一个未被污染的人,一只爱猫的“老鼠“,一位真诚forever的科学家 也许,当人在社会生活中变得事故,人就不知不觉地老了。要不,人们为什么说“老于事故”呢? “石青云的心理年龄非常年轻,许多在她那个年纪该懂的人情世故,她好像不懂,其实是她压根就不在意,她的心思全放在了她所钟情的事业上。'专注'和'真诚'是科学家的基本素质,石青云就是这类优秀人物中的一位。”石青云在大学时代的一位同窗学友评 价说。 毫无疑问,八面玲珑的人,肯定做不了科学家。 “石老师的话,假不了。”她的真实,名声在外。 “她是一个未被污染的人。”学生们感叹。“在物欲横流、人心不古的今天,石老师的内心深处仍保留着一片净土。她是一个纯粹的学术导师,一个真诚forever的科学家。” “石老师生病住院期间,我负责处理她的信件。有一大堆来自国内、国外邀请她入各类'名人录'的函件,她从不care。在如今社会上急功近利比较泛滥的时段,她却保持着心态的平和,没有一丝一毫的烦躁。”封举富告诉我。“研究指纹识别的核心算法,她是 咱这儿的元老,开公司闹个股份什么的,天经地义,可她始终最关心的,是科技的发展和应用。” 石头在地上,云在天上。石青云有生命中的沉实,亦有生命中的轻视,就像那石头的沉实,云彩的轻盈。 我相信,没有功利,才拥有内心的一片平和。 人们说,成就斐然的石青云全然没有女强人的咄咄逼人,确实朴实无华,平易近人。 一次,她去参加学术活动。进得门去,就有人问:“你是不是石老师带来旁听的?“没想到这个“旁听者”开会时坐到了主席台。给学生讲这个笑话的时候,她开心地笑着,毫无责怪别人对她不恭之意。 逢年过节,学生们都盼着到石老师家里去“撮”一顿。他们喜欢吃石老师做的“梅菜扣肉”、“麻婆豆腐”、“红焖大虾”,更喜欢看她表扬学生时的笑脸,她的笑是那样的由衷,那样的真诚,那样的明媚。看着素来作风严谨、要求严格,且说话从不带拐弯的 老师忽然笑得像个孩子,学生们宁愿老师加倍严格,宁愿在计算机房多干几个通宵。 “石青云的心太纯朴,太没有社会经验,太不会保护自己。她这样的人今天能有这样的成绩,多亏了我们这个社会,多亏了党和国家的培养。”与妻子一起走过了40多个春秋,黄槐成说的是心里话。“石青云一个最大的特点,是她的耐受性特强。”黄教授接着 向我讲述了一件陈年往事…… “文革“时期,北大的“五七干校”设在江西南昌鲤鱼洲。黄槐成那时还在中科院工作,石青云带着两个孩子去了干校。那里的生活条件如何艰苦,石青云从来没向丈夫吭过一声。那年,黄槐成满怀分别数月后的期盼和兴奋,赶到鲤鱼洲探亲。 那是一个小雨淅沥的下午,顾不上仆仆风尘,黄槐成一进干校就四处寻找石青云。听说她在井口值班,踩着一路泥泞他便赶了过去。朦胧中,黄槐 成远远望见一个人影,呆呆地伫立在井边。他慢慢地走过去。北风吹来,撩起她过耳的短发,此人又黑又瘦,一脸冻疮疙瘩,一身那个年代最时髦的草绿衣衫,随风 飘荡着勾勒出她瘦削的身子骨。 黄槐成走上前去正要开口打听,话到嗓子眼却被哽住了…… 那位女士笑了。 就在这一刹那,他发现她就是石青云。艰苦的环境可以改变妻子的容貌,却改变不了她纯真的微笑。 黄槐成一时百感交集。 随石青云来到她们的住地,那是一个破旧的仓库,一溜通铺贴着潮湿的墙根。掀起褥子伸手一摸,全是水。黄槐成心痛极了。“生活条件这么差,你怎么也不说一声?”他想埋怨妻子,可话到嘴边又哽住了。 妻子还是在笑…… 后来,黄槐成调到了北大。曾担任北大校办主任的他,再也没敢卸下自己肩上的担子。 在这个家里,他是“家办主任“,更是石青云生活中的“保护神”。 “除了想为国家多做些事,核心算法的研究对我来说,从来就不是苦差事,我的确有极大的兴趣,我非常热爱我的工作。“石青云坦言。当她的病情稍稍缓解,就要求介入工作。起初,黄槐成竭力反对。但慢慢地,他发现他很难将工作与妻子分开,而模式识别 中的核心算法,似乎已成为石青云生命的一部分。终于,他慢慢理解了妻子坐在计算机前的那份痴迷;工作,正是石青云治疗癌症的一贴良药。 一份执著,一份忘却。 平时,石青云在家里吃着饭,说着话,常常会突然心不在焉,答非所问,黄教授知道,她又“跑神”了。 算法研究是个什么感觉,一般人很难体会,据说很容易让人“走火入魔”。因为你提炼成的数学问题,要用计算机编程去解决。当你用不同的方法去试、不停地尝试时,那个问题就成了脑子里的兴奋点;而你停止了工作,脑子却下不来,顺着思维的惯性,“问 题“转入“后台”运行。就像下棋,早就决出了胜负,却还止不住会想,“我那步棋应该这么走,就好了。” 曾经有一段时间,石青云的脑子也“下不来”,做梦都想着她所研究的算法,影响了休息的质量。但很快,她就找到了解决的办法:看武侠小说。 金庸的“射雕系列”,古龙的“楚留香系列“……那些身怀绝技、侠骨柔肠、肝胆相照的各路豪杰杀富济贫,救人于千钧一发,也把她从几乎“走火入魔“的沉迷中 搭救出来。 石青云喜欢养花,偏爱小动物,但就是不爱逛商店,她的衣服,大多都是授意丈夫为她买的。虽然“很久很久以前”,心灵手巧的石青云曾为丈夫手工缝制过一条毛料西裤。 石青云爱猫,爱得极为“深刻”。她的家里,猫的挂历、猫的茶盘、猫的瓷器、猫的枕头……去年儿子从美国回来探亲时亲自数了数,发现家里竟 有15只“猫”。在“朗润园”,石青云与季羡林曾是邻居。季先生养了两只美丽高贵的波斯猫。“长着鸳鸯眼,一蓝一黄,纯种的波斯猫都这样。”石青云还记 得。每当她回家走过院门看见了它们,总要亲近一下。 因为石青云爱猫,黄槐成在很久以前,曾经真的为妻子买回只猫,黄毛黑斑地“披”着一身“虎皮”,神气极了。那会儿正是夏天,午休的时候, 小猫跳上床来,躺在夫妻俩中间,非常缠绵的样子。可当他们挂上蚊帐,温顺的小猫就露出了调皮的本性,它又蹦又跳,把扑抓蚊帐当作了它最喜欢的游戏。 最后,小猫送了人。黄槐成则送了石青云一条最新成语:石公好猫。 石青云住院时,曾收到从美国寄来的贺卡。打开一看,立刻乐得合不拢嘴。第一张是儿子的,折叠的卡片上有三幅画面,一只面相俊美的黑猫以三种不同的姿势凌空吊在树上。第一幅是单爪挂,大有杂耍的惊险;第二幅是双爪挂,猫儿全身笔直,姿势优美得像 训练有素的体操运动员,可惜它挂在了一条短短的枯枝上,看起来令人担忧;第三幅,小猫双爪紧扣结结实实的树叉,后腿屈收,照这身姿,就是 突然坠落,也可以就地一个“驴打滚”。儿子在这幅画面上写着:Hang in there (and get well soon!) 孙子的那张更逗。一只小猫受伤了,可怜它头上、腿上都扎着绷带。一个头戴护士帽的漂亮的小姑娘正跪在地上为小猫包扎伤口。11岁的他把爱猫的奶奶真的当作了猫。 可以想见,儿子和孙子为了买到这两张让石青云爱不释手的贺卡,不知在偌大的洛杉矶跑了多少家商店。 石青云爱猫,爱的是猫的美丽和温顺。这与她的平和,不谋而合。然而更有趣的是,爱猫的石青云属鼠。“猫“与“鼠“竟又能如此“和平共处”。 在石青云60大寿那年,儿媳妇曾送给婆婆一本印制精美的猫咪专集。上面有不同品种、不同“肤色“、不同姿态的几十只猫,整个一个栩栩如 生、热热闹闹的猫星大荟萃。相信这本猫星的画册,她已经欣赏过无数次。但那天她为我拿出来再次翻阅时,仍然天真地笑着,说:“呀,这些猫真好玩儿!“那一 刻,我得以亲自验证了有关她心理年龄的说法。 我以为,人生在世,应该有梦,应该大胆幻想,因为有梦想、有幻想,才有希望。于是在采访中,我故意地问石青云,“在人生的不同阶段,您有过什么梦想?”她的回答,竟出乎我的意料。 “没有梦想。”她说。“只是做事,一件一件地做,不停地做,踏踏实实地做。” 于是我发现,在这个问题上,她没有浪漫,但仍然拥有平和。 她的平和,竟是无处不在。 也许,她做的比想的还要多,做的比想的还要快,所以没有“梦想”,或许,连“梦”也难以企及。 我曾经问石青云,“您怎样看待'生'与'死'?“我似乎期望能从她那里听到些更为深刻的人生哲理。 “我脑子里似乎没有这个问题。我其实是一个非常简单的人,工作交待了,积极治疗就行了。我最大的兴趣,是工作,只要有可能,我尽量要为国家多做点事。我的下一个指标,是希望春节后能正常工作。“她说着,简洁得不需要任何的注释。生命的平和,原来来自于生命的质朴。 像蜜蜂酿出的蜜;又像“阿香婆“的紫米粥…… 先生之风,山高水长!
3128 次阅读|0 个评论
人脸检测之一:样本准备
热度 3 wanglin193 2011-2-1 17:50
人脸检测之一:样本准备
基于机器学习方法的人脸检测,通常需要固定大小的人脸图像样本作为训练用的正样本,不包含人脸的样本作为负样本。训练过程是一个监督学习的过程,通过特定的特征提取和学习规则的制定,让计算机计算出最有效的将两类样本区分开来的数据,这些数据最为自动检测系统的最终配置加以存储,在真正检测的时候,对于任意输入图像,系统可以调用存储好的数据(知识),对图像加以判断,从而得出样本属于‘+’或‘-’的结论。 模式识别问题总是和统计学紧紧相联系的,它所得出的结论往往不是绝对的1或0,只能说是1的概率是多少,是0的概率的多少。所以天气预报会有“降水概率为80%”这种听起来模棱两可的说法。预报出错的情况在所难免,就像所有的模式识别问题都会有false alarm和false positive一样,这就需要对模式识别的结果有理性的认识。喜欢钻牛角尖的人从事这项工作就很容易抑郁,因为往往有这种情况:你花了很大工夫设计的算法,仍然无法在识别率达到100%的同时又没有出现任何错检。所以不能总盯着那些一时无法解决的“特例”,要用一种权衡的思想通盘考虑问题。一个好的识别系统,应该是好的算法加上好的权衡。 人脸样本一般是用手工的方法从一幅包含人脸的照片上截取的,然后在缩放成统一的尺寸,比如16×16或20×20。这个过程需要一些耐性,即使设计一个专门的小程序来选取人脸位置并自动缩放,对于几千个样本,重复这样的操作也不是一件轻松愉快的事。好在我们从这个网址找到了现成的训练样本 http://www.cmucam.org/wiki/viola-jones ,它包含两个.pat文件(链接已经失效,pat文件可以直接 下载 ),分别存储两类图像样本,每个样本是24×24的灰度图像。这些样本是Viola-Jones 2001年论文里用的训练样本,从里面甚至可以找到很多熟悉的面孔。 利用附件里的matlab程序读出这些样本,正样本为: psams = getsamples('faces.pat',24); psams是3维矩阵,维度是24*24*4916,每个样本沿着z方向存放,可以用下面命令显示其中的某个样本: imshow(psams(:,:,6));%显示第6个样本 同样负样本用下面语句读出: nsams = getsamples('nonfaces.pat',24); 这只是很少的一部分负样本,对于一个鲁棒的系统来说远远不够,需要在训练过程中不断加入新的负样本。 并且还可以把它们拼成一个大图,写论文的同学可以从上面截一块出来,插到文章里:“看,我用的人脸样本是这样的”: tilesamples(psams,'faces.bmp'); tilesamples(nsams,'nonfaces.bmp'); 部分正样本如下: 把样本存储成3维矩阵的好处是,提取特征的运算可以充分利用矩阵运算功能,而不用循环处理每个图像。比如正样本的平均值可以用: meanface = mean(double(psams),3); imshow(meanface,[]); 平均脸的结果是这样的: 以下附件是从打包存储的样本文件.pat中读取人脸矩阵的matlab小程序: getdata.rar
个人分类: 人脸检测|12544 次阅读|3 个评论
[转载]韩国宣布9月1日起采集检查入境外国人指纹
maczone 2010-9-1 15:47
据韩国《朝鲜日报》报道,韩国法务部宣布,将于9月1日起在韩全国22个机场和港口对入境外国人进行指纹采集检查。 据报道,韩国法务部将对和国际恐怖分子外貌相似者、遗失护照持有者、旅行路线特殊者、出发当天用现金购买单程机票者和涉嫌持假护照者等人进行指纹扫描检查,并用面部识别器对脸部拍照。 通过这一措施,一旦确认过去在韩国有犯罪前科或是被国际刑警受监控的罪犯,就会强制遣返。法务部已对在韩国有犯罪前科的23万名外国人建立了指纹信息数据库。 从明年下半年开始,这一措施将面向所有入境韩国的外国人(外交官除外)实施。外国人指纹登记已在美国和日本实行,经济合作与发展组织(OECD)的32个成员国,大多也在推进这一措施。 韩法务部表示,为了保障11月在首尔举行的二十国集团(G20)首脑会议的安全,提前实施了该措施。法务部出入境外国人政策本部部长石东炫说:事先阻止有犯罪危险的外国人入境,以使社会治安和保障机制得到国内外的信任。 (本文来源: 中国新闻网 )
个人分类: 兴趣|2169 次阅读|0 个评论
吃一堑 长一智
lovepuma 2010-7-15 19:50
今天被卷入一场小小的纷争中,让我的心情很不爽,令我更不爽的是我已经不是第一次被同一个人、以同样的方式卷入这样的纷争,俗话叫吃一百个豆不嫌腥,谚语叫未能吃一堑,长一智,哎 古人说:人非圣贤,孰能无过,伟大领袖毛主席也教导我们:只要活着就一定会犯错,这些话的意思是允许人犯错误,也理解人犯错误。但是虽然圣人、伟人与一般人一样都会犯错,但是他们同样的错误不会犯第二次,因为他们都会从上一个错误中吸取教训,并举一反三,今后在遇到类似的情况时就不会犯同样的错误了。长此以往,人就会越来越成熟,所犯的错误就会越来越少,所走的弯路就会越来越少,人就会不断的进步,就越趋近于伟人。 哲学家说:人不能两次踏入同一条河流,放到我这件事中就可以理解为人都有点自我纠错能力的,总犯一个错误其实也不是那么太容易。那么为什么有些人,比如说我,在某些事情上会一再的犯错呢,而且每次犯错后都懊悔不已,这不是自己给自己找罪受么,这不是自虐呢么。好吧,为了咱以后更趋近于伟人,或者往小了说不给自己添堵,今儿个就好好总结总结,自我批判一下,看看自己在吃第一百零一个豆的时候啥样。 首先从主观上来说,自己一直对这个事情准备不够,没有引起足够的重视,所谓好了伤疤忘了痛,不明白这个事情虽小,但是日积月累就会出问题的。同时,自己的社会阅历还差很多,这个是个硬伤,对一些矛盾和斗争认识的太肤浅,其中不是别的问题,而是对社会和周围环境的适应问题,所谓适者生存而不是强者生存,更何况我根本也不强,要么适应,要么被淘汰,游戏规则就是这么定的,能不能玩明白就看自己了。 其次,我要发挥一下敢于幻想和自我逃避的精神,从客观上找找借口。我认为从理性思维的角度来看,人脑就是一部超精密、超复杂的机器,由于人类还没聪明到可以把自己的大脑研究明白的程度,因此可以把大脑看成一个黑箱,经历的那些事是输入,经过这个黑箱处理后,输出就是你的行为,至于黑箱中是怎么处理输入的,有会输出什么,这个机理没人知道,但是我更愿意借用一个我不太懂的术语模式识别来解释。大脑在积累的一定的经验后,可以对某些事形成某种模式,就好比建模一般,以后再遇到类似的事物,就带入到模型中处理一下,很快就会得出结论。生活中基本都是这样的例子,比如我们喜欢什么样的颜色,喜欢吃什么样的食物,甚至对哪一类人一看就厌恶,都是这些模型在起作用。那么对于有些大脑来说,建立模型很快、很准,通过一次事情就能准确的建立起相关模型,并在再遇到这个事的时候准确的通过模型来识别出结果,那么拥有这样大脑的人就是一个强人。有的大脑对同类事物的聚类能力不够,也就是对事物的特征不敏感,那么建立的模型就既慢又不准,这样就一定会影响到对以后事物的判断,久而久之自己对自己越来越没有信心,形成恶性循环,拥有这样大脑的人很难成大事,能安安稳稳过一辈子就谢天谢地了。很不幸,我觉得我离后一种情况更近一些(也许平凡也是一种幸福?)。 那么这个黑箱能不能得到改进呢?我觉得这里面有个先天优势和后天努力的关系。恐怕再唯物的人也得承认人都是存在个性的(这里的个性是与共性相对的),也就是有所差异,那么人的各项能力,包括智力、体力、适应力等有差别也就不难理解了。先天的部分基本很难改变,就好比我练一辈子篮球也进不了NBA,练一辈子唱歌也进不了娱乐圈一样,能做的是改变后天的部分,也就是通过努力让自己的黑箱在原有基础上更优化一些,而不是成为最好的那个黑箱。明确了这些以后就知道了自己应该作什么: 1.主观上对每件小事都要重视一些,而且要非常重视,有时候宁可进度慢一点也要好好总结,争取不犯相似的错误。 2.要勤,俗话说勤能补拙,对于先天不具备的东西,可以通过反复不断的做,从而形成条件反射,来接近最理想的结果(注意,我说的是接近)。古人练武功和背文章都是这个道理,烂熟于胸后就可以施展自如了。我想锻炼大脑也是,要敢于重复,要巧于重复,没有量变,谈何质变。 3.有个名人说:只有偏执狂才能成功,不执著的人注定得不到天助。只要认准方向,不要考虑太细,先投入进去。有句话说的极端:一件错事,只要坚持一万次就能变成正确的事,想想好像也有那么点道理。我所见过的所有有成就的人没有一个没有自己的个性跟特点,没有一个随随便便就复制了别人的成功。 4.要心胸开阔,但这不同于麻木,不同于犬儒主义,因为在犯了错误、遇到麻烦时,只有心胸开阔才能抛开那些对人的好恶以及对事的悔恨上,而把精力集中于如何度过目前的难关,如何总结错误并吸取教训。做好了这些,让自己更加强大了,就是对阻碍你的人和事最有力的回答。 本来今天挺生气的,刚开始写的时候发了一些牢骚,态度有点消极,但写到这里已经很平和了,要开始专注于自己的事了。我要感谢今天这件事的再次发生能让我有了更加深刻的思考,就当是成长所付出的代价吧,只是希望这样的代价越少越好。
4083 次阅读|1 个评论
人脸识别中的特征选择问题(科研笔记)
ZhangMeng 2010-3-1 23:03
目前已经有大量的特征提取方法,如何选择其中最具代表性的信息是一件非常头疼的事情。Allen Y. Yang等人从利用稀疏化表示方法介绍了一种新的特征选择的方法。这种特征选择策略不需要任何花哨的空间变换方法或者复杂的分类器设计。只需要将测试对象映射到训练样本点空间组成的冗余原子库空间中,查看得到的稀疏化表示的能量集中在哪类样本组成的冗余原子库中,由此推断测试样本所属的类别。 有几个问题值得考虑: 1 什么样的稀疏表示适合于这种识别方法,L 1 ,L 2 或者 L p ? 2 需要多少样本来完成这样的识别任务,即原子库规模的问题;感觉上,样本比较多的时候识别效果可能会比较好,但是否存在极限情况,即样本越多越好?
个人分类: 生活点滴|6022 次阅读|0 个评论
mean-shift算法学习
热度 4 jiangqiuhua 2010-1-7 22:57
最近,花了三天时间将mean-shift算法初步学习了一下,基本上有点懂,由于博客中输入公式实在不方便,故将pdf文件附在后面。下一步争取对其收敛性证明和最新的改进研究一下。 mean-shift算法学习小结
个人分类: 智能视频|19235 次阅读|3 个评论
从指牛为狗看儿童认知
chrujun 2009-12-1 22:08
模式识别是人类最基本的思维过程。我们能够认字、认识人、辨别各种声音及事物,都离不开模式识别。所谓模式识别,就是一个人将当前所看、所听、所闻及其它手段所感知的信息与大脑中记忆的信息进行对比和匹配的过程。如果一个人所感知的信息和他(她)大脑中的信息能够匹配,则能够认识出所感知的信息。人类的模式识别过程具有有非线性、模糊性和自适应性。例如,我们能够把穿了不同衣服的同一个人认识出来,就在于我们能够从感知的信息中提取部分关键信息和大脑中存储的信息进行匹配,即使二者的相似度只有40%,我们也会认为是同一个人。我再举一个例子,我们能够把不同字号的人认识成同一个字,就在于我们在匹配汉字信息的时候主要匹配字的形状,而不是匹配字的面积。 我感兴趣的是幼儿成长过程中的模式识别现象。 当我儿子只有两岁的时候,我注意到了一个有趣的现象。一天,儿子指着牛奶瓶上的奶牛喊狗狗。这不是狗,是奶牛。 我笑着纠正儿子的错误。 我仔细思考这个问题,就是儿子为什么会指牛为狗。 我发现,如果我们像认识汉字一样认识牛和狗,容易把狗和牛认成是同一种动物。 因为狗和牛都有四只脚,都是四脚行走动物,如果不考虑体积大小,从形状角度看是很像的。 当儿子指牛为狗的时候,他只是考虑到了两者形状上的相似性,而没有考虑体积上的差别。 当我纠正他的认知错误后,儿子对动物的模式识别方法就和对汉字的模式识别有区别。对汉字识别注意考虑形状,不必考虑尺度。对动物则不然,既要考虑尺度,又要考虑形状。 因此,一个人长大后,其模式识别过程针对不同类型事物就有了不同的匹配手段。 对于汉字的识别,主要看形状差异。对人的识别,主要看脸部特征。对于动物的识别,尺度和形状差异并举。 在儿童成长过程中,模式识别是其认知的第一手段。随着儿童的成长,他(她)会发展出归纳、演绎、实验、假设等多种认知手段。如果我们仅仅关心儿童每天能够认多少个字,实际上对儿童的成长是极其有害的。 我们应该培养儿童的多种认知手段,而不仅仅是模式识别。
个人分类: 我的教学|5793 次阅读|2 个评论
IEEE计算机视觉与模式识别(CVPR 2010)国际会议预报
热度 1 wanyuehua 2009-10-18 07:33
2010 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR 2010) 会议网址: http:// cvl. umiacs. umd. edu/ conferences/ cvpr2010/ 论文摘要提交截止日期:2009年11月12日 会议召开时间地点:San Francisco, California, USA, June 13, 2010-June 18, 2010 这是人工智能与相关学科领域的顶级会议,2010年已经是27届,每年会议均被EI、ISTP收录,每年的会议论文会选择部分论文到SCI收录期刊发表。2008年26届会议收录756篇论文,其中美国361篇、中国63篇、德国44篇、法国25篇、英国24篇、加拿大23篇、日本22篇、 澳大利亚 19篇、以色列16篇,新加坡16篇、瑞士16篇、新西兰14篇、西班牙14篇等。 中科院12篇、香港中文大学9篇、清华7篇、中科大6篇、浙大5篇、香港科技大学5篇等著名学校均在26届会议上发表论文。 Topics : Motion and Tracking Stereo and Structure from Motion Shape-from-X Color and Texture Segmentation and Grouping Image-Based Modeling Illumination and Reflectance Modeling Shape Representation and Matching Sensors Early and Biologically-Inspired Vision Computational Photography and Video Object Recognition Object Detection and Categorization Video Analysis and Event Recognition Face and Gesture Analysis Statistical Methods and Learning Performance Evaluation Medical Image Analysis Image and Video Retrieval Vision for Graphics Vision for Robotics Applications of Computer Vision CVPR 2010
个人分类: 国际会议预报|37421 次阅读|0 个评论
20th International Conference on Pattern Recognition (ICPR 2010)国际会议预报
wanyuehua 2009-10-3 09:55
会议网址: http://www.icpr2010.org/ 论文提交截止日期:2010年1月15号 Istanbul Convention Exhibition Centre (ICEC), Istanbul, Turkey August 23-26, 2010 这是国际模式识别学会( International Association for Pattern Recognition (IAPR) .)的会议,每两年召开一次,每年会议均被EI、ISTP收录,19届会议收录987篇论文,其中美国203篇、中国181篇、日本97篇、法国68篇、德国46篇、加拿大35篇。 中科院、清华、哈工大、上海交大、北大、香港城市大学、香港理工大学等著名学校均在19届会议上发表论文。 Topics Track I: Computer Vision * Segmentation and Grouping * Color and Texture * Shape Modeling * Object Detection and Recognition * Stereo and Motion * Scene Understanding * Image based modeling * Tracking and Surveillance * Performance Evaluation * Biologically Motivated vision * Applications Track II: Pattern Recognition and Machine Learning * Statistical machine learning * Structural and Syntactic Pattern Recognition * Neural Networks * Kernel Methods * Graphical Models * Bayesian Methods * Combinatorial Optimization * Feature Selection * Model Selection * Data Mining and Pattern Recognition for Bioinformatics * Voting and Fusion Schemes * Compressed Sensing Detection and Estimation * Applications Track III: Signal, Speech, Image and Video Processing * Speech Recognition * Speech Processing and Synthesis * Image and Multidimensional Signal Processing * Image and Video Synthesis and Geometric Compression * Motion Estimation and Video Registration * Video Processing and Motion-Compensated Filtering * Video Compression and Streaming * Multimedia Signal Processing * Multimedia Security and Perceptual Hashes * Signal Processing for Sensor Networks * Applications Track IV: Biometrics and Human Computer Interaction * Fingerprint Recognition * Face Recognition * Iris Recognition * Speaker Recognition * Palmprint, Gait and Other Biometrics * Multimodal Person Verification and Identification * Biometric Security and Privacy * Facial Expression Analysis * Gesture Analysis * Applications Track V: Multimedia and Document Analysis, Processing and Retrieval * Digital Libraries * Multimedia Content Description and Indexing * Retrieval and Browsing * Multi-modal Interaction and Integration * Summarization * Data Mining and Machine Learning for Multimedia Information Retrieval * Video analysis and event recognition * 3D Video Processing and Compression * Applications Track VI: Medical Imaging and Visualization * General Medical Image Computing * Quantitative Medical Image Analysis * Computer Aided Detection and Diagnosis * Molecular and Cellular Image Analysis * Interventional Systems and Medical Robotics * Computational Neuroimaging * General Biological Image Computing * Visualization and Interaction * Applications
个人分类: 国际会议预报|10673 次阅读|0 个评论
[小红猪]你的电脑需要你
eloa 2009-8-3 19:08
小红猪小分队 发表于 2009-08-02 15:22 译者:maltose(很二的糖),最喜欢的女性地球人是Angelina Jolie,最喜欢的机器人是阿拉蕾,最喜欢的机器宠物是哆啦A梦,最喜欢的外星种族是那美克星人,最喜欢的超级英雄是钢铁侠,Sheldon Cooper是我对现实世界的男生所有美好幻想的集合体,如果你想和我交朋友,可以 fellow我的twitter 。原文链接: http://songshuhui.net/archives/4405.html 容易让人上瘾的在线游戏在不知不觉中叩击着你的大脑潜能,与此同时,它还可以解决那些让最强大的计算机也甘拜下风的难题。路易斯特尼尔报告。 阿瑞思泰德斯是个普通的13岁男孩。放学后打篮球,学习单簧管,到了晚上就坐到电脑前玩游戏。有个游戏让他特别着迷,也让他在同龄人中显得与众不同。每天,他都会用奶酪这个昵称登录 www.fold.it , 他玩的这个游戏需要弯曲、拉伸和扭动一个有些像大树根系那样的3维结构。通过调节这些扭动的绿色小管儿的长度,他要设法将它们的体积最小化。这看上去不过就是个有点奇怪的游戏顶多就有些类似3维俄罗斯方块但实际上,脱去游戏这层鲜艳的外衣,它蕴含着当今生物学家们面临的最大难题之一:蛋白质是如何折叠的? 而阿瑞思泰德斯摆弄的那个3维结构就是通过电脑所呈现的真实蛋白, 比如胶原蛋白分子。不需要知道分子生物学最基本的知识,他一样能够帮助解决现代科学里最棘手的难题之一。这个游戏的发明者,西雅图华盛顿大学的戴维贝克(David Baker)说道:在无数多种可能的情况下,要用计算机准确预知一个长蛋白质链是如何用最简洁紧凑的方式折叠,是一个相当困难的问题。 随着蛋白质肽链长度的增加,它可能的折叠方式也指数式地增加。即便是最简单的链条,也需要让一台标准台式计算机花上几个世纪的时间去预测最佳折叠方式。而有了60 000名像阿瑞思泰德斯一样的业余玩家,仅仅运作了六个月的Foldit游戏,就得到几十种蛋白的折叠方式了。 Foldit的成功在于它给一个老观点赋予了聪明的新创意。在过去的十年里,分布式计算工程风起云涌,许多大的计算问题被分成小块,通过互联网分发给全球数以百万计的台式电脑,并行地进行数字运算。这些略带冒险性质的尝试中最有历史也最流行的一项就是地外文明搜索计划的一部分。SETI@home利用空闲的计算机对来自位于波多黎各的阿雷西博射电天文望远镜收集到的数据进行分析,以寻求外星生命存在的线索。分布式计算如今已运用于多个领域,包括蛋白质折叠,密码暴力破解和气候预测。 大脑召集令 但即使一百万台计算机也不是万能的。在英国伯明翰大学研究人工智能的亚伦斯洛曼(Aaron Sloman)认为,尽管在某些问题上,计算机速度迅速准确,在很多任务上,比如视觉处理、空间推理或者问题求解上,他们远远无法超越人脑。现在看来,分布式计算的观念正在改变。研究者们不再只是利用那些闲置的机器,他们正在设法利用这些闲置计算机的主人们大脑的处理能力。 这些源源不断的智力资源看上去不会枯竭。纽约大学的克雷舍基(Clay Shirky)计算过,仅仅在美国,每个周末,人们把1亿个小时都花在观看电视广告上而这等同于创造编写250万个维基百科词条的时间。如果将这些闲置的智力中的一小部分用于简单的在线任务,为科研提供帮助,那贡献将是巨大的。 NASA的 Clickworkers 网站则是最早向在线人群求助的尝试之一。这个在2000年启动的项目,需要志愿者们标记由19世纪70年代 Viking探测器拍摄到的照片上,火星表面的环形山的位置和大小。最近,志愿者们已经在火星侦查卫星传回的超高分辨率图片上,将不同的地形分门别类。将来,等到Dawn太空船探索位于火星与木星之间的小行星带上的两颗最大的天体灶神星和谷神星的时候,NASA还打算将这些人力资源运用到其传回的照片上。 Clickworkers方法有个大问题,说到底,它是一个没什么乐趣可言的孤立操作。除了那种为一项重要事业而做出贡献的荣誉感,看不出来有什么因素可以吸引赋闲在家的志愿者们。这也是所有涉及到人类协作的关键问题:怎么才能让那些志愿者乐此不疲? 宾州匹兹堡卡内基大学的计算机科学家路易斯佛南(Luis von Ahn)给出了答案。从2002年起,他就开始推进对那些志愿者资源,也叫人体计算机的利用, 其形式远远超越了Clickworkers所进行的早期尝试。 他的秘诀就在于将复杂的问题转化成简单又吸引人的游戏。 他的第一个游戏叫做ESP,他设计的这个游戏列出了一系列单词,游戏者需要将它们同数据库中一系列图片对应起来,游戏目的是帮助训练人工智能系统。为了做到这一点,游戏将匿名玩家配对,并给他们同样的图片。玩家必需试着在最快的时间里猜出他们的搭档会用什么词语来形容图片中的物体,并通过这种方式得分。 现在这个游戏在有目的的游戏( Game with a Purpose)网站开放( www.gwap.com ),目前该网站已经有120 000名用户,也取得了一些重要的成绩。例如,ESP就给5千万张图片标记了单词,去年得到Google认可,用来帮助改进它的图片搜索引擎。人们喜欢这个游戏,和自己素未谋面的人合作让他们感觉到了前所未有的默契,佛南说道。 他最近在做的项目是 ReCAPTCHA 。ReCAPTCHA利用人脑识别被扭曲图像的能力。在将手抄本数字化时,ReCAPTCHA技术可以被用于识别那些无法被光学文字识别技术识别的文字。呈现给参与者的除了未被识别的文字,还有一个已知单词,这样就可以区分参与者究竟是计算机还是人类。如果正确识别了两个单词,那参与者就证明了自己是真人,从而可以进一步在线注册,协助完成古籍的数字化和保护工作。现在被用于像Facebook和Twitter这样的网站来确认新用户为人类,以防止黑客运用程序自动获得数以百计的帐号,从而非法地散播垃圾邮件。 这个系统已经成功转录了超过10亿个单词,现在正被用于将《纽约时报》130年的存档数字化。在未来,佛南希望用同样的方法来建立历史音频记录的副本。 【图:利用人脑识别被扭曲图像】 然而,利用人来处理图像并不是一个十全十美的方法。运行 星系动物园 的科学家们发现,这其中也会出现一些意料不到的结果。这个项目在2007年启动,集结了160 000名志愿者的力量,以帮助鉴别斯隆数位巡天计划收集到的图片上的一百万个星系。志愿者们被要求将星系按漩涡星系或椭圆星系进行分类,并记录漩涡星系的旋转方向。不需要专家指导,新手们很快就可以投身到这个项目中。 星系动物园的研究员想知道,在螺旋形星系的旋转方向上是否存在任何倾向。早先的研究发现星系顺时针或逆时针旋转的差别取决于你所看的天空的位置,这体现了在较大尺度上,宇宙的组织具有不可知性。然而,星系动物园的志愿者给出的海量数据显示在可观测的宇宙空间里没有这种趋向。 但是星系动物园这个项目还真的发现了当人们在给相同星系进行分类时的一个有趣的倾向。不知为何,人们在给漩涡星系归类的时候,更喜欢将其旋转方向归为逆时针而非顺时针,虽然研究者认为从大体上看这不会对结果造成不良影响;这个倾向实在是太微妙了,只是因为星系动物园的志愿者数量太庞大了才显现出来。 不过,这也突显了人类处理的一个顾虑研究者如何才能保证人类心理上的无意识的嗜好或怪癖不会影响到自己的研究结果?而星系动物园中,人们出现倾向的原因尚不得知。我个人认为,这可能仅仅因为逆时针这个选项的按钮处于中间, 负责管理星系动物园研究结果的凯特兰德(Kate Land)说道。 星系动物园还诞生了另一个出人意料的结果。去年,荷兰学派教师汉尼范阿克尔(Hanny van Arkel)在一张图片中发现了一个奇怪的天体。这个物体看起来像一小束明亮的绿光,其中没有恒星,也不像任意一个已知的天文现象。如果不是范阿克尔眼尖,这样一种新物体很有可能不会被发现。人脑非常擅长辨别与众不同的东西,而这种本领很难被作为搜索参数而编程到自动化的视觉归类系统中去。 星系动物园很大程度上依靠的是天文爱好者,而佛南的reCAPTCHAs计划则让网络用户们除了解决谜题之外别无选择,这种新一代的项目想要使普通民众将他们的纯粹用于娱乐的闲暇时光贡献给出来。Foldit就是这类项目中的佼佼者。 Foldit衍生于一项名为 Rosetta@home 分布式计算项目,该项目也是由贝克运作的。与 SETI@home 项目的运作方式相同,Rosetta@home利用世界各地空闲的计算机来查找蛋白质的所有可能的折叠结构以找出其中最紧凑的一种。利用该项目的结论,在过去的一年里,贝克的研究小组在《自然》和《科学》杂志上发表了一系列有关蛋白质结构的预测和构思的论文。但是,贝克和他的小组发现Rosetta@home所得到的结果必须经过人工处理,才能作科研之用。如今,贝克想看看Foldit的用户是如何参与游戏以改进Rosetta@home电脑程序的。 维杰辛潘德(Vijay Pande)是斯坦福大学另一个致力于模拟蛋白折叠的分布式计算的研究者,他的程序名为Folding@home,他担心志愿者给出结果的质量远远达不到计算机所能给出的结果。折叠蛋白质就像要学好下棋,不过有更多的棋子和更为复杂的规则,因此需要谨慎对待更加大量的可能性组合,,他认为人们不可能利用好所有的自由度。潘德相信Foldit是一个让那些不是科学家的人了解蛋白质复杂程度的好方法,他说如果人们的最终结果要是和计算机给出的一样好,他会大吃一惊。 贝克当然不会同意。蛋白质的无数种折叠的方式正好是计算机所无法理解的,他说道。像阿瑞思泰德斯这样的玩家证明了有技术的人类是如何准确地将蛋白质进行准确折叠。游戏进行几个月之后,阿瑞思泰德斯从全球60000名玩家中脱颖而出,名列前十,并被邀请加入Foldit的高级组。他展示出了对微妙的力学问题的如此直观的理解,一位Foldit研究员将他称作Foldit学者,最近他飞往西雅图,告诉他们自己是如何解决蛋白质难题的。 针对不同人和不同的计算方法的准确度在年末将被展示出来,被称为蛋白质结构预测技巧的关键性评估的比赛结果届时将宣布。比赛将通过实验确定的蛋白结构与不同小组使用计算机或人工预测的蛋白质结构进行对比。对Foldit的初步分析显示,其结果的前景很好。我们已经从这些能与大型计算机相媲美的志愿者中找到了解决方法,有时这些志愿者甚至超过大型计算机, Foldit的主要研究员,来自华盛顿大学的佐兰波波维克(Zoran Popovic)说道,我预期,一旦我们将工具精炼,使它更像游戏和人类解谜的过程,人们将能做得更好。 本月开始,Foldit将衍生出一个新游戏,这个游戏本质上是对玩家的挑战,需要他们从零做起,去设计新的蛋白质。玩家可以改变支链,这样能有效地创造人工蛋白质,而其中最好的一些会被合成并测试,波波维克说道。在12月,一种新的游戏将被推出,目的是生长和构建可以结合病毒的合成蛋白。这最终将有助于生产新药物和疫苗。我想这就是人类要比计算机有优势的地方, 贝克说道。 正如SETI@home的备受欢迎带动了分布式计算的应用,其他领域的科学也很有可能会模仿Foldit。舍基甚至看得更远:在未来,将会发起很多人类处理项目,我们会看到自身的大脑闲置周期有着无与伦比的竞争力,他说。谁说科技会让我们变得越来越闲,真是大错特错。 当个自由自在的科学家 忘了俄罗斯方块和纸牌游戏吧,将你的闲暇时光投入到科研项目中来 有目的的游戏 帮助完善计算机的图像识别和人工智能系统。 www.gwap.com 谷歌图片标签 有目的的游戏的衍生项目,通过与陌生的搭档在最快时间内标记物体来帮助改进图片搜索引擎。 www.images.google.com/imagelabeler FOLDIT 尝试各种方法折叠或设计蛋白质结构,帮助生物学家设计新一代药物。 www.foldit.com 星系动物园 将数百万张不同星系的图片进行分类,以帮助解决一些宇宙学中的重大问题。 www.galaxyzoo.org/
个人分类: 小红猪翻译小分队|1685 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-11 16:52

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部