科学网

 找回密码
  注册

tag 标签: 图像处理

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

[转载]数字图像处理领域可以投稿的期刊(转)
dylan 2011-5-19 08:24
数字图像处理领域可以投稿的期刊 Computer Vision and Image Processing IEEE Transactions on Pattern Analysis and Machine Intelligence (PAMI) IEEE International Journal of Computer Vision (IJCV) Springer Vision Research Elsevier IEEE Transactions on Image Processing (IEEE-T-IP) IEEE ACM Transactions on Applied Perception ACM Computer Vision and Image Understanding (CVIU) Elsevier Image and Vision Computing Elsevier Journal of Vision JV Journal of Visual Communication and Image Representation (JVCIR) Elsevier Journal of Mathematical Imaging and Vision Springer Journal of Electronic Imaging SPIE ICGST International Journal on Graphics, Vision and Image Processing (GVIP) ICGST MGV: Machine GRAPHICS VISION Institute of Computer Science International Journal of Imaging Systems and Technology Wiley InterScience Electronic Letters on Computer Vision and Image Analysis Elcvia The Visual Computer Springer IET Image Processing IET IET Computer Vision IET International Journal of Image and Graphics (IJIG) World Scientific International Journal of Remote Sensing Taylor Francis SIAM Journal on Imaging Sciences SIAM Signal, Image and Video Processing Springer Pattern Recognition Pattern Recognition Elsevier Pattern Recognition Letters (PRL) Elsevier International Journal of Pattern Recognition and Artificial Intelligence World Scientific Pattern Analysis Applications Springer Journal of Pattern Recognition Research (JPRR) JPRR Signal Processing IEEE Signal Processing Letters IEEE IEEE Signal Processing Magazine IEEE Signal Processing Elsevier EURASIP Journal on Applied Signal Processing EURASIP Signal Processing : Image Communication Elsevier IET Signal Processing IET Neurophysical Journals in Computer Vision Nature Neuroscience. Nature Visual Neuroscience. Cambridge IEEE Transactions on Neural Networks. IEEE Neural Networks Elsevier Perception and Psychophysics. Psychonomic Society Perception. Pion Ltd. Journal of Experimental Psychology: Human Perception and Performance. Elsevier Computer Graphics ACM Transactions on Graphics ACM IEEE Computer Graphics and Applications (CGA) IEEE IEEE Transactions on Visualization and Computer Graphics IEEE ACM SIGGRAPH Computer Graphics ACM Computers and Graphics Science Direct Computer Graphics Forum (including Eurographics) Eurographics Graphics Interface Graphics Interface Journal of Graphics Tools ACM Journal of Visualization and Computer Animation Wiley Symposium on Interactive 3D (I3D) ACM Virtual Reality Virtual Reality Software and Technology (VRST) ACM Machine Vision Applications Machine Vision and Applications Springer Real-Time Imaging Elsevier Vision Interface Vision Interface IEEE Transactions on Geoscience and Remote Sensing IEEE International Journal of Applied Earth Observation and Geoinformation Elsevier Remote Sensing of Environment Elsevier ISPRS JOURNAL OF PHOTOGRAMMETRY AND REMOTE SENSING ISPRS Journal of Applied Remote Sensing SPIE Journal of the Indian Society of Remote Sensing Springer Multimedia IEEE Transactions on Circuits and Systems for Video Technology IEEE IEEE Transactions on Multimedia IEEE Optics Journal Optical Society of America OSA Optometry and Vision Science LWW Information Fusion Information Fusion Elsevier Information Processing Letters Elsevier Information Sciences Elsevier Information Sciences - Applications Elsevier Information Systems Elsevier Soft Computing Applied Soft Computing Elsevier Journal of Soft Computing Springer Others Medical Image Analysis Elsevier ACM Transactions on Information Systems ACM Swarm Intelligence Springer IET Information Security IET Numerical Functional Analysis and Optimization Taylor Francis Sadhana - Academy Proceedings in Engineering Sciences Springer International Journal of Wavelets, Multiresolution and Information Processing (IJWMIP) World Scientific IETE Technical Review IETE IETE Journal of Research IETE IEEE Transactions on Information Forensics and Security IEEE
个人分类: 科研资源|9360 次阅读|0 个评论
浅谈数字图像处理技术
ChinaAbel 2011-5-3 14:51
随着工业技术的高速发展,零部件尺寸检测和质量评价已成为工业生产中极为重要的一个环节,而且对尺寸检测技术水平的要求也越来越高。   一、数字图像处理技术研究背景   当前,工业零部件尺寸有多种测量方法,但检测过程中都存在一些问题。工业零部件的加工质量直接影响工业的正常生产,由于尺寸的检测缺陷,会影响生产并产生安全隐患。因此如何采用一种行之有效的尺寸检测方法,是目前急需解决的问题,这不仅要求检测效果好,而且还要求检测速度快。   二、数字图像处理技术概述   数字图像处理的英文名称为“Digital Image Processing”。通常所说的数字图像处理是指用计算机进行的处理,因此也称为计算机图像处理(Computer Image Processing)。数字图像处理就是利用数字计算机或者其他数字硬件,对从图像信息转换而得的电信号进行某些数学运算,以提高图像的使用性。总的来说,数字图像处理包括以下几项内容:   1、点运算   点运算主要是针对图像的像素进行加、减、乘、除等运算。图像的点运算可以有效地改变图像的直方图分布,这对提高图像的分辨率以及图像均衡都是非常有益的。   2、几何处理   几何处理主要包括图像的坐标转换,图像的移动、缩小、放大、旋转,多个图像的配准以及图像扭曲校正等,几何处理是最常见的图像处理手段,几乎任何图像处理软件都提供了最基本的图像缩放功能。图像的扭曲校正功能可以将变形的图像进行几何校正,从而得出准确的图像。   3、图像增强   图像增强的作用主要是突出图像重要的信息,同时减弱或者去除不需要的信息。常用方法有直方图增强和伪色彩增强等。   4、图像复原   图像复原的主要目的是去除干扰和模糊,从而恢复图像的本来面目,例如去噪声复原处理。   5、图像形态学处理   图像形态学是数学形态学的延伸,是一门独立的研究学科,利用图像形态学处理技术,可以实现图像的腐蚀、细化和分割等效果。   6、图像编码   图像编码研究属于信息论中信源编码的范畴,其主要宗旨是利用图像信号的统计特性及人类视觉特性对图像进行高效编码,从而达到压缩图像的目的,图像编码是数字图像处理中一个经典的研究范畴,有60多年研究历史,目前已经制定了多种编码标准。   7、图像重建   图像的重建起源于CT技术的发展,是一门新兴的数字图像处理技术,主要是利用采集的数据来重建出图像,图像重建的主要算法有代数法、迭代法、傅立叶反投影法和使用最广泛的卷积反投影等。   8、模式识别   模式识别也是数字图像处理的一个新兴的研究方向,当今的模式识别方法通常有3种:统计识别法、句法结构模式识别法和模糊识别法,目前应用广泛的文字识别(OCR)技术就是应用模式识别技术开发出来的。   三、数字图像处理的应用   到今天,数字图像处理已经渗透到工业、医疗保健、航空航天、军事等各个领域,在国民经济中发挥越来越大的作用。其中最典型的应用有:   1、遥感技术中应用   遥感图像处理的用处已越来越大,并且其效率和分辨率也越来越高。它被广泛地应用于土地测绘、资源调查、气象检测、环境污染监督、农作物估产和军事侦查等领域。目前遥感技术已经比较成熟,单数还必须解决其数据量庞大、处理速度慢的缺点。   2、医学应用   图像处理在医学上有着广泛的应用,其中最突出的临床应用就是超声、核磁共振和CT等技术。在医学领域利用图像处理技术可以实现对疾病的直观诊断和无痛、安全方便的诊断和治疗。   3、安全领域   利用图像处理的模式识别等技术,可以应用在控制、指纹档案管理等安全领域中。   4、工业生产   产品的无损检测也是图像处理技术的一项广泛的应用。   四、数字图像检测技术   数字图像检测技术就是将数字图像处理技术应用到精密测量领域,它的原理是通过对被测物体图像边缘的处理而获得物体的几何参数。   工业上的检测方法多种多样,从测量方式上分为接触式和非接触式两种。接触式测量大都使用不同类型的探头,通过探头在物体表面滑动感知物体形貌的变化。这类检测系统主要用于精密表面的轮廓检测。而非接触式测量以光测为主,该方法目前都是与图像处理技术相结合,利用光学方法对目标的位置、尺寸、形状、方位和目标间相互关系等进行测定,在工业检测方面具有广泛应用。   五、数字图像检测技术的应用   由于视觉信息独特的空间及结构特性,伴随着近年来计算机技术的飞速发展,数字图像技术在许多领域里发挥作用,如电子工业中印刷电路板、集成电路和光掩膜等的生产工艺流程中,通过对所获得的图像进行处理和识别来判断制作线路的正误,从而来保证产品的生产质量;冶金工业中钢板表面的自动探伤、赤热钢板切割位置定位;农业中农产品的品质检测,如水果、蔬菜、烟叶、谷物等的缺陷、类别及等级检测;林业生产中木材品质的检测,如板材厚度检测、板材表面粗糙度检测、木材材质及微观构造分析、板材表面缺陷检测、树种的识别和苗木参数测量等;玻璃制品行业中的产品检测,如产品外形尺寸检测(高度、直径、不规则程度等)、内部缺陷检测(裂纹、气泡等);公路裂纹检测等;机械零件的自动识别及几何尺寸测量、表面粗糙度和表面缺陷检测等,从而提高了产品的检测精度,同时也提高了生产效率。数字图像检测已经成为计算机图像技术的基本应用领域。国外数字图像检测技术自上世纪八十年代初开始已经得到了广泛的研究。将数字图像检测技术用于工业产品的检测在发达国家已经非常普遍。国内的视觉检测研究从上世纪九十年代才开始得到重视,最近几年有了突飞猛进的发展。 数字图像修复技术综述.pdf   
个人分类: 图像处理|1 次阅读|0 个评论
[转载]Maple图像处理的例子
COMSOLFEM 2011-3-1 17:29
图像处理 来自:www.cybernet.sh.cn 举例说明在 Maple 读取和处理图像文件。 模型和原文献 » 下载 用户资源 中文资料下载 Maple 用户论坛 Maple 应用下载中心 Maple Primes - 在线支持 Maple 和 MapleSim 试用申请 Image Tools This example demonstrates how to efficiently work with images in Maple. Using the embedded GUI components you can read in images, apply manipulations and edge detection to those images.
个人分类: 用户故事|2888 次阅读|0 个评论
[转载]【转】ArcGIS中自定义ENVI/IDL图像处理工具
热度 1 dongyanqing 2011-2-22 23:42
[转载]【转】ArcGIS中自定义ENVI/IDL图像处理工具
ArcGIS 中自定义 ENVI/IDL 图像处理工具 随着空间信息市场的快速发展,遥感数据与 GIS 的结合日益紧密。遥感影像已经是 GIS 的核心组成部分,为 GIS 提供了即时、丰富的数据。导致遥感与 GIS 的一体化集成逐渐成为一种趋势和发展潮流。 ENVI 与 ArcGIS 一体化集成已经从最开始的数据互操作、工作流的无缝连接发展到了第三阶段,即系统无缝融合阶段,全面提升遥感影像价值。进一步提升了空间和影像分析的工作效率,并有效节约系统成本。 目前 ENVI4.8 的部分图像处理功能可以无缝集成在 ArcGIS931 和 10 版本的 ArcToolbox 中,在 ArcGIS 软件中能直接使用 ENVITools ,并且可以用 ModelBuilder 将 ENVI 工具和 ArcToolbox 中的 GIS 工具组合成需要的业务模型和工作流。同时这些模型和工具支持 ArcGISServer 的网络发布。 ENVITools 中现有的工具在 ArcGIS 下使用和建模都非常方便,在此不一一细说。 下面主要介绍如何利用 Python 脚本将 ENVI/IDL 编写的图像处理功能集成到 ArcGIS 中,进行一体化的数据处理和分析。(以及如何利用 ArcGISServer 发布 ENVI 的图像处理功能。) 一、步骤 1 、指定路径和文件夹 指定一个路径创建一个文件夹,用于存放 IDL 文件和 Python 代码文件。 如: C:\MyTool 2 、编写 Python Script Python script 文件是为了从用户交互式界面中获取参数,执行脚本文件时将这些参数传递给图像处理程序( IDL 编写了 .sav 文件)调用图像处理的功能。 利用 Python 来编写脚本调用 ENVI/IDL 工具,包含三个部分: ( 1 ) 导入 envipy 类。 “ envipy ”是 ITT 专门为 ENVI/ArcGIS 一体化开发的一个 python 模块, envipy 与 IDL 代码中调用 ENVI 库函数时的加载的代码 ENVI , /RESTORE_BASE_SAVE_FILES 和 ENVI_BATCH_INIT 的效果是一样的,就是加载 ENVI 的进程。 ( 2 )从GP对象中获取参数。( Get the parameters from the geoprocessor object.) ( 3 ) 调用envipy类中的‘RunTool’方法。(Call the RunTool function in the envipy module.) 以 ArcGIS10 为例( ArcGIS931 可查看 ENVI 的 Help 文档): # 导入模块 import envipy, arcpy # Get input raster inRasterName = arcpy.GetParameterAsText(0) # Get output raster outRasterName = arcpy.GetParameterAsText(1) # Get the Kernel Size kernelSize = arcpy.GetParameterAsText(2) # IDL procedure name in the SAVE file for this tool toolname = 'MyScriptTool' # Execute ENVI custom tool envipy.RunTool(toolname, inRasterName, outRasterName, kernelSize, Library=r'MyScriptTool.sav') 在 Python 的编译环境复制粘贴该代码,保存为 MyScriptTool.py 文件,供后面创建界面时使用。 3 、编写 IDL 程序,并编译成 sav 文件 在 IDL 的利用 IDL 调用 ENVI 的图像处理接口实现某一图像处理功能;再编译成 sav 文件供 Python 脚本中 envipy.RunTool() 调用。 有两种编译方式: 方式 1 :命令行 IDL . full_reset_session IDL . compile myscripttool . pro; 或者点击 IDL开发环境界面上的‘编译’按钮,编辑该程序。 IDL resolve_all ,skip_routines= 'envi' ,/continue_on_error,/quiet IDL save ,/routines,filename= 'C:\MyTool\MyScriptTool1.sav' ;指定保存路径和名字。 方式 2 :按钮操作 构建一个工程,将所有的 pro 和 function 文件加载该工程中,右键该工程文件夹点击“构建工程”(注意工程属性的设置,属性中的 RESOLVE_ALL 选上与不选都可以)。 需要注意的是: ( 1 ) 可以将多个图像处理的工具( pro toolname1, arg0, arg1, arg2 和 pro toolname2, arg0, arg1, arg2 等等,每一个 pro 对应一个图像处理功能)打包成一个 sav 文件,这个 sav 文件在 Python 脚本中被调用。如第 2 节中的例子代码: toolname = 'MyScriptTool' envipy.RunTool( toolname , inRasterName, outRasterName, kernelSize, Library=r' MyScriptTool.sav ') 此代码中的 Library=r' MyScriptTool.sav ' 中 MyScriptTool.sav 文件的文件名可以是任意的 , 如 ha.sav 。但是必须保证该 sav 文件中有程序名与 toolname 对应(此代码中的 toolname 就是为了调用 sav 文件中的同名的程序, toolname 不支持函数 function ,只支持程序 pro )。 将多个图像处理的程序打包成一个 sav 文件,这就保证了多个脚本工具可以对应一个同一个 sav 文件,免得每一个脚本对应的 pro 都要编译成单独的一个 sav 文件。 如:有 5 个图像处理的程序 pro tool1 、 pro tool2 、 pro tool3 、 pro tool4 、 pro tool5 。可以编译成 5 个 sav 文件,分别建立 5 个脚本工具。同样地,可以将这 5 个 pro 编译成 1 个 sav 文件,被 5 个脚本调用,效果是一样的,只是这种方式更方便些。 ( 2 ) 尽量将 sav 文件与 python 脚本文件放在一个文件夹(相同目录)下,方便共享。如果不在一个目录下,在 envipy.RunTool() 中 Library 要指定 sav 文件的完整路径,如 Library = r' c:\savefiles\MyEnviTool.sav ' 。 4 、构建用户使用界面 在C atalog 中构建界面需要三步骤: l 创建文件和工具箱 toolbox ; l 给 toolbox 添加 script ; l 运行该脚本 script 。 操作流程如下: ( 1 )打开 arcgis desktop10 ,打开 catalog ,在 catalog 中指定或者新建一个文件夹并修改相应的名字,右键该文件夹—— NEW —— toolbox (并修改相应的名字 mytool )。 ( 2 )右键该工具箱( mytool )—— Add —— Script 点击下一步 “添加脚本文件”,将事先写好的脚本导入即可。 点击下一步 “为 IDL 或 ENVI 功能程序中的参数进行设置”。 设置完成后,点击‘ finish ’即可。 ( 3 )上述步骤完成后,会在已建好的工具 mytools 下出现 。 双击,即可出现运行界面: 点击 OK 执行脚本工具。 二、共享脚本工具 如果想将制作的脚本工具与别人共享或移植到别的计算机上运行该脚本,必须保证三个文件在一个文件包(文件夹)中。 MyScriptTool.py ——脚本文件(.py)。 MyScriptTool.sav —— IDL 或 ENVI 的功能文件(. sav )。 MyToolbox.tbx ——创建的 toolbox 界面文件(.tbx)。 以上三个文件放在一个文件包中,移动改文件包即可完成共享。 使用时,打开 ArcToolbox ,右键空白处 点击 Add Toolbox ,添加共享文件包 中的 .tbx 文件即 MyToolbox.tbx 。 然后该工具出现在 ArcToolbox 中, 如要下载源码和工具请链接: http://bbs.esrichina-bj.cn/ESRI/viewthread.php?tid=86612extra = 注意:如果没有指定建立 toolbox 的路径,直接在 catalog 中的 arctoolbox 中新建的 toolbox ,该文件的路径如下: · MyToolbox.tbx , located in: For ArcGIS 10: C:\Documents and Settings\ username \Application Data\ESRI\Desktop10.0\ArcToolbox\My Toolboxes\MyToolbox.tbx For ArcGIS 9.3: C:\Documents and Settings\ username \Application Data\ESRI\ArcToolbox\My Toolboxes\MyToolbox.tbx 原帖:http://hi.baidu.com/%C6%D0%CC%E1%C3%F7/blog/item/a70513aec85b53df7cd92ab4.html
个人分类: ENVI|5967 次阅读|2 个评论
GIMP:最好的免费图像处理软件
outcrop 2010-11-14 23:11
GIMP的全名是GNU Image Manipulation Program,是一款开放源代码、跨平台、免费的图像处理软件。号称Linux下的PhotoShop;显然功能不及Photoshop强大,但对于一般非专业用户是足够的,而且二次开放及脚本编程,都很方便。详细资料见: GIMP官方网站 需要提一下的是,GIMP早期版本在中文Windows操作系统下并不稳定,可能是GTK的毛病,新版本据说有改善。Linux下表现相当稳定优秀,我偶尔用的是Ubuntu自带的2.6.8版。
个人分类: 开放源代码工具|5283 次阅读|0 个评论
多传感器图像融合中的若干新概念和关键技术
热度 1 zoumouyan 2010-11-14 00:55
多传感器图像融合中的若干新概念和关键技术 Some New Concepts and Key Techniques in Multi-Sensor Image Fusion 邹谋炎 图像融合技术已经有近四十的历史。人们一直期望它能够在目标辨识、分类和变化检测方面有出色的应用。然而事与愿违。多年来,研究者们习惯于这样的定义:图像融合是使用一定的算法来组合两个或多个图像,以形成一个新图像 。这个定义出自本领域中的知名专家,对年青研究者的思考方式有不小的影响。 我们的研究认为,( 1 )组合多个图像以形成一个新图像不是图像融合的本质;( 2 )任何一个图像应该被理解为视场中目标的某种属性的一个分布( DAO );( 3 )特征级图像融合应该是各个图像中描述同一个目标的不同属性数据的数据关联;( 4 )决策级图像融合应该是依据关联数据,对每个目标产生出一组数值描述,其描述方法决定于辨识、分类、变化检测的不同应用;( 5 )是否形成一个融合图像完全决定于应用。常常,在目标位置上的一个标记,一层或多层伪彩色区域,可以更鲜明和方便地表达融合结果。 根据这些概念,研究者应该更加关注每个图像的物理隐含。据此,需要重新思考多传感器图像融合涉及的各个相关研究问题,如配准、分割、特征抽取。数据关联的自然推理导致关联数据库、数据库协议等概念。如何处理这些问题富有很高的挑战性。为了使图像融合技术的研究朝着应用需求有本质的进步,我们期待能引起更多研究者的研究兴趣。在此,我们提供一篇近期的文稿,供讨论参考。 以下文稿可下载供讨论。若引用,请注明作者和网络出处。 MultiSensor_ZouMouYan_R2a.pdf (2010-11-13)
个人分类: 研学小记|7543 次阅读|3 个评论
图像的现代魔术
热度 1 songshuhui 2010-8-9 21:10
方弦 发表于 2010-08-02 7:30 内容感知填充 现在的摄影爱好者对数码技术总是颇有微词。他们说,CCD记录的数字信号失却了世界各种细腻的美好,数字格式的照片遗失了胶片时代的质感。我不懂摄影,当然也没有资格评论这种感觉,但在另一方面,数码技术带来的便利也是显而易见的。各种在胶片时代几乎是魔术的图像处理效果,在这个数码时代不费吹灰之力。 尽管胶片可以留住瞬间的景象,却也敌不过时光的侵蚀。十几年前的老照片,完好无缺仍然鲜活的就不多见。发黄的照片,扫描到电脑上校准一下色调就行了。但对于那些有折痕甚至缺损的照片,即使瑕疵多么微小,不得不说也是一种遗憾。以往,修复这些瑕疵,只能将其扫描到计算机中,然后用各种图像处理软件进行手工处理。这个过程,如果要得到良好的效果,即使对于专业人士来说,也是极费精力的。但应用一种名为内容感知填充的新技术,计算机可以自动完成这一切,而得到的结果很多时候也相当可取。 除了修复照片的瑕疵外,这项技术的另一个用途就是去除照片中碍眼的东西。试想一下,一张青山绿水的野外照片,草地上却有几个易拉罐,这恐怕有些煞风景。但在计算机上,只需选中这些杂物,轻点鼠标,这些瑕疵就被抹去了,留下的是绿油油的草地。 只需圈出需要修补的瑕疵,向计算机下达命令,数秒后照片就完好如初。粗看这种技术的确近乎魔术,但其实背后的算法很直白,就是拆东墙补西墙。将瑕疵标记之后,计算机就会接过手来,删除这一部分,然后尝试用照片其余部分的图案,一点一点填充图像的缺口。 算法最复杂的地方,就在于如何选取与填充。显然,填充的基本条件就是填充的图案要与缺口附近的图案相近,否则填充成一件百衲衣就得不偿失了。为了选取相近的图案,计算机会在缺口的附近或者纹理相近的地方,提取局部的图案一一比较,再选取最适合的。这一小片图像,在进行适当的处理后,就被填充到缺口中。如此逐步填充,最后完成的图像,虽远非完美,但起码不会有明显的局部拼接的痕迹。 这个技术,说起来虽然很轻松,但在实现上却远非如此。最繁重的工作就是找到匹配的局部图案,这需要对大量的数据组合进行模糊匹配。而填充的具体策略也会影响最后的效果。在很多情况下,结果也还不尽如人意,还需要进一步的修缮。但这项技术毕竟自动化了大部分的工作,降低了人工处理的工作量。 当然,内容感知填充也有它的限制。根据它的原理,我们知道它其实并不能猜测某个物体背后遮盖的到底是什么,它做的不过是拆东墙补西墙。所以,利用这种技术,从性感女星的火辣剧照中去掉衣服的努力是注定要失败的。但对于去除在繁杂背景前凸显的某些物体,比如说沙滩上某位碍眼的救生员的话,内容感知填充会给你带来意外的惊喜。 另一项与内容感知填充相近的技术,名为内容感知缩放,解决的却是另一个问题。当我们调整照片大小和比例时,照片上的物体也会相应地被拉伸或者收缩。林青霞的照片,稍稍拉伸一下,大概就可以冒充沈殿霞了。但我们有时也需要内容相同,尺寸不同的一系列图片,内容感知缩放解决的正是这一问题。在改变图片尺寸时,它可以帮助保持图片中主要内容不变,让女士的身材避免走形。 内容感知缩放 尽管名称相似,这项技术与内容感知填充的原理完全不同。在需要缩放图片时,计算机会利用一种叫动态规划的算法,计算一条由像素组成,贯穿照片相对边沿的最不起眼的路径,然后将它填充或者删去,图片的大小就变化了一点,重复多次就可以得到缩放的效果。而在这里,不起眼的像素路径,就是那些每个像素都与它的邻居相差不远,属于多它一个不多少它一个不少的类型。这就不难理解为什么填充或者删除这样的路径之后,图片的内容保持不变了。 同样,这项技术也不是万能的。如果图片的主要内容与背景相差不远的话,也可能被误伤,导致变形。弥补这个不足的办法相对简单:可以选定要重点保护的部分,这样在探查这些区域的时候,算法不敢越雷池一步,内容也得以在大刀阔斧的填充和删除下保存。 无论是内容感知填充,还是内容感知缩放,这些技术之所以在我们眼中仍有缺陷,是因为它们对于照片的内容,仍然处于感知的层面上,而不能像人那样理解照片的内容。计算机不能理解情人在背后会轻轻挽手,也不能理解易拉罐在草地上的反讽。对计算机而言,一张数码照片的所有意义就是像素构成的数据矩阵。而对于我们,一张照片意味着的,可能是家人的微笑,情人的可爱,或是自然的美好。照片代表的回忆,无论绚烂或平淡,都是计算机所不能理解的。 也只有照片负载的回忆,可以成为好好活过的证据。 【已刊于《艺术世界》七月刊】
个人分类: 计算机科学|1630 次阅读|3 个评论
[转载]推荐:Photoshop科学图像处理:方法、测量与输出
kksonne 2010-6-21 08:08
盛弘强 2010-06-20 推荐理由:本书是科研人员处理图像不可或缺的资源--Eric J .Wexier, Adobe 生物图像咨询组专家 Photoshop科学图像处理:方法、测量与输出 市场价:¥98.00元本店价:¥73.50元 书籍作者:(美国)塞奇威克? 译者:黄晓磊?李化 书籍出版社:清华大学出版社 出版日期:2009年05月 书籍ISBN:9787302198840 书籍页数:278 页 书籍版次:第1版 书籍装帧:平装 书籍开本:16 书籍标识:asinB002C1APKK 书籍名:Photoshop科学图像处理:方法、测量与输出 【作者介绍】 (美国)塞奇威克 译者:黄晓磊 李化 Jerry Sedgewick,资深科研图像处理专家,美国明尼苏达大学生物图像处理实验室主任。Jerry在该实验室执教10多年,积累了大量的实践经验。该实验 室拥有光学显微领域的核心设施,为学校和该地区相关行业的科研和工程人员提供技术支持。Jerry经常撰写一些学术文章,并发表在多种刊物上,其中包括 Science和Circulation等杂志。除本书外,他还是Quick Photoshop for Research:A Guide to Digital Imaging for Photoshop 5x,6x and 7x一书的作者。 【目录】- Photoshop科学图像处理:方法、测量与输出 第I部分学术规范与背景知识 第1章 可视化数据及其学术规范 1.1 可视化数据的精确表示 1.1.1 误表示发生的时机 1.1.2 图像的种类 1.1.3 创作者须知 1.1.4 使用标准与参考值 第2章 图像通用规则 2.1 规则 2.2 图像获取阶段 2.2.1 准备样本 2.2.2 优化成像系统 2.2.3 关闭自动过滤功能 2.2.4 位深度 2.2.5 裁切 2.2.6 明场图像白平衡的颜色 2.2.7 噪声图像与帧平均 2.2.8 存档 2.2.9 操作规程 2.3 后期处理阶段 2.3.1 全局修正及应用 2.3.2 裁切与修齐 2.3.3 颜色模式变换 2.3.4 改变位深度 2.3.5 颜色校正 2.3.6 数码相机中的彩色噪声 2.3.7 合并及图像栈功能 2.3.8 标志.文字.标尺 2.4 适应输出阶段 2.4.1 减少位深度 2.4.2 白色(或黑色)极限 2.4.3 调整图像大小 2.4.4 颜色模式的变换:从RGB到CMYK 2.4.5 文件格式 2.4.6 说明文档 2.5 后期处理中禁止的操作 2.5.1 污点修正 2.5.2 从一幅图像向另一幅图像移取特征 2.5.3 有目的地操作可视化数据 2.5.4 改变图像大小(子采样) 2.5.5 使用亮度/对比度工具 2.5.6 复制/粘贴操作 第3章 特定图像类型的规则 3.1 测量OD/I的图像 3.1.1 平板扫描仪上的电泳样本 3.1.2 图像获取 3.1.3 后期处理 3.1.4 使用照相机/扫描光束系统获取测量OD/I的图像 3.1.5 图像获取 3.1.6 后期处理 3.2 表示性图像 3.2.1 图像获取 3.2.2 后期处理 3.2.3 适应输出 3.3 用于量化和可视化的图像 3.3.1 可视化 3.3.2 图像获取 3.3.3 后期处理 第II部分输入.校正与输出 第4章 获取最佳输入 4.1 用标准(复式)显微镜获取图像 4.1.1 精确表示 4.1.2 均匀照明 4.1.3 减少噪声 4.1.4 显微镜设置 4.1.5 在相机或获取软件中获取图像 4.2 激光共聚焦扫描系统 4.2.1 按照用途分类的共焦成像 4.2.2 共焦系统的成像步骤 4.3 平板扫描仪 4.3.1 平板扫描仪的预扫描设置 4.3.2 通用的扫描过程 4.3.3 关于扫描的几点提示 4.4 立体显微镜成像 4.4.1 控制眩光与照明 4.4.2 关于复杂样本成像的几点提示 4.5 环境成像 4.5.1 曝光时间与光圈 4.5.2 照明 4.5.3 校准相机 4.6 PowerPoint及其他程序中的图像 4.6.1 将复制粘贴作为(低劣的)解决方法 4.6.2 保持分辨率不变的最佳方法 第5章 Photoshop设置与标准过程 5.1 颜色和对比度匹配的方法 5.2 颜色设置 5.2.1 非同步 5.2.2 工作空间 5.2.3 颜色管理方案 5.2.4 转换选项 5.3 标准过程 5.3.1 输出色阶和ColorSampler工具 5.3.2 寻找黑色和白色参考点 5.3.3 设置白色和黑色输出色阶 第6章 打开图像与初始化步骤 6.1 图像校正流程表 6.2 打开图像 6.2.1 Bridge数据库程序(适用于CS2和CS3) 6.2.2 SmartObject或复制图像 6.2.3 打开时存在问题的文件 6.2.4 在AdobeCameraRaw中打开图像 6.2.5 打开多幅图像,合并为一幅图像 6.2.6 用于合成或分层的图像栈 6.2.7 打开多幅图像进行照片合并(照片缝合) 6.3 预校准修正 6.3.1 IndexedColor(转换为RGBColor) 6.3.2 校正不均匀照明 6.3.3 问题图像 6.3.4 减少噪声 第7章 颜色校正与最终步骤 7.1 明场颜色校正与RGB颜色转换为CMYK 7.1.1 精确的颜色校正 7.1.2 参考区域 7.1.3 色调与饱和度 7.1.4 彩色噪声 7.1.5 白色或灰色吸管方法 7.1.6 与参考图像的颜色匹配 7.1.7 其他手动或自动颜色校正方法 7.1.8 降低饱和度.修正色调,使图像符合CMYK标准 7.1.9 彩色边缘现象与彩色噪声的消除 7.2 明场图像彩色模式到灰度模式的变换 7.3 单色暗场图像 7.3.1 设置黑白极限与亮度匹配 7.3.2 单色图像转换为灰度图像 7.3.3 彩色化灰度图像 7.3.4 修正现有的颜色 7.3.5 显示共区域化/共存 7.3.6 使图像符合CMYK标准 7.3.7 彩色化.脱色动作 7.4 利用伪彩色和彩色化将灰度图像转换为彩色图像 7.4.1 根据颜色表伪彩色化图像 7.4.2 色调分离 7.5 灰度图像的调色 7.6 锐化 7.6.1 UnsharpMask锐化方法 7.6.2 HighPass锐化方法 7.7 Gamma 第8章 制作插图/图解与适应输出 8.1 制作插图或图解 8.1.1 自动的保留分辨率法 8.1.2 手动的保留分辨率法 8.1.3 自动的出版分辨率法 8.1.4 手动的出版分辨率法 8.1.5 匹配图像背景 8.1.6 为插图添加文字 8.1.7 对齐文本.编号及符号 8.1.8 将文本和直线图层合并为单个图层 8.1.9 符号.形状及箭头 8.2 编辑图表 8.3 图像中的局部图 8.4 针对输出的重采样(ImageSize) 8.5 锐化.Gamma.CMYKColor及保存插图 8.6 输出 8.6.1 喷墨打印 8.6.2 激光打印 8.6.3 电子文档 第III部分分割与量化 第9章 从背景中提取相关特征 9.1 使用Photoshop还是体视学宋分割图像 9.1.1 体视学 9.1.2 计算机辅助图像测量 9.1.3 混用两种方法 9.1.4 手动测量 9.2 计算机辅助测量中分割图像的过程 9.2.1 针对需要的校正检查图像 9.2.2 特征聚集或求平均特征 9.2.3 彩色图像:寻找对比度最高的灰度通道或者根据颜色选择 9.2.4 识别特征与背景的边界 9.2.5 应用HighPass滤镜 9.2.6 使用Threshold进行二值化 9.2.7 修改二值化的图像 9.2.8 参考区域 9.2.9 使用相关图像测试分割过程 9.2.1 0直方图和线性直方图匹配 9.2.1 1创建动作(或脚本)将所有步骤自动化 9.3 手动分割 9.3.1 使用网格分割图像 9.3.2 创建小的.固定的选区 9.3.3 使用Lasso或MagicWand工具手动选择 第10章 测量图像 10.1 测量所选择的特征 10.2 在旧的Photoshop版本中获取测量值 10.3 在Photoshop中测量共区域化/共存 10.4 使用数据库/电子表格程序来区分特征 参考文献 【内容提要】- Photoshop科学图像处理:方法、测量与输出 Adobe Photoshop是当今科研人员使用的强大工具之一。如果测量时需要准备样本的数字图像,该工具是必不可少的,尤其对于从背景细节中分离出相关特性的情 况更是如此。《Photoshop科学图像处理:方法、测量与输出》使用简单通俗的语言介绍了使用Photoshop进行科学图像处理的全过程,是一本在 科研上操作Photoshop的权威指南。它从道德层面上关注使用图像增强软件从数字图像中提取数据所带来的后果。另外,《Photoshop科学图像处 理:方法、测量与输出》还讲解了获取数字图像的过程以及使用数字和硬拷贝格笺输出处理后图像的操作。初级用户可以通过学习《Photoshop科学图像处 理:方法、测量与输出》掌握基本的图像处理方法,高级用户则可以学习使用Photoshop的自动操作功能。 【介绍/插图】 《Photoshop科学图像处理:方法、测量与输出》特色 ●全面介绍从背景中提取所关心的特性时使用的一些鲜为人知的方法,为后续的量化做准备。 ●讲解如何生成出版时能正确复制的密集色彩和微小的可视化细节。 ●论述适用于所有Photoshop用户的正确操作方法和技巧。 ●详细讨论在Photoshop的早期版本、Photoshop Elements以及Photoshop Extended中可以使用的操作。 插图: 第1部分 学术规范与背景知识 第1章 可视化数据及其学术规范 1.1 可视化数据的精确表示 应该尽最大努力来保证可视化数据的表示效果,使它看起来跟通过眼睛观察到的图像是基本一致的。换句话说,作为论据的图像必须是所看到景象的真实再现。与正 确表示不符的任何偏差都是一种误表示(misrepresentation),而其对应的图像存在某种程度上不精确的数据。 除非对光密度或强度(opticaldensityorintensity,OD/I)进行过测量,精确表示通常需要进行后期处王里(post- processing)。大多数情况下,因为成像设备和有关测量仪器上的限制,基本都要对图像进行后期处理。这些成像设备和仪器的限制主要包括:许多相机 在光检测器上使用了反锯齿功能,导致图像模糊;测量仪器在近距离检测上的限制,导致图像产生噪声;能量来源存在可变性。鉴于上述几个原因,要想为可视化数 据提供很好的表示效果,必须对原图像进行校正。
个人分类: 好书推荐|5529 次阅读|0 个评论
[转载]图像处理入门过程
热度 1 zhang11wu4 2010-5-27 16:44
Low Level -- Middle Level -- High Level 过程:简单的图像处理(线性变换、直方图、边缘提取、平滑去噪、滤波) -- 图像分析和理解(数学形态学、小波、光流、模式分析)(机器人、生物识别等等) 数学基础:线性代数/概率统计 -- 微分方程 -- 拓扑/泛函 入门书:冈萨雷斯的《数字图像处理》,Forsyth的《计算机视觉》,章毓晋的《图像工程》等等 经常关注CMU的RI,MIT的CSAIL,Oxford的VGG,INRIA的Lear,UC Berkeley,Stanford等相关研究机构 经常关注的期刊会议有PAMI、IJCV、IP、PR、CVPR、ICCV、ECCV、ICIP等 需要掌握Matlab、OpenCV等编程语言或工具软件~
个人分类: 未分类|5634 次阅读|1 个评论
[转载]图像处理入门过程
zhang11wu4 2010-5-27 16:44
Low Level -- Middle Level -- High Level 过程:简单的图像处理(线性变换、直方图、边缘提取、平滑去噪、滤波) -- 图像分析和理解(数学形态学、小波、光流、模式分析)(机器人、生物识别等等) 数学基础:线性代数/概率统计 -- 微分方程 -- 拓扑/泛函 入门书:冈萨雷斯的《数字图像处理》,Forsyth的《计算机视觉》,章毓晋的《图像工程》等等 经常关注CMU的RI,MIT的CSAIL,Oxford的VGG,INRIA的Lear,UC Berkeley,Stanford等相关研究机构 经常关注的期刊会议有PAMI、IJCV、IP、PR、CVPR、ICCV、ECCV、ICIP等 需要掌握Matlab、OpenCV等编程语言或工具软件~
个人分类: 未分类|11 次阅读|0 个评论
再测可靠性和图像处理代码
zuoxinian 2010-3-25 07:24
贴一些我公开的代码,包括:可靠性分析用的MATLAB代码,图像处理的MATLAB代码和BASH脚本等。MATLAB的我基本都放在我的 MATLABCentral的FileExchange 了;BASH的在 NITRC 。
个人分类: 个人软件|3969 次阅读|0 个评论
一种雷达辐射源信号分类新方法,数据采集与处理, 2009, 24(4): 487-492.
eaglezxw 2009-12-31 14:39
邹兴文,张葛祥,李明等.一种雷达辐射源信号分类新方法.数据采集与处理,2009,24(4):487-492. 摘要:针对复杂体制雷达辐射源信号分类问题,提出一种基于时频分析、图像处理和支持向量机的辐射源信号分类新方法。该方法将辐射源信号分类问题转换为图像处理及识别问题,先对辐射源信号进行时频分析,获得时频分布图,并将其转化为灰度图像和作归一化处理,再用支持向量机对处理后的图像进行分类。五种典型辐射源信号分类实验表明,该方法在信噪比高于2.5dB时,平均正确分类率达92%以上。本文工作对电子对抗信号处理具有一定的参考价值。 关键字:雷达辐射源信号;自动分类;时频分析;图像处理;支持向量机 一种雷达辐射源信号分类新方法
个人分类: 论文成果|2547 次阅读|1 个评论
图像处理(ICIP 2010)国际会议预报
wanyuehua 2009-10-20 07:00
2010 International Conference on Image Processing (ICIP 2010) 会议网址: http://www.icip2010.org/ 论文提交截止日期:2010年1月25日,录用通知:2010年4月26日 会议地点:中国香港,2010年9月12日2010年9月15日 这是IEEE Signal Processing Society主办的会议,从1994年开始ICIP基本是每年召开一次,ICMA 2010已是17届,每年会议均被EI、ISTP收录,每年的会议论文会选择部分论文到SCI收录期刊发表。 2008年15届ICIP会议被EI收录808篇、其中美国265篇、中国98篇、法国61篇、日本38篇、加拿大37篇、德国34篇、西班牙28篇、韩国26篇等。 中国科学院17篇、清华大学12篇、上海交通大学6篇、北京交通大学5篇、香港中文大学5篇、北京大学5篇、香港理工大学3篇、中山大学3篇、中国科技大学3篇、西安交通大学3篇、西安电子科技大学3篇等著名学校均在15届会议上发表论文。 会议主题: 1. IMAGE/VIDEO CODING AND TRANSMISSION: Still image and video coding, model-based and synthetic-natural hybrid coding, source/channel coding, stereoscopic and 3-D coding, coding standards, image and video over networks, and video streaming. 2. IMAGE/VIDEO PROCESSING AND ANALYSIS: Image filtering and enhancement, restoration, multiframe image restoration, video segmentation and tracking, wavelets and multiresolution processing, morphological processing, color and multispectral processing, stereoscopic and 3-D processing, modeling, analysis, biometrics, interpolation and super-resolution, motion detection and estimation, and computer vision. 3. IMAGE FORMATION: Biomedical imaging, remote sensing imaging, geophysical and seismic imaging, optical imaging, and synthetic-natural hybrid image systems. 4. IMAGE SCANNING, PRINTING, DISPLAY AND COLOR: Scanning and sampling, quantization and halftoning, color reproduction, image representation and rendering, display and printing systems, image quality assessment. 5. IMAGE/VIDEO STORAGE, RETRIEVAL, AND Authentication: Image and video databases, image search and sorting, video indexing and editing, integration of images and video with other media, content-based multimedia, multimedia applications, authentication and watermarking. 6. APPLICATIONS: Application of image processing technology to any field, including biomedical sciences, astronomy, geosciences, environment, humanities, and document processing.
个人分类: 国际会议预报|17962 次阅读|2 个评论
图像处理中的数学问题(连载1)
ChinaAbel 2009-9-3 11:53
在图像处理的发展过程中,数学始终起着举足轻重的作用,并渗透在图像处理的所有分支之中。 到上世纪六七十年代为止,以Fourier分析为代表的线性处理方法占据了几乎整个数字图像处理领域。在此期间,借助于随机过程理论,人们建立了图像模型通过概率论以及在此基础上建立的信息论建立了图像编码的框架;线性滤波(维纳滤波、卡尔曼滤波)方法为低层图像处理提供了有力的理论支持;而FFT则被广泛使用在图像处理的几乎所有分支中。这些数学工具极大地促进了图像处理的发展和应用。 自上世纪八十年代开始,非线性科学开始逐渐渗透到图像处理方法之中,许多新颖的数学工具被引入到图像处理领域,使相关的理论变得多元化。尤其以小波和多尺度分析为代表的信息处理方法,继承和发展了Fourier分析,将函数论和逼近论的最新成果应用在工程应用中,建立起了完整的系统框架,在图像编码、图像分割、纹理识别、图像滤波、边缘检测、特征提取和分析等方面的应用中,已经取得了非凡的成果。目前,小波分析方法业已成为信号处理的基础理论之一 同时,其他非线性的数学工具的应用也取得丰硕的成果:如分形在图像编码和纹理识别中的应用,李群在动态图像弹性形变识别中的应用,多尺度分析在图像检索和识别中的应用,非线性规划在矢量量化和图像编码中的应用等等。另外,图像确定性模型(BV 模型)的建立、模糊数学对图像质量的评价体系、Meaningful理论对图像距离的研究是对图像本质的进一步刻划,使计算机可以更贴切地描述人类的视觉系统。 同时,其他非线性的数学工具的应用也取得丰硕的成果:如分形在图像编码和纹理识别中的应用,李群在动态图像弹性形变识别中的应用,多尺度分析在图像检索和识别中的应用,非线性规划在矢量量化和图像编码中的应用等等。另外,图像确定性模型(BV 模型)的建立、模糊数学对图像质量的评价体系、Meaningful理论对图像距离的研究是对图像本质的进一步刻划,使计算机可以更贴切地描述人类的视觉系统。 特别的,基于非线性发展(偏微分)方程的图像处理方法成为近年来图像研究的一个热点。它从分析图像去噪的机理入手,结合数学形态学微分几何、射影几何等数学工具,建立了滤波和偏微分方程相关的公理体系。另外,它在图像重构、图像分割、图像识别、遥感图像处理、图像分析、边缘检测、图像插值、医学图像处理、动态图像修补、立体视觉深度检测、运动分析等方面得到了一定的应用。在研究过程中,人们介绍了一些概念,如active coutour(snake),level set(level line)等,把数学和图像有机地联系起来。 另一方面,图像处理的实际需求和工程背景也刺激了一些数学分支的发展,如小波理论的研究动力来源于信号处理中对于时频局部化分析的需求,而且在理论体系建立起来之前已经有了广泛的应用;偏微分方程的粘性解概念的提出也是因为在图像处理的应用中应用条件不满足各种微分学中的假设;对于投影几何的研究也由于图像Moisaic的需求变得细致。 近年来,我国高校的数学系设置了信息与科学计算专业,甚至如北京大学数学科学院信息科学系。作为一个近年快速发展的新学科,它运用近代数学方法和计算机技术解决信息科学领域中的问题,应用十分广泛。图像处理是其中一个非常重要的方向,许多学校都把图像处理作为一个重点发展方向。但是,目前还存在一些问题:一方面,数学系的研究人员对于图像发展以及背景的了解不够深刻;另一方面,数学系中新建的专业和图像处理领域的交流沟通还不是很通畅,因而对于图像处理领域中的一些热点问题的了解还不够及时和全面。 进入本世纪以后,随着计算机的和Internet网络技术的飞速发展,图像处理的发展也进入了一个新的飞跃阶段。同时,图像处理和计算机视觉的工程应用中还有许多问题尚待解决。为了进一步关注图像处理领域中涉及的数学问题,并使数学研究人员对相关数学问题的工程背景有所了解,1999中国科学院自动化研究所举办了相关的暑期班,2003年西安交通大学理学院举办了图像处理的数学问题研讨班,2004年在浙江大学数学科学研究中心举办图像处理中的数学问题讲习班,2004年,河南大学数学院举办了以"数学与图像处理"为主题的国际会议,2007年,偏微分方程在图像处理中的应用国际会议在广东韩山师范学院成功举办.(未完待续)
个人分类: 图像处理|13658 次阅读|2 个评论
“玩伴女郎”误入学术圈
eloa 2009-7-27 19:00
Robot 发表于 2009-07-26 20:52 她是让无数专家为之痴迷和痛苦的研究对象,她是充斥着枯燥数学公式的论文中最吸引眼球的光芒,翻开任何一本关于计算机图像处理的教材,你都能看到她动人的微笑。她就是雷娜(Lena),她的照片是图像处理领域使用最为广泛的标准测试图。她是真人吗?她到底从何而来? 1、事件起因 一举成名计算机界知 1973年的夏天,美国南加州大学信号与图像处理研究所里,年轻的助理教授亚历山大(Alexander Sawchuk)和研究员威廉(William Pratt)正为一篇学术论文忙碌,试图从一叠常用的测试图片中找出一张适合测试压缩算法的图片:最好是人脸,表面光滑,内容多层次。不过这些单调陈旧,如同早期电视画面的图片很快就让他们失望了。历史在这里开了个小小的玩笑,正巧有人拿着一本《花花公子》杂志(1972年11月刊)到实验室来串门,当期的玩伴女郎雷娜(Lena Sderberg)立刻吸引了众人的目光。亚历山大发现这张有着光滑面庞和繁杂饰物的图片正好符合要求,于是,他们撕下这张彩图,将上半部扫描成一张512512像素大小的图片,雷娜图就此诞生。 雷娜图(黑白版) 亚历山大并未觉得有任何不妥的地方,他用这张图片测试了自己的压缩算法,满意地完成了论文。而对于这一切,远在芝加哥的雷娜一无所知,在结束自己的模特生涯后,她回到瑞典的故乡,结婚生子,无从知晓自己将成为一个学术圈里的传奇人物。在亚历山大的论文发表后,不断有同行向他索要原始的扫描件,以便能同他们自己的图像压缩算法进行效果比较。久而久之,这张图片成为了图像处理领域的一个标准测试图,只要支付一小笔费用,你就能从南加州大学得到原始的扫描件拷贝,而大多数研究者奋斗的目标只有一个:如何在保证图片质量的同时让它的压缩率高一点,再高一点。 随着这张标准图在学术圈的流行,不少人开始对这位迷人的女郎产生了兴趣。1988年,一家瑞典的电脑出版社联系并采访到了雷娜,这是她十五年来首次得知自己的照片被应用在计算机行业里,兴奋和惊讶之情溢于言表。1997年,在《花花公子》杂志社的帮助下,图像科学和技术会议(IST)的筹办方正式邀请雷娜参加于当年五月份在波士顿召开的五十周年大会。这离当初雷娜图的诞生,已经过去了约四分之一个世纪,当初的年轻教授已成为业内的知名学者,而红颜少女的鬓边终于也见到了白发。他们肯定早已厌烦我了,这么多年都看着同一张照片。雷娜在会议上受到了热情的欢迎,她看到了许多基于雷娜图的研究工作,并忙于在一张又一张自己的照片上签名。 雷娜和邀请她的IST会议主席 雷娜在IST会议上 2、版权之争 盗用带来一纸风行 1991年,学术期刊 《光学工程》 (Optical Engineering)使用雷娜图作为其7月刊的封面。至此,《花花公子》才得知这张图片已然在学术界被盗用了18年之久(由此我们亦可得知学术界和娱乐界是多么的不通往来)。当初的无心之举使得照片的版权问题终于浮出水面。《花花公子》正式致函《光学工程》的出版者国际光学工程学会( SPIE ),要求在其之后出版物中任何使用雷娜图的地方都要事先得到授权。作为业内最流行的标准测试图,完全依循此要求无疑将会给遍布全球的研究者们带来极大的不便。不得已,SPIE在回复中解释了雷娜图在学术界的使用现状,并且指出自己是一个非盈利科学协会,出版物只供教育和研究使用。面对既成事实,《花花公子》亦乐得慷慨,表示不会追究雷娜图在学术领域造成的侵权问题。 在这起小小的纠纷之后,学术界对于论文图片的版权问题更加注意。(值得一提的是,雷娜图并不是首次用于图像处理领域的《花花公子》图片,早在1961年,麻省理工大学的一位学生就在自己的硕士论文中使用了一张事先得到授权的《花花公子》图片。)而对于广大使用雷娜图的研究者来说,他们从此可以免费从南加州的大学得到雷娜图了。大度的杂志社也没有吃亏,刊有雷娜的那一期《花花公子》,是它历史上卖的最好的一期,总共售出了超过700万份(Geek们的购买力是很惊人的!)。 版权的风波已经过去,但关于雷娜图的争议还在继续。 3、技术之争 雷娜图并非完美无缺 雷娜图(轮廓版) 雷娜图为何如此受欢迎?《IEEE图像处理期刊》的主编大卫(David Munson)认为有 两个原因 :首先,这张图片含有细节部分、平坦区域、阴影和纹理,有利于测试各种不同的图像处理算法。其次,这是一个非常迷人的女性照片,图像处理领域(多数人为男性)愿意使用一张他们认为很有吸引力的图片也并不令人惊奇。 这张图片含有丰富的频段,包括处于低频的光滑皮肤和处于高频的羽毛,很适合做为测试图片。而人眼对于人脸的细节差别感受也远比一般的景物更为明显。不过,这也并不意味着雷娜图是完美无缺的。 当年扫描雷娜图使用的是如今看来很落后的扫描仪和计算机。由于软件错误,亚历山大只得到了511行(预计是512行)数据,图片最上面一行的数据是复制而来的,这造成了边缘的些微瑕疵。由于扫描仪上数模转换器的计时器问题,扫描件相比原件有略微的拉长变形亚历山大如果知道这会是一张标准图,一定会更小心些的。最重要的是,作为一张标准图,雷娜图缺少了很多关键信息,例如所用胶片、光线环境、印刷环境、扫描仪型号等等。上世纪70年代以来,图像技术已经有了很大的改进,完全能够制作出一幅比雷娜图更标准的标准图来。不过,雷娜图的粉丝们理直气壮:研究者们对雷娜图非常熟悉,能够轻易地判断出压缩算法的好坏。也有不少人赞成用今天的技术重新扫描原始图片,得到新的标准雷娜图。 4、性别之争 此图涉嫌性别歧视? 雷娜图(变形版) 扫描雷娜图时所用的扫描仪在每英寸长度上可以产生100条扫描线,所以共512行的雷娜图只显示原图上方5.12英寸的范围,正好展示出雷娜漂亮的肩部。这掩盖不了一个事实:原图是一张裸照。正所谓成也萧何,败也萧何,随着越来越多的女性研究者进入图像处理领域,性别歧视无疑是雷娜图面临的最大问题。 1997年,《电子工程专辑》(Electronic Engineering Times)的编辑桑尼(Sunny Bains)在同出版社商量之后,决定在自己的工作范围内封杀雷娜图。她解释说:一个女性在一个由男性主导的领域里工作是很容易感到被孤立的,在学术杂志上看到这种有争议的图片将会加重这种不被接受的感觉。据说,她收到了不少来自女性的感谢信,也没人抱怨这影响了工作。无独有偶,纽约州立大学石溪分校的教授特奥(Theo Pavlidis)在编写计算机图形学教材时,也因为编辑的坚持,将雷娜图换成了其他图片。 作为引用雷娜图最多的期刊编辑,大卫也接到了不少的投诉:很多人希望我封杀雷娜图,人们并不是反对图片本身,而是认为它来源于一本利用女性的杂志。他提供的办法则更为折中:不用封杀雷娜图,而是鼓励作者多用其他的图片。 时至今日,雷娜图仍是图像处理领域最受欢迎的测试图。不过近年来,其压倒性的优势已经有所松动。关于版权、技术和歧视的多重争议让雷娜图不堪重负,不断涌现的新测试图也为研究者们提供了更多的选择。然而无论如何,雷娜这个不经意间闯入学术圈的玩伴女郎,以及她所见证的几十年来图像压缩技术的发展,将会永远留在我们的记忆里。 另外一些废话: 作为一个女性,常常有人问我在男性主导的领域中工作是否有不满或特别困难的时候,我个人并没有遇到值得抱怨的地方。不过,积极吸引和鼓励更多的女性进入这个行业无疑比强烈反对一张有潜在歧视意味的图片来的更有意义。在这一点上,国外有很多经验值得我们借鉴,美国很多学校和机构都有特别为女性进入应用科学和工程学领域而设置的奖学金和研究经费。我博士期间的导师是一位非常出色的女性,她多次在暑假期间指导由各种机构赞助的本科女生来我们实验室进行短期(二个月左右)的研究工作。我毕业找工作时也常常能在各大学或研究所的招聘广告上发现这样的声明:我们特别鼓励符合条件的女性来申请这个职位(qualified female candidates are strongly encouraged to apply for this position.)。我目前工作的学校在吸引女生就读工程学专业也不遗余力,每年专门有一天是Introduce a Girl to Engineering Day,组织高中女生前来参观各个工程院系的实验室。他山之石,可以攻玉,希望中国所谓的和尚班和招聘会上只招男性的告示牌能够越来越少。 附诗一首《致雷娜》 这是一首不知名作者给雷娜的献诗,在圈中流传甚广。 原作 用英文写成,使用了大量的图像处理术语,表达了图像处理工作者对这位神奇的玩伴女郎的热爱。 哦,亲爱的雷娜,你的美丽是如此浩瀚而难以快速描绘 如果我能压缩你的影像,我想我能震动整个世界 唉,当我第一次使用矢量量化,我发现你的面庞只属于你自己 你那千缕丝般的长发,怎能用离散余弦变换来匹配 而你那性感的双唇,即使耗尽十三部超级计算机也找不到合适的分形碎片来形容 虽然这些挫折如此巨大,我也许还能将它们一一克服 但当滤波器夺走了你眼中的光彩,我只能说:算了,数字化就好。 本文已发表于本期的《新京报新知周刊》
个人分类: 其他|4142 次阅读|2 个评论
安防应用中图像处理难点分析及处理器选择
leanee 2009-6-5 08:41
引言 随着人们对生活质量要求的提高和全球反恐的大势所需,以及数字化技术本身的不断进步,依托指纹识别、虹膜识别、人脸识别等技术的生物识别方案和视频监控方案等正逐步成为提高个人、家庭、企业和社会安全性的重要手段。生物识别方案主要包括四个步骤:图像采集、图像预处理,特征取样,匹配分析;而视频监控方案则主要包括图像采集、图像预处理、图像处理与传输、图像显示及图像管理等。不难看出,无论是生物识别还是视频监控,图像预处理都是必需的。事实上,图像预处理算法的灵活度、复杂度、对图像处理芯片资源的占用度,以及处理时间的长度将直接对整个系统运行产生举足轻重的影响。因此,图像预处理对于整个安防方案来说都是一项艰巨而又关键的任务,直接决定了后续图像处理与分析的准确性和便捷性。 图像预处理分析 根据目的的不同,图像预处理可分为对采集图像进行清晰化处理,对图像进行识别前的预处理,以及对图像进行压缩前的预处理等。其中,对采集图像进行清晰化处理主要包括对CMOS或CCD图像传感器感光单元的不一致进行后续纠正,对实际环境与传感器采集的图像进行差异补偿(如背光),以及对采集到的原始图像进行去噪处理等。虽然这种预处理算法本身的难度不大,但随着实时性需求的普及,尤其是在像素较大时,这种算法还是对DSP的处理能力提出了很高的要求。 而对图像进行识别前的预处理则目的性很强,可能需要破坏原来的像素和分布,以便后续进行特征提取。这种预处理算法的难度视识别场合的不同而不同。要综合后面的识别算法部分,选择适当的DSP。图像压缩前的预处理主要是指将YUV422变为YUV420、将RGB变为YUV等。这类处理往往有实时性要求,如果采用软件实现,会对处理性能有较高的要求;如果采用硬件实现,则虽然在处理性能上有保证,但硬件成本会有所上升。 同时,根据应用不同,图像预处理又可分为生物识别应用中的图像预处理和视频监控应用中的图像预处理。对于生物识别应用,以指纹识别为例,其预处理主要包括指纹图像增强、指纹图像二值化、指纹图像细化、指纹图像细化后处理。而视频监控应用中的图像预处理主要是指对图像传感器输出的连续图像进行分析,获取足够的信息,并通过自动白平衡、伽马(Gamma)校正、自动聚焦、自动曝光、背光补偿等来提高图像的实际效果。 图像预处理的挑战 无论是生物识别还是视频监控,其图像预处理正面临以下挑战:其一,用户对图像质量的要求越来越高,图像预处理的算法越来越复杂,从而对图像预处理主芯片处理能力及存储空间提出了更加苛刻的要求;其二,用户对图像的实时性处理和传输要求越来越高,一方面要求图像预处理算法尽量优化、精简,另一方面也对图像预处理主芯片的内核处理能力、内部总线架构、数据传输能力、外围接口,以及硬件整体架构和指令集对预处理算法的支持提出了更高要求;其三,不同于图像和视频编解码算法具有业界统一的算法标准和清晰的演进路线图,图像预处理算法不仅没有统一的标准和清晰的发展方向,甚至在很大程度上,方案提供商正是通过这些秘密的个性化算法来作为市场竞争的法宝。此外,随着应用领域的不同、需求的提高和技术本身的演进,原有算法会不断升级,新的算法会不断涌现,这些都要求图像预处理芯片具有更高的灵活性和适应能力。其四,对于方案提供商来说,不仅其体现竞争力的核心算法需要防止被非法读取或拷贝,而且无论是生物识别还是视频监控,其图像数据往往都会涉及隐私,因此也需要提供可以信任的安全保证。以上两方面,都要求图像处理芯片必须提供一个可靠、完全的处理平台。 基于以上多方面的挑战,在图像预处理主芯片的选择上,以控制能力见长的传统MCU并不适合庞大、复杂的算法处理;ASIC虽然在运算速度和功耗方面具有一定的优势,但其成本高、灵活性差,且不利于升级和修改,因此无法满足预处理算法个性化的灵活性需求;FPGA并行处理的架构虽然具备了强大的数据处理能力,但价格、功耗,以及开发难度方面的缺点使其很难成为图像预处理的主流选择;而DSP则以强大的数据处理能力和软件可编程能力成为图像预处理主芯片的主流选择。 除了以上挑战,从系统设计的角度来讲,还面临以下几方面的需求:其一,虽然图像预处理和图像处理工作巨大,但是工程师并不希望采用多个芯片来处理这件事情。因为信号处理和控制系统分别运行于不同处理器的传统DSP架构已经让工程师非常头疼,如果再把图像预处理和图像处理分开,则更加大了工程师进行系统开发、系统联调、系统维护的难度。因此,对于系统设计中的主芯片DSP来说,还面临集成度的要求有没有可能在单芯片上实现图像预处理、图像处理,甚至包括系统控制等功能。 其二,随着包括预处理在内的整个图像处理算法复杂性的不断增加,作为主处理器的DSP,除了需要提供足够的硬件处理能力之外,还应该在软件上提供针对该处理器专门优化的指令集,从而帮助工程师降低对处理器物理架构的熟悉难度,最大限度的驾驭、发挥处理器的特性,尽快开发出精简、优化的图像处理算法。 其三,除了上面提到的专门优化的指令集以外,面对日益复杂的图像处理和产品上市时间的压力,工程师还期望处理器供应商能够分担一些他们的工作比如,提供专门针对该处理器优化、仅占极少量时钟周期的底层图像处理软件模块,以帮助他们缩短图像处理算法开发流程,并加速软件移植。 另外,功能强大、界面友好、简单易学的开发工具也是系统开发中工程师要求的重点,而且随着系统复杂度和模块复用性需求的增加,对开发工具的兼容性也提出了更高的要求。 理想的DSP处理器 基于以上分析,针对图像处理应用的理想DSP处理器必须具备以下几方面的特点:内核处理能力强;专门针对图像处理的指令集;易于大量数据传输的低功耗硬件架构;高集成度;丰富的软件模块库;功能强大的开发工具。以下是对该类DSP处理器的代表系列Blackfin汇聚处理器架构的具体分析。 硬件特性 Blackfin DSP处理器基于由ADI 和Intel公司联合开发的微信号架构(MSA),通过将传统DSP和微控制器的优点融为一体,兼顾了事件控制以及纯算法运算处理功能。其汇聚的单一内核可提供高达756MHz的处理能力,不仅为处理复杂的预处理算法提供了强大性能保证,而且为整个系统的图像处理和事件控制提供了强有力的硬件支持,从而允许工程师在单芯片上实现图像预处理、图像处理、系统控制,大大提高了系统的集成度。 Blackfin系列处理器的硬件架构专门针对图像处理进行优化,多个DMA通道和可灵活配置的Cache能很好地解决大运算量、高数据吞吐率的图像处理应用要求。在图像处理应用中,虽然对图像数据进行的传输也可由软件实现,但是这样会消耗掉大量的CPU时钟周期,从而使DSP的高速数据处理能力难以发挥。如果由DMA独立负责数据传输,那么在系统内核对DMA进行初始设置并启动后,DMA控制器就可在无需内核参与的情况下直接把图像数据从PPI接口传输至SDRAM存储器进行存储,比如在进行MPEG或JPEG处理的计算密集型算法中,一个灵活的DMA控制器能省去额外的数据通路。此外,通过二维DMA还能简化宏块进出外部存储器的传送,从而允许数据控制成为数据实际传送的一部分,这对色彩空间元素的交叉和解交叉来说非常方便也非常重要。因此,Blackfin处理器的这种特性在有效地解决了大批量图像数据传输这一速度瓶颈的同时,又能让DSP处理器抽出更多的资源从事算法处理工作,大幅提高了系统的处理能力。 而且,针对图像处理应用,Blackfin系列DSP还在不断强化硬件功能模块的支持,比如,ADSP-BF54x系列Blackfin处理器的最新版本中增加了一个用于处理叠加图像(Pixel Compositor)的硬件加速器和一个扩展视频接口(EPPI),它使得色彩空间变换、缩放和图像叠加等任务可以在无需处理器参与计算的情况下完成,从而减轻了内核的处理压力,为进行更高性能、更高速度的图像处理提供了更多空间。 软件特性 在指令集方面,Blackfin系列DSP针对图像处理提供了丰富的向量指令和视频指令。其中向量指令可以实现对16位数的操作(大多指令可以并行完成两个16位数的操作)。由于图像处理运算中大多是针对16位数的操作,因此,通过合理使用这些向量指令来优化图像运算非常重要。不仅Blackfin指令集中的大多数算术指令和移位指令都有对应的向量指令,而且,向量指令中还有根据符号相加、32位数转16位数等特殊指令。在对图像预处理的汇编优化中合理的应用这些向量指令,可以提高算法的并行度,并大大加快运算速度。 视频像素指令主要包括BYTEOP16P (完成两个8位数加法操作)、BYTEOP3P (完成16位和8位数的加法操作)、BYTEOPIP(完成两个8位数求平均操作)、BYTEOPZP(完成四个8位数求平均操作)、BYTEOP16M(完成两个8位数减法操作)、SAA (完成求SAD操作)、BYTEAPCK (完成16位数转8位数操作),以及BYTEUNAPCK(完成8位数转16位数操作)等。一条视频像素操作指令可以在一个周期内完成4对视频数据分量的加、减、加减混合、取平均值,或者相减并求绝对值等11种视频像素运算。由于视频像素值一般都是按照8位存放的,所以使用视频像素指令可以大大提高包括求SAD、像素插值、8位数和16位数直接转换等在内的各种视频图像运算的速度。 安全特性 在安全性方面,ADI公司的Blackfin Lockbox Secure Technology通过提供一次可编程(OTP)存储器与安全处理模式(Blackfin安全模式),将软件与硬件保护相结合,为开发人员提供实现以上安全措施的手段,其中,在OTP存储器的公共、非安全、用户可编程区域开发人员可以用来存储公共密钥,这样可以通过可控制与可配置的方式来鉴别系统。而在OTP存储器的私有、安全、用户可编程区域,开发人员则可以设置私人密钥等私有器件资产(deviceassets),并保持这些器件资产的机密性与完整性。此外,在Blackfin处理器上使用安全模式后,处理器只能在安全处理环境内执行授权的信任编码。包括保护秘密(如原始设备制造商知识产权)、为保护电子商务与社会网络而验证器件和用户身份、以及数字版权(DRM)内容保护。从而为图像预处理方案的各个环节提供了量身定做的安全保护功能。 软件模块库支持 除了以上Blackfin DSP在硬件架构和指令集方面对图像处理的支持外,ADI公司还提供多种针对图像处理的软件模块,包括H.264 Baseline Profile Decoder模块、能够按比例缩放具有不同输入及输出尺寸图像的增强视频后处理(eVPP)模块、JPEG编码器模块MPEG-2 Decoder Simple Main Profile Decoder库、MPEG-4 Simple Profile Advanced Simple Profile Decoder库,以及MPEG-4 Simple Profile Advanced Simple Profile Video Encoder模块等,它们都专门针对Blackfin处理器而优化,并经过业界严格验证。这些软件模块能够大幅降低系统工程师的开发难度,并显著提高系统效率。 此外,ADI公司还专门针对图像处理应用推出了Image Tool Box软件包,该软件包由一系列专用模块组成,并针对图像处理算法的一些常用和基本函数进行了专门优化,可以进行图像变换、图像分析与图像增强、二值图像操作以及形态学处理等图像处理操作。这款软件包有利于降低工程师的开发难度,加速上层算法的实现和优化。 开发环境的支持 用于Blackfin系列DSP处理器开发应用和工程管理的VisualDSP++开发环境主要包括集成了ViusalDSP++内核的集成编译和调试环境(DIDE);带实时运行库的CC/++优化编译器;汇编器和链接器,以及仿真软件和程序例程等。其中,编译器允许程序开发人员用C或C++语言编写信号处理和控制代码,从而方便了系统的开发和维护。图形化的友好用户信息交换界面使工程师能够在窗口中进行工程管理、编辑、编译和调试程序,并在其间快速轻松地切换。此外,VisualDSP++开发工具还与Green Hills软件公司的MULTI环境、NI公司的LabVIEW软件,以及MathWorks公司的MATLAB和Simulink软件相兼容,为系统开发和模块复用提供了一个更加便捷、宽松的环境。 ADI公司技术支持 processor.china@analog.com 欲获更多参考信息 dsp.marketing@analog.com
个人分类: 图像|4272 次阅读|0 个评论
人工智能网站和图像处理网络资源
linpandr 2009-5-10 02:57
人工智能网站和图像处理网络资源 (转载)  来源:互联网   酷勤网 收集 2009-02-21 摘要 酷勤网   图像处理研究工作的两个问题:其一是要把握住国际上最前沿的内容;其二是所作工作要具备很高的实用背景。解决第一个问题的办法就是找出这个方向公认最牛的几个超级大拿和最权威的出版物,解决第二个问题的办法是你最好能够找到一个实际应用的项目,边做边写文章。 第一部分:人工智能网站 科大人工智能实验室 网址: http://ailab.ai.ustc.edu.cn/ 图象识别与人工智能研究所 网址: http://iprai.hust.edu.cn/ 人工智能实验室 网址: http://www.aiport.net/ 人工智能历史 网址: http://www.longen.org/A-D/detaila~d/AIHistory.htm 神经网络在线 网址: http://www.2nsoft.com/ 人工神经网络首页 网址: http://www.youngfan.com/ann/index.htm 北邮模式识别与智能系统网站 网址: http://www.pris.edu.cn/ 复杂系统与计算智能实验室 网址: http://202.38.78.168/ 欧洲人工智能联合会ECCAI 说明:European Coordinating Committee for Artificial Intelligence 网址: http://www.eccai.org/ 国际人工智能联合会IJCAI 说明:IJCAI is the International Joint Conference on Artificial Intelligence, the main international gathering of researchers in AI. 网址: http://www.ijcai.org/ 美国人工智能联合会AAAI 说明:American Association for Artificial Intelligence (AAAI) devote to advancing the scientific understanding of the mechanisms underlying thought and intelligent behavior and their embodiment in machines. 网址: http://www.aaai.org/ 第二部分:图像处理网络资源 作图像处理方面的研究工作,最重要的两个问题:其一是要把握住国际上最前沿的内容;其二是所作工作要具备很高的实用背景。解决第一个问题的办法就是找出这个方向公认最牛的几个超级大拿(看看他们都在作什么)和最权威的出版物(阅读上面最新的文献),解决第二个问题的办法是你最好能够找到一个实际应用的项目,边做边写文章。 做好这几点的途径之一就是充分利用网络资源,特别是权威网站和大拿们的个人主页。下面是我收集的一些资源,希望对大家有用。(这里我要感谢SMTH AI版的alamarik和Graphics版的faintt) 一、研究群体 cs.cmu.edu 这是卡奈基梅隆大学的计算机视觉研究组的主页,上面提供很全的资料,从发表文章的下载到演示程序、测试图像、常用链接、相关软硬件,甚至还有一个搜索引擎。 ZIMAGE 这是一个侧重图像分析的站点,一般。但是提供一个Image Analysis环境---ZIMAGE and SZIMAGE。 Conell.edu 康奈尔大学的计算机视觉和图像分析研究组,好像是电子和计算机工程系的。侧重医学方面的研究,但是在上面有相当不错资源,关键是它正在建设中,能够跟踪一些信息。 The statistical pattern and image analysis (SPIA) 有一个很有意思的项目:DID(文档图像解码)。 Stanford.edu 斯坦福大学计算机系主页,自己找吧:( Fmrib:Image Analysis Group 主要研究:Brain Extraction Tool,Nonlinear noise reduction,Linear Image Registration,Automated Segmentation,Structural brain change analysis,motion correction,etc. Pattern Recognition and Image Processing Lab 这是密歇根州立大学计算机和电子工程系的模式识别--图像处理研究组,它的FTP上有许多的文章(NEW)。 Pandora:Digital Image Processing Groups 德国的一个数字图像处理研究小组,在其上面能找到一些不错的 链接资源 。 CVCC:computer vision and image processing CVIP(used to be CVCC for Computer Vision and Cluster Computing) is a research group focusing on cluster-based computer vision within the Spiral Architecture. CFIA.gmu.edu:Multi-Disciplinary IA Research The mission of the Center for Image Analysis is to foster multi-disciplinary research in image, multimedia and related technologies by establishing links between academic institutes, industry and government agencies, and to transfer key technologies to help industry build next generation commercial and military imaging and multimedia systems. PEIPA 可以通过它来搜索全世界各地的知名的计算机视觉研究组(CV Groups),极力推荐。 二、图像处理GPL库 CPPima Cppima 是一个图像处理的C++函数库。这里有一个较全面介绍它的 库函数的文档 ,当然你也可以下载压缩的 GZIP包 ,里面包含TexInfo格式的文档。 IRAF Welcome to the IRAF Homepage! IRAF is the Image Reduction and Analysis Facility, a general purpose software system for the reduction and analysis of astronomical data. TNimage 一个非常不错的Unix系统的图像处理工具,看看 它的截图 。你可以在此基础上构建自己的专用图像处理工具包,我已经在计算机上成功安装了,看看 我运行的画面 。 SourceForge 这是GPL软件集散地,到这里找你想要得到的IP库吧。 三、搜索资源   当然这里基本的搜索引擎还是必须要依靠的,比如Google等,可以到 我常用的链接 看看。下面的链接可能会节省你一些时间: SAL(Scientific Applications on Linux) PKU's SAl Mirror 四、大拿网页 Bill Freeman 这位可是MIT人工智能实验室的BILL FREEMAN。大名鼎鼎!专长是:理解--贝叶斯模型。 Matthew Brand MERL(Mitsubishi Electric Research Laboratory)中的擅长Style Machine高手。 Andrew Blake CV界极有声望的A.Blake 1977年毕业于剑桥大学三一学院并或数学与电子科学学士学位。之后在MIT,Edinburgh,Oxford先后组建过研究小组并成为Oxford的教授,直到1999年进入微软剑桥研究中心。主要工作领域是计算机视觉。 Henry A. Rowley 这位牛人好像正在学习汉语,并且搜集了诸如两只老虎(Two Tigers)的歌曲,嘿嘿:) 他的主页上面还有几个牛:Shumeet Baluja, Takeo Kanade。他们的Face Detection作的绝对是世界一流。他毕业于卡奈基梅隆大学的计算机科学系,兴趣是计算机视觉。 Thomas Huang 这位老牛在1963年就获得了MIT的博士学位!他领导的Image Lab比较出名的是指纹识别。 下面这些是我搜集的牛群(大部分是如日中天的Ph.D们),可以学习的是他们的Study Ways! Finn Lindgren(Sweden):Statistical image analysis Pavel Paclik(Prague):statistical pattern recognition Dr. Mark Burge:machine learning and graph theory yalin Wang:Document Image Analysis Geir Storvik: Image analysis Heidorn Joakim Lindblad:Digital Image Cytometry S.Lavirotte: Sporring:scale-space techniques Mark Jenkinson:Reduction of MR Artefacts Justin K. Romberg:digital signal processing Fauqueur:Image retrieval by regions of interest James J. Nolan:Computer Vision Daniel X. Pape:Information Drew Pilant:remote sensing technology 五、前沿期刊(TOP10) 这里的期刊大部分都可以通过上面的大拿们的主页间接找到,在这列出主要是为了节省直接想找期刊投稿的兄弟的时间:) IEEE Trans. On PAMI IEEE Transactions on Image Processing Pattern Recognition Pattern Recognition Letters
个人分类: 未分类|5799 次阅读|1 个评论
VC图像处理
shushenlw 2009-5-8 11:14
最近在用VC做图像处理,感觉相对来说VC入门还是相对容易的,但是想深入一些比较困难,特别是在添加映射函数的时候,要是自己添加的话就太难了,现在好像进入一个瓶颈期,再该怎么进步呢? 聪明的你,告诉我好么?
个人分类: 未分类|1203 次阅读|0 个评论
图像处理的一些资料(1)
热度 2 ChinaAbel 2009-4-6 13:26
作图像处理方面的研究工作,最重要的两个问题:其一是要把握住国际上最前沿的内容;其二是所作工作要具备很高的实用背景。解决第一个问题的办法就是找出这个方向公认最牛的几个超级大拿(看看他们都在作什么)和最权威的出版物(阅读上面最新的文献),解决第二个问题的办法是你最好能够找到一个实际应用的项目,边做边写文章。 做好这几点的途径之一就是充分利用网络资源,特别是权威网站和大拿们的个人主页。下面是我收集的一些资源,希望对大家有用. 研究群体 大拿主页 前沿期刊 GPL软件资源 搜索引擎 一、研究群体 http://www-2.cs.cmu.edu/~cil/vision.html 这是卡奈基梅隆大学的计算机视觉研究组的主页,上面提供很全的资料,从发表文章的下载到演示程序、测试图像、常用链接、相关软硬件,甚至还有一个搜索引擎。 http://www.cmis.csiro.au/IAP/zimage.htm 这是一个侧重图像分析的站点,一般。但是提供一个Image Analysis环境---ZIMAGE and SZIMAGE。 http://www.via.cornell.edu/ 康奈尔大学的计算机视觉和图像分析研究组,好像是电子和计算机工程系的。侧重医学方面的研究,但是在上面有相当不错资源,关键是它正在建设中,能够跟踪一些信息。 http://www2.parc.com/istl/groups/did/didoverview.shtml 有一个很有意思的项目:DID(文档图像解码)。 http://www-cs-students.stanford.edu/ 斯坦福大学计算机系主页,自己找吧:( http://www.fmrib.ox.ac.uk/analysis/ 主要研究:Brain Extraction Tool,Nonlinear noise reduction,Linear Image Registration, Automated Segmentation,Structural brain change analysis,motion correction,etc. http://www.cse.msu.edu/prip/ 这是密歇根州立大学计算机和电子工程系的模式识别--图像处理研究组,它的FTP上有许多的文章(NEW)。 http://pandora.inf.uni-jena.de/p/e/index.html 德国的一个数字图像处理研究小组,在其上面能找到一些不错的链接资源。 http://www-staff.it.uts.edu.au/~sean/CVCC.dir/home.html CVIP(used to be CVCC for Computer Vision and Cluster Computing) is a research group focusing on cluster-based computer vision within the Spiral Architecture. http://cfia.gmu.edu/ The mission of the Center for Image Analysis is to foster multi-disciplinary research in image, multimedia and related technologies by establishing links between academic institutes, industry and government agencies, and to transfer key technologies to help industry build next generation commercial and military imaging and multimedia systems. http://peipa.essex.ac.uk/info/groups.html 可以通过它来搜索全世界各地的知名的计算机视觉研究组(CV Groups),极力推荐。 二、图像处理GPL库 http://www.ph.tn.tudelft.nl/~klamer/cppima.html Cppima 是一个图像处理的C++函数库。这里有一个较全面介绍它的库函数的文档,当然你也可以下载压缩的GZIP包,里面包含TexInfo格式的文档。 http://iraf.noao.edu/ Welcome to the IRAF Homepage! IRAF is the Image Reduction and Analysis Facility, a general purpose software system for the reduction and analysis of astronomical data. http://entropy.brni-jhu.org/tnimage.html 一个非常不错的Unix系统的图像处理工具,看看它的截图。你可以在此基础上构建自己的专用图像处理工具包。 http://sourceforge.net/projects/ 这是GPL软件集散地,到这里找你想要得到的IP库吧。 三、搜索资源 当然这里基本的搜索引擎还是必须要依靠的,比如Google等,可以到我常用的链接看看。下面的链接可能会节省你一些时间: http://sal.kachinatech.com/ http://cheminfo.pku.edu.cn/mirrors/SAL/index.shtml 四、大拿网页 http://www.ai.mit.edu/people/wtf/ 这位可是MIT人工智能实验室的BILL FREEMAN。大名鼎鼎!专长是:理解--贝叶斯模型。 http://www.merl.com/people/brand/ MERL(Mitsubishi Electric Research Laboratory)中的擅长Style Machine高手。 http://research.microsoft.com/~ablake/ CV界极有声望的A.Blake 1977年毕业于剑桥大学三一学院并或数学与电子科学学士学位。之后在MIT,Edinburgh,Oxford先后组建过研究小组并成为Oxford的教授,直到1999年进入微软剑桥研究中心。主要工作领域是计算机视觉。 http://www-2.cs.cmu.edu/afs/cs.cmu.edu/user/har/Web/home.html 这位牛人好像正在学习汉语,并且搜集了诸如两只老虎(Two Tigers)的歌曲,嘿嘿:) 他的主页上面还有几个牛:Shumeet Baluja, Takeo Kanade。他们的Face Detection作的绝对是世界一流。他毕业于卡奈基梅隆大学的计算机科学系,兴趣是计算机视觉。 http://www.ifp.uiuc.edu/yrui_ifp_home/html/huang_frame.html 这位老牛在1963年就获得了MIT的博士学位!他领导的Image Lab比较出名的是指纹识别。 -------------------------------------------------------------------------------- 下面这些是我搜集的牛群(大部分是如日中天的Ph.D们),可以学习的是他们的Study Ways! Finn Lindgren(Sweden):Statistical image analysis http://www.maths.lth.se/matstat/staff/finn/ Pavel Paclik(Prague):statistical pattern recognition http://www.ph.tn.tudelft.nl/~pavel/ Dr. Mark Burge:machine learning and graph theory http://cs.armstrong.edu/burge/ yalin Wang:Document Image Analysis http://students.washington.edu/~ylwang/ Geir Storvik: Image analysis http://www.math.uio.no/~geirs/ Heidorn http://alexia.lis.uiuc.edu/~heidorn/ Joakim Lindblad:Digital Image Cytometry http://www.cb.uu.se/~joakim/index_eng.html S.Lavirotte: http://www-sop.inria.fr/cafe/Stephane.Lavirotte/ Sporring: scale-space techniques http://www.lab3d.odont.ku.dk/~sporring/ Mark Jenkinson:Reduction of MR Artefacts http://www.fmrib.ox.ac.uk/~mark/ Justin K. Romberg:digital signal processing http://www-dsp.rice.edu/~jrom/ Fauqueur:Image retrieval by regions of interest http://www-rocq.inria.fr/~fauqueur/ James J. Nolan:Computer Vision http://cs.gmu.edu/~jnolan/ Daniel X. Pape:Information http://www.bucho.org/~dpape/ Drew Pilant:remote sensing technology http://www.geo.mtu.edu/~anpilant/index.html 五、前沿期刊(TOP10) 这里的期刊大部分都可以通过上面的大拿们的主页间接找到,在这列出主要是为了节省直接想找期刊投稿的兄弟的时间:) IEEE Trans. On PAMI http://www.computer.org/tpami/index.htm IEEE Transactionson Image Processing http://www.ieee.org/organizations/pubs/transactions/tip.htm Pattern Recognition http://www.elsevier.com/locate/issn/00313203 Pattern Recognition Letters http://www.elsevier.com/locate/issn/01678655 神经网络 Neural Networks Tutorial Review http://hem.hj.se/~de96klda/NeuralNetworks.htm ftp://ftp.sas.com/pub/neural/FAQ.html Image Compression with Neural Networks http://www.comp.glam.ac.uk/digimaging/neural.htm Backpropagator's Review http://www.dontveter.com/bpr/bpr.html Bibliographies on Neural Networks http://liinwww.ira.uka.de/bibliography/Neural/ Intelligent Motion Control with an Artificial Cerebellum http://www.q12.org/phd.html Kernel Machines http://www.kernel-machines.org/ Some Neural Networks Research Organizations http://www.ieee.org/nnc/ http://www.inns.org/ Neural Network Modeling in Vision Research http://www.rybak-et-al.net/nisms.html Neural Networks and Machine Learning http://learning.cs.toronto.edu/ Neural Application Software http://attrasoft.com Neural Network Toolbox for MATLAB http://www.mathworks.com/products/neuralnet/ Netlab Software http://www.ncrg.aston.ac.uk/netlab/ Kunama Systems Limited http://www.kunama.co.uk/ Computer Vision Computer Vision Homepage, Carnegie Mellon University www.cs.cmu.edu/~cil/vision.html Annotated Computer Vision Bibliography http://iris.usc.edu/Vision-Notes/bibliography/contents.html http://iris.usc.edu/Vision-Notes/rosenfeld/contents.html Lawrence Berkeley National Lab Computer Vision and Robotics Applications http://www-itg.lbl.gov/ITG.hm.pg.docs/VISIon/vision.html CVonline by University of Edinburgh The Evolving, Distributed, Non-Proprietary, On-Line Compendium of Computer Vision, www.dai.ed.ac.uk/CVonline Computer Vision Handbook, www.cs.hmc.edu/~fleck/computer-vision-handbook Vision Systems Courseware www.cs.cf.ac.uk/Dave/Vision_lecture/Vision_lecture_caller.html Research Activities in Computer Vision http://www-syntim.inria.fr/syntim/analyse/index-eng.html Vision Systems Acronyms www.vision-systems-design.com/vsd/archive/acronyms.html Dictionary of Terms in Human and Animal Vision http://cns-web.bu.edu/pub/laliden/WWW/Visionary/Visionary.html Metrology based on Computer Vision www.cranfield.ac.uk/sme/amac/research/metrology/metrology.html Digital Photography Digital Photography, Scanning, and Image Processing www.dbusch.com/scanners/scanners.html Educational Resources, Universities Center for Image Processing in Education www.cipe.com Library of Congress Call Numbers Related to Imaging Science by Rochester Institute of Technology http://wally2.rit.edu/pubs/guides/imagingcall.html Mathematical Experiences through Image Processing, University of Washington www.cs.washington.edu/research/metip/metip.html Vismod Tech Reports and Publications, MIT http://vismod.www.media.mit.edu/cgi-bin/tr_pagemaker Vision Lab PhD dissertation list, University of Antwerp http://wcc.ruca.ua.ac.be/~visielab/theses.html INRIA (France) Research Projects: Human-Computer Interaction, Image Processing, Data Management, Knowledge Systems www.inria.fr/Themes/Theme3-eng.html Image Processing Resources http://eleceng.ukc.ac.uk/~rls3/Contents.htm Publications of Carsten Steger http://www9.informatik.tu-muenchen.de/people/steger/publications.html FAQs comp.dsp FAQ www.bdti.com/faq/dsp_faq.htm Robotics FAQ www.frc.ri.cmu.edu/robotics-faq Where's the sci.image.processing FAQ? www.cc.iastate.edu/olc_answers/packages/graphics/sci.image.processing.faq.html comp.graphics.algorithms FAQ, Section 3, 2D Image/Pixel Computations www.exaflop.org/docs/cgafaq Astronomical Image Processing System FAQ www.cv.nrao.edu/aips/aips_faq.html
个人分类: 图像处理|14573 次阅读|4 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-27 09:02

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部