科学网

 找回密码
  注册

tag 标签: 启航

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

科研启航:(九)结构变换的图像拼接方法
kingang 2013-10-30 19:10
PAMI2008 Image Stitching Using Structure Deformation Jiaya Jia,Chi-Keung Tang
个人分类: 科海随笔|2 次阅读|0 个评论
科研启航:(八)CAD图像拼接研究小组第一次讨论会
kingang 2013-10-27 15:29
图像拼接研究小组成员我,朱泽伟,陈启明,吴晓蓓四人及周博参与了第一次小组讨论会。 首先从敦煌壁画目前的瓶颈问题出发,展开相关讨论,从图像的畸变问题及拼接方式方法问题出发,形成以图像畸变校正为切入点的一个方面的预处理研究方向。另外针对特征提取算法,从SIFT,SURF的基础上开始,保求算法精度基础上,选取SIFT作为特征提取方法。广泛讨论了图像的配准时面临的一些问题。 最终制定当前作为项目前期调研阶段的任务,按照图像拼接的一般流程,从图像预处理、图像配准,图像融合出发,在预处理阶段优先调研图像的几何畸变以及校正的算法情况,图像配准方面在SIFT或SURF基础上的配准方法以及基于光流场的配准方法等,以及相应配准的评价方法。最后在图像拼接融合阶段重点是有一个针对图像拼接好坏的拼接标准,比如RMS方法是怎么工作的。 调研阶段,对国内外相关的以上几点出发,查找资料文献,阅读,并分工没成员参与一部分论文的阅读,并形成相关的论文的内容评价介绍等。在最后完成拼接相关的综述文章。 还有两个周的时间 , 时间比较紧迫,任务还是比较艰巨的。
个人分类: 科海随笔|2 次阅读|0 个评论
科研启航:(七)敦煌数字化技术的切入点
kingang 2013-10-25 19:33
敦煌壁画数字化技术方面,根据最近的查阅学习,有几点思考和拟定的切入点。 思考: 图像拼接来说,技术体系相对完整成熟,常见的可应用软件已较多。对于拼接方面的关于校正、配准等论文较多,针对敦煌目前的情况来看,是半自动化完成图像拼接,短期内完全摒弃掉手工是不太现实的,努力的方向是尽可能大的解放人工,辅助功能做到最大化。 切入点: 1.壁画图像几何校正与自动配准拼接 几何校正,帮助解决最首要的畸变问题,将误差减到最小,同时采用当下精度最高的SIFT进行特征提取与匹配,首要保证拼接的低误差率。 2.Giga 像素级壁画快速拼接 在第一点基础上,保证高精度同时采用优化思路或并行处理方法提高算法运算效率。 3.自适应学习的图像拼接校验算法 通过对手工拼接过程中的缝合时的参数等特征,构造训练集,对拼接后图像效果进行分类评价。 4.基于内容、上下文语义的壁画场景分类 为壁画的场景种类进行区分,为后续保存和研究提供辅助。 5.壁画图像检索 莫高窟45000平方米的壁画,内容多种多样,需要对大量的壁画内容构造数据库,研究检索方法进行壁画搜索,关键字不仅限于文字描述符,可以通过类似小部分壁画图像来搜索匹配整个图像库。 6.基于机器学习的壁画修复 根据现存完好的壁画色彩等特征,针对破损壁画进行色彩修复等。
个人分类: 科海随笔|3 次阅读|0 个评论
科研启航:(六)敦煌数字化技术研究现状
kingang 2013-10-25 09:39
参阅《敦煌论坛 文化遗产与数字化技术国际学术研讨会》International Conference on Cultural Heritages and Digitization 论文集——2011年8月 论文集中包含了国内外相关学者的文章,主要是针对文化遗产的保护等。国外的有各个博物馆或研究院等组织,国内的以敦煌研究院为首,对文化遗产,特别是物质遗产进行的工作的相关现状及技术的研讨。 一、敦煌莫高窟 俗称千佛洞,实际上现存规模最大,保存最完好的佛教艺术宝库,被誉为“东方艺术明珠”。莫高窟上下五层,南北月1600米,现存洞窟492个,壁画45000平方米,彩塑2400余身,飞天4000余身,是由建筑、绘画、雕塑、组成的文书和文物,逐渐形成了敦煌学。 二、文物保护的挑战 莫高窟地处偏远戈壁,交通不便,第一手研究资料很难得到,洞窟内光线和位置布局受限。各种墙面已经龟裂、起甲、灰尘覆盖。对壁画的数字采集工作有很大挑战,包括后续的数字图像的处理拼接等。 三、相关合作组织及工作情况 从1996年敦煌研究院与浙江大学开始合作,为壁画的保护和保存提出了一套解决方法。 四、会议论文的相关内容 文献【1】提出的壁画的技术需求:大幅面、高保真、墙面不平。以及相对应的技术问题:自动拼接、图像校正、正射校正。现在已设计出轨道式自动拍摄设备,扫描分辨率能达到300PPI,色彩深度48bitRGB。相关技术包括:照片自动正射影像拼接、基于SfM(Structure of Motion)的多相机拍摄参数与方位精确信息求解、基于简单三维表面重建的照片正射投影校正、基于多分辨率图像融合的多幅图像合成、图像特征自适应配准效果。文中指出自动拼接系统可以稳定支持200幅以上规模壁画照片的自动正射影像拼接生成,高效且没有变形。 文献【2】对比高保真图像获取的两种方式:大幅面相机拍照、多幅拍摄后拼接。根据敦煌洞窟的实际情况确定利用多幅拍摄后拼接的方法,在国际上有较多的应用,如:(1)ASIDC Automatic System for Image Digital Capturing希腊萨洛尼卡大学开发的一套系统,用来获取古画数据。有三部分组成,PC控制的运动系统、图像捕获设备、拼接算法。【A system for capturing high resolution images 1998】(2)VITRA Veridical Imaging of Transmissive and Reflective Artefacts 英国伦敦通讯学院开发的系统,最后有拼接系统。【A Robotic System for Digital Photography SPIE2006】(3)VASARI Visual Arts system for archiving and Retrieval of Images图像存储和检索的视觉艺术系统,旨在直接从绘画中得到高分辨率的彩色数字图像,最后拼接。此系统已在伦敦国际艺术馆使用【 http://users.ecs.soton.ac.uk/km/projs/vasari/ 2009 】。 文献【2】的自动正射影像拼接:利用计算机视觉中多视点三维重构的最新算法,根据图片之间的特征点匹配计算出这些匹配的特征点在空间中的三维坐标,形成一个三维的特征点云。根据这个点云可以拟合成一个笔画所在墙面的近似平面,作为笔画拼接的投影平面。根据图像特征点与三维点云中特征点的对应关系,可求出每张照片到投影平面的正射投影变换,该变换将原始图像映射到全景图生成平面中,最后进行融合得到全图。使用开源软件Bundler【 http://phototour.cs.washington.edu/bundler 】匹配壁画图像特征点,然后生成特征三维点云,计算得到每幅照片拍摄时的相机参数和姿态。根据图像中的特征点与三维点云中的特征点之间的对应关系,将原始图像插值到全景图生成平面中。开源软件Enblend【 http://enblend.sourceforge.net 】进行图像融合。 文献【3】提出一种在PCA-SIFT基础上,加入核函数和采用四邻域与八邻域距离(街区距离棋盘距离)线性结合取代欧式距离的方法。文章说他大大降低了SIFT描述子的维数,其实PCA本身就做到了。又说对噪声、旋转及尺度变化良好的鲁棒性,其实这些SIFT就已经做得很好了,如果要快速的话可以用SURF,只是SIFT对仿射变换方面和计算量有些不足。我认为此文的方法在应用中效果不会很理想。 文献【4】使用了由微软亚洲研究院赠送的十亿级像素相机进行数字化工作,并提高了一定的效率。文中指出了当前人工拼接的方法和限制:拍摄方式延续了1999-2005年敦煌研究院和美国梅隆基金会、美国西北大学共同开展的数字化敦煌壁画合作研究项目的技术。所拍摄的每一幅图形都会与相邻的两幅图像有50%的重叠度,拍摄方式工作量相当巨大。拼接方面,当前采用的图像拼接技术是基于图像对齐,它的理想对象是一个纯粹的平面或是等距离的场景,而这种理想对象在莫高窟基本不存在,人工凿的壁面不规则。起伏不断的平面,势必导致拼接结果的不准确。几乎所有的图像拼接技术都会采取图像融合或切断缝合来隐藏这些错误,而隐藏拼接错误违背了关于数字敦煌档案的最大程度逼近真是的原则,不能得到接受。目前采用的是使用PS图像软件拼接,使用局部变形功能人工调整图像来弥补非平面造成的拼接误差。因此工作时间非常长,容易出现眼花疲劳出错。 此处是图像拼接中亟待解决的瓶颈问题。 十亿级相机Apsara自带自动拼接功能,一定程度上提高了工作效率。 文献【5】针对避免墙面不平和相机畸变因素研究图像拼接时如何进行形变校正。此文通过修正相机镜头畸变来改善壁画照片的形变,优化自动拼接的效果。文章介绍了图形学中的几何形变中的几种像差,为了尽可能小的减少拼接后的整幅图像的变形,文章采用十字骨架形式拼接,先拼接出整幅图像的十字骨架,然后再另外的四个空白区域内拼接填补上剩余的图像,尽可能的减少变形。畸变校正,找到理想图像与畸变图像坐标间的对应关系,进行空间位置校正,目的是将发生了位移的即便图像的坐标移回到正确位置。然后根据畸变图像对应点邻域像素的灰度值估计理想图像上对应点的灰度值。 文献【6】在PS中对图像的拼接时出现的错误:重影;手动变形产生的图像缺失、图像错位、局部模糊;自动拼接的断线、局部严重变形与色彩偏差;整体严重变形与色彩偏差。列出了拼接的检查情况,如重影、拉虚、错位断线等。自我在PS中的拼接结果检查通过使用蒙版的启用或停用来完成。拼接检查主要通过拼接人员内部的互相交换检查寻找错误,最后验收保存。 【1】计算机辅助敦煌莫高窟保护利用技术研究应用:探索与实践。浙江大学,鲁东明。《敦煌论文集》 【2】敦煌壁画高保真正射影像的自动数字化工作框架。浙大:刁常宇。敦煌研究院:吴健。《论文集》 【3】一种改进的KPCA-SIFT敦煌壁画数字图像拼接算法。西北工业大学:卢选民,此人有篇此算法相关的EI会议论文。 【4】十亿级像素相机在数字敦煌档案中的应用实验。敦煌研究院:孙志军。《论文集》 【5】基于几何形变改善的莫高窟数字壁画图像拼接方法研究。敦煌研究院浙大:俞天秀,吴健。 【6】敦煌壁画数字图像的质量控制与检查——以莫高窟第三窟数字化为例。敦煌研究院:丁晓宏。
个人分类: 科海随笔|2 次阅读|0 个评论
科研启航:(五)SIFT & SURF 既生瑜何生亮
kingang 2013-10-22 21:17
这几天一直很郁闷,读了两篇巨牛的论文,一头雾水的我不得不说,巨牛的论文就该这样,让我辈如读天书。 英属哥伦比亚大学的David Lowe(大卫 洛维)在上个世纪末第一次提出了他的SIFT尺度不变特征变换算法,可谓突破了特征检测领域的所有前人的方法,后来2004年,Lowe又独自发表论文,来完善了更具鲜明特征的SIFT,至此Lowe教授以这两篇论文奠定了领域大牛牛地位,据目测,当下的目标检测识别、图像拼接配准、视频等相关应用中,均说选来选去还就是SIFT算法好用,不是先入为主,是实践检验的结果啊。 SIFT算法主要特点就是精度高,实现简单,采用DoG函数来把图像在尺度空间一层一层的相减,得到了图像尺度金字塔,然后寻找某一像素在尺度空间的邻域中寻找最大或最小。结合梯度方向使得特征点具有不变特征。总之,Lowe的贡献非常之大,128维的SIFT就是计算时间慢一点。 到了2006年,瑞士的Herbert Bay在ECCV 2006会议上的论文,提出了SURF,快速鲁棒的特征的算法。经过了2年后,名称基本相同的另一篇文章发表在CVIU计算机视觉和图像理解期刊上,后者对SURF进行了完善和更多的对比实验。经过对比我们也得到了这样的结论,SURF的特征检测效果与SIFT差不多,或者略微不如SIFT,但是已在某些时候超过SIFT,并且关键的是SURF比SIFT更快,这一点是不得不说的关键,可以硬要的实时在线的应用场景中。 此篇SURF算法主要用到了两个方法,Hessian矩阵检测和积分图像来加速。作者对比了基于Hessian的检测器和基于Harris的检测器,结果是前者更稳定。其实关键就是检测兴趣点,利用积分图像(图像中任意一点 的值是从图像左上角到这个点所构成的矩形区域内所有点的灰度值之和),用加减法就可以来计算出。自然加快了速度。那么Hessian矩阵呢,多元函数的二阶导数就是一个海森矩阵,一般用于牛顿法解决的大规模优化问题中。如果多元函数f在区域D内连续并处处存在二阶导数,那么f的海森矩阵在D区域内是对称矩阵。给定二阶导数连续的函数f,海森矩阵的行列式(实数值)可用来分辨f的临界点鞍点还是极值点。 在兴趣点的描述部分,Herbert和他的小伙伴们建立了在x和y方向上的一阶Haar小波响应的分布,而不是采用梯度。并且用积分图像Integral image来提速,并且仅使用64个维度,对比SIFT的128维,降维了。这样减少了特征计算和匹配的时间,也就意味着大大提高了自身的鲁棒性。在2008年论文中,作者对SURF的应用做了较多的介绍和实验,也从另一个侧面说明,在实际应用中,用实际应用数据来说话,SURF比SIFT要快要好! 虽然这几天的时间一直郁闷着,但码字一般把论文一字字的码完了,懂肯定是不懂了,也就是了解了下吧,毕竟才马马虎虎读过一次,有点遗憾就是硕士期间用到它们时并没有深挖,只是懂得如何去用而已,现在需要深挖,感觉有难度,但值得深挖,毕竟特征检测作为图像处理和高层图像理解的底层和最基础部分,必须要打好这个基础才能稳健的进行后续的研究。 科研深似海,果然果然,不过一点点的啃掉,就有种豁然开朗的喜悦感。 另外,关于SIFT和SURF,我想说,既生瑜何生亮,不是说不共存了,当下,你说你的方法好,我说我的方法好,但到实际应用中,这改进那改进,总是不如人家原本的原生态好用,为啥呢?!那还要不要改进?改进是真的提升了性能吗?还是灌水太多了呢?! 我想,SIFT和SURF两个优秀的算法在应用中作为基础来说,非常值得研究,而要针对每个应用场合呢,多少需要具体问题具体研究,是SIFT还是SURF不能一竿子打死,要结合起来就更好了,取众家所长,也就是当下融合算法的精神吧。当然,需要更多的研究它们,掌握了才能说如何取舍,也要实际动手去实验,去对比才会有真真的结果和评断,so,动起来,不要亮气死瑜,要又亮又瑜,小伙伴团结协作起来!
个人分类: 科海随笔|3 次阅读|0 个评论
科研启航:(四)关于图像特征检测方法
kingang 2013-10-17 21:37
特征检测方法Feature detection methods,作为图像拼接应用中比较基本的也是关键的部分,需要着重加强研究学习。对于目前来说,常见的比较经典的方法有SIFT,PCASIFT,SURF。根据论文《A Comparison of SIFT,PCA-SIFT and SURF》来进行相关的对比学习。 SIFT SIFT,Scale Invariant Feature Transform。尺度不变特征变换。2004.在绝大多数情况下表现稳定,就是有点慢。David Lowe提出SIFT抽取出图像中具有特色的不变特征,以适应图像尺度和旋转的变化。并广泛用于图像镶嵌拼接,识别,检索等。 SIFT包含四个主要步骤:尺度空间极值检测scale-space extrema detection,关键点定位keypoint localization,方向分配orientation assignment,关键点描述keypoint descriptor。 第一步:尺度空间极值检测使用(DoG) Difference-of-Gaussian函数定义潜在兴趣点,其中尺度和方向不变。用DoG代替Gaussian来改进计算速度。 第二步:关键点定位中,拒绝低对比度点并消除边缘响应。海森Hessian矩阵用来计算主曲率,并消除那些ratio比率在主曲率之间比ratio更大的关键点。 第三步:从关键点周围的区域中采样点的梯度方向构造方向直方图,为了得到方向分配。 原文实验结果,在每个8方向块直方图4*4数组上得到了最好的结果。所以SIFT的描述是4*4*8=128维。 PCA-SIFT PCA-SIFT,Principal Component Analysis -SIFT。主成分分析SIFT。2004.在旋转和光照变换情况下具有优势。Y.Ke and R.Sukthankar采用PCA代替直方图来归一化梯度块。他们展示了基于PCA的局部描述符对图像变形也很出众和鲁棒,但是抽取鲁棒特征仍然很慢。 PCA是一种标准降维技术,非常适合描述关键点块,它可以让我们将线性高维采样到低维特征空间,但是观察到其对配准误差比较敏感。PCASIFT的特征向量比标准SIFT特征向量明显小很多,可以使用相同的匹配算法。PCASIFT与SIFT一样使用欧氏距离来检测不同图像间两个向量是否有相同的关键点。输入向量的创建,通过串联集中在关键点处的41*41块patch的水平和垂直梯度图,其具有2*39*39=3042个元素。对于PCASIFT来说,更少的元素一方面减少了存储,同时还保证快速的匹配,因此选择n=20的特征空间维度得到比较显著的结果。 SURF SURF,Speeded up Robust Features。快速鲁棒特征。2006.与SIFT具有一样好的性能,而且非常快。Bay and Tuytelaars提出快速鲁棒特征,使用积分图像卷积和快速Hessian检测器。实验这么运行更快,且工作良好。快速Hessian检测器比hessian检测器更快更好。 SURF与SIFT的检测特征方法略有不同。SIFT建立图像金字塔,用高斯过滤每一层,通过增加sigma的值来找到不同。SURF创建了一个‘堆stack’without 2:1 downsampling,对相同分辨率的图像金字塔高层(??)。采用了积分图像,SURF滤波堆采用近似高斯二阶偏导滤波器,因为积分图像允许矩形滤波器在最近固定时间里in near constant time进行计算。 关键点匹配步骤,最近邻定义为具有最小欧式距离关键点,作为不变描述符向量。采用与SIFT作者Lowe使用的具有更有效的测度方法,获得最近邻和次最近邻间距离的对比,与SIFT相同,此处选择了0.5作为距离比率。 Time Scale Rotation Blur Illumination Affine SIFT 3 1 1 1 3 2 PCA-SIFT 2 3 2 3 2 2 SURF 1 2 3 2 1 2
个人分类: 科海随笔|3 次阅读|0 个评论
科研启航:(三)高分辨率复杂表面图像拼接调研
kingang 2013-10-16 20:25
由于实验室大王老师的临时安排,需要我参与他关于图像拼接的项目,作为前期工作,则需要对图像拼接的近几年的研究背景现状做一个综述,当然给我安排了一个月的时间来完成这个任务。目的是要能够总结到近五年研究的方法以及其方法的评价。而且本次项目期望能够与敦煌研究院进行合作,从事壁画的图像拼接方法研究。 对于敦煌石窟的了解不多,据说有超过400个不同规模的洞窟组成,有超过42000平方米的壁画规模!当前敦煌研究院的工作是把壁画通过影像技术把壁画进行数字存档,并且要求壁画的高精度和清晰度。因为所采用的数码相机都是采样一部分的壁画,所以要进行大量的图像拼接工作,当前是采用photoshop来进行手工拼接,耗时耗力,而且容易造成不可预知的误差错误。所以亟需解决诸如此类的问题。 图像拼接技术的产生发展已经有超过五十年的时间,可以视作较为成熟的技术,并且市面上有很多商用的图像拼接软件可以见到,而且针对一般的图像拼接甚至giga像素级图像的拼接也可以达到很好的要求,实时性也能满足。但是针对复杂场景下的敦煌石窟来说,则要复杂的多了,首先这不同于一般的图像拼接,或者全景图拼接,只要肉眼可以达到的误差要求就算非常不错。但是作为数字档案来存放的壁画图像来说,误差的控制是必须要非常精确,而且要求运算速度要快,而且尽量减少人工的干预,并能够寻找一种方法来评价和衡量拼接后的图像效果。 经过两天的调研,从国内到国外,相关的研究有很多,毕竟作为数字图像处理技术的一个小分支,技术已经非常的成熟,不同的是应用场景不同带来的定向性的技术调整或优化。随着Lowe提出SIFT算子并在2004年进行完善之后,但凡是与图像有关的技术中,特征的提取方面基本都要过这一关,一般来说每一个事物都有正反面,即有好有坏,SIFT的好处就是精度非常高,缺点就是运算太慢。后来有人提出的改进方法中,最经典的就是SURF算法,在SIFT基础上进行了优化,提高了运算速度。但无论如何改进,SIFT作为特征提取中的关键的技术,是图像拼接研究中最需要掌握的第一个关键点和切入点。 图像拼接一般分成三个部分,图像校正,图像配准,图像渲染融合。而图像配准则是其中的最关键的一个环节,这方面的论文相当的多,一般经典的是采用特征点的模板匹配或频率域变换的相关算法来进行配准。 从Web of Science中搜索相关SCI收录的论文情况来看,主题标明image stitching,image registration的论文数量非常之多,而且可以非常清晰的看到,这些论文大多来自两个方向,一个是医学图像处理,一个是遥感图像处理。作为艺术图像处理的壁画来看,需要填补一些空白,是一个很好的切入点。但是从敦煌研究院已举办国际学术研讨会来看,这一部分也不算是一个非常空白的研究,至少已经做了很多的工作。至少有浙江大学,微软亚洲研究院,中科院等单位参与了相关的合作研究,并也取得了很多的成果,主要是看到2011.8月的敦煌论坛的论文集,400页,已经比较厚实了,但是关键的技术问题还是比较棘手,正是因为比较棘手,所以要展开更开阔的合作研究。 从已经商用的软件来看,我下载到Kolor Autopano Giga 3.0的应用软件,可以针对高清大尺寸图像进行快速自动拼接。我选取了一副11956*3555的图像,将其分成6975*1975的四幅图像,进行拼接,耗时约几秒钟,拼接效果非常理想,当然我的事先裁剪的图像都比较好,所以拼接效果不错。但是当我用手机采集了3328*1872的十幅实验室室内全景图像,拼接的速度还是很快,但是效果却拼接为了两幅图像,其中有两幅图像被拿出来单独拼接成了一副图像,而且另外8幅图像拼接的效果,由于视角的问题,肉眼一看是不错,但是像墙角、电灯等位置则出现了错位非常明显的情况,因此对于此软件来说,视角或图像畸变后的拼接就显得不那么理想,就必须用他的后续微调的手工操作来弥补。 综上所述,近两天的调研来看,可以采用的技术目前来看,以SIFT或SURF为核心来展开,先了解成熟技术室如何进行拼接处理的,另外要了解前沿研究技术的发展情况,关注像近期的高水平国际会议上相关的论文情况。当然这里的搜索需要很大的气力,因为关键字找不准就很难找到理想的论文文献。 对于拼接研究,特别是壁画的拼接研究是个不错的切入点,用来实现产学研的结合是不错的。同时在壁画基础上,可以想办法建立机器学习理论相关的模型来对图像拼接或后期的修复进行研究,理想的是能够建立自适应学习的最优化方法来完成复杂情况下的问题。因此来看,此方面的研究还是很有意义的。
个人分类: 科海随笔|2 次阅读|0 个评论
科研启航:(二)自适应主动学习图像分类
kingang 2013-10-14 11:09
2013.10.13 Adaptive Active Learning for Image Classification 关于自适应 主动学习 的图像分类。作者指出近期主动学习开始越来越多的关注计算机视觉领域,指出了一般视觉数据分析在准备一个好的标记图像数据集时的费时费力的缺点。指出现存的主动学习方法大多采用uncertainty measure作为实例选择标准应用到计算机视觉中,这种策略也比较有效,有一点就是在有大量没有标记的图像数据集中,它们这些策略方法就没法获得数据,并且还容易造成查询到离群点。因此作者提出了一个新颖的自适应主动学习方法。结合了信息密度测量information density measure和最不确定测量most uncertainty measure来选择标准实例去标记。 文中指出图像分类中最大的挑战是类之间较大的多样性差异,建立一个鲁棒的图像分类器需要训练大量的标记实例。随机的选择没有标记的实例来标记在很多情况下是无效的。 不确定条件uncertainty term基于当前在标记实例上训练的分类器;信息密度条件information density term测量候选实例和剩余未标记实例间的 互信息 mutual information。将这个两个进行加权结合,并通过选择权重参数来获得这两个条件的自适应结合,使得在未标记实例上得到最小的期望分类误差。 主动学习的目标是生成一个分类器,具有在问题域中处理不可见实例的良好的泛化generalization性能。 主动学习的应用方向:图像或视频标定annotation,图像或视频检索,图像或视频识别。 作者将其提出的方法分成了三部分:uncertainty measure,information density measure,adaptive combination framework。此方法基于概率分类模型,此文采用逻辑回归作为概率分类模型来进行实验。uncertainty measure:在给定候选实例Xi上的标记变量Y的条件熵。用来获得候选实例与标记实例间的信息。information density measure:表示在一个高斯过程Gaussian Process框架下候选实例与剩余未标记实例间的互信息。互信息是一个测量两个变量集合之间相互依赖的量。它比间隔密度marginal density p(x)更直接表述的测度。比cosine距离密度测量更加具有原则性principled。(计算互信息类似的就是计算熵)。自适应调节以上两个调节的权重,采用0.1,0.2,...,1之间的数。 整体算法: 输入标记集L,未标记集U,权重集B= ; 直到足够的实例被查询到之前一直重复执行,训练一个L上的概率分类器。 for循环 i属于U,计算uncertainty measure:f(xi),information density measure:d(xi),以上两者的加权结合measure:h(xi)。 end for 定义已选择的实例集合S为空。 for循环β属于B,利用argmax h(xi)=实例x,并将其加入到S中。end for 从S中选择实例x*,利用公式10。从U中剔除x*,查询x*的true label y*,通过添加x*,y*到L中来升级L集合。 实验:数据集采用13 Natural Scene Categories,Caltech101,Pascal VOC2007。实验对比,本文是两种测度自适应结合,则对比一种Near Optimal(基于主动学习方法的互信息【文献10 C. Guestrin, A. Krause, and A. Singh. Near-optimal sensor placements in Gaussian processes. InICML, 2005.】),对比没有自适应时固定权值的情况,再对比most uncertainty采样和随机采样的情况,最后给出集中β的几种取值来对比。 2013.10.14 A Bayesian hierarchical Model for Learning Natural Scene Categories 本文作者为Stanford大学VisionLab实验室主任LiFeiFei 本文提出的学习和识别场景类别的方法,不需要人工进行标定数据集。用无监督学习来获得码书。提出的方法能够自动无监督的学习相关中间描述。提出的方法是原则性概率框架,通过码书来学习纹理模型。本文的模型能够将图像类别分到一个合理的层级。 本文方法学习的目标是获得能够在每个场景类别上这些码书分布的最佳描述。 采用了Blei提出的LDA模型 . 码书的构造采用Kmeans聚类,码书则是学习到的集群的中心点。 局部区域检测和描述,1.划分网格,2.随机采样,3.Kadir和Brady的显著性检测,4.Lowe的DoG检测。 实验中,本文在学习和识别阶段仅使用灰度图像。 作者最后也指出,针对室内场景的分类性能,本文的方法是乏善可陈的,而且她们的模型也不完整。
个人分类: 科海随笔|2 次阅读|0 个评论
科研启航:(一)关于我的几个思考
kingang 2013-10-12 22:03
1.我来的目的是什么 9月2号开学至此日已经40天时间,做了40天的博士有很多感触,最眼前的就是科研之路。那总是要围绕着一个问题:为什么要读博士?!我想这个问题的时候总是会会心一笑,总是很自然的说:“读完硕士就该读博士了呀。”,其实这个问题非常的关键,而摆在眼前的和以后的也照样会围绕这个问题。那就是我来这里的目的是什么,经过了报名考博,笔试面试终于录取而且进入到了梦想中的博士平台,总是要问清楚和回答清楚我来的目的是什么。 记得硕士的有个老师略带鄙夷的对我说,“我读博是因为兴趣,跟你不一样”。我自然会对号入座,跟他不一样那肯定就是不为兴趣读博咯,当然他的话显出他的不稳重来,此处不再讨论。我读博既有兴趣原因,也有根据整体环境条件的考虑,总之立志于做研究的新科博士,怀揣着能够做出像样东西来的年轻人。我来的目的就是夯实基础,follow科研前沿,最终具备独立科研的能力,当然不仅仅限于当前研究方向。 2.我要做什么样的研究 硕士阶段起初没有在科研中发现有如此之乐趣,后来悬崖勒马考取了博士研究生,至此进入博士群体,当然自己学历在上升,所面临的知识能力的提高也压力重重,作为基础的数学需要非常狠狠的恶补,而整个科研能力对自己来说还非常非常欠缺,脑子喜欢但是鲜有创新思维,唯一可以找到突破口的就是坚持。 开学第二天来见赵导面谈,几个问题还是老生常谈,但是这次心里更加确定要如何来规划面前的这三四年时间,当然科研是必须的,工程项目则也是要去涉及的,繁杂琐事也会有很多,面临如此情况下,自己首先在不依赖导师的情况下,如何来订立研究规划和读博生涯,是个非常值得思考的问题。努力完成学业是个基础,在此之上要漂亮的完成研究任务,特别是在感兴趣领域内达到一定水平,如果用论文来衡量的话就是一篇高水平期刊或会议论文。当然不积跬步无以至千里,眼下目标订立过高总有得不偿失之害,因此把目标慢慢提高,循序渐进式的模式来巩固科研生涯的开端。 硕士期间就是在图像方面做相关研究,其实非常的简单,而且一方面自己没有相应的科研思维,另一方面导师没有起到很好的指导。总之硕士期间做的是比较老的模式识别中的模板匹配相关方法应用研究,虽然在短时间内完成了毕业要求,但是回头看看真是不堪。因此也是给现在的自己提个醒,因为读硕时时奔着技术型路线走的,后来转到现在的博士科研路线中,必须要认认真真的做些研究。当然考取的方向也是仿真与多媒体处理方向,而且实验室也是有做图像方面的传统,在跟大王老师聊过之后,在已毕业的同门师兄的图像分类基础相关方向上探索出新的研究切入点来。 本来没有这方面的概念,后来拿着 大 王老师给买的书,看了一遍发现有好多好多的空白需要填补到脑子里,什么机器学习上的分类器了,什么各种统计概率的相关数学计算了,什么数学模型了,又什么语义分析解决语义鸿沟等等的新的未曾听过的概念,面临这些新鲜的东西,自然是个挑战,但也确实非常刺激,上个月的开始时间里,还非常努力的想一口气都掌握,现在想来,盲目冒进是多大哥错误,静下来思考下会有很大帮助。 现在来说,图像识别,分类,分割等相关的研究已经非常非常多,每年的CVPR上的论文基本都是相关的主题,而就是在这样的环境下,如何从中发现切入点,是我现在最需要解决的重点难题。 自底向上来说,从图像底层的预处理,特征抽取到图像描述符,到高层的对象识别、分类与理解,每个层级上的研究都已经有很多可以参考的前人的工作。特别是在底层方面更是比较充分,从中找到突破也比较有难度,一些特征抽取的算法相对比较成熟,应用也很广泛,特别像SIFT,虽然老但仍然好用。训练阶段的分类器如SVM也是这样,虽然有很多变种但依然应用广泛。一个比较直观的难题就是如何能够像人一样更加快速的理解一副图像中所要说明的意思,那就是最高层的图像理解,需要在所有上面的基础之上对图像的语义含义进行提取分析,才能让机器完成更人性化的理解。这些首先需要很多先验知识,比如一副简单的图像,有人能够看出乐观,有人能够看出悲观,有人能够看出惊奇等等,所以需要很多的参数来训练,也很难做出唯一的理解,但可以做出最一般最普通的,由人事先定义好的广义的图像理解结果。 上述问题,对于现在很多的研究来说,都是在数学模型上下功夫,提出很多个目标识别、图像分类的模型,能够很好的在数据集上完成相关的任务,比较前人的算法都能取得很好的实验结果。给出的模型也能做到state of the art,但给我感觉貌似千篇一律,或许是因为我现在入门太浅,还看不出其中奥妙的缘故吧。总之,每篇论文总会有个新颖的创新想法出来,包括算法或者模型,解决的问题也都差不多,但关键是它们找到了可以切入的切入点。也许就是奥妙所在。 经过开学一个月的时间适应环境和对科研学习的重新认识,包括拜读老教授的科研方法方面的经验交流,我还是需要做好如下的几个方面:1.应用数学基础(高数,线性代数,概率论,统计学,随机过程,离散数学);2.保持每天的外文文献的阅读,现在每天一篇略读,在此基础上增加每天的读后总结很关键;3.最重要是要思考,随时记录新鲜想法并能够想法动手实验;4.代码实验与论文并驾齐驱,或许一个idea就来自某次实验结果。 人生是短暂的,博士生涯亦是弹指一挥间,在有限的时间内做到成功的读完博士学位,需要自己很大程度的努力,当然我更要把身体锻炼好,保持每天一定量的活动时间,娱乐也可以适当安排,总之,我提倡的是更加高效的,哪怕是短时间的高效率学习工作都是非常值得的。
个人分类: 科海随笔|4 次阅读|0 个评论
[转载]历史性启航
wyc 2012-10-13 06:49
中国航母入役后首次离港 码头鞭炮齐鸣(图) 2012-10-12 16:31 中国新闻网 44 字号: T T   10月12日早上,中国航空母舰“辽宁舰”驶离大连港码头。这是其在9月25日正式交接入列后首次离港出海。当天早上六时整,码头响起鞭炮声。悬挂鲜艳“八一”军旗的中国航母“辽宁舰”,在5艘拖船的协助下,仅仅用了20分钟就将舰首调整到面向航道的位置。中新社发 宋太盛 摄   中新社大连10月12日电 (宋太盛 董永君)12日6时,中国航空母舰“辽宁舰”驶离大连港码头。这是其在9月25日正式交接入役后首次离港出海。   中新社记者当天5时在大连港码头看到,“辽宁舰”和“88”保障舰上灯火通明,人员在甲板上不停走动,似乎在进行出航前的各项准备工作。4艘拖船呈“一”字型从“辽宁舰”的左舷舰首至舰尾整齐排列。5时40分,停靠在码头附近的一艘大型油轮被4艘拖船拖离码头,为“辽宁舰”出航清理航道。 -   5时55分,中国航母“辽宁舰”上的指挥员下达了“离码头部署”命令。随即,全舰官兵进入海训状态,各就各位。舷梯开始撤离甲板,第五艘拖船也靠向舰尾。   6时整,码头响起鞭炮声。悬挂鲜艳“八一”军旗的中国航母“辽宁舰”,在5艘拖船的协助下,仅用20分钟就将舰首调整到面向航道的位置。这时,码头上再次鞭炮齐鸣。   “辽宁舰”从9月17日起开始按照海军相关条例执行升旗仪式,在过去一个月的时间里,“辽宁舰”发生了由“蛹”到“蝶”的巨变。完成了舷号“16”的涂刷,接受了军方的相关验收,先后三次处于挂满旗状态,并于9月25日正式交接入役。   中国国防部新闻发言人杨宇军在此前的例行记者会上表示,“辽宁号”航母在交付海军后,将继续开展科研试验和军事训练,后续工作将根据试验和训练的进展情况来确定。(完)
个人分类: 未分类|1835 次阅读|0 个评论
热烈祝贺:中国第一艘航空母舰“辽宁舰”正式启航
Fangjinqin 2012-9-26 08:23
热烈祝贺:中国第一艘航空母舰“辽宁舰”正式启航
热烈祝贺: 中国第一艘航空母舰“辽宁舰”正式启航 我国第一艘航空母舰“辽宁舰”2012年9月25日上午正式交付海军。 中共中央总书记、国家主席、中央军委主席胡锦涛出席交接入列仪式并登舰视察。 这是我国海军一个伟大的里程碑! 让帝国主义和军国主义在伟大的中国人民面前发抖吧! 2
个人分类: 信息交流|1823 次阅读|0 个评论
我的学术启航
wk5411 2012-9-8 08:32
今 天通过了科学网的通过,今后就能在上面写博文了,感觉很好。
1 次阅读|0 个评论
中国航母平台再次从大连启航,又一次海试。
可变系时空多线矢主人 2012-4-27 10:43
中国航母平台再次从大连启航,又一次海试。 国防部新闻发言人耿雁生26日说,中国航母平台前期开展海上试验均达到预期效果。这次航母平台出海试验是按照计划安排的,与当前地区局势没有关系。 辽宁海事局 18 日发布的辽航警 0055 航行警告显示:渤海北部 4 月 19 日 8 时 至 4 月 29 日 18 时 ,在下列四点水域内执行军事任务, 1 、 39 ° 31 ′ .0N 120 ° 00 ′ .0E ; 2 、 39 ° 44 ′ .0N 120 ° 00 ′ .0E ; 3 、 39 ° 31 ′ .0N 120 ° 45 ′ .0E ; 4 、 39 ° 44 ′ .0N 120 ° 45 ′ .0E 。各航船禁止驶入。 从位置看,该区域位于渤海北部、河北省秦皇岛市东部海域,距离辽宁省兴城市约 80 至 150 千米。 而在 19 日 9 时,辽宁海事局再次发布的辽航警 0056 航行警告显示: 4 月 20 日 11 时至 17 时,渤海海峡老铁山水道,在下列 4 点连线水域内执行军事任务, 1 、 38 ° 35 ′ .0N 121 ° 31 ′ .0E ; 2 、 38 ° 25 ′ .0N 121 ° 17 ′ .5E ; 3 、 38 ° 32 ′ .0N 120 ° 47 ′ .3E ; 4 、 38 ° 44 ′ .4N 120 ° 42 ′ .5E 。任何船只在上述时间内不得进入该海域。这也预示着在该时间段内,航母平台将经过该水域。 根据辽宁海事局的两次航行警告显示,中国航母平台此次海试的时间大约持续 9 天左右。 在此之前,中国第一艘航母平台已进行了数次海试。 2011 年 8 月 10 日 ,航母平台首航试验, 8 月 14 日 上午返航,共计 5 天时间; 11 月 29 日 上午,航母平台第二次出海试验, 12 月 11 日 返回,持续时间长达 13 天; 12 月 21 日 至 12 月 29 日 ,航母平台进行了第三次出海试验,持续时间达 9 天。 航母平台此次出航距上一次海试间隔数个月,军迷们猜测应是期待已久的歼 15 舰载机试飞。 按照国际惯例,航母海试工程是项庞大的工程。中国国防部新闻事务局此前曾发出官方消息称,航母海试已成为常态化,外界对此可以保持理性看法。
个人分类: 其它|2753 次阅读|0 个评论
启航2012 ---- 元旦晚会一定要看
xupeiyang 2011-12-31 07:04
启航2012 ----元旦晚会一定要看 晚会地址: 北京国家体育馆 晚会时间: 12月31日晚20:00开始切入,于2012年1月1日凌晨0:30分结束,时长共计4个半小时 2012央视跨年演唱会收看指南 http://www.fengfeng.cc/cctvkuanian/
个人分类: 文化艺术|1523 次阅读|0 个评论
就算
热度 1 gyx2650 2011-12-23 20:12
就算失败 也要记得重新启航 就算再忙 也要记得常和家人聊聊 就算很烦 也要记得吃好睡香每天笑笑 心情 自己作主 价值 别人无权定义 Everybody has his own value. Sometimes your biggest weakness can become your biggest strength. If you give up when it's winter, you will miss the promise of your spring, the beauty of summer, and fulfilment of your fall. Don't let the pain of one season destroy the joy of all the best.
个人分类: 小诗习作|2106 次阅读|1 个评论
研究生启航。。。
wlp924577010 2011-12-1 19:56
开始研究生的生活已经有快三个月了,因为要进修,老板出国了。只剩下我与师姐们(之前我甚至没有一位嫡系的师兄)。第一个学期忙于基本课程的学习,感觉似乎并未真正进入研究生的角色,怎样做好一名研究生,网上的榜样铺天盖地,有的文章达人可以将发表SCI当做浮云,有的教授却认为我们应该追求的是自己感兴趣的研究领域的研究成果以及他给人们带来的意义,而不是文章的多少,奈何中国的现实是文章决定学术者的命运,这虽是误区,但却是现实。我也想为自己的研究生生涯做好规划,SCI一篇就好。有挑战就有激情,GO.GO.GO...
2078 次阅读|0 个评论
[转载]历史上的今天 5月9日
xupeiyang 2011-5-9 05:58
给孙子乐乐宝宝带两套小衣服和一个玩具,是爷爷的心意。以后出差总要想到孙子啦。 5月9日是阳历年的第129天(闰年是130天),离一年的结束还有236天。 1502年, 哥伦布 最后一次启航出发 1915年,袁世凯承认“ 二十一条 ” 1944年,苏军收复 克里米亚半岛 1950年,“ 舒曼计划 ”提出 1993年,首届 东亚运动会 在上海举行
个人分类: 我的日记|1461 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-18 17:27

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部