参阅《敦煌论坛 文化遗产与数字化技术国际学术研讨会》International Conference on Cultural Heritages and Digitization 论文集——2011年8月 论文集中包含了国内外相关学者的文章,主要是针对文化遗产的保护等。国外的有各个博物馆或研究院等组织,国内的以敦煌研究院为首,对文化遗产,特别是物质遗产进行的工作的相关现状及技术的研讨。 一、敦煌莫高窟 俗称千佛洞,实际上现存规模最大,保存最完好的佛教艺术宝库,被誉为“东方艺术明珠”。莫高窟上下五层,南北月1600米,现存洞窟492个,壁画45000平方米,彩塑2400余身,飞天4000余身,是由建筑、绘画、雕塑、组成的文书和文物,逐渐形成了敦煌学。 二、文物保护的挑战 莫高窟地处偏远戈壁,交通不便,第一手研究资料很难得到,洞窟内光线和位置布局受限。各种墙面已经龟裂、起甲、灰尘覆盖。对壁画的数字采集工作有很大挑战,包括后续的数字图像的处理拼接等。 三、相关合作组织及工作情况 从1996年敦煌研究院与浙江大学开始合作,为壁画的保护和保存提出了一套解决方法。 四、会议论文的相关内容 文献【1】提出的壁画的技术需求:大幅面、高保真、墙面不平。以及相对应的技术问题:自动拼接、图像校正、正射校正。现在已设计出轨道式自动拍摄设备,扫描分辨率能达到300PPI,色彩深度48bitRGB。相关技术包括:照片自动正射影像拼接、基于SfM(Structure of Motion)的多相机拍摄参数与方位精确信息求解、基于简单三维表面重建的照片正射投影校正、基于多分辨率图像融合的多幅图像合成、图像特征自适应配准效果。文中指出自动拼接系统可以稳定支持200幅以上规模壁画照片的自动正射影像拼接生成,高效且没有变形。 文献【2】对比高保真图像获取的两种方式:大幅面相机拍照、多幅拍摄后拼接。根据敦煌洞窟的实际情况确定利用多幅拍摄后拼接的方法,在国际上有较多的应用,如:(1)ASIDC Automatic System for Image Digital Capturing希腊萨洛尼卡大学开发的一套系统,用来获取古画数据。有三部分组成,PC控制的运动系统、图像捕获设备、拼接算法。【A system for capturing high resolution images 1998】(2)VITRA Veridical Imaging of Transmissive and Reflective Artefacts 英国伦敦通讯学院开发的系统,最后有拼接系统。【A Robotic System for Digital Photography SPIE2006】(3)VASARI Visual Arts system for archiving and Retrieval of Images图像存储和检索的视觉艺术系统,旨在直接从绘画中得到高分辨率的彩色数字图像,最后拼接。此系统已在伦敦国际艺术馆使用【 http://users.ecs.soton.ac.uk/km/projs/vasari/ 2009 】。 文献【2】的自动正射影像拼接:利用计算机视觉中多视点三维重构的最新算法,根据图片之间的特征点匹配计算出这些匹配的特征点在空间中的三维坐标,形成一个三维的特征点云。根据这个点云可以拟合成一个笔画所在墙面的近似平面,作为笔画拼接的投影平面。根据图像特征点与三维点云中特征点的对应关系,可求出每张照片到投影平面的正射投影变换,该变换将原始图像映射到全景图生成平面中,最后进行融合得到全图。使用开源软件Bundler【 http://phototour.cs.washington.edu/bundler 】匹配壁画图像特征点,然后生成特征三维点云,计算得到每幅照片拍摄时的相机参数和姿态。根据图像中的特征点与三维点云中的特征点之间的对应关系,将原始图像插值到全景图生成平面中。开源软件Enblend【 http://enblend.sourceforge.net 】进行图像融合。 文献【3】提出一种在PCA-SIFT基础上,加入核函数和采用四邻域与八邻域距离(街区距离棋盘距离)线性结合取代欧式距离的方法。文章说他大大降低了SIFT描述子的维数,其实PCA本身就做到了。又说对噪声、旋转及尺度变化良好的鲁棒性,其实这些SIFT就已经做得很好了,如果要快速的话可以用SURF,只是SIFT对仿射变换方面和计算量有些不足。我认为此文的方法在应用中效果不会很理想。 文献【4】使用了由微软亚洲研究院赠送的十亿级像素相机进行数字化工作,并提高了一定的效率。文中指出了当前人工拼接的方法和限制:拍摄方式延续了1999-2005年敦煌研究院和美国梅隆基金会、美国西北大学共同开展的数字化敦煌壁画合作研究项目的技术。所拍摄的每一幅图形都会与相邻的两幅图像有50%的重叠度,拍摄方式工作量相当巨大。拼接方面,当前采用的图像拼接技术是基于图像对齐,它的理想对象是一个纯粹的平面或是等距离的场景,而这种理想对象在莫高窟基本不存在,人工凿的壁面不规则。起伏不断的平面,势必导致拼接结果的不准确。几乎所有的图像拼接技术都会采取图像融合或切断缝合来隐藏这些错误,而隐藏拼接错误违背了关于数字敦煌档案的最大程度逼近真是的原则,不能得到接受。目前采用的是使用PS图像软件拼接,使用局部变形功能人工调整图像来弥补非平面造成的拼接误差。因此工作时间非常长,容易出现眼花疲劳出错。 此处是图像拼接中亟待解决的瓶颈问题。 十亿级相机Apsara自带自动拼接功能,一定程度上提高了工作效率。 文献【5】针对避免墙面不平和相机畸变因素研究图像拼接时如何进行形变校正。此文通过修正相机镜头畸变来改善壁画照片的形变,优化自动拼接的效果。文章介绍了图形学中的几何形变中的几种像差,为了尽可能小的减少拼接后的整幅图像的变形,文章采用十字骨架形式拼接,先拼接出整幅图像的十字骨架,然后再另外的四个空白区域内拼接填补上剩余的图像,尽可能的减少变形。畸变校正,找到理想图像与畸变图像坐标间的对应关系,进行空间位置校正,目的是将发生了位移的即便图像的坐标移回到正确位置。然后根据畸变图像对应点邻域像素的灰度值估计理想图像上对应点的灰度值。 文献【6】在PS中对图像的拼接时出现的错误:重影;手动变形产生的图像缺失、图像错位、局部模糊;自动拼接的断线、局部严重变形与色彩偏差;整体严重变形与色彩偏差。列出了拼接的检查情况,如重影、拉虚、错位断线等。自我在PS中的拼接结果检查通过使用蒙版的启用或停用来完成。拼接检查主要通过拼接人员内部的互相交换检查寻找错误,最后验收保存。 【1】计算机辅助敦煌莫高窟保护利用技术研究应用:探索与实践。浙江大学,鲁东明。《敦煌论文集》 【2】敦煌壁画高保真正射影像的自动数字化工作框架。浙大:刁常宇。敦煌研究院:吴健。《论文集》 【3】一种改进的KPCA-SIFT敦煌壁画数字图像拼接算法。西北工业大学:卢选民,此人有篇此算法相关的EI会议论文。 【4】十亿级像素相机在数字敦煌档案中的应用实验。敦煌研究院:孙志军。《论文集》 【5】基于几何形变改善的莫高窟数字壁画图像拼接方法研究。敦煌研究院浙大:俞天秀,吴健。 【6】敦煌壁画数字图像的质量控制与检查——以莫高窟第三窟数字化为例。敦煌研究院:丁晓宏。
2013.10.13 Adaptive Active Learning for Image Classification 关于自适应 主动学习 的图像分类。作者指出近期主动学习开始越来越多的关注计算机视觉领域,指出了一般视觉数据分析在准备一个好的标记图像数据集时的费时费力的缺点。指出现存的主动学习方法大多采用uncertainty measure作为实例选择标准应用到计算机视觉中,这种策略也比较有效,有一点就是在有大量没有标记的图像数据集中,它们这些策略方法就没法获得数据,并且还容易造成查询到离群点。因此作者提出了一个新颖的自适应主动学习方法。结合了信息密度测量information density measure和最不确定测量most uncertainty measure来选择标准实例去标记。 文中指出图像分类中最大的挑战是类之间较大的多样性差异,建立一个鲁棒的图像分类器需要训练大量的标记实例。随机的选择没有标记的实例来标记在很多情况下是无效的。 不确定条件uncertainty term基于当前在标记实例上训练的分类器;信息密度条件information density term测量候选实例和剩余未标记实例间的 互信息 mutual information。将这个两个进行加权结合,并通过选择权重参数来获得这两个条件的自适应结合,使得在未标记实例上得到最小的期望分类误差。 主动学习的目标是生成一个分类器,具有在问题域中处理不可见实例的良好的泛化generalization性能。 主动学习的应用方向:图像或视频标定annotation,图像或视频检索,图像或视频识别。 作者将其提出的方法分成了三部分:uncertainty measure,information density measure,adaptive combination framework。此方法基于概率分类模型,此文采用逻辑回归作为概率分类模型来进行实验。uncertainty measure:在给定候选实例Xi上的标记变量Y的条件熵。用来获得候选实例与标记实例间的信息。information density measure:表示在一个高斯过程Gaussian Process框架下候选实例与剩余未标记实例间的互信息。互信息是一个测量两个变量集合之间相互依赖的量。它比间隔密度marginal density p(x)更直接表述的测度。比cosine距离密度测量更加具有原则性principled。(计算互信息类似的就是计算熵)。自适应调节以上两个调节的权重,采用0.1,0.2,...,1之间的数。 整体算法: 输入标记集L,未标记集U,权重集B= ; 直到足够的实例被查询到之前一直重复执行,训练一个L上的概率分类器。 for循环 i属于U,计算uncertainty measure:f(xi),information density measure:d(xi),以上两者的加权结合measure:h(xi)。 end for 定义已选择的实例集合S为空。 for循环β属于B,利用argmax h(xi)=实例x,并将其加入到S中。end for 从S中选择实例x*,利用公式10。从U中剔除x*,查询x*的true label y*,通过添加x*,y*到L中来升级L集合。 实验:数据集采用13 Natural Scene Categories,Caltech101,Pascal VOC2007。实验对比,本文是两种测度自适应结合,则对比一种Near Optimal(基于主动学习方法的互信息【文献10 C. Guestrin, A. Krause, and A. Singh. Near-optimal sensor placements in Gaussian processes. InICML, 2005.】),对比没有自适应时固定权值的情况,再对比most uncertainty采样和随机采样的情况,最后给出集中β的几种取值来对比。 2013.10.14 A Bayesian hierarchical Model for Learning Natural Scene Categories 本文作者为Stanford大学VisionLab实验室主任LiFeiFei 本文提出的学习和识别场景类别的方法,不需要人工进行标定数据集。用无监督学习来获得码书。提出的方法能够自动无监督的学习相关中间描述。提出的方法是原则性概率框架,通过码书来学习纹理模型。本文的模型能够将图像类别分到一个合理的层级。 本文方法学习的目标是获得能够在每个场景类别上这些码书分布的最佳描述。 采用了Blei提出的LDA模型 . 码书的构造采用Kmeans聚类,码书则是学习到的集群的中心点。 局部区域检测和描述,1.划分网格,2.随机采样,3.Kadir和Brady的显著性检测,4.Lowe的DoG检测。 实验中,本文在学习和识别阶段仅使用灰度图像。 作者最后也指出,针对室内场景的分类性能,本文的方法是乏善可陈的,而且她们的模型也不完整。
就算失败 也要记得重新启航 就算再忙 也要记得常和家人聊聊 就算很烦 也要记得吃好睡香每天笑笑 心情 自己作主 价值 别人无权定义 Everybody has his own value. Sometimes your biggest weakness can become your biggest strength. If you give up when it's winter, you will miss the promise of your spring, the beauty of summer, and fulfilment of your fall. Don't let the pain of one season destroy the joy of all the best.