科学网

 找回密码
  注册

tag 标签: 图像检索

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

图像检索:有趣的一个检索试验
热度 7 mdzhao 2016-3-31 15:59
最近因为拍了不少花花草草的照片,也在朋友圈发了几张。几天前发了几张桃花的照片,结果有一同事问了个问题:那粉色的桃花与八重樱怎么区分?因为平时午饭后会在校园里散步,看到各种花草也会认一下,这几天正是校园里几株八重樱开得最好的时候,被她那一问,一时倒真说不出最明显的这两者的区别,从外观看,还真的很类似,不过细看似乎两者的花瓣和花托都是有区别的。 也是因为有这一问,便想到,现在有什么问题大家都习惯到网上去找答案,但似乎对图像类的东西,如果没有文字说明就比较难直接找到。突然想起去年暑假曾听过罗昭锋老师的一个讲座,介绍了百度的图像检索功能。那是我第一次知道搜索引擎已经可以通过上传的图片来检索了,不过此后却一直没有用过,便想去试验一下。于是找了张八重樱的照片上传了,看到出来的结果很是惊喜,出来的图片看上去好像大多数还真的都是八重樱,还告知该图可能是日本晚樱,顺便点开相关条目看了下,却没法判断日本晚樱是否就是八重樱,再搜了八重樱的条目,也没有相关说明。又到几张照片的源网址看了下,却并没有对花的具体介绍,连花名都没有。突然发现,通过图片检索似乎越查越糊涂了。只好求助文字检索,用“八重樱和日本晚樱”检索,谁想从检索结果看,有说它们不是同一种花,又有说它们就是同一种花,测底晕菜了! 然后传了张粉色桃花的照片,但这次出来的相似图片却似乎与上传的图片差距较大,虽然能看出大多数是桃花,但显然有单瓣桃花,也有梅花,与上传图片有明显区别,而且搜索结果告知没有找到相关结果,顿时有点蒙,居然在网上没有这样的粉色桃花吗?其实我上次在科网就发过这种桃花的照片,虽然不是同一张照片。 这个检索让我对图像检索产生了进一步使用一下的兴趣,便想试试,如果不知道某个东西是什么,只有它的图片,能否通过图像检索找到对某种东西的说明和相关信息?于是从手机上找了张随手拍的一种野花,那是在山上长得很多的一种花,春天爬山的时候经常看到,似乎是某种豆科植物,我觉得曾经看到过该花的名称,却没有记住。便找了张比较清晰的照片上传后让百度识别,谁想结果却告知没有找到相关结果,而给的相似图片基本都不是同种植物,其中有两张图片我自己判断是同种植物,但点开原网站,却也说明是拍的野花。看来如果只有图片要到网上找相关信息还是比较困难的。 想到计算机检索本来就有比较死板的毛病,便猜测是否只能检索到网上能找到的一模一样的图片?于是上传了一张自己在科网上发布过的照片,但并没检索到科网上的照片,最不靠谱的是检索结果说猜测该图片是工笔画。看来,即便网上已经有的一模一样的图片,从图形检索中也未必能检索到。 可见,目前的图像检索的精确度还不能令人满意,想要通过图像检索获取相关信息大多数情况下难以达到目的,检索信息的准确度还是通过文字更好一些。而类似的问题,最靠谱的或许还是通过咨询来获得答案更靠谱。所以,最后我也还是在这里问一下科网的植物专家们:八重樱与日本晚樱到底是不是同一种花?下图的照片究竟是什么植物?
个人分类: 文献检索|5922 次阅读|19 个评论
初识图像检索技术
bruisefree 2011-10-21 22:06
Google 、百度、搜狗相继推出了识图搜索服务,能够以图片找图片,终于比基于文字的图片检索前进了一大步。以前一直认为在信息检索领域基于内容的图片检索大多数只停留在表面,直到这样的应用大量出现后才真正开始关注起基于内容的图片检索( CBR )。找了一些文章后发现, CBR 在十年前已经研究得很丰富了,相关的理论框架也比较完善。原来工业界总是会落后于学术界,科研还是工业技术的排头兵啊。大致总结一下吧,也加深自己对这方面的认识。主要内容参考了《图像检索技术综述》一文。 图像检索前的几个核心问题:( 1 )图像数据是非结构化的,为了建立颜色、形状、纹理等视觉内容的索引,需要构造相应的数据模型;( 2 )图像的内容往往受到主观因素的影响 , 与人的经验、知识、心理都有关系,如何准确全面地描述图片内容( MPEG-7 标准是 MPEG 专家组制定的一个多媒体内容描述方案);( 3 )如何做到从图像物理内容到信息内容的映射。根据建立索引的方式和索引的内容不同 , 可以把图像索引分为 3 类 : 基于注释的索引、基于特征的索引和基于知识的索引。 A )基于注释的图像检索。图像注释就是描述图像内容的文本信息,分为语句注释和关键字注释。这种模式出现较高,尤其是在关系数据库出现后,是一种主要的模式。这一阶段的数据模型主要是元数据模型,例如 DC 、 RDF 。这种方式简单,实现起来比较容易,但是多采用手工完成,局限是⑴注释图像的工作量太大 ; ⑵由于人的认知主观性,造成了注释结果的模糊性,尤其是海量数据的出现,这一方式可行性受到一定的影响。 B) 基于特征的图像检索。图像中包含信息内容和视觉内容等内容,可用于特征索引的视觉内容包括颜色、形状、纹理等。( 1 )基于颜色特征的检索,采用的主要方法是颜色直方图,具体有直方图相交法、累计直方图等;( 2 )基于纹理特征的检索,纹理对图像灰度变化的特征进行量化 , 与对象的位置、走向、大小、形状有关 , 与平均灰度级无关,纹理分为随机纹理和模式纹理。随机纹理用统计性质表征 , 如灰度级的标准偏差或自相关宽度 ; 而模式纹理可通过抽取某些度量进行进一步表征。主要方法有共生矩阵、小波变换(这种似乎在工业界用得多);( 3 )基于形状特征的检索。形状的表示方法有两类 : 基于边界的表示和基于区域的表示 . 这两种表示方法的典型代表分别是傅里叶描述子和不变矩。这个过程中很重要的过程是图像分割。 C )基于知识的图像检索。建立视觉内容和信息内容之间的映射 , 这个过程称为图像解释或图像理解。人类在理解世界时用到很多经验和知识 , 因此在图像解释中也可以借用知识提高解释的可靠性和效率,对知识的利用是通过建立领域知识的逻辑模型实现的。在图像检索过程中用到的知识可以分为两类:事实性知识和规则性知识。事实性知识是描述性的 , 如描述图像语义的关键字;利用知识检索图像的方法是建立一个规则库或知识库。而对图像知识进行形式化表示的常用方法包括语义网络、谓词逻辑、框架等。
个人分类: 图像检索|5372 次阅读|0 个评论
对技术层面降低犯罪率的一点思考
longtao312 2010-5-15 11:44
犯罪是一个大家所深恶痛绝但又不能根除的社会问题。每年,世界各国的新闻报道中犯罪问题占有不小的比例。如何才能有效降低犯罪率是一个值得深入探讨的现实问题。随着计算机以及图像处理等科学技术的发展,在技术层面上降低犯罪率可能成为现实。 Google 和百度收索引擎给大家带来了很大的便利,那么收索引擎技术是否也可以用于刑侦或打击犯罪呢?答案是肯定的。我宿舍有两个同学是学通信的,不时地给我灌输一点图像检索知识,如基于纹理的图像检索。我们图像检索已经具备一定能力。如果在全国(甚至全球)范围内建立一个公民图像库,具体包括指纹库、肖像库等,每个图像对于每一个公民的具体身份信息,即根据图像就可以确定是谁。当有犯罪分子作案时留下了视频或者指纹资料,我们就可以先将视频转换成图像,然后在已建立的图像库中按图像将的关联性进行图像检索,就像在 Google 和百度上检索信息一样。公民图像库和个人信息进行实时更新,像身份证一样,可以在办理身份证时采集或更新信息。这样一旦掌握了图像资料就可以很方便地检索出犯罪分子至少可以缩小嫌疑犯人数,这对快速侦破犯罪案件将大有裨益。此外,图像库的建立工作在全国范围内展开后,大家也都知道如果自己犯罪将会很容易被逮捕,这样对可能犯罪但并未实施的人将起到长期的威慑作用,从而也可以达到在技术层面上降低犯罪率的目的。
个人分类: 未分类|4408 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-31 05:51

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部