魔幻空间:教而不研则浅,研而不教则空。分享 http://blog.sciencenet.cn/u/njumagic 个人网页:http://cs.nju.edu.cn/szx/

博文

从信息检索到信息交互

已有 6311 次阅读 2009-2-8 16:49 |个人分类:学术动向|系统分类:科普集锦|关键词:学者| 信息检索, 信息空间, 信息交互, 信息空间, 信息交互

信息检索成为研究热点。在40年的系统研究和发展后,经常被忽视的是,技术和全球信息经济的发展使信息检索成为全球信息空间(cyberinfrastrucure)的一个重要部分,并成为最优秀的研究者关注的热点。新的公司如Google、亚马逊(Amazon)、eBay和巨型机构如IBM、微软已经建立了信息检索的研究开发组。在许多方面,信息检索的研究已经处于稳定水平,直到WWW的发展,为信息检索技术的研究注入了新的活力,使得信息检索技术成为支撑全球市场的电子信息交互的关键技术。本文认为,信息检索的研究重点已经发生变化,一种新的信息交互策略已经产生。这种观点包括两个方面,第一,通过对现在的信息环境和信息检索研究的趋势的观察,来考虑信息检索研究的变化。第二,通过一些例子来说明信息检索作为一种交互的过程,需要激发人的注意力和精神努力。
1.  信息对象与人
信息检索作为一个科学研究领域,可以分成多个组成部分,我们重点关注对我们的技术很重要的部分。信息检索一直关注的重点是信息对象以及创建、发现和使用这些对象的人。然而,因为人是比较难以预测的,也难以控制,所以信息检索研究主要关注信息对象。传统的信息对象主要是文档(document)和查询,研究主要集中在两个问题上:对象的表示和对象间关系的定义。对象的描述一直是哲学、信息科学[9]、人工智能的典型问题。信息检索研究者已经提出了许多有效的表示文档和查询的方法,包括语言的表示(如词汇集)和基于词频(term-occurrence)、相关性的估计以及超链图等大量的数学表示。信息检索研究主要关注于等同性和相似关系(对象间的相似程度),并开发了大量的匹配算法,应用于现在的检索系统。图1是一个传统信息检索问题的示意图。
图1表示,来自各自对象空间的文档和查询对象的样本都表示为一定的形式,通常使用相同的表示方法。例如,在早期的商业检索系统中,一种简单的方法是把文档和查询表示为词汇集中的一些项(terms),并简单的匹配其相交性。一种更加通俗的方法是通过把文档和查询都表示为一些项集在文档中出现的频率的向量,并根据余弦相似性排序,返回按照相似性排列的检索结果。当文档和查询表示为不同的形式的时候,就必须加入翻译、转化或者中间语言。这种以内容为中心的策略已经推动了创造性的工作,并开发出有效的检索系统。然而,同时提高查准率和查全率的研究似乎已经达到了稳定状态,进展缓慢。
电子信息环境中发生的两种重要的改变,拓宽了研究计划(schema),并刺激了新的信息检索类型的研究和发展。这两种改变主要是出现了新的类型和属性的信息对象,以及对信息检索过程人的参与的进一步关注。信息检索研究者已经开始意识到这些改变,体现在信息检索研究战略小组提出的信息检索所面临的两个重大的研究、发展方向[1]:全球信息访问(global information access) 和上下文信息检索(contextual retrieval)。全球信息访问是指通过与自动化的系统(这个系统对覆盖了世界范围内任何语言的结构化和非结构化的数据)进行自然、有效的交互,来满足人们的信息需求。上下文信息检索是指把搜索技术和查询知识以及用户的上下文关系结合起来,形成一个简单的框架,提供最合适的答案,满足用户的信息需要。
信息检索感兴趣的信息对象范围已经扩大,性质也发生了改变(qualitatively morphed)。一方面,信息检索感兴趣的对象范围已经扩大,不仅仅局限于文本,还包括统计数据、科学数据集和序列、图像、声音、视频、动画和其他多媒体。许多情况下,这些类型的对象可以使用同样的检索策略。另外,新的对象类型已经出现,如可执行的数据模块、交互协议和窗体、智能agent和程序,每种对象都有新类型的特征,这些特征可能对检索至关重要。比新的对象类型更重要的是,所有的对象变得更加动态化,更少的静态,并依赖于信息检索目的。例如,一个动态的blog是一个不断变化的对象,它的表示形式也同样不停的更新。这种改变来源于新对象的能力,和包含这些对象的外界环境的新能力。其实,电子对象更多的设计在于展示行为——根据外界环境的改变而变化。超文本是典型的例子,托付(recommender)系统是更新的例子,而环境敏感的传感器—程序装置是近来的趋势。另外,全球信息空间(the global retrieval system)存储和使用上下文信息的趋势是利用更加复杂的信息对象的内在行为。?例如,一个检索系统可能不仅表示了网页内容,而且不断的更新存取时间和引用页面。另外,系统可能增量的存储详细的在线事务的状态轨迹,甚至是用户端的鼠标移动和点击等动作。对象获取历史、注释、链接的信息,这些信息可以影响检索和使用。重要的是,这些信息同样应用于查询对象和文档对象。例如,在9.11前、后查询关于世贸中心的资料的不同。
信息对象这些自然的改变为信息检索提供了挑战和机遇。信息检索的研究已经在许多战线上接受这些挑战,例如,TREC的发展轨迹。明显的,所有各种新的特征类型已经开始用于对象表示。同时,对象上下文信息将对对象的表示和对象间的关系的发现起到巨大的帮助。最重要的是有机会发现对象的新的类型的特征和新的对象间关系,这些对象间关系对检索结果有重要影响。超链接和引用是由对象创建者建立的文字上(literal)的关系,这些关系已经在页面的排序和路由算法中用于表示对象。直接(explicit)的关系是指由第三方定义的对象和观点(opinion)间的关系,可以用于将相同的观点聚类。隐含的关系是根据行为(即人和对象交互的动作轨迹)建立的,这些隐含的关系对检索的目的也有重要的影响。电子对象有许多自然的特征,电子对象间有更多的关系,这些与检索目的有关。目前,信息检索的最激动人心的事情是有许多新的领域去开发,甚至初学者都可以获得重要发现。
信息的这种基本的改变将使信息检索领域出现大量的可选的表示方法和匹配算法。第二个趋势是需要一种新的信息检索策略。这种趋势越来越多的考虑了使用信息检索系统的人。尽管信息检索研究中已经存在用声音表示人的研究(如主观相关性的提倡者Saracevic[17],Schamber[18]和Harter[7]。关注于检索的认知过程的有Belkin[2],Ingwersen[10]和Marchionini[12]),信息检索研究者更加努力的把人和检索的问题联系起来。这种表示被成熟的应用于我们的信息检索方法中,我们希望扩展我们的问题定义以包括大量的facets,这些facets因为聚焦于信息检索问题的内容facets而被长期搁置。?
图2描述了一种不同的解决检索问题的策略,而不是图1中展示的典型匹配策略。这里的信息样本被表示为一片云,而不是一个固定的数据库,因为它是动态的。图中,重点在表示的变化和动作,而不是匹配问题。索引是多样的、动态的。典型的表示信息对象的技术仍然有用,但可能被用户控制和选择而不是固定在系统中的。然而,相似性关系可以由信息搜索者根据其需要和能力而灵活的决定。因而,问题从系统优化匹配转变为让信息搜索者参与整个检索过程并做选择。在这种以用户为中心的策略中,人具有职责和能力。指望在google中使用两个词的查询请求来获得需要的所有信息是懒惰的、天真的,人必须通过别的方法来达到信息搜索的目的。一种挑战是当处理复杂的单调的任务,特别是在检索任务需要大量的行为时,人往往是懒惰的、天真的。我们解决这个问题的方法是,设想信息检索是人与信息源不断交互的生命过程,正如我们的身体通过和环境高度协调的过滤和选择作用被连接到环境中一样。在这种策略中,至关重要的系统设计挑战变成了对灵活的吸引人的表示方法、交互方式的控制机制的研究。值得注意的是,结合原来的查询/结果模式的一些新的交互方式已经普遍存在。
信息检索研究使用户体验各种方法。研究者们一直努力的提供一种自动的、用户可以控制的查询表示[14],可以从用户相关反馈中获益的系统[15][16],并努力的提供用户帮助[13]。除了用户产生的元数据,研究者在寻找利用用户行为和有意识的注解来为对象增加额外的元数据、特征的方法。有些研究已经利用文件(profile)来为用户建模,这些文件是由用户明确(explicitly)的完成或根据用户行为来动态生成的。近来,关注于利用明确的和自动获得的用户行为来建立(recommender)系统的研究[11]。这些努力推动了信念挖掘的研究,信念挖掘产生新的推断关系,这些关系可以作为检索的特征。其他的努力在于为用户提供一些帮助[5],典型的例子是获取尽量完整交互历史[3]。其他的方法在于保存长时期的人机交互状态(网络存档文件保存网页的状态,并考虑保持所有与特定资源的长时期的交互的信息—这是许多电话公司需要做的日常事务)。其他目的在于创造一个统一的环境,使用数据挖掘规则和当时(contemporaneous)行为进行上下文信息的获取[4]。有的研究在于建立预想的信息系统,该系统可以很好的运行在可选的分发系统上,对上下文和用户的文件产生重要作用。?所有的这些努力将丰富以人为中心的信息检索策略,并推动该领域对信息搜索进行更完整的考虑。我认为,最大的进步在于将人类的能力积极的包含到信息检索过程。到目前为止,许多研究者关注于至关重要的人机交互机制,这是这种策略的关键。
2.  高度交互性的界面
直接操作的思想已经由Shneiderman[20]引入到界面设计,并被一些研究者应用于信息检索的界面设计。Shneiderman 和他的同事把直接操作技术用于检索环境,称为动态查询系统[19]。这个高度交互性界面的关键是使用户和不断更新的视觉信息进行交互,并允许动作的撤销。对于动态的查询,结果表示和鼠标、键盘动作有紧密的关系。其他的研究者也为数据库和信息的检索建立高度交互的环境。典型的有PARC小组的系统。关于信息检索界面的综述可以参考Hearst[8]的文章。我们关于信息交互界面的工作的两个例子如下。
3.1 数字视频检索
       作为我们开发的一个开放源码的数字视频数据库的一部分,我们已经建立并系统的评价了一系列的表示视频内容的视觉表示。这些表示方式包括基于主键的情节串连图板(storyboard)和幻灯片,快进,摘要等。这些表示是用户可选择的观察方法,可以通过文本查询或者选择等交互来选择文集中的部分内容。图3展示了一个开放的视频框架。?可以通过简单的鼠标动作来改变视图。用户可以根据需要,选择某种表示方式,并快速的获取具有不同的视觉和文本重点提示的结果集。点击一个片断的按钮(surrogate),会生成一个完整的元数据记录,以及视频的内容的三种不同的预览: 7秒的摘要、情节串连图板和快进。点击一个按钮,立即在预览画板上显示预览,而不打开新的窗口或者改变用户的上下文信息。文本元数据同时显示。检索策略允许用户快速的移动不同层次粒度的视频,不同的粒度具有不同的表示方式,强调不同的视频特征,目的在于让用户观看视频,理解特定视频的全部上下文信息,以决定是否值得下载。实际系统也考虑了其他因素,如下载的人数、基于应用的相似性,和各种标准的目录索引、适当的超链接。系统同时支持文本查询,目的不是代替有用的功能,而是扩大系统的功能,由信息搜索者决定搜索策略。
       我们认为这个计划最重要的是系统的设计是基于一个交互的框架,对象表示以经验为主的,并有广泛的用户测试。这种系统开发的原则和方法来源于人机交互(HCI)和信息检索领域的评价机制。用户反馈和开放式视频数据库的应用从理论和开发的角度证明了这种经验评估的有效性。?
3.2 与网页数据库的交互
       另外一个例子是一个高度交互性的界面Relation Browser++,该界面使查询和结果无缝结合(http://idl.ils.unc.edu/rave)。目的是给用户展示一个完整的信息空间,并允许用户与各个基于属性集的不同信息集交互。图5-7显示了在美国能源信息管理网站上的一系列检测,数据库中有超过10000个网页的描述。这些网页已经根据他们的相关性被分为四个主要类别:燃料类型、地区、部门(sector)和处理(process),每个种类都有一些属性值。屏幕显示了页面的数量和每个属性值在文集(corpus)中的相对长度。这些页面可以利用文集(facet)中或文集间的若干个属性值来建立索引。当用户移动鼠标在一个属性值上时,页面的数量和其属性值随之被更新。这允许用户探究各个方面(facets)的关系。单击一个属性值将分割数据库,使其只包括符合情况的网页。浏览、鼠标移动是连续的、动态的,用户也可以单击搜索按钮以获得检索结果。图5中,用户可以单击属性值“天然气”和搜索按钮。可以看到有2916个页面是和天然气相关的,其中128个与燃料有关,576个与商业部门有关,403个与进出口有关。单击后,按钮变成“重新开始”,结果展现在相同的窗口中。这是交互界面的重要成分——保持用户的上下文信息以使交互流不被丢失。新的窗口显示将被避免直到出现转变点(until discrete transition points)。在RB++中,所有的浏览和搜索动作在相同的窗口中发生,并更新优化以避免认知中断。新的窗口只当用户单击某个记录并跳转到另外一个网页的时候使用。搜索按钮左边的是结果数量,利用类似于SQL的查询表示生成的结果出现在窗口的下面。
       这样,用户可以不断的浏览、在结果中执行一系列的搜索,得到一个特定的网页,或从头开始。图6展示了一个例子,当用户简单的移动鼠标到与住宅有关的属性值。所有的属性值数量和bar立刻更新,得到902个网页与天然气和住宅相关,540个网页和住宅的天然气相关。此外,搜索结果的数目也被更新,以表示902个结果是可用的。每个鼠标移动的过程实际上是一个新的查询。用户可以通过鼠标或在任何三个结果集之一中输入文本检索请求,不断的缩小结果的范围。字符串检索立刻返回匹配结果,并突出显示。图7显示了用文本“house”检索的结果,从2916个天然气页面中得到50个结果。
       关系浏览器(Relation Browser++)是第三个版本,这个界面包括浏览和搜索数据库中的网页内容的功能。最新的版本是用一个java applet连接到MySQL数据库。Relation browser ++及其以前版本已经应用于许多应用,界面facet的数量和属性值的数量都比较小。该界面用于大约几万条记录的中型数据库。我们已经使用了大概300万条的交互日志记录,但把元数据传到客户端的applet的速度是非常慢的。对于大型的数据库,如WWW的搜索,Relation Browser+ 更适合于与一部分搜索结果集或一个种类的页面交互。我们现有的工作目标在于开发一些自动的方法来寻找更好的facet,显示数据库中合适的页面。第一个问题是种类的发现问题,第二个问题是文本的分类问题。我们已经研究了聚类方法,使用一些常用的启发性[6]的统计研究方法。
3.  结论

      这里的例子用于说明使用户在信息检索中不被中断(连续的)的一些初步的研究。视频搜索和网页数据库浏览的例子目的在于利用信息检索研究的成果,使机器在人的控制下做得更好,并具有识别模式、利用各种关系进行推断的能力。通过这种方法,在检索的同时,信息被创建。用户通过行为、理解和反映等来获取用户想要的信息,而不只是通过查询请求的陈述。因而,信息交互的观念比信息检索更能体现人的活跃角色,以及电子环境中信息对象的动态性质。

(李曼舞编译)



https://m.sciencenet.cn/blog-39479-213626.html

上一篇:人机交互中的计算机视觉技术
下一篇:非受限人机交互概念与技术

1 邹晓辉

发表评论 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-19 13:46

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部