章成志 分享 http://blog.sciencenet.cn/u/timy 宠辱不惊闲看庭前花开花落,去留无意漫观天外云展云舒

博文

搜索引擎与社会科学研究

已有 4829 次阅读 2008-11-18 10:17 |个人分类:研究方法|系统分类:科研笔记|关键词:学者| 搜索引擎, 社会科学, 天网搜索

        2008年11月15~16日在清华大学召开了第四届全国信息检索与内容安全学术会议。本来想pt(旁听)两天的,但由于周日(11月16日)要赶回南京备课,所以只听了11月15号的报告。大会的三个主题报告分别是:北京大学李晓明教授的“天网搜索、天网大全、天网荟萃——从几个实例看引入时间维后的新空间”、中科院计算所白硕研究员的“搜索技术业态分析与展望”以及阿里巴巴总架构师王坚博士的“Internet as infrastructure for data-intensive computing"。

       个人感觉,第一个报告是相对富有启发性的报告,并且理论结合实践。也许学术会议需要产业界的参与,因为有些研究本身就是应用驱动型的,另外,更重要的是很多大公司会提供会议赞助,嘿嘿。

        摘记第一个报告的一些要点如下:    

       1.  引入时间维度后的新空间。李晓明教授将传统的互联网信息引入时间维度后,由此带来一系列的应用问题(如事件报道,历史搜索,人物追踪等),并衍生一系列需要研究的问题(如信息类型问题、时间确认问题,网页消重问题等),这个过程可以概括为“信息空间”->“应用空间”->“研究空间”。

        2. 搜索引擎与社会科学研究。基于天网大全(http://www.infomall.cn/,以前叫“中国Web信息博物馆”),可以进行事件跟踪报道、进行历史事件搜索,网络舆情检测,这些工具可以给社会科学研究者提供很好的研究素材和大量数据。
(博主注:好像几年前,李晓明教授就在一些会议上,提出将搜索引擎和社会科学研究结合起来的设想。按他的原话“物理,化学等学科都有基本的仪器,那么社会科学也应该有自己的基本研究工具”。社会科学研究者,在利用历史文献、数据时,借助于搜索引擎可以提高工作效率。利用搜索引擎对用户行为进行分析,本身就涉及到信息科学、新闻传播学、社会学、心理学等多学科交叉问题)。

        3. 若干需要解决的技术问题。主要包括:网页类型的识别、网页发布时间的确定、网页版本数的控制、相似文档检测、人物跟踪报道中的若干关键技术等。李晓明教授演示了,在地图上展示关于一个运动员的舆论变化情况。

         从天网荟萃截几个关于“姚明演示图如下:

 









https://m.sciencenet.cn/blog-36782-47249.html

上一篇:“下一代”图书馆目录(Next Generation Library Catalogs)[zz]
下一篇:美国最聪明的青年科学家与互联网

2 刘耀 金镇

发表评论 评论 (3 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-28 17:31

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部