章成志 分享 http://blog.sciencenet.cn/u/timy 宠辱不惊闲看庭前花开花落,去留无意漫观天外云展云舒

博文

简记:参加2009北京大学情报学与信息管理论坛

已有 4542 次阅读 2009-5-9 20:36 |个人分类:研究方法|系统分类:科研笔记|关键词:学者| 情报学, 信息管理, 学术论坛, 首席科学家

     今天上午起了个早,乘所里班车赶到北大国关楼秋林报告厅,参加2009年度的情报学与信息管理论坛(以后每年都会有这个论坛,并且图书馆学也有另外专门的论坛)。参加论坛的基本上是在京的高校和研究所师生,论坛的主题发言人包括政府、企业、高校和科研院所的代表。会上遇到很多老朋友和一些熟悉的面孔,能看出很多人是非常珍惜这次宝贵的交流和学习机会的。相比以前,现在我们这个学科的相关会议也越来越多了。希望以后每年都能有更大规模或更大范围的相关会议举行。

      由于整个论坛只有一天(上午是5个主题报告,下午是4个分会论坛),安排时间很紧凑,以至于每个大会主题报告只有一个提问机会。相对来说,Baidu首席科学家William Chang博士的报告提问者较多,但也是只有一个提问机会。通常来说,除非讲真正意义上的学术成果,一般公司基本上都无非介绍一些公司理念、新产品宣传性的演讲。但这次William Chang博士在最后还是补充了一些PPT以外的东西,但说的一笔带过。我很认同他的两个PPT以外的观点(以下是我个人理解,不是他本人原话,仅供参考):

      1. 无论是中文,还是英文,都面临“词语切分”问题,英文中,有时候真正有意义的单元是复合词。(博主注:不过,中文不分词造成的损失,显然比英文不进行复合词识别造成的损失要大的多,因此,同样一个任务,面临不同对象,机会成本也不一样。)

      2. WWW时代很多应用需要的不是传统的分类体系,而是多个细分的维度。(博主注:从我们学科来看,可以理解为分面(facet),就比如对汽车的评价,不是通过传统的分类体系来做评价的,而是通过一些更细分的维度对汽车从不同的角度进行分类评价。关于产品维度的自动生成,这个已有很多公司已经在研究了,MSRA,阿里巴巴以前都介绍过相关的工作。目前面临的一个共同问题是,如何高效的自动选择这些“分面”?)



https://m.sciencenet.cn/blog-36782-230892.html

上一篇:关于一词多译
下一篇:“搜索行为与用户认知研究”北京研讨会即将举办

5 赵星 刘耀 周春雷 魏瑞斌 吴怡

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-29 09:08

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部