科学网—标签 - 信息检索

terahertz 2020-8-25 16:06

（本文发表于《图书馆杂志》2020年第8期P57-65）摘要：为提高数字图书馆的资源整合以及对图像的分析能力，介绍了一种基于内容的图像检索方法，该方法基于特征包（Bag of features）方法，提取图像的SURF特征作为视觉单词，之后运用建立视觉字典，通过直方图表示图像特征，最终实现图像的检索，实践表明该系统具有良好的运算效率以及检索精度，并且充分考虑到图像的光照、透视、图像尺寸大小等因素，可以促进与改进图书馆的工作流程，也可以根据工作需求进行对应的技术改进，适合在数字图书馆进行进一步推广。关键词：数字图书馆；图像检索；特征包；SURF 链接：基于特征包的数字图书馆图像检索系统框架设计及实证研究 http://www.libraryjournal.com.cn/CN/Y2020/V39/I8/57

个人分类: 发表论文|2228 次阅读|0 个评论

信息素养类精品课程小辑

libseeker 2020-6-13 08:16

图谋按：信息素养教育是高等学校培养高素质、创新型人才的必要环节，信息素养能力是当代大学生的必备基本能力，能够促进问题解决、知识创新和终身学习等能力的形成。按照信息获取与利用的一般逻辑流程，信息素养教育内容包括信息意识的培养、信息源的认知与选取、信息的查询与获取、信息的管理与利用、信息的伦理与安全等5个方面，每个方面的具体内容则充分体现新环境下信息素养的特征和新的发展需要。关于信息素养类课程有许多，本文辑录影响较为广泛且便于在线学习的精品课程。国家精品课程《信息检索》 https://www.icourse163.org/course/WHU-29001 信息是一种重要的资源、机遇和资本，也是智慧的源泉。信息素养是信息时代每个人的必备素养。《信息检索》MOOC课程旨在培养学员的信息素养，即增强其信息意识、培养其在最短的时间内找到最相关的信息的能力，提高其利用信息检索解决生活、学习、工作与研究各方面问题的能力。本课程为素质教育课程，是一门实用性、操作性很强的课程。以通俗易懂的语言、由易到难，通过大量生动有趣的案例和电影片段等视频素材，展现信息检索在衣食住行、提高综合素质、提高学习与工作效率、提升研究水平、撰写论文、申报科研项目以及提高企业竞争力等方面的益处与具体应用，讲授网络信息检索的基本方法、常用搜索引擎与自动翻译等工具的使用技巧、利用信息检索解决实际问题的流程。力图最大限度地提高学员的信息素养和灵活运用信息解决各种问题的能力。本课程适用对象：所有的网民，具备基本的计算机操作和上网技能。鉴于MOOC的学员来源广泛、知识起点各异，本课程涉及的绝大部分信息资源都是可以免费使用的，对内容难度较大的Web of Science数据库的考核不作要求。面对日益纷繁复杂的网络信息，你是否感觉检索和获取信息有些力不从心？《信息检索》课程从实际操作出发，讲授如何精准、快捷地获取你想要的资源，培养信息素养，使你能够从容面对信息爆炸的挑战。无论是生活、学习、工作还是科研，你都能从本课程中找到对应的信息检索的工具与方法，从而终身受益。—— 课程团队主讲教师简介：黄如花，武汉大学信息管理学院副院长、教授、博士生导师，2002年获得武汉大学管理学博士学位。美国加州大学伯克利分校、匹兹堡大学访问学者。2007年入选“教育部新世纪优秀人才计划”。主要社会兼职有：联合国教科文组织（UNESCO）“全民信息计划”（Information for All Programme，IFAP）咨询专家、国际期刊《国际信息与图书馆述评》（International Information and Library Review，IILR）同行评审专家、国际知识组织协会（International Society of Knowledge Organization，ISKO）会员、中国图书馆学会图书馆学教育与培训专业委员会副主任、中国图书馆学会编译出版委员会图书馆学文献编译出版专业委员会副主任、湖北省图书馆学会副会长。主讲的“信息检索”类课程分别于2010、2013和2014被评为国家级精品课程、国家精品资源共享课程和“全国大学素质教育优秀通选课”；主编的《信息检索》入选教育部“十二五”规划教材。主讲武汉大学信息管理学院图书馆学系本科生课程“信息检索”、全校本科生通识教育课“网络信息检索”、全校工程硕士必修课“信息检索”、图书馆学硕士研究生课程“信息检索进展”和博士研究生课程“信息检索前沿”。学习幕课（可以通过手机APP端学习）：信息检索 https://www.xuexi.cn/014cccedea5f5f3649173a174153f334/9b0f04ec6509904be734f5f609a3604a.html 信息是一种重要的资源、机遇和资本，也是智慧的源泉。信息素养是信息时代每个人的必备素养。《信息检索》MOOC课程旨在培养学员的信息素养，即增强其信息意识、培养其在最短的时间内找到最相关的信息的能力，提高其利用信息检索解决生活、学习、工作与研究各方面问题的能力。本课程为素质教育课程，是一门实用性、操作性很强的课程。以通俗易懂的语言、由易到难，通过大量生动有趣的案例和电影片段等视频素材，展现信息检索在衣食住行、提高综合素质、提高学习与工作效率、提升研究水平、撰写论文、申报科研项目以及提高企业竞争力等方面的益处与具体应用，讲授网络信息检索的基本方法、常用搜索引擎与自动翻译等工具的使用技巧、利用信息检索解决实际问题的流程。力图最大限度地提高学员的信息素养和灵活运用信息解决各种问题的能力。本课程适用对象：所有的网民，具备基本的计算机操作和上网技能。鉴于MOOC的学员来源广泛、知识起点各异，本课程涉及的绝大部分信息资源都是可以免费使用的，对内容难度较大的Web of Science数据库的考核不作要求。课程大纲第一周绪论 1.1 课程回顾与展望 1.2 什么是信息检索：电影《搜索》为你揭晓 1.3 信息检索：世界电影共同关心的主题 1.4 讨论请谈谈你对《信息检索》这门课程的认识与感受。第二周如何利用信息检索提高生活质量 2.1 帮你省钱 2.2 防止上当受骗 2.3 时尚大师为你支招 2.4 为你的健康保驾护航 2.5 畅行万里路 2.6 讨论第二周作业第三周如何利用信息检索提高综合素质 3.1 免费读万卷书 3.2 解放你的眼睛 3.3 足不出户上国内名牌大学 3.4 零距离接触全球优秀教师 3.5 手把手教你学计算机 3.6 讨论第三周作业第四周如何利用信息检索提升研究效率第四周 4.1 站在巨人的肩膀上 4.2 最新信息自动送上门 4.3 瞬间抓住外文论文大意 4.4 特定类型文件的检索 4.5 不用手抄的读书笔记 4.6 多人同时撰写论文 4.7 随时随地获取你的资料 4.8 讨论第五周信息检索的基本方法第五周 5.1 布尔逻辑检索 5.2 位置限制检索 5.3 短语检索（精确检索） 5.4 截词检索 5.5 字段限制检索 5.6 区分大小写检索 5.7 多种检索方法的综合运用 5.8 讨论第六周搜索引擎的利用第六周测验 6.1 搜索引擎的工作原理 6.2 搜索引擎的类型 6.3 综合型搜索引擎 6.4 中文学术搜索引擎 6.5 英文学术搜索引擎 6.6 讨论第七周 Web of Science让你站在世界科学研究的前沿 7.1 WOS的重要性 7.2 WOS的特点 7.3 WOS的基本检索 7.4 WOS作者检索 7.5 WOS被引参考文献检索 7.6 WOS的化学结构检索 7.7 WOS的高级检索 7.8 WOS检索结果的排序 7.9 WOS检索结果的分析功能 7.10 WOS的个性化服务 7.11 WOS的其他功能 7.12 讨论第八周免费检索各类专门信息第八周测验 8.1 专利信息的检索 8.2 商标信息检索 8.3 学位论文的检索 8.4 会议论文和会议信息的检索 8.5讨论第九周利用信息检索解决实际问题的流程第九周测验 9.1 分析检索问题 9.2 选择合适的检索工具 9.3 抽取关键词 9.4 构造检索式 9.5 筛选检索结果 9.6 调整检索策略 9.7 求助专家 9.8讨论第十周信息检索拓展你的课堂第十周测验 10.1 检索某一概念的定义 10.2 检索课堂教学的相关材料 10.3 多媒体素材为教学增色 10.4 免费请专家为您授课 10.5 管理自己的教学素材 10.6 讨论 10.7 讨论2 第十一周信息检索在论文写作和项目申报中的应用第十一周 11.5 研究内容的设计 11.6 研究素材的收集 11.7 引用的规范 11.8 讨论 11.1 信息检索的主要应用领域 11.2 科技查新的重要性 11.3 科技查新中的文献检索 11.4 研究背景信息的检索第十二周信息检索助你在商战中立于不败之地 12.1 利用大数据进行市场分析 12.2 获取竞争情报 12.3 利用新媒体进行营销 12.4 企业预警 12.5 保护企业信息安全 12.6 访谈世界500强信息素养——学术研究的必修课 https://next.xuetangx.com/course/THU12051000419/1515624 开课机构：清华大学。本课程将助你提高信息素养，在多彩的信息海洋中精准捕获、享用高质量信息，在学术之道上不断创新、健步前行。 “信息素养——学术研究的必修课”是一门让学习者终身受益的关于方法与技能的课程，无论你处于哪个年龄段，无论你拥有何种专业背景。课程开篇会有人与你聊聊他对信息素养的认识，聊过之后你可以顺便测一测自己的信息素养水平，包括在很大程度上决定你信息素养水平的信息检索与利用的能力。如果你希望继续学习，接下来的内容包括： ① 文献信息检索的基础知识； ② 信息检索的误区和常见问题； ③ 从检索案例出发，探讨信息源的利用、检索方法与技巧； ④ 利用参考工具检索各类数据与事实； ⑤ 享用一切可以利用的网络信息资源； ⑥ 认识学术交流模式，学习学术规范； ⑦ 做好知识与文献管理，利用现代技术与工具提高工作效率。主讲教师简介：林佳，研究馆员。北京大学理学学士，中国科学院理学硕士，美国匹兹堡大学访问学者。从事信息素养教育、信息参考咨询、馆际互借与文献传递、数字图书馆建设等工作。主讲本科生课程《文献检索与利用》、研究生课程《文献检索与专题应用》及工程硕士课程《文献检索与论文写作》。主编/参编教材《化学及相关学科信息源——信息检索、分析与管理》、教育部十二五规划教材《信息检索》、面向21世纪课程教材《信息资源共享》。学习幕课（可以通过手机APP端学习）：信息素养——学术研究的必修课 https://www.xuexi.cn/d62ab6ead1a8f34b46f0a2ae450881ba/9b0f04ec6509904be734f5f609a3604a.html “信息素养——学术研究的必修课”是一门让学习者终身受益的关于方法与技能的课程，无论你处于哪个年龄段，无论你拥有何种专业背景。课程开篇会有人与你聊聊他对信息素养的认识，聊过之后你可以顺便测一测自己的信息素养水平，包括在很大程度上决定你信息素养水平的信息检索与利用的能力。如果你希望继续学习，接下来的内容包括： ① 文献信息检索的基础知识；② 信息检索的误区和常见问题；③ 从检索案例出发，探讨信息源的利用、检索方法与技巧；④ 利用参考工具检索各类数据与事实；⑤ 享用一切可以利用的网络信息资源；⑥ 认识学术交流模式，学习学术规范； ⑦ 做好知识与文献管理，利用现代技术与工具提高工作效率。课程章节: Week-1 信息素养与学术研究 1.1 认识信息素养 1.2 信息素养是学术素养的重要组成部分 1.3 测一测你的信息素养 1.4 是时候提高你的信息素养了 Week-2 庖丁解牛——认识文献信息检索 2.1文献信息的分类 2.2认识文献数据库与检索系统 2.3 做研究，一定要使用文献数据库吗 2.4 如何避免文献调研中的常见错误 Week-3 拨开云雾见月明——查找文献的方法（1） 3.1 文献从何找起 3.2.1 查找课题图书的3个途径 3.2.2 关于馆藏目录 3.2.3 馆藏目录的使用 3.2.4 关于电子图书 3.2.5 电子图书的使用 Week-4 拨开云雾见月明——查找文献的方法（2） 3.3.1 查找国内学术论文的主要途径 3.3.2 顺藤摸瓜找论文 3.3.3 城市改造中的旧城区问题 3.3.4 霉菌与甲醛的相互作用 3.3.5 片段信息及其他 3.3.6 屠呦呦教授的期刊论文 3.3.7 查找中文学术论文的其他途径 Week-5 拨开云雾见月明——查找文献的方法（3） 3.4.1 文摘数据库全文数据库 3.4.2 关于Web of Science核心合集 3.4.3 碳纳米管力学性能的综述性论文 3.4.4 植物捕获PM2.5的机制和其影响因素 3.4.5 检索结果的深度挖掘与自动追踪 3.4.6 概论全文数据库 3.4.7 核心期刊和高水平国际会议 Week-6 拨开云雾见月明——查找文献的方法（4） 3.5.1 文献调研的常见误区与基本原则 3.5.2 你不能放弃检索多种类型文献 3.5.3 图书馆的资源发现系统 3.5.4 获得全文与文献阅读 Week-7 你应该掌握的数据与事实检索（1） 4.1 我们需要数据与事实的检索 4.2 认识概念、了解定义、读懂术语/缩略语 4.3 掌握事实 4.4 查找性能指标、理化常数和器件参数等 Week-8 你应该掌握的数据与事实检索（2） 4.5 检索标准文献 4.6 查阅法律文件与司法案例/裁判文书 4.7 获取统计数据 4.8 查找人物传记 Week-9 开放获取资源与搜索引擎 5.1 信息访问的权限 5.2 开放获取资源 5.3 一般搜索引擎 5.4 学术搜索引擎：简介 5.5 学术搜索引擎：实例 5.6 科学评价与合理使用网络资源 Week-10 学术交流与学术规范 6.0 引言 6.1 学术信息交流模式 6.2 出版，还是出局 6.3 学术期刊与同行评审 6.4 选择交流平台——投稿 6.5 学术规范 6.6 常见的参考文献引用格式 Week-11 你的知识需要管理，你的工具需要换代（1） 7.1 引子 7.2.1 有效管理个人文献信息——概述 7.2.2 建立个人文献数据库 7.2.3 向数据库中添加记录 7.2.4 编辑/整理记录，添加附件与笔记，记录的导入/导出与共享 7.2.5 利用个人文献数据库 7.2.6 更多使用方法与更多管理内容 Week-12 你的知识需要管理，你的工具需要换代（2） 7.3.1 邮箱订阅（Email Alerts） 7.3.2 RSS订阅 7.4 利用云笔记随时记录、收集、分享信息 7.5 使用思维导图整理大脑中发散性的信息 7.6 通过文本分析和可视化软件创建知识图谱国家精品课程《信息素养通识教程：数字化生存的必修课》 https://www.icourse163.org/course/SYSU-1001936003 信息素养通识教程”是专为你量身定制的慕课，以好学的方法、好记的高招和好用的工具，助你轻松解决在日常的生活、学习和工作中遇到的各种获取信息的难题，快速学会各类信息获取技能，有效提升信息素养。学会检索方法，受益无穷；提升信息素养，生活、学习、工作不迷茫。—— 课程团队主讲教师简介：潘燕桃博士现任中山大学资讯管理学院教授、博士生与硕士生导师，兼任中国图书馆学会第九届理事会学术研究委员会副主任，曾任教育部高等学校图书馆学学科教学指导委员会委员、广东图书馆学会学术研究委员会副主任委员和理事；英国伦敦大学学院信息研究学系、美国加州大学伯克利校区信息系统与信息管理学院、美国威斯康星大学麦迪逊校区图书馆学信息学研究院访问学者。主要研究方向包括信息素养及其教育、信息组织与信息检索、信息资源管理、图书馆学与信息学教育等。主讲信息素养通识教程、信息素养与信息检索通用教程、信息获取与利用、信息资源共享、图书馆学研究方法论、图书情报基础与研究方法、信息资源共享研究等课程。迄今已出版学术著作与专业教材12部，发表学术论文50余篇，主持和参加国家级、省市级科研项目20余项，获得各级教学和科研奖励近20项。开设的“信息素养通识教程：数字化时代生存的必修课”慕课于2019年1月入选“2018年国家精品在线开放课程”。课程大纲第 1 周叮咚！课程打卡 1.1 学什么？ 1.2 有亮点！ 1.3 有何用？ 1.4 谁来教？ 1.5 测试一下你在信息社会的生存能力第 2 周知识储备：信息检索不可不知的五大概念 2.1 信息 2.2 数据 2.3 知识 2.4 信息资源 2.5 信息检索第 3 周技能装备：提升检索效率的方法和技术 3.1 搜索信息的三大思维误区 3.2 消除误区的检索三原则 3.3 搞定检索的五步骤 3.4 拓宽思路的五种常用检索方法 3.5 值得掌握的三大高级检索技术第 4 周检索实战：新手须知的工具与途径 4.1 7 分钟全面了解检索工具的类型 4.2 搜索引擎的 3 个使用技巧 4.3 5 种给力的网络检索工具 4.4 3 分钟了解 7 类 APP 内置搜索 4.5 撬开移动搜索的大门，你准备好了吗？ 4.6 掌握这 8 招助你成为检索大神第 5 周休闲当下：生活场景下的信息检索 5.1 为好友挑选一件生日礼物 5.2 挡不住的美食诱惑 5.3 丰富你的休闲生活 5.4 来一次说走就走的旅行第 6 周新生入学：学习场景下的信息检索（一） 6.1 只需 6 分钟，助你融入学习环境 6.2 迈进专业第一步，你需要了解这些信息 6.3 关注这几点，带你玩转图书馆 6.4 巧用这些工具与途径，专业学习 so easy 第 7 周老生常学：学习场景下的信息检索（二） 7.1 如何利用图书馆完成作业？ 7.2 百科知识学习？这里看招！第 8 周毕业升学：学习场景下的信息检索（三） 8.1 检索学术信息资源，你可以这么做 8.2 学术论文写作，有哪些注意事项？ 8.3 怎样查找考研资料？ 8.4 怎样查找留学信息？第 9 周初入职场：工作场景下的信息检索（一） 9.1 如何找实习找工作？ 9.2 如何了解行业信息？第 10 周掌握先机：工作场景下的信息检索（二） 10.1 做年终报表时，怎么获取统计信息？ 10.2 推广产品时，怎么查找市场信息？第 11 周创业路上：工作场景下的信息检索（三） 11.1 立项前怎么查找专利信息？ 11.2 研发新产品时怎么查找标准信息？ 11.3 注册商标时怎么查找商标信息？第 12 周防微杜渐：个人信息管理和保护 12.1 如何管理个人信息？ 12.2 如何保护个人信息？ 12.3 个人信息管理常用工具第 13 周信息素养：信息社会个人能力的新标配 13.1 信息意识 —— 人未觉而我先觉 13.2 信息伦理 —— 人未知而我先知 13.3 信息能力 —— 人未能而我先能 13.4 信息素养 —— 人未达而我先达第 14 周数字时代：拓展个人能力圈的五大素养 14.1 数字素养 14.2 计算机素养 14.3 网络素养 14.4 数据素养 14.5 图书馆素养第 15 周生存指南：如何适应信息社会？ 15.1 我们生活在怎样的社会？ 15.2 我们面临着怎样的挑战？ 15.3 我们该如何适应？延伸阅读: 信息检索(第三版) 黄如花武汉大学出版社 9787307205895 http://product.dangdang.com/1553167096.html 本书系统阐述了信息检索的基本概念、原理、历史、流程、模型，信息检索系统的构成与评价、搜索引擎的工作原理与种类，较全面地介绍了重要的中英文搜索引擎、国内外统合性信息检索系统、国外专业性信息检索系统的检索方法，提出了信息资源评价的主体与标准，分析了信息检索与利用中的费用与知识产权问题，介绍了重要的参考文献管理软件、自动翻译工具和自动问答系统，讨论了信息检索的重要应用——科技查新的流程与策略。作者简介:黄如花，女，1968年生，教授，博士。现任武汉大学信息管理学院副院长、博士研究生导师。兼任《中国图书馆分类法》编委会第七届委员会委员、中国图书馆学会标引与编目专业委员会委员、湖北省图书馆学会学术委员会委员，武汉大学数字图书馆研究所副所长、武汉大学信息资源研究中心兼职研究员和武汉大学中国科学评价研究中心研究员。

个人分类: 圕人堂|4908 次阅读|1 个评论

螺旋波等离子体研究现状调研报告

YUNJU 2019-12-9 04:31

螺旋波等离子体研究现状调研报告一、调研总结：概括介绍自己对这个领域现状、前景、主要方向、主要团队的一个认识（半页到一页纸即可）螺旋波是在径向约束的磁化等离子体中传播的右旋极化波，最早于 1960 s 被人们发现。 Klozenberg 是 19世纪60年代早期研究螺旋波的理论家，对螺旋波做了较完整的论述( Klozenberg ,1965)。在 Klozenberg 的螺旋波理论基础上，后来许多学者继续做了大量工作，其中一位做出较大贡献的学者是英国的 Boswell 。 1970年 Boswell 用一种新型天线 (现在称为 Boswell 天线 )做了一个小型放电装置实现了螺旋波放电，获得电子密度高达10 -12 cm -3 、完全电离的等离子体（ Boswell ,1970）。 Boswell 还通过螺旋波等离子体源实验发现了放电模式转化现象，随着功率不断增大，发生了容性耦合射频放电模式（ E Mode ）向感性耦合射频放电模式（ H Mode ）跳变、感性耦合射频放电模式向螺旋波放电模式（ W Mode ）跳变的现象（ Boswell ,1996）。很多学者对高电离效率的物理机制这一研究热点进行了探究， Chen （ Chen ,1985）提出螺旋波是通过朗道阻尼加热电子的， S hoji （ S hoji ,19 91 ）等人对朗道阻尼理论进行了实验论证。 Chen 还通过实验证明了右旋极化天线优于左旋极化和平面极化天线（ Chen ,19 95 ）。后来 Arnush 等人发现，在低约束磁场下除了朗道阻尼的方式还存在 TG 模式（ Trivelpiece – Gould mode ）加热电子的方式。至今关于螺旋波等离子体源的物理机制还没有完全弄清楚，仍有很多学者通过多种方法研究和论证螺旋波等离子源电离效率高、右旋极化天线优于左旋极化天线、低场峰效应等问题背后的物理机制。国内对螺旋波等离子体源的起步较晚，成果相对较少。 1999 年，房同珍较详细的地综述了国外的研究进展，并通过实验得出螺旋波放电的密度跳跃现象是是由天线耦合的某种不确定导致的，此后逐渐有更多的学者开始研究螺旋波。姜帆等对以氢等离子体为工质的螺旋波放电过程中的由密度跳跃引起的放电模式转换现象进行了深入研究，并从 Nagoya type Ⅲ型天线电场耦合作用和电子与氢分子的相互作用两方面解释了密度跳跃现象；李波等人进行了 VASIMA 中螺旋波等离子体源的简明设计和初步试验；北京印刷学院的陈强团队进行了螺旋波等离子体源的特性研究和低场峰效应的相关研究；北京航天航空大学、国防科技大学等高校对螺旋波等离子体源做了相关的数值模拟研究 ;西安航天动力研究所孙斌等人进行了 4KW 的螺旋波等离子源诊断试验研究。总体来说，虽然没有取得重大理论突破，国内学者短短 10 几年在螺旋波等离子体源领域还是取得了不错的成绩。现在螺旋波等离子体源在材料处理和已经成为一个活跃的领域，在空间推进、薄膜沉积、亚纳米电路制造等领域得到关注和应用，已经发表了超过 2700篇论文。20世纪90年代呈现在美国、日本、澳大利亚等国家兴起大规模的研究浪潮，发表该领域论文的主要期刊有 Plasma of Physic 、 Plasma Sources Science Technology 等，该领域主要的贡献者是 Boswell 、 Scimeetal 、 Shinohara 、 Chen 和 Shamrai 等人，此外，世界各地许多国家的许多研究人员和团体也为深入了解螺旋波等离子体源做出了努力。二、信息收集与调研 1. 明确写下自己的调研的方向和调研目的，以及 1 - 2 句话解释为什么想了解这个主题本次调研的目的是想了解螺旋波等离子体领域的研究现状，快速搜集该领域的游泳信息，了解领域内的大牛作者实验室，找到领域的核心论文和期刊及主要研究方向，用于指导以后的文献阅读和科研。 2. 写下自己检索所使用的关键词说明：关键词可以通过三种方法确定。一是通过网页搜索了解，二是通过 cnki . net 、百科等完整的提示，三是利用 endnote 等做关键词分析。本次调研的关键词是： helicon 、螺旋波等离子体 3. 了解该方向相关基础知识、新闻报道和最新动向，重要网页建议收藏到为知笔记等软件中，以便进一步整理说明：通过网页搜索（谷歌、百度， bing ）；新闻报道（谷歌新闻，百度新闻）；微信文章（ sogou . com ）等 3.1 所查询到的相关网页 5 个 ( 列出标题和网址，并用一句话对内容进行评述 ) Helicon ( physics )– Wikipedia —— 螺旋波是在磁场存在下存在于有界等离子体中的一种低频电磁波。 https :// en . wikipedia . org / wiki / Helicon _( physics ) Numerical Investigation of Power Deposition and Transport Phenomena in Helicon Plasma Sources ——开发了一种由两个软件组成的工具，分别研究电波传播和等离子体传输，分别是 ADAMANT 和 COMSOLMultiphysics ® 的 Plasma 模块。 https :// cn . comsol . com / paper / numerical - investigation - of - power - deposition - and - transport - phenomena - in - helicon - p - 36331 螺旋波等离子体推进研究进展 —— 螺旋波等离子体推力器是一种新概念磁等离子体推进装置 ,以其电离率高、无电极烧蚀、寿命长、比冲高等优点受到国内外学者的广泛关注,该新型推力器在未来长寿命深空探测器和卫星的动力系统中具有广阔的应用前景。 http :// mall . cnki . net / magazine / Article / TJJS201106020 . htm 基于 FHN模型的螺旋波模拟Matlab程序，非常难得 – MATLAB中文论坛 https://www.ilovematlab.cn/thread-37994-1-1.html Plasma Diagnostics of a High Power Helicon Source ——试验结果表明：离子密度在放电管中心区较高，沿径向逐渐降低 http :// www . tjjs . casic . cn / tjjs / ch / reader / view _ abstract . aspx ? file _ no = 20190327 flag = 1 3.2 列出国内外重要相关新闻报道 5 条（ KW ： helicon plasma ） 39 天到达火星？ VASIMR 发动机技术说可以 _网易订阅 http :// dy . 163 . com / v2 / article / detail / ECIO0V5J05119RIN . html Helicon Radiofrequency Plasma Thrusters / ACT / ESA —— ACT 正在研究两种不同的等离子推进器概念，即 RF Helicon 推力器（实验和建模研究）和 Helicon 离子回旋加速器共振推力器（建模和初步设计研究）。 http :// www . esa . int / gsp / ACT / projects / helicon . html 启动更长的太空任务 - ScienceDaily https :// www . sciencedaily . com / releases / 2019 / 08 / 190820130936 . htm 螺旋等离子推进器性能下降的机理 https :// phys . org / news / 2015 - 05 - degradation - mechanism - helicon - plasma - thruster . html 螺旋波等离子体推进器中双层形成的 PIC 模拟 http :// www . opticsjournal . net / Articles / Abstract ? aid = OJ151130001209rXu1w4 3.3 列出 5 篇微信公众号文章我与博士面对面系列活动之螺旋波等离子体源实验特性研究 https :// mp . weixin . qq . com / s ? src = 11 timestamp = 1575803148 ver = 2022 signature = hsA0IiPKr0HyrwttB7YI0YtQ1X1hJy - 7mGjpIUNuinilcamhvaa1 - W8b3mJ - hzwCcOQXc9ih37bX9gvlGC3fGD3Qn5Tam1NJvX6eVM * 8S6zYvPQVTkPA0e0ui86BLZNn new = 1 iDncXGH * FIc7EqkzI2 new = 1 等离子推进器 -- 面向深空探索的次世代发动机（上） https :// mp . weixin . qq . com / s ?__ biz = MzUyNzg 0 OTQ 2 NA == mid =2247484143 idx =1 sn =9 e 6587 b 796 dbdf 6 d 6 d 37 ab 3 f 5085 a 499 chksm = fa 780078 cd 0 f 896 e 8111 bd 14151 ef 6 c 82 e 193 dc 8 db 62 f 98447 b 63283198 f 5 fe 518 e 737350 a 3 b scene =21# wechat _ redirect 等离子推进器 --面向深空探索的次世代发动机（中） https :// mp . weixin . qq . com / s ? src = 11 timestamp = 1575803148 ver = 2022 signature = C9w4 - Bj0wC4lCFoJkeRJQs01iUGUwJurlGgDnEbDE1eEUFpqkcSe4cWJj937aaEzdIlmOh4a2fWRyZiJLUwjb3OG6yXCnRyFk0nKlT9XauGOEWFatvpLtVzwh7L8VaWx new = 1 前沿技术中的射频等离子体 https :// mp . weixin . qq . com / s ? src = 3 timestamp = 1575803902 ver = 1 signature = XCRKy5Gy4X3AJr9SB3ubAtS4yzbLSv97ejPMZe - HNAyIdzxOzeLZWKSblT8o5qGPmRStRUd2PxRMSjGcsUwOuKYecUKVhQ5DkpeG * 6sXctTP1GF8biYANB5p9IZ0VD54CBxtCiF * ru * Rs1RzbIFZqQ == 黑科技：疯狂工程离子发动机，到底有多疯狂？ https :// mp . weixin . qq . com / s ? src = 3 timestamp = 1575804426 ver = 1 signature = 9rqIbZBm9luZu3TUhHMb - xIeXQm7RbPc53aeShK1pRZyNpzG5XtM3bI9nggaSA2wLhzkEdxfLF70BJa1Ie337iGZWfYrKkhDZcifM4bStAJe7uJkWEDx9gMRXiJPU * 15IUySnC1iOrwmt0Mbg5UXaHSTMTf2vVw1OSbPn4UZdpM = 3.4 列出相关的 5 张图片（如果有密切相关的话） 3.5 列出 3 - 5 个相关视频（如果有请列出） https :// v . qq . com / x / page / c13092dzagk . html https :// v . youku . com / v _ show / id _ XODQ1NjQ0ODQw . html ? spm = a2h0k . 11417342 . soresults . dposter https :// v . youku . com / v _ show / id _ XMzc4MTMxOTc2NA ==. html ? spm = a2h0k . 11417342 . soresults . dposter https :// vdse . bdstatic . com //308 b 0 b 88 e 2726 f 1 bc 031708 d 12 a 0 db 72. mp 4? authorization = bce - auth - v 1/40 f 207 e 648424 f 47 b 2 e 3 dfbb 1014 b 1 a 5/2019-11-30 T 18:20:24 Z /-1/ host / d 9 ee 8 b 9 eaa 661718 e 2 e 002 ad 4 edfa 6 f 07127 c 7 fddb 5 e 4 c 357 c 37337 c 42 f 4 cc 3 c 3.6 列出 3 - 5 本相关书籍（如果有请列出）帕斯卡 ·夏伯特等著 . 射频等离子体物理学 . 科学出版社 , 20 18 . 迈克尔 A ·力伯曼，阿伦 J ·里登伯格．等离子体放电原理与材料处理［ M ］．蒲以康译．北京 : 科学出版社， 2007 等离子体物理学，李定等，高等教育出版社， 2006 年版 . 4. 发展趋势进行分析（利用数据库完成）说明：可以在数据库中检索，然后利用数据库 ( web of science 或者 scopus ，如果没有相关数据库权限，可以使用谷歌学术、百度学术等 ) 的分析功能得到结果，可以截图放在作业中。如果论文数量太多（如 10 万 +），建议优化关键词。 4 . 1 该领域的文章随年度变化的情况 4 . 2 该领域研究国家的分布情况 4 . 3 发表该领域论文的主要期刊有哪些 5. 从 WOS 下载相关文献，并利用 histcite 进行分析说明：如果文献数量太多，建议先按被引次数排序，下载前 1000 篇进行分析，并把重要的前 30 - 50 篇文献（ LCS 最高的）输出至 endnote 中。需提供 hiscite 和 endnote 截图。图 1 图 2 图 3 6.了解该方向有哪些大牛，以及他们的主要研究方向说明： l 数据库中检索后，分析作者的产出，通常文章数最多的几位，应该也是该领域影响力较大的作者 l 检索会议，特邀报告人（ keynote speaker ）一般都是该领域公认的大牛。搜索会议的方法，国内的用：关键词 + 研讨会或大会或论坛；国际会议可以使用：关键词 + conference symposium seminar workshop 等 l 可以访问大牛的实验室网站，进一步了解他们的研究动向 l 直接搜索某个作者相关的网页或新闻，有时候也能了解到他的动向要求 6 . 1 查找专业会议、列出相关会议和特邀报告人 3 人以上 3rd Asia - Pacific Conference on Plasma Physics ( AAPPS - DPP2019 ) keynote s peaker ： BOSWELL RW , SHINOHARA S , Richard Sydra 6 . 2 列出 3 - 5 位大牛科学家实验室网站（根据数据库分析结果，或者大会 keynote speaker 报告人） 1 、 UCLA ' s Low Temperature Plasma Technology Laboratory ~ CHEN FF http :// www . seas . ucla . edu / ltptl / 2 、 Professor Rod Boswell | ECI https :// energy . anu . edu . au / about - us / participants / rod - boswell 3 、篠原研究室のホームページ ~ Sinohara http :// web . tuat . ac . jp /~ sinohara / index . html 3 . 3 列出 2 - 5 位你欣赏的专家和团队 CHEN FF Arnush , D . BOSWELL RW SHINOHARA S 7.了解该方向的研究前沿说明：通常比较宏观的热门领域，国家会发布相应的申请指南；学术会议的探讨主题，会议通常能够紧跟时代热点；前面检索新闻中，也可以了解到最新的研究热点和动向 7 . 1 列出国家发布的科研课题申请指南（ 1 - 5 项），列出其中自己感兴趣的研究方向 1、国家磁约束核聚变能发展研究专项 2018 年度项目申报指南 —— 氘氚聚变等离子体中 alpha 粒子过程对等离子体约束性能影响的理论模拟研究 2、 “科技冬奥”重点专项2020年度定向项目申报指南——“氢能出行”关键技术研发和应用示范 3、 “主动健康和老龄化科技应对”重点专项2020年度项目申报指南（征求意见稿）——膳食营养评估和干预技术研究 4、国家重点研发计划政府间国际科技创新合作 / 港澳台科技创新合作重点专项 2019 年度第二批项目申报指南——中国和芬兰政府间科技合作项目：能源互联网技术经济评价理论与评价方法 5、 “ 可再生能源与氢能技术 ” 重点专项2019年度项目申报指南—— 新结构太阳电池研究及测试平台（共性关键技术类） 7 . 2 列出一年内该领域资助的项目 ( 不少于 5 项，不足 5 项全部列出即可 ) http :// fund . sciencenet . cn / 1 、螺旋波等离子推进器中等离子体与波相互作用和输运过程的研究负责人：田滨申请单位：哈尔滨工业大学研究类型：青年科学基金项目项目批准号： 51907039 批准年度： 2019 金额： 25 . 00 万 2 、螺旋波放电的模式转换、羽流特性和相似性负责人：欧阳吉庭申请单位：北京理工大学研究类型：面上项目项目批准号： 11975047 批准年度： 2019 金额： 65 . 00 万 3 、 CFETR 螺旋波电流驱动数值模拟及螺旋波天线和等离子体耦合机制研究负责人：杨宇晴申请单位：江南大学研究类型：青年科学基金项目项目批准号： 11905084 批准年度： 2019 金额： 17 . 00 万 7 . 3 列出 5 个美国资助的项目（通过海研全球科研项目数据库进行查找） http :// www . hiresearch . cn / 1 、 Unraveling the Link Between Radio - frequency Wave Propagation and High Ionization Efficiency of Helicon Waves 项目来源： U . S . National Science Foundation 美国国家科学基金资助年度： 2019 资助金额： 131728 美元项目负责人： Oliver Schmitz 2 、 Advanced Simulations of Helicon Antennae and Sources 项目来源： Small Business Innovation Research ( SBIR )美国中小企业创新研究基金资助年度： 2018 资助金额： 1009133 美元项目负责人： Name : David Smithe 项目负责机构： TECH - X CORPORATION 3 、 Physics and Simulation of Helicon Plasma Sources 项目来源： U . S . National Science Foundation 美国国家科学基金来源类别： Standard Grant 资助年度： 1996 资助金额： 207300 美元项目负责人： John Scharer 项目负责机构： University of Wisconsin - Madison 4 、 Helicon Wave Studies 5 、 High Power Helicon Plasma Propulsion 7 . 4 搜索结题报告 5 个（列出网址，如果找不到 5 个仅列出部分即可）国家科技报告查询系统 https :// www . nstrs . cn 1 、发散磁场中螺旋波等离子体双电层加速机理研究详细信息 https :// www . nstrs . cn / xiangxiBG . aspx ? ts = id = 139846 flag = 1 2 、螺旋波等离子体特性及与材料相互作用基础研究详细信息 https :// www . nstrs . cn / xiangxiBG . aspx ? id = 113496 三、附件、 7 .1 manictime 过程记录（附上 manictime 的截图，必须） 7.4 manictime 的所有使用记录列表导出，贴在下方。 1. 选中作业期间的所有记录，右键单击， copy ，然后贴在文末即可（必须） Microsoft Office 专业增强版 2016 下午 6:07:12 下午 6:07:27 0:00:15 离开此网站？下午 6:07:27 下午 6:07:34 0:00:07 云炬导航 | 让搜索更高效！ - Google Chrome 下午 6:07:34 下午 6:07:40 0:00:06 Windows 资源管理器下午 6:07:40 下午 6:07:59 0:00:19 桌面整理 -文件搜索下午 6:07:59 下午 6:10:12 0:02:13 api 下午 6:10:12 下午 6:10:17 0:00:05 Windows Installer 下午 6:10:17 下午 6:10:30 0:00:13 Cortana (小娜) 下午 6:10:30 下午 6:10:53 0:00:23 Office 下午 6:10:53 下午 6:11:01 0:00:08 Cortana (小娜) 下午 6:11:01 下午 6:11:15 0:00:14 标红 -螺旋波等离子体源设计及VASIMR发动机的热力学分析.docx - Word 下午 6:11:15 下午 6:11:47 0:00:32 www.yunju.net + 科大云炬 +螺旋波电离过程仿真模拟的调研报告V1.docx - Word 下午 6:11:47 下午 6:12:02 0:00:15 另存为下午 6:12:02 下午 6:12:09 0:00:07 Microsoft Word 下午 6:12:09 下午 6:12:15 0:00:06 Word 下午 6:12:15 下午 6:12:21 0:00:06 另存为下午 6:12:21 下午 6:12:27 0:00:06 api 下午 6:12:27 下午 6:12:36 0:00:09 标红 -螺旋波等离子体源设计及VASIMR发动机的热力学分析.docx - Word 下午 6:12:36 下午 6:12:51 0:00:15 Windows 资源管理器下午 6:12:51 下午 6:12:57 0:00:06 标红 -螺旋波等离子体源设计及VASIMR发动机的热力学分析.docx - Word 下午 6:12:57 下午 6:13:10 0:00:13 Windows 资源管理器下午 6:13:10 下午 6:13:15 0:00:05 knight 下午 6:13:15 下午 6:13:32 0:00:17 QQ邮箱 - Google Chrome 下午 6:13:32 下午 6:13:57 0:00:25 QQ邮箱 - 搜索结果 - Google Chrome 下午 6:13:57 下午 6:14:11 0:00:14 QQ邮箱 - 附件夹 - Google Chrome 下午 6:14:11 下午 6:14:34 0:00:23 ManicTime - TRIAL 下午 6:14:34 下午 6:14:46 0:00:12 您要做什么工作下午 6:14:46 下午 6:14:52 0:00:06 ManicTime - TRIAL 下午 6:14:52 下午 6:15:12 0:00:20 您要做什么工作下午 6:15:12 下午 6:15:17 0:00:05 ManicTime - TRIAL 下午 6:15:17 下午 6:15:39 0:00:22 云炬导航 | 让搜索更高效！ - Google Chrome 下午 6:15:39 下午 6:16:03 0:00:24 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 6:16:03 下午 6:17:30 0:01:27 云炬导航 | 让搜索更高效！ - Google Chrome 下午 6:17:30 下午 6:17:37 0:00:07 https://www.google.com/search?q=helicon - Google Chrome 下午 6:17:37 下午 6:17:42 0:00:05 helicon - Google 搜索 - Google Chrome 下午 6:17:42 下午 6:18:05 0:00:23 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 6:18:05 下午 6:18:14 0:00:09 helicon - Google 搜索 - Google Chrome 下午 6:18:14 下午 6:18:19 0:00:05 helicon plasma - Google 搜索 - Google Chrome 下午 6:18:19 下午 6:18:47 0:00:28 A Helicon Plasma Source | SpringerLink - Google Chrome 下午 6:18:47 下午 6:18:58 0:00:11 云炬导航 | 让搜索更高效！ - Google Chrome 下午 6:18:58 下午 6:19:13 0:00:15 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 6:19:13 下午 6:19:47 0:00:34 无标题 - Google Chrome 下午 6:19:47 下午 6:19:52 0:00:05 螺旋波等离子体 _百度搜索 - Google Chrome 下午 6:19:52 下午 6:20:00 0:00:08 百度资讯搜索 _螺旋波等离子体 - Google Chrome 下午 6:20:00 下午 6:20:22 0:00:22 https://www.google.com/search?q=螺旋波等离子体 - Google Chrome 下午 6:20:22 下午 6:20:27 0:00:05 https://www.google.com/search?q=螺旋波等离子体newwindow=1source=lnmstbm=nwssa=Xved=2ahUKEwi3nPqD6qXmAhW1JaYKHZ-HDjgQ_AUoA3oECAwQBQ - Google Chrome 下午 6:20:27 下午 6:20:32 0:00:05 螺旋波等离子体 - Google 搜索 - Google Chrome 下午 6:20:32 下午 6:20:57 0:00:25 螺旋波等离子体 - Google 搜索 - Google Chrome 下午 6:20:57 下午 6:21:11 0:00:14 https://cn.bing.com/search?q=螺旋波等离子体 - Google Chrome 下午 6:21:11 下午 6:21:16 0:00:05 螺旋波等离子体 - 国际版 Bing - Google Chrome 下午 6:21:16 下午 6:21:24 0:00:08 螺旋波等离子体 - 国内版 Bing - Google Chrome 下午 6:21:24 下午 6:21:31 0:00:07 螺旋波激发等离子体源装置 - 百度文库 - Google Chrome 下午 6:21:31 下午 6:22:14 0:00:43 无标题 - Google Chrome 下午 6:22:14 下午 6:22:19 0:00:05 螺旋波等离子体推进研究进展 -《推进技术》2011年06期-中国知网 - Google Chrome 下午 6:22:19 下午 6:22:52 0:00:33 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 6:22:52 下午 6:23:50 0:00:58 螺旋波等离子体推进研究进展 -《推进技术》2011年06期-中国知网 - Google Chrome 下午 6:23:50 下午 6:24:16 0:00:26 任务切换下午 6:24:16 下午 6:24:21 0:00:05 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 6:24:21 下午 6:24:51 0:00:30 螺旋波等离子体推进研究进展 -《推进技术》2011年06期-中国知网 - Google Chrome 下午 6:24:51 下午 6:24:56 0:00:05 螺旋波等离子体 - 国内版 Bing - Google Chrome 下午 6:24:56 下午 6:25:02 0:00:06 螺旋波等离子体能量耦合的研究进展 - 论文- 百度文库 - Google Chrome 下午 6:25:02 下午 6:26:07 0:01:05 螺旋波等离子体 - 国内版 Bing - Google Chrome 下午 6:26:07 下午 6:26:16 0:00:09 螺旋波等离子体放电三维直接数值模拟 _物理论文_笔耕文化传播 - Google Chrome 下午 6:26:16 下午 6:26:36 0:00:20 螺旋波等离子体 - 国内版 Bing - Google Chrome 下午 6:26:36 下午 6:26:46 0:00:10 高密度螺旋波等离子体源的应用进展 - Google Chrome 下午 6:26:46 下午 6:26:56 0:00:10 螺旋波等离子体 - 国内版 Bing - Google Chrome 下午 6:26:56 下午 6:27:18 0:00:22 https://wenku.baidu.com/view/5c750a0916fc700abb68fc5e.html - Google Chrome 下午 6:27:18 下午 6:27:26 0:00:08 螺旋波诱导氢等离子体的密度跳跃研究 - 论文- 百度文库 - Google Chrome 下午 6:27:26 下午 6:27:42 0:00:16 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 6:27:42 下午 6:27:52 0:00:10 螺旋波诱导氢等离子体的密度跳跃研究 - 论文- 百度文库 - Google Chrome 下午 6:27:52 下午 6:27:57 0:00:05 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 6:27:57 下午 6:28:18 0:00:21 桌面整理 -文件搜索下午 6:28:18 下午 6:29:00 0:00:42 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 6:29:00 下午 6:30:03 0:01:03 桌面整理 -文件搜索下午 6:30:03 下午 6:30:58 0:00:55 VASIMR 下午 6:30:58 下午 6:31:36 0:00:38 Word 下午 6:31:36 下午 6:31:42 0:00:06 Microsoft Office 2016 下午 6:31:42 下午 6:31:47 0:00:05 Microsoft Setup Bootstrapper 下午 6:31:47 下午 6:31:53 0:00:06 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 6:31:53 下午 6:32:11 0:00:18 打开下午 6:32:11 下午 6:32:32 0:00:21 bishe.doc - Word 下午 6:32:32 下午 6:32:39 0:00:07 Windows 资源管理器下午 6:32:39 下午 6:32:56 0:00:17 Word 下午 6:32:56 下午 6:33:08 0:00:12 bishe.doc - Word 下午 6:33:08 下午 6:34:25 0:01:17 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 6:34:25 下午 6:34:36 0:00:11 Microsoft Word 下午 6:34:36 下午 6:34:41 0:00:05 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 6:34:41 下午 6:35:16 0:00:35 bishe.doc - Word 下午 6:35:16 下午 6:35:37 0:00:21 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 6:35:37 下午 6:36:14 0:00:37 螺旋波诱导氢等离子体的密度跳跃研究 - 论文- 百度文库 - Google Chrome 下午 6:36:14 下午 6:36:32 0:00:18 螺旋波等离子体 - 国内版 Bing - Google Chrome 下午 6:36:32 下午 6:36:39 0:00:07 螺旋波等离子体 - 国内版 Bing - Google Chrome 下午 6:36:39 下午 6:36:54 0:00:15 高功率螺旋波等离子体诊断试验研究 -Plasma Diagnostics of a High Power Helicon Source - Google Chrome 下午 6:36:54 下午 6:37:11 0:00:17 bishe.doc - Word 下午 6:37:11 下午 6:37:20 0:00:09 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 6:37:20 下午 6:37:35 0:00:15 任务切换下午 6:37:35 下午 6:37:41 0:00:06 高功率螺旋波等离子体诊断试验研究 -Plasma Diagnostics of a High Power Helicon Source - Google Chrome 下午 6:37:41 下午 6:37:46 0:00:05 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 6:37:46 下午 6:38:07 0:00:21 高功率螺旋波等离子体诊断试验研究 -Plasma Diagnostics of a High Power Helicon Source - Google Chrome 下午 6:38:07 下午 6:39:09 0:01:02 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 6:39:09 下午 6:41:01 0:01:52 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 6:41:01 下午 6:41:41 0:00:40 https://www.esa.int/About_Us/Corporate_news - Google Chrome 下午 6:41:41 下午 6:41:52 0:00:11 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 6:41:52 下午 6:42:04 0:00:12 ESA - Corporate news - Google Chrome 下午 6:42:04 下午 6:42:26 0:00:22 云炬导航 | 让搜索更高效！ - Google Chrome 下午 6:42:26 下午 6:42:35 0:00:09 helicon - 国内版 Bing - Google Chrome 下午 6:42:35 下午 6:42:44 0:00:09 helicon plasma - 国内版 Bing - Google Chrome 下午 6:42:44 下午 6:43:07 0:00:23 Windows 资源管理器下午 6:43:07 下午 6:43:13 0:00:06 Helicon Radiofrequency Plasma Thrusters / ACT / ESA - Google Chrome 下午 6:43:13 下午 6:43:39 0:00:26 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 6:43:39 下午 6:43:48 0:00:09 helicon plasma - 国内版 Bing - Google Chrome 下午 6:43:48 下午 6:43:55 0:00:07 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 6:43:55 下午 6:44:23 0:00:28 正在翻译 … 下午 6:44:23 下午 6:44:32 0:00:09 Google Chrome 下午 6:44:32 下午 6:44:37 0:00:05 Helicon（物理学）-维基百科 - Google Chrome 下午 6:44:37 下午 6:45:04 0:00:27 Helicon (physics) - Wikipedia - Google Chrome 下午 6:45:04 下午 6:45:11 0:00:07 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 6:45:11 下午 6:45:32 0:00:21 Helicon Radiofrequency Plasma Thrusters / ACT / ESA - Google Chrome 下午 6:45:32 下午 6:45:48 0:00:16 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 6:45:48 下午 6:46:19 0:00:31 任务切换下午 6:46:19 下午 6:46:25 0:00:06 Helicon Radiofrequency Plasma Thrusters / ACT / ESA - Google Chrome 下午 6:46:25 下午 6:46:51 0:00:26 Helicon Radiofrequency Plasma Thrusters / ACT / ESA - Google Chrome 下午 6:46:51 下午 6:47:32 0:00:41 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 6:47:32 下午 6:48:14 0:00:42 helicon plasma - 国内版 Bing - Google Chrome 下午 6:48:14 下午 6:48:24 0:00:10 helicon plasma 新闻 - 国内版 Bing - Google Chrome 下午 6:48:24 下午 6:48:55 0:00:31 39天到达火星？VASIMR发动机技术说可以_网易订阅 - Google Chrome 下午 6:48:55 下午 6:49:32 0:00:37 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 6:49:32 下午 6:49:57 0:00:25 39天到达火星？VASIMR发动机技术说可以_网易订阅 - Google Chrome 下午 6:49:57 下午 6:50:12 0:00:15 helicon plasma 新闻 - 国内版 Bing - Google Chrome 下午 6:50:12 下午 6:50:22 0:00:10 helicon plasma 新闻 - 国内版 Bing - Google Chrome 下午 6:50:22 下午 6:50:56 0:00:34 Numerical Investigation of Power Deposition and Transport Phenomena in Helicon Plasma Sources - Google Chrome 下午 6:50:56 下午 6:51:20 0:00:24 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 6:51:20 下午 6:51:37 0:00:17 翻译此页？下午 6:51:37 下午 6:51:43 0:00:06 螺旋等离子体源中功率沉积和输运现象的数值研究 - Google Chrome 下午 6:51:43 下午 6:52:21 0:00:38 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 6:52:21 下午 6:52:48 0:00:27 Microsoft Word 下午 6:52:48 下午 6:52:53 0:00:05 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 6:52:53 下午 6:53:29 0:00:36 helicon plasma 新闻 - 国内版 Bing - Google Chrome 下午 6:53:29 下午 6:53:37 0:00:08 云炬导航 | 让搜索更高效！ - Google Chrome 下午 6:53:37 下午 6:53:53 0:00:16 螺旋波推进器 _百度搜索 - Google Chrome 下午 6:53:53 下午 6:54:02 0:00:09 百度资讯搜索 _螺旋波推进器 - Google Chrome 下午 6:54:02 下午 6:54:09 0:00:07 螺旋波推进器 _百度搜索 - Google Chrome 下午 6:54:09 下午 6:54:16 0:00:07 螺旋波推进器新闻 _百度搜索 - Google Chrome 下午 6:54:16 下午 6:54:23 0:00:07 螺旋波推进器今日头条 _百度搜索 - Google Chrome 下午 6:54:23 下午 6:54:32 0:00:09 helicon plasma 新闻 - 国内版 Bing - Google Chrome 下午 6:54:32 下午 6:54:39 0:00:07 helicon plasma 今日头条 - 国内版 Bing - Google Chrome 下午 6:54:39 下午 6:55:00 0:00:21 螺旋波推进器新闻 - 国内版 Bing - Google Chrome 下午 6:55:00 下午 6:55:13 0:00:13 螺旋波等离子体推进器新闻 - 国内版 Bing - Google Chrome 下午 6:55:13 下午 6:55:42 0:00:29 螺旋波等离子体推进器科学网 - 国内版 Bing - Google Chrome 下午 6:55:42 下午 6:55:58 0:00:16 螺旋波推进器今日头条 _百度搜索 - Google Chrome 下午 6:55:58 下午 6:56:10 0:00:12 科学网 —构建全球华人科学社区 - Google Chrome 下午 6:56:10 下午 6:56:21 0:00:11 螺旋波 _百度搜索 - Google Chrome 下午 6:56:21 下午 6:56:53 0:00:32 科学网 -啊哦，等离子体！-科学出版社的博文 - Google Chrome 下午 6:56:53 下午 6:57:37 0:00:44 螺旋波新闻 _百度搜索 - Google Chrome 下午 6:57:37 下午 6:57:54 0:00:17 螺旋波新闻 _百度搜索 - Google Chrome 下午 6:57:54 下午 6:58:11 0:00:17 螺旋波新闻 _百度搜索 - Google Chrome 下午 6:58:11 下午 6:58:24 0:00:13 螺旋波新闻 _百度搜索 - Google Chrome 下午 6:58:24 下午 6:58:30 0:00:06 螺旋波新闻 _百度搜索 - Google Chrome 下午 6:58:30 下午 6:58:36 0:00:06 螺旋波 _百度搜索 - Google Chrome 下午 6:58:36 下午 6:58:50 0:00:14 螺旋波等离子体 _百度搜索 - Google Chrome 下午 6:58:50 下午 6:59:06 0:00:16 螺旋波等离子体推进器 _百度搜索 - Google Chrome 下午 6:59:06 下午 6:59:19 0:00:13 螺旋波等离子体推进器科学网 - 国内版 Bing - Google Chrome 下午 6:59:19 下午 6:59:27 0:00:08 螺旋波等离子体推进器新闻资讯 - 国内版 Bing - Google Chrome 下午 6:59:27 下午 6:59:43 0:00:16 云炬导航 | 让搜索更高效！ - Google Chrome 下午 6:59:43 下午 7:00:14 0:00:31 https://www.google.com/search?q=helicon plasma 推进器 - Google Chrome 下午 7:00:14 下午 7:00:19 0:00:05 helicon plasma 推进器 - Google 搜索 - Google Chrome 下午 7:00:19 下午 7:00:29 0:00:10 helicon plasma 推进器 - Google 搜索 - Google Chrome 下午 7:00:29 下午 7:00:52 0:00:23 https://www.google.com/search?q=helicon+plasma+推进器newwindow=1biw=1511bih=695source=lnmssa=Xved=0ahUKEwj06JiJ86XmAhWpBKYKHesmC7EQ_AUICSgA - Google Chrome 下午 7:00:52 下午 7:00:58 0:00:06 helicon plasma 推进器 - Google 搜索 - Google Chrome 下午 7:00:58 下午 7:01:05 0:00:07 无标题 - Google Chrome 下午 7:01:05 下午 7:01:15 0:00:10 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 7:01:15 下午 7:01:29 0:00:14 helicon plasma 推进器 - Google 搜索 - Google Chrome 下午 7:01:29 下午 7:02:01 0:00:32 https://patents.google.com/patent/CN104405603A/ko - Google Chrome 下午 7:02:01 下午 7:02:09 0:00:08 Windows 资源管理器下午 7:02:09 下午 7:02:14 0:00:05 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 7:02:14 下午 7:02:35 0:00:21 CN104405603A - 螺旋波等离子体电推进装置 - Google Patents - Google Chrome 下午 7:02:35 下午 7:03:19 0:00:44 helicon plasma 推进器 - Google 搜索 - Google Chrome 下午 7:03:19 下午 7:03:26 0:00:07 www.hplpb.com.cn/CN/abstract/abstract10996.shtml - Google Chrome 下午 7:03:26 下午 7:03:33 0:00:07 螺旋波等离子体推进器中双层形成的 PIC模拟 - Google Chrome 下午 7:03:33 下午 7:03:46 0:00:13 helicon plasma 推进器 - Google 搜索 - Google Chrome 下午 7:03:46 下午 7:03:55 0:00:09 螺旋波等离子体推进器中双层形成的 PIC模拟—中国光学期刊网 - Google Chrome 下午 7:03:55 下午 7:04:01 0:00:06 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 7:04:01 下午 7:04:49 0:00:48 螺旋波等离子体推进器中双层形成的 PIC模拟—中国光学期刊网 - Google Chrome 下午 7:04:49 下午 7:04:54 0:00:05 无标题 - Google Chrome 下午 7:04:54 下午 7:04:59 0:00:05 helicon plasma 推进器 - 搜狗搜索 - Google Chrome 下午 7:04:59 下午 7:05:13 0:00:14 搜狗搜索 - Google Chrome 下午 7:05:13 下午 7:05:26 0:00:13 helicon plasma 推进器的相关微信公众号文章 – 搜狗微信搜索 - Google Chrome 下午 7:05:26 下午 7:05:49 0:00:23 螺旋波等离子体推进器的相关微信公众号文章 – 搜狗微信搜索 - Google Chrome 下午 7:05:49 下午 7:06:23 0:00:34 螺旋波等离子体推进器的相关微信公众号文章 – 搜狗微信搜索 - Google Chrome 下午 7:06:23 下午 7:06:29 0:00:06 螺旋波等离子体推进器的相关微信公众号文章 – 搜狗微信搜索 - Google Chrome 下午 7:06:29 下午 7:06:36 0:00:07 https://mp.weixin.qq.com/s?src=11×tamp=1575803148ver=2022signature=hsA0IiPKr0HyrwttB7YI0YtQ1X1hJy-7mGjpIUNuinilcamhvaa1-W8b3mJ-hzwCcOQXc9ih37bX9gvlGC3fGD3Qn5Tam1NJvX6eVM*8S6zYvPQVTkPA0e0ui86BLZNnnew=1 - Google Chrome 下午 7:06:36 下午 7:06:47 0:00:11 我与博士面对面系列活动之螺旋波等离子体源实验特性研究 - Google Chrome 下午 7:06:47 下午 7:07:39 0:00:52 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 7:07:39 下午 7:08:33 0:00:54 Windows 资源管理器下午 7:08:33 下午 7:08:42 0:00:09 螺旋波等离子体推进器的相关微信公众号文章 – 搜狗微信搜索 - Google Chrome 下午 7:08:42 下午 7:08:52 0:00:10 螺旋波等离子体推进器的相关微信公众号文章 – 搜狗微信搜索 - Google Chrome 下午 7:08:52 下午 7:09:02 0:00:10 https://weixin.sogou.com/link?url=dn9a_-gY295K0Rci_xozVXfdMkSQTLW6cwJThYulHEtVjXrGTiVgS0ZKpGtIQOm7DNrI9JvfyZmenF2URcekAlqXa8Fplpd96Eo7GUcQ8ieM0MAy7EwMBWQr7wn1dup93dPXdOIQIFQp8Ibbs2DxlmkbgDMbyoknA9Zo9eqiARoWQtRO8J73O5QpEeQX5Ds5bawlPIhZmr5gCde-lI79lh56dWjtJNRnhfW59epmN9QSBKBZoLjZSqH0K-1dpu8R7CvJdvmmj2LyPfCoem7FzA..type=2query=螺旋波等离子体推进器k=92h=E - Google Chrome 下午 7:09:02 下午 7:09:09 0:00:07 https://mp.weixin.qq.com/s?src=11×tamp=1575803148ver=2022signature=C9w4-Bj0wC4lCFoJkeRJQs01iUGUwJurlGgDnEbDE1eEUFpqkcSe4cWJj937aaEzdIlmOh4a2fWRyZiJLUwjb3OG6yXCnRyFk0nKlT9XauGOEWFatvpLtVzwh7L8VaWxnew=1 - Google Chrome 下午 7:09:09 下午 7:09:25 0:00:16 等离子推进器 --面向深空探索的次世代发动机（中） - Google Chrome 下午 7:09:25 下午 7:10:21 0:00:56 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 7:10:21 下午 7:10:48 0:00:27 等离子推进器 --面向深空探索的次世代发动机（中） - Google Chrome 下午 7:10:48 下午 7:10:56 0:00:08 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 7:10:56 下午 7:11:01 0:00:05 等离子推进器 --面向深空探索的次世代发动机（中） - Google Chrome 下午 7:11:01 下午 7:11:14 0:00:13 TIM 下午 7:11:14 下午 7:11:22 0:00:08 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 7:11:22 下午 7:11:28 0:00:06 等离子推进器 --面向深空探索的次世代发动机（中） - Google Chrome 下午 7:11:28 下午 7:12:07 0:00:39 另存为下午 7:12:07 下午 7:12:12 0:00:05 等离子推进器 --面向深空探索的次世代发动机（中） - Google Chrome 下午 7:12:12 下午 7:13:15 0:01:03 knight 下午 7:13:15 下午 7:13:26 0:00:11 等离子推进器 --面向深空探索的次世代发动机（中） - Google Chrome 下午 7:13:26 下午 7:13:50 0:00:24 任务切换下午 7:13:50 下午 7:14:08 0:00:18 Windows 资源管理器下午 7:14:08 下午 7:14:15 0:00:07 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 7:14:15 下午 7:14:22 0:00:07 knight 下午 7:14:22 下午 7:14:29 0:00:07 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 7:14:29 下午 7:14:45 0:00:16 等离子推进器 --面向深空探索的次世代发动机（中） - Google Chrome 下午 7:14:45 下午 7:15:01 0:00:16 TIM 下午 7:15:01 下午 7:15:18 0:00:17 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 7:15:18 下午 7:15:37 0:00:19 等离子推进器 --面向深空探索的次世代发动机（中） - Google Chrome 下午 7:15:37 下午 7:15:52 0:00:15 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 7:15:52 下午 7:16:04 0:00:12 插入图片下午 7:16:04 下午 7:16:11 0:00:07 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 7:16:11 下午 7:16:38 0:00:27 Microsoft Word 下午 7:16:38 下午 7:16:43 0:00:05 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 7:16:43 下午 7:16:50 0:00:07 等离子推进器 --面向深空探索的次世代发动机（中） - Google Chrome 下午 7:16:50 下午 7:17:03 0:00:13 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 7:17:03 下午 7:17:42 0:00:39 螺旋波等离子体推进器的相关微信公众号文章 – 搜狗微信搜索 - Google Chrome 下午 7:17:42 下午 7:18:10 0:00:28 搜狗搜索 - Google Chrome 下午 7:18:10 下午 7:18:23 0:00:13 无标题 - Google Chrome 下午 7:18:23 下午 7:18:29 0:00:06 https://mp.weixin.qq.com/s?src=3×tamp=1575803902ver=1signature=XCRKy5Gy4X3AJr9SB3ubAtS4yzbLSv97ejPMZe-HNAyIdzxOzeLZWKSblT8o5qGPmRStRUd2PxRMSjGcsUwOuKYecUKVhQ5DkpeG*6sXctTP1GF8biYANB5p9IZ0VD54CBxtCiF*ru*Rs1RzbIFZqQ== - Google Chrome 下午 7:18:29 下午 7:18:39 0:00:10 前沿技术中的射频等离子体 - Google Chrome 下午 7:18:39 下午 7:18:51 0:00:12 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 7:18:51 下午 7:19:00 0:00:09 螺旋波等离子体推进器的相关微信公众号文章 – 搜狗微信搜索 - Google Chrome 下午 7:19:00 下午 7:19:20 0:00:20 螺旋波等离子体推进器的相关微信公众号文章 – 搜狗微信搜索 - Google Chrome 下午 7:19:20 下午 7:19:41 0:00:21 第 205期泰山科技论坛—— 航空航天助推新动能人才教育服务新动能 - Google Chrome 下午 7:19:41 下午 7:19:57 0:00:16 螺旋波等离子体推进器的相关微信公众号文章 – 搜狗微信搜索 - Google Chrome 下午 7:19:57 下午 7:20:14 0:00:17 前沿技术中的射频等离子体 - Google Chrome 下午 7:20:14 下午 7:20:24 0:00:10 www.yunju.net + 科大云炬 +helicon.docx - Word (未响应) 下午 7:20:24 下午 7:20:30 0:00:06 bishe.doc - Word 下午 7:20:30 下午 7:20:36 0:00:06 任务切换下午 7:20:36 下午 7:20:48 0:00:12 等离子推进器 --面向深空探索的次世代发动机（中） - Google Chrome 下午 7:20:48 下午 7:20:57 0:00:09 https://mp.weixin.qq.com/s?__biz=MzUyNzg0OTQ2NA==mid=2247484143idx=1sn=9e6587b796dbdf6d6d37ab3f5085a499chksm=fa780078cd0f896e8111bd14151ef6c82e193dc8db62f98447b63283198f5fe518e737350a3bscene=21#wechat_redirect - Google Chrome 下午 7:20:57 下午 7:21:04 0:00:07 等离子推进器 --面向深空探索的次世代发动机（上） - Google Chrome 下午 7:21:04 下午 7:21:59 0:00:55 TIM 下午 7:21:59 下午 7:22:04 0:00:05 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 7:22:04 下午 7:22:39 0:00:35 等离子推进器 --面向深空探索的次世代发动机（上） - Google Chrome 下午 7:22:39 下午 7:22:47 0:00:08 前沿技术中的射频等离子体 - Google Chrome 下午 7:22:47 下午 7:22:53 0:00:06 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 7:22:53 下午 7:23:25 0:00:32 任务切换下午 7:23:25 下午 7:23:40 0:00:15 等离子推进器 --面向深空探索的次世代发动机（上） - Google Chrome 下午 7:23:40 下午 7:25:57 0:02:17 螺旋波等离子体推进器的相关微信公众号文章 – 搜狗微信搜索 - Google Chrome 下午 7:25:57 下午 7:26:12 0:00:15 VASIMR推进器的相关微信公众号文章 – 搜狗微信搜索 - Google Chrome 下午 7:26:12 下午 7:27:02 0:00:50 VASIMR HPT的相关微信公众号文章 – 搜狗微信搜索 - Google Chrome 下午 7:27:02 下午 7:27:09 0:00:07 https://weixin.sogou.com/link?url=dn9a_-gY295K0Rci_xozVXfdMkSQTLW6ft3wfAVofsP5Peu-UiA4DDnLVVG-blFmPs-X8HjQlAWVgrFeYQugDpDgKV6r21jz8jS-1L47etzpBFvUjjoflCdbXzK45UXlfuQ_XOKQLFP_GARQc_Ssk0aH6HkBHahWTRxSlpEa-Z0utJdKzy2bYyonBQvPD0tt1aqDU3J-SnutkqsLcmfOas7D9BQP78MtFE7-CwwwqGYBVCB1lgT2Tne0SxByV6NTTEdjVGySu524ffDIku1xb08R6Z_0AZXn476XF-0b31Zx5vfr0pi-HOVBH-62TLfniZqwg0yoRFw.type=2query=VASIMRk=37h=G - Google Chrome 下午 7:27:09 下午 7:27:14 0:00:05 https://mp.weixin.qq.com/s?src=3×tamp=1575804426ver=1signature=9rqIbZBm9luZu3TUhHMb-xIeXQm7RbPc53aeShK1pRZyNpzG5XtM3bI9nggaSA2wLhzkEdxfLF70BJa1Ie337iGZWfYrKkhDZcifM4bStAJe7uJkWEDx9gMRXiJPU*15IUySnC1iOrwmt0Mbg5UXaHSTMTf2vVw1OSbPn4UZdpM= - Google Chrome 下午 7:27:14 下午 7:27:21 0:00:07 黑科技：疯狂工程离子发动机，到底有多疯狂？ - Google Chrome 下午 7:27:21 下午 7:27:50 0:00:29 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 7:27:50 下午 7:28:04 0:00:14 云炬导航 | 让搜索更高效！ - Google Chrome 下午 7:28:04 下午 7:28:16 0:00:12 VASIMR的相关微信公众号文章 – 搜狗微信搜索 - Google Chrome 下午 7:28:16 下午 7:28:21 0:00:05 射频等离子体五行力学 - 搜狗搜索 - Google Chrome 下午 7:28:21 下午 7:28:31 0:00:10 黑科技：疯狂工程离子发动机，到底有多疯狂？ - Google Chrome 下午 7:28:31 下午 7:28:37 0:00:06 射频等离子体物理学 - 搜狗搜索 - Google Chrome 下午 7:28:37 下午 7:28:47 0:00:10 云炬导航 | 让搜索更高效！ - Google Chrome 下午 7:28:47 下午 7:29:06 0:00:19 黑科技：疯狂工程离子发动机，到底有多疯狂？ - Google Chrome 下午 7:29:06 下午 7:32:30 0:03:24 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 7:32:30 下午 7:32:46 0:00:16 黑科技：疯狂工程离子发动机，到底有多疯狂？ - Google Chrome 下午 7:32:46 下午 7:33:17 0:00:31 VASIMR的相关微信公众号文章 – 搜狗微信搜索 - Google Chrome 下午 7:33:17 下午 7:33:32 0:00:15 VASIMR-搜索页 - Google Chrome 下午 7:33:32 下午 7:33:48 0:00:16 VASIMR-搜索页 - Google Chrome 下午 7:33:48 下午 7:33:56 0:00:08 黑科技：疯狂工程离子发动机，到底有多疯狂？ - Google Chrome 下午 7:33:56 下午 7:34:12 0:00:16 VASIMR-搜索页 - Google Chrome 下午 7:34:12 下午 7:34:22 0:00:10 api 下午 7:34:22 下午 7:34:30 0:00:08 云炬导航 | 让搜索更高效！ - Google Chrome 下午 7:34:30 下午 7:34:36 0:00:06 射频等离子体物理学 - 搜狗搜索 - Google Chrome 下午 7:34:36 下午 7:34:43 0:00:07 无标题 - Google Chrome 下午 7:34:43 下午 7:34:48 0:00:05 射频等离子体物理学 - 国内版 Bing - Google Chrome 下午 7:34:48 下午 7:34:55 0:00:07 射频等离子体物理学 - Bing 学术 - Google Chrome 下午 7:34:55 下午 7:35:25 0:00:30 射频等离子体物理学 - 搜狗搜索 - Google Chrome 下午 7:35:25 下午 7:35:41 0:00:16 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 7:35:41 下午 7:35:50 0:00:09 bishe.doc - Word 下午 7:35:50 下午 7:36:50 0:01:00 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 7:36:50 下午 7:37:25 0:00:35 射频等离子体物理学 - 搜狗搜索 - Google Chrome 下午 7:37:25 下午 7:37:31 0:00:06 《射频等离子体物理学 (法)帕斯卡·夏伯特等著；王友年等译科学出版社有限责任公司 9787030459190》【简介_书评_在线阅读】 - 当当 - 正瀚图书专营店 - Google Chrome 下午 7:37:31 下午 7:37:53 0:00:22 bishe.doc - Word 下午 7:37:53 下午 7:38:05 0:00:12 Microsoft Word 下午 7:38:05 下午 7:38:10 0:00:05 bishe.doc - Word 下午 7:38:10 下午 7:38:16 0:00:06 《射频等离子体物理学 (法)帕斯卡·夏伯特等著；王友年等译科学出版社有限责任公司 9787030459190》【简介_书评_在线阅读】 - 当当 - 正瀚图书专营店 - Google Chrome 下午 7:38:16 下午 7:38:22 0:00:06 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 7:38:22 下午 7:38:31 0:00:09 bishe.doc - Word 下午 7:38:31 下午 7:38:36 0:00:05 《射频等离子体物理学 (法)帕斯卡·夏伯特等著；王友年等译科学出版社有限责任公司 9787030459190》【简介_书评_在线阅读】 - 当当 - 正瀚图书专营店 - Google Chrome 下午 7:38:36 下午 7:38:57 0:00:21 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 7:38:57 下午 7:39:21 0:00:24 bishe.doc - Word 下午 7:39:21 下午 7:39:26 0:00:05 射频等离子体物理学 - 搜狗搜索 - Google Chrome 下午 7:39:26 下午 7:39:31 0:00:05 云炬导航 | 让搜索更高效！ - Google Chrome 下午 7:39:31 下午 7:39:40 0:00:09 螺旋波 - 搜索结果 - 哔哩哔哩弹幕视频网 - ( ゜- ゜)つロ乾杯~ - bilibili - Google Chrome 下午 7:39:40 下午 7:40:09 0:00:29 螺旋波等离子体 - 搜索结果 - 哔哩哔哩弹幕视频网 - ( ゜- ゜)つロ乾杯~ - bilibili - Google Chrome 下午 7:40:09 下午 7:40:21 0:00:12 螺旋波推进器 - 搜索结果 - 哔哩哔哩弹幕视频网 - ( ゜- ゜)つロ乾杯~ - bilibili - Google Chrome 下午 7:40:21 下午 7:40:30 0:00:09 云炬导航 | 让搜索更高效！ - Google Chrome 下午 7:40:30 下午 7:40:43 0:00:13 螺旋波推进器 - 国内版 Bing - Google Chrome 下午 7:40:43 下午 7:40:49 0:00:06 螺旋波推进器 - 国内版 Bing video - Google Chrome 下午 7:40:49 下午 7:41:08 0:00:19 helicon - 国内版 Bing video - Google Chrome 下午 7:41:08 下午 7:41:18 0:00:10 helicon - 国内版 Bing video - Google Chrome 下午 7:41:18 下午 7:41:39 0:00:21 helicon plasma - 国内版 Bing video - Google Chrome 下午 7:41:39 下午 7:41:48 0:00:09 helicon plasma - 国际版 Bing video - Google Chrome 下午 7:41:48 下午 7:42:06 0:00:18 helicon thruster - 国际版 Bing - Google Chrome 下午 7:42:06 下午 7:42:25 0:00:19 bishe.doc - Word 下午 7:42:25 下午 7:42:37 0:00:12 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 7:42:37 下午 7:42:50 0:00:13 任务切换下午 7:42:50 下午 7:42:56 0:00:06 helicon thruster - 国际版 Bing - Google Chrome 下午 7:42:56 下午 7:43:12 0:00:16 bishe.doc - Word 下午 7:43:12 下午 7:43:17 0:00:05 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 7:43:17 下午 7:43:30 0:00:13 bishe.doc - Word 下午 7:43:30 下午 7:43:58 0:00:28 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 7:43:58 下午 7:44:16 0:00:18 bishe.doc - Word 下午 7:44:16 下午 7:44:33 0:00:17 helicon thruster - 国际版 Bing - Google Chrome 下午 7:44:33 下午 7:44:44 0:00:11 helicon thruster book - 国际版 Bing - Google Chrome 下午 7:44:44 下午 7:44:51 0:00:07 helicon thruster book - 国际版 Bing - Google Chrome 下午 7:44:51 下午 7:45:14 0:00:23 云炬导航 | 让搜索更高效！ - Google Chrome 下午 7:45:14 下午 7:45:27 0:00:13 VASIMR-搜索页 - Google Chrome 下午 7:45:27 下午 7:45:35 0:00:08 VASIMR-搜索页 - Google Chrome 下午 7:45:35 下午 7:45:41 0:00:06 诊断教学 PPT - Google Chrome 下午 7:45:41 下午 7:45:55 0:00:14 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 7:45:55 下午 7:46:26 0:00:31 云炬导航 | 让搜索更高效！ - Google Chrome 下午 7:46:26 下午 7:46:31 0:00:05 载中加 - Google Chrome 下午 7:46:31 下午 7:46:38 0:00:07 中加载 - Google Chrome 下午 7:46:38 下午 7:46:43 0:00:05 https://www.scopus.com/search/form.uri?display=basic - Google Chrome 下午 7:46:43 下午 7:46:51 0:00:08 Scopus - 文献搜索 - Google Chrome 下午 7:46:51 下午 7:47:13 0:00:22 Scopus - 文献搜索结果 - Google Chrome 下午 7:47:13 下午 7:48:35 0:01:22 https://www.scopus.com/term/analyzer.uri?sid=7545bc699ead73635be3e26f25fb24e3origin=resultslistsrc=ss=TITLE-ABS-KEY%28helicon%29sort=plf-fsdt=bsot=bsl=22count=2476analyzeResults=Analyze+resultstxGid=7ce445d581b3d3eec0ff25b7ecd4748e - Google Chrome 下午 7:48:35 下午 7:48:49 0:00:14 Scopus - 分析搜索结果 - Google Chrome 下午 7:48:49 下午 7:49:04 0:00:15 bishe.doc - Word 下午 7:49:04 下午 7:49:09 0:00:05 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 7:49:09 下午 7:49:21 0:00:12 任务切换下午 7:49:21 下午 7:49:34 0:00:13 无标题 - Google Chrome 下午 7:49:34 下午 7:49:43 0:00:09 www.sciencenet.cn - Google Chrome 下午 7:49:43 下午 7:49:49 0:00:06 云炬导航 | 让搜索更高效！ - Google Chrome 下午 7:49:49 下午 7:49:58 0:00:09 云炬导航 | 让搜索更高效！ - Google Chrome 下午 7:49:58 下午 7:50:06 0:00:08 VASIMR - 搜索结果 - 哔哩哔哩弹幕视频网 - ( ゜- ゜)つロ乾杯~ - bilibili - Google Chrome 下午 7:50:06 下午 7:50:28 0:00:22 电推进 - 搜索结果 - 哔哩哔哩弹幕视频网 - ( ゜- ゜)つロ乾杯~ - bilibili - Google Chrome 下午 7:50:28 下午 7:51:00 0:00:32 NASA电推进 - 搜索结果 - 哔哩哔哩弹幕视频网 - ( ゜- ゜)つロ乾杯~ - bilibili - Google Chrome 下午 7:51:00 下午 7:51:11 0:00:11 云炬导航 | 让搜索更高效！ - Google Chrome 下午 7:51:11 下午 7:51:23 0:00:12 VASIMR - Google Chrome 下午 7:51:23 下午 7:51:47 0:00:24 任务切换下午 7:51:47 下午 7:51:52 0:00:05 Microsoft Word 下午 7:51:52 下午 7:51:59 0:00:07 任务切换下午 7:51:59 下午 7:52:04 0:00:05 VASIMR - Google Chrome 下午 7:52:04 下午 7:52:13 0:00:09 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 7:52:13 下午 7:52:33 0:00:20 Windows 资源管理器下午 7:52:33 下午 7:52:39 0:00:06 VASIMR - Google Chrome 下午 7:52:39 下午 7:52:45 0:00:06 任务管理器下午 7:52:45 下午 7:52:57 0:00:12 Windows 资源管理器下午 7:52:57 下午 7:53:07 0:00:10 任务管理器下午 7:53:07 下午 7:53:14 0:00:07 Scopus - 分析搜索结果 - Google Chrome 下午 7:53:14 下午 7:53:44 0:00:30 bishe.doc - Word 下午 7:53:44 下午 7:54:14 0:00:30 Scopus - 分析搜索结果 - Google Chrome 下午 7:54:14 下午 7:56:03 0:01:49 TIM 下午 7:56:03 下午 7:56:11 0:00:08 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 7:56:11 下午 7:56:35 0:00:24 Scopus - 分析搜索结果 - Google Chrome 下午 7:56:35 下午 7:57:15 0:00:40 https://www.scopus.com/results/results.uri?numberOfFields=0src=sclickedLink=edit=editSaveSearch=origin=searchbasicauthorTab=affiliationTab=advancedTab=scint=1menu=searchtablin=searchterm1=heliconfield1=TITLE_ABS_KEYdateType=Publication_Date_TypeyearFrom=Before+1960yearTo=PresentloadDate=7documenttype=AllaccessTypes=AllresetFormLink=st1=heliconst2=sot=bsdt=bsl=22s=TITLE-ABS-KEY%28helicon%29sid=7545bc699ead73635be3e26f25fb24e3searchId=7545bc699ead73635be3e26f25fb24e3txGid=89d9be8487b6ae31ef1549e4c9e39954sort=plf-foriginationType=brr= - Google Chrome 下午 7:57:15 下午 7:57:20 0:00:05 Scopus - 文献搜索结果 - Google Chrome 下午 7:57:20 下午 7:57:55 0:00:35 Scopus - 分析搜索结果 - Google Chrome 下午 7:57:55 下午 7:58:23 0:00:28 Web of Science - Web of Science 核心合集基本检索 - Google Chrome 下午 7:58:23 下午 7:58:38 0:00:15 Scopus - 分析搜索结果 - Google Chrome 下午 7:58:38 下午 7:58:45 0:00:07 Web of Science - Web of Science 核心合集检索结果 - Google Chrome 下午 7:58:45 下午 7:59:02 0:00:17 Scopus - 分析搜索结果 - Google Chrome 下午 7:59:02 下午 7:59:18 0:00:16 Web of Science - Web of Science 核心合集结果分析 - Google Chrome 下午 7:59:18 下午 7:59:24 0:00:06 Web of Science - Web of Science 核心合集结果分析 - Google Chrome 下午 7:59:24 下午 7:59:56 0:00:32 TIM 下午 7:59:56 下午 8:00:01 0:00:05 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 8:00:01 下午 8:00:26 0:00:25 Web of Science - Web of Science 核心合集结果分析 - Google Chrome 下午 8:00:26 下午 8:00:31 0:00:05 Scopus - 文献搜索结果 - Google Chrome 下午 8:00:31 下午 8:00:37 0:00:06 Scopus - 文献搜索 - Google Chrome 下午 8:00:37 下午 8:00:43 0:00:06 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 8:00:43 下午 8:01:01 0:00:18 Scopus - 文献搜索 - Google Chrome 下午 8:01:01 下午 8:01:23 0:00:22 Web of Science - Web of Science 核心合集结果分析 - Google Chrome 下午 8:01:23 下午 8:01:52 0:00:29 Web of Science - Web of Science 核心合集结果分析 - Google Chrome 下午 8:01:52 下午 8:02:00 0:00:08 任务切换下午 8:02:00 下午 8:02:08 0:00:08 TIM 下午 8:02:08 下午 8:02:26 0:00:18 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 8:02:26 下午 8:02:51 0:00:25 Web of Science - Web of Science 核心合集结果分析 - Google Chrome 下午 8:02:51 下午 8:03:02 0:00:11 Web of Science - Web of Science 核心合集结果分析 - Google Chrome 下午 8:03:02 下午 8:03:31 0:00:29 Web of Science - Web of Science 核心合集结果分析 - Google Chrome 下午 8:03:31 下午 8:03:48 0:00:17 TIM 下午 8:03:48 下午 8:03:55 0:00:07 Web of Science - Web of Science 核心合集结果分析 - Google Chrome 下午 8:03:55 下午 8:04:23 0:00:28 knight 下午 8:04:23 下午 8:04:28 0:00:05 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 8:04:28 下午 8:04:48 0:00:20 Web of Science - Web of Science 核心合集结果分析 - Google Chrome 下午 8:04:48 下午 8:04:53 0:00:05 Scopus - 文献搜索结果 - Google Chrome 下午 8:04:53 下午 8:05:36 0:00:43 Scopus - 分析搜索结果 - Google Chrome 下午 8:05:36 下午 8:05:46 0:00:10 Web of Science - Web of Science 核心合集结果分析 - Google Chrome 下午 8:05:46 下午 8:05:53 0:00:07 Web of Science - Web of Science 核心合集结果分析 - Google Chrome 下午 8:05:53 下午 8:06:05 0:00:12 Web of Science - Web of Science 核心合集结果分析 - Google Chrome 下午 8:06:05 下午 8:06:17 0:00:12 Web of Science - Web of Science 核心合集结果分析 - Google Chrome 下午 8:06:17 下午 8:06:24 0:00:07 Web of Science - Web of Science 核心合集检索结果 - Google Chrome 下午 8:06:24 下午 8:06:29 0:00:05 Scopus - 分析搜索结果 - Google Chrome 下午 8:06:29 下午 8:06:36 0:00:07 TIM 下午 8:06:36 下午 8:06:49 0:00:13 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 8:06:49 下午 8:07:13 0:00:24 Scopus - 分析搜索结果 - Google Chrome 下午 8:07:13 下午 8:07:33 0:00:20 TIM 下午 8:07:33 下午 8:07:44 0:00:11 密码本 - 为知笔记: 收藏知识，分享快乐下午 8:07:44 下午 8:07:49 0:00:05 任务切换下午 8:07:49 下午 8:07:54 0:00:05 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 8:07:54 下午 8:08:01 0:00:07 Scopus - 分析搜索结果 - Google Chrome 下午 8:08:01 下午 8:08:48 0:00:47 TIM 下午 8:08:48 下午 8:09:08 0:00:20 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 8:09:08 下午 8:09:36 0:00:28 Scopus - 分析搜索结果 - Google Chrome 下午 8:09:36 下午 8:09:41 0:00:05 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 8:09:41 下午 8:09:46 0:00:05 Web of Science - Web of Science 核心合集检索结果 - Google Chrome 下午 8:09:46 下午 8:11:10 0:01:24 Web of Science - Web of Science 核心合集 - Google Chrome 下午 8:11:10 下午 8:11:32 0:00:22 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 8:11:32 下午 8:11:40 0:00:08 云炬导航 | 让搜索更高效！ - Google Chrome 下午 8:11:40 下午 8:11:50 0:00:10 WOS中的Hotpaper_百度搜索 - Google Chrome 下午 8:11:50 下午 8:12:06 0:00:16 Web of Science - Web of Science 核心合集检索结果 - Google Chrome 下午 8:12:06 下午 8:12:15 0:00:09 Scopus - 分析搜索结果 - Google Chrome 下午 8:12:15 下午 8:12:31 0:00:16 Web of Science - Web of Science 核心合集检索结果 - Google Chrome 下午 8:12:31 下午 8:13:04 0:00:33 任务切换下午 8:13:04 下午 8:13:10 0:00:06 WOS中的Hotpaper - 国际版 Bing - Google Chrome 下午 8:13:10 下午 8:13:16 0:00:06 高被引论文 hot paper 怎么查_百度知道 - Google Chrome 下午 8:13:16 下午 8:13:35 0:00:19 如何查 esi高引用论文第二作者_百度知道 - Google Chrome 下午 8:13:35 下午 8:13:53 0:00:18 怎么查询一篇 SCI 论文是否是“高引论文”_百度知道 - Google Chrome 下午 8:13:53 下午 8:14:06 0:00:13 Web of Science - Web of Science 核心合集检索结果 - Google Chrome 下午 8:14:06 下午 8:14:28 0:00:22 Web of Science - Web of Science 核心合集检索结果 - Google Chrome 下午 8:14:28 下午 8:14:55 0:00:27 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 8:14:55 下午 8:15:41 0:00:46 高被引论文 hot paper 怎么查_百度知道 - Google Chrome 下午 8:15:41 下午 8:15:46 0:00:05 怎么查询一篇 SCI 论文是否是“高引论文”_百度知道 - Google Chrome 下午 8:15:46 下午 8:15:54 0:00:08 Windows 资源管理器下午 8:15:54 下午 8:15:59 0:00:05 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 8:15:59 下午 8:16:18 0:00:19 怎么查询一篇 SCI 论文是否是“高引论文”_百度知道 - Google Chrome 下午 8:16:18 下午 8:16:23 0:00:05 Web of Science - Web of Science 核心合集检索结果 - Google Chrome 下午 8:16:23 下午 8:16:33 0:00:10 Web of Science - Web of Science 核心合集检索结果 - Google Chrome 下午 8:16:33 下午 8:17:11 0:00:38 另存为下午 8:17:11 下午 8:17:26 0:00:15 云炬导航 | 让搜索更高效！ - Google Chrome 下午 8:17:26 下午 8:17:41 0:00:15 Histcite - 搜索结果 - 知乎 - Google Chrome 下午 8:17:41 下午 8:17:48 0:00:07 https://zhuanlan.zhihu.com/p/20902898 - Google Chrome 下午 8:17:48 下午 8:17:54 0:00:06 文献引文分析利器 HistCite 详细使用教程暨 HistCite Pro 首发页面 - 知乎 - Google Chrome 下午 8:17:54 下午 8:19:23 0:01:29 NASA电推进 - 搜索结果 - 哔哩哔哩弹幕视频网 - ( ゜- ゜)つロ乾杯~ - bilibili - Google Chrome 下午 8:19:23 下午 8:19:28 0:00:05 Web of Science - Web of Science 核心合集检索结果 - Google Chrome 下午 8:19:28 下午 8:19:54 0:00:26 另存为下午 8:19:54 下午 8:20:03 0:00:09 文件资源管理器下午 8:20:03 下午 8:20:08 0:00:05 文档 (E:) 下午 8:20:08 下午 8:20:19 0:00:11 HistCite Pro 2.1 下午 8:20:19 下午 8:20:27 0:00:08 TXT 下午 8:20:27 下午 8:20:44 0:00:17 HistCite Pro 2.1 下午 8:20:44 下午 8:20:50 0:00:06 Windows 资源管理器下午 8:20:50 下午 8:20:55 0:00:05 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 8:20:55 下午 8:21:05 0:00:10 E:\\HistCite Pro 2.1\\HistCite Pro 2.1\\main.exe 下午 8:21:05 下午 8:21:16 0:00:11 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 8:21:16 下午 8:21:21 0:00:05 Web of Science - Web of Science 核心合集检索结果 - Google Chrome 下午 8:21:21 下午 8:21:28 0:00:07 HistCite - Loading File... - Google Chrome 下午 8:21:28 下午 8:21:39 0:00:11 HistCite - savedrecs.txt - Google Chrome 下午 8:21:39 下午 8:21:58 0:00:19 HistCite - savedrecs.txt - Google Chrome 下午 8:21:58 下午 8:22:05 0:00:07 HistCite - savedrecs.txt - Google Chrome 下午 8:22:05 下午 8:22:33 0:00:28 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 8:22:33 下午 8:22:40 0:00:07 TIM 下午 8:22:40 下午 8:22:57 0:00:17 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 8:22:57 下午 8:23:07 0:00:10 无标题 - Google Chrome 下午 8:23:07 下午 8:23:12 0:00:05 HistCite - Graph Maker - Google Chrome 下午 8:23:12 下午 8:23:23 0:00:11 HistCite Pro 2.1 下午 8:23:23 下午 8:23:31 0:00:08 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 8:23:31 下午 8:23:53 0:00:22 任务切换下午 8:23:53 下午 8:23:58 0:00:05 HistCite - Graph Maker - Google Chrome 下午 8:23:58 下午 8:24:22 0:00:24 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 8:24:22 下午 8:24:28 0:00:06 HistCite - Graph Maker - Google Chrome 下午 8:24:28 下午 8:25:59 0:01:31 TIM 下午 8:25:59 下午 8:26:22 0:00:23 HistCite - savedrecs.txt - Google Chrome 下午 8:26:22 下午 8:26:27 0:00:05 360安全卫士下午 8:26:27 下午 8:26:36 0:00:09 HistCite - Graph Maker - Google Chrome 下午 8:26:36 下午 8:26:41 0:00:05 360安全卫士下午 8:26:41 下午 8:26:48 0:00:07 TIM 下午 8:26:48 下午 8:27:02 0:00:14 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 8:27:02 下午 8:27:16 0:00:14 TIM 下午 8:27:16 下午 8:27:24 0:00:08 HistCite - Graph Maker - Google Chrome 下午 8:27:24 下午 8:28:19 0:00:55 鲁大师硬件防护中心下午 8:28:19 下午 8:28:40 0:00:21 TIM 下午 8:28:40 下午 8:28:56 0:00:16 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 8:28:56 下午 8:29:19 0:00:23 HistCite - Graph Maker - Google Chrome 下午 8:29:19 下午 8:29:36 0:00:17 TIM 下午 8:29:36 下午 8:29:55 0:00:19 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 8:29:55 下午 8:30:03 0:00:08 HistCite - savedrecs.txt - Google Chrome 下午 8:30:03 下午 8:30:15 0:00:12 HistCite - savedrecs.txt - Google Chrome 下午 8:30:15 下午 8:30:32 0:00:17 HistCite - savedrecs.txt - Google Chrome 下午 8:30:32 下午 8:30:41 0:00:09 另存为下午 8:30:41 下午 8:31:02 0:00:21 Cortana (小娜) 下午 8:31:02 下午 8:31:09 0:00:07 Windows 资源管理器下午 8:31:09 下午 8:31:17 0:00:08 桌面整理下午 8:31:17 下午 8:31:23 0:00:06 任务管理器下午 8:31:23 下午 8:31:33 0:00:10 EndNote X9 - 下午 8:31:33 下午 8:32:04 0:00:31 Save A Copy 下午 8:32:04 下午 8:32:14 0:00:10 EndNote X9 - 下午 8:32:14 下午 8:32:20 0:00:06 New Reference Library 下午 8:32:20 下午 8:32:28 0:00:08 EndNote X9 - 下午 8:32:28 下午 8:32:33 0:00:05 EndNote X9 - 下午 8:32:33 下午 8:32:48 0:00:15 打开下午 8:32:48 下午 8:33:39 0:00:51 Import File 下午 8:33:39 下午 8:33:49 0:00:10 EndNote X9 - 下午 8:33:49 下午 8:35:11 0:01:22 TIM 下午 8:35:11 下午 8:35:21 0:00:10 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 8:35:21 下午 8:35:42 0:00:21 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 8:35:42 下午 8:35:48 0:00:06 EndNote X9 - 下午 8:35:48 下午 8:37:35 0:01:47 任务切换下午 8:37:35 下午 8:37:44 0:00:09 bishe.doc - Word 下午 8:37:44 下午 8:37:58 0:00:14 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 8:37:58 下午 8:38:30 0:00:32 云炬导航 | 让搜索更高效！ - Google Chrome 下午 8:38:30 下午 8:38:35 0:00:05 Histcite - 搜索结果 - 知乎 - Google Chrome 下午 8:38:35 下午 8:38:47 0:00:12 星辰大海 - 知乎 - Google Chrome 下午 8:38:47 下午 8:38:57 0:00:10 无标题 - Google Chrome 下午 8:38:57 下午 8:39:03 0:00:06 研究螺旋波的大牛科学家实验室网站 - 知乎 - Google Chrome 下午 8:39:03 下午 8:39:32 0:00:29 写文章 - 知乎 - Google Chrome 下午 8:39:32 下午 8:39:46 0:00:14 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 8:39:46 下午 8:40:14 0:00:28 任务切换下午 8:40:14 下午 8:40:19 0:00:05 新标签页 - Google Chrome 下午 8:40:19 下午 8:40:25 0:00:06 Home Page - Google Chrome 下午 8:40:25 下午 8:40:32 0:00:07 People - Google Chrome 下午 8:40:32 下午 8:40:51 0:00:19 Research - Google Chrome 下午 8:40:51 下午 8:40:57 0:00:06 Presentations and programs - Google Chrome 下午 8:40:57 下午 8:41:04 0:00:07 History - Google Chrome 下午 8:41:04 下午 8:41:18 0:00:14 People - Google Chrome 下午 8:41:18 下午 8:41:57 0:00:39 Home Page - Google Chrome 下午 8:41:57 下午 8:42:05 0:00:08 People - Google Chrome 下午 8:42:05 下午 8:42:32 0:00:27 Research - Google Chrome 下午 8:42:32 下午 8:42:40 0:00:08 History - Google Chrome 下午 8:42:40 下午 8:42:49 0:00:09 Publications - Google Chrome 下午 8:42:49 下午 8:43:02 0:00:13 Presentations and programs - Google Chrome 下午 8:43:02 下午 8:43:17 0:00:15 MEDUSA - Google Chrome 下午 8:43:17 下午 8:43:22 0:00:05 Research - Google Chrome 下午 8:43:22 下午 8:43:35 0:00:13 TIM 下午 8:43:35 下午 8:43:43 0:00:08 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 8:43:43 下午 8:43:51 0:00:08 写文章 - 知乎 - Google Chrome 下午 8:43:51 下午 8:44:46 0:00:55 研究螺旋波等离子体的大牛科学家实验室网站 - 知乎 - Google Chrome 下午 8:44:46 下午 8:45:23 0:00:37 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 8:45:23 下午 8:45:52 0:00:29 云炬导航 | 让搜索更高效！ - Google Chrome 下午 8:45:52 下午 8:46:03 0:00:11 无标题 - Google Chrome 下午 8:46:03 下午 8:46:08 0:00:05 螺旋波眼讨论 - 国际版 Bing - Google Chrome 下午 8:46:08 下午 8:46:27 0:00:19 螺旋波眼讨论 - 国际版 Bing - Google Chrome 下午 8:46:27 下午 8:46:34 0:00:07 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 8:46:34 下午 8:46:43 0:00:09 螺旋波推进器研讨论 - 国际版 Bing - Google Chrome 下午 8:46:43 下午 8:46:55 0:00:12 螺旋波论坛 - 国际版 Bing - Google Chrome 下午 8:46:55 下午 8:47:01 0:00:06 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 8:47:01 下午 8:47:12 0:00:11 螺旋波论坛 - 国内版 Bing - Google Chrome 下午 8:47:12 下午 8:47:25 0:00:13 基于 FHN模型的螺旋波模拟Matlab程序，非常难得 – MATLAB中文论坛 - Google Chrome 下午 8:47:25 下午 8:48:09 0:00:44 bishe.doc - Word 下午 8:48:09 下午 8:48:17 0:00:08 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 8:48:17 下午 8:48:24 0:00:07 为知笔记 - 为知笔记: 收藏知识，分享快乐下午 8:48:24 下午 8:48:35 0:00:11 3.1 相关网页 - 为知笔记: 收藏知识，分享快乐下午 8:48:35 下午 8:49:01 0:00:26 螺旋波论坛 - 国内版 Bing - Google Chrome 下午 8:49:01 下午 8:49:18 0:00:17 螺旋波等离子体论坛 - 国内版 Bing - Google Chrome 下午 8:49:18 下午 8:49:31 0:00:13 螺旋波等离子体研讨会 - 国内版 Bing - Google Chrome 下午 8:49:31 下午 8:49:49 0:00:18 螺旋波等离子体论坛 - 国内版 Bing - Google Chrome 下午 8:49:49 下午 8:49:55 0:00:06 螺旋波等离子体电推进大会 - 国内版 Bing - Google Chrome 下午 8:49:55 下午 8:50:04 0:00:09 https://www.baidu.com/s?wd=螺旋波等离子体电推进大会 - Google Chrome 下午 8:50:04 下午 8:50:10 0:00:06 螺旋波等离子体电推进大会 _百度搜索 - Google Chrome 下午 8:50:10 下午 8:50:32 0:00:22 螺旋波 or等离子体or 电推进 and 大会or论坛or研讨会_百度搜索 - Google Chrome 下午 8:50:32 下午 8:51:32 0:01:00 (螺旋波 | 等离子体 | 电推进 | 大会 | 论坛 | 研讨会)_百度搜索 - Google Chrome 下午 8:51:32 下午 8:51:52 0:00:20 (螺旋波 | 等离子体 | 电推进 | 大会 | 论坛 | 研讨会) and_百度搜索 - Google Chrome 下午 8:51:52 下午 8:52:07 0:00:15 (螺旋波 | 等离子体 | 电推进) and ( |大会 | 论坛 | 研讨会)_百度搜索 - Google Chrome 下午 8:52:07 下午 8:52:15 0:00:08 (螺旋波 | 等离子体 | 电推进) and ( 大会 | 论坛 | 研讨会)_百度搜索 - Google Chrome 下午 8:52:15 下午 8:52:21 0:00:06 https://www.baidu.com/link?url=TyuoU50yi8D4j9Vx5pAdtusAraa9mupSja1y6Kw8kTmklCt6Rc0aZeuQUZLNItilwd=eqid=85a291b6004f9225000000035decf1fc - Google Chrome 下午 8:52:21 下午 8:52:26 0:00:05 2019年11月29日五室第127研讨会 – 等离子体物理理论与数值模拟研究室 - Google Chrome 下午 8:52:26 下午 8:52:46 0:00:20 成员介绍 – 等离子体物理理论与数值模拟研究室 - Google Chrome 下午 8:52:46 下午 8:53:26 0:00:40 (螺旋波 | 等离子体 | 电推进) and ( 大会 | 论坛 | 研讨会)_百度搜索 - Google Chrome 下午 8:53:26 下午 8:53:51 0:00:25 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 8:53:51 下午 8:54:34 0:00:43 EndNote X9 - 下午 8:54:34 下午 8:54:56 0:00:22 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 8:54:56 下午 8:55:29 0:00:33 EndNote X9 - 下午 8:55:29 下午 8:55:43 0:00:14 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 8:55:43 下午 8:57:23 0:01:40 ManicTime - TRIAL 下午 8:57:23 下午 8:57:28 0:00:05 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 8:57:28 下午 9:12:01 0:14:33 Windows 资源管理器下午 9:12:01 下午 9:12:18 0:00:17 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 9:12:18 下午 9:13:42 0:01:24 (螺旋波 | 等离子体 | 电推进) and ( 大会 | 论坛 | 研讨会)_百度搜索 - Google Chrome 下午 9:13:42 下午 9:13:50 0:00:08 https://www.baidu.com/link?url=bqDCZNyInnC-uNX5GOGyUVFHx_3HcCqY_tRGHyBT2WP5wyezexRMoPWAPCjSwUoFwd=eqid=9330b5e00055e76a000000035decf70c - Google Chrome 下午 9:13:50 下午 9:13:55 0:00:05 雨课堂网页版 -登录 - Google Chrome 下午 9:13:55 下午 9:14:29 0:00:34 雨课堂网页版 - Google Chrome 下午 9:14:29 下午 9:14:35 0:00:06 雨课堂网页版 - Google Chrome 下午 9:14:35 下午 9:16:16 0:01:41 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 9:16:16 下午 9:16:46 0:00:30 文档 (E:) 下午 9:16:46 下午 9:18:11 0:01:25 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 9:18:11 下午 9:18:24 0:00:13 打开下午 9:18:24 下午 9:18:33 0:00:09 www.yunju.net + 科大云炬 +螺旋波等离子体研究现状调研.docx - Word 下午 9:18:33 下午 9:18:51 0:00:18 文档 (E:) 下午 9:18:51 下午 9:18:59 0:00:08 雨课堂网页版 - Google Chrome 下午 9:18:59 下午 9:20:12 0:01:13 另存为下午 9:20:12 下午 9:20:18 0:00:06 雨课堂网页版 - Google Chrome 下午 9:20:18 下午 9:20:23 0:00:05 bishe.doc - Word 下午 9:20:23 下午 9:20:29 0:00:06 打开下午 9:20:29 下午 9:20:45 0:00:16 正在打开 - Word 下午 9:20:45 下午 9:20:51 0:00:06 20191128 学号姓名调研主题.docx (受保护的视图) - Word 下午 9:20:51 下午 9:21:00 0:00:09 任务切换下午 9:21:00 下午 9:21:07 0:00:07 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 9:21:07 下午 9:21:15 0:00:08 20191128 学号姓名调研主题.docx (受保护的视图) - Word 下午 9:21:15 下午 9:21:31 0:00:16 20191128 学号姓名调研主题.docx - Word 下午 9:21:31 下午 9:21:50 0:00:19 bishe.doc - Word 下午 9:21:50 下午 9:21:57 0:00:07 Windows 资源管理器下午 9:21:57 下午 9:22:05 0:00:08 www.yunju.net + 科大云炬 +helicon.docx - Word 下午 9:22:05 下午 9:22:17 0:00:12 文档 (E:) 下午 9:22:17 下午 9:22:28 0:00:11 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 9:22:28 下午 9:25:23 0:02:55 bishe.doc - Word 下午 9:25:23 下午 9:25:58 0:00:35 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 9:25:58 下午 9:26:03 0:00:05 查找和替换下午 9:26:03 下午 9:26:25 0:00:22 替换字体下午 9:26:25 下午 9:27:06 0:00:41 查找和替换下午 9:27:06 下午 9:27:20 0:00:14 WPS 文字下午 9:27:20 下午 9:27:25 0:00:05 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 9:27:25 下午 9:27:52 0:00:27 查找和替换下午 9:27:52 下午 9:28:30 0:00:38 查找和替换 (未响应) 下午 9:28:30 下午 9:28:45 0:00:15 查找和替换下午 9:28:45 下午 9:29:37 0:00:52 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 9:29:37 下午 9:30:14 0:00:37 bishe.doc - Word 下午 9:30:14 下午 9:30:30 0:00:16 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 9:30:30 下午 9:30:36 0:00:06 bishe.doc - Word 下午 9:30:36 下午 9:30:47 0:00:11 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 9:30:47 下午 9:36:13 0:05:26 EndNote X9 - 下午 9:36:13 下午 9:36:28 0:00:15 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 9:36:28 下午 9:36:45 0:00:17 雨课堂 _百度搜索 - Google Chrome 下午 9:36:45 下午 9:36:51 0:00:06 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 9:36:51 下午 9:39:25 0:02:34 雨课堂 _百度搜索 - Google Chrome 下午 9:39:25 下午 9:39:30 0:00:05 bishe.doc - Word 下午 9:39:30 下午 9:42:09 0:02:39 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 9:42:09 下午 9:42:33 0:00:24 bishe.doc - Word 下午 9:42:33 下午 9:45:15 0:02:42 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 9:45:15 下午 9:45:23 0:00:08 bishe.doc - Word 下午 9:45:23 下午 9:47:31 0:02:08 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 9:47:31 下午 9:47:42 0:00:11 bishe.doc - Word 下午 9:47:42 下午 9:48:10 0:00:28 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 9:48:10 下午 9:49:19 0:01:09 HistCite - Graph Maker - Google Chrome 下午 9:49:19 下午 9:49:28 0:00:09 bishe.doc - Word 下午 9:49:28 下午 9:50:43 0:01:15 HistCite - Graph Maker - Google Chrome 下午 9:50:43 下午 9:51:15 0:00:32 EndNote X9 - 下午 9:51:15 下午 9:51:24 0:00:09 bishe.doc - Word 下午 9:51:24 下午 9:52:21 0:00:57 雨课堂 _百度搜索 - Google Chrome 下午 9:52:21 下午 9:52:26 0:00:05 HistCite - savedrecs.txt - Google Chrome 下午 9:52:26 下午 9:52:33 0:00:07 HistCite - savedrecs.txt - Google Chrome 下午 9:52:33 下午 9:53:01 0:00:28 HistCite - savedrecs.txt - Google Chrome 下午 9:53:01 下午 9:54:03 0:01:02 bishe.doc - Word 下午 9:54:03 下午 9:58:35 0:04:32 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 9:58:35 下午 9:59:43 0:01:08 bishe.doc - Word 下午 9:59:43 下午 10:00:49 0:01:06 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 10:00:49 下午 10:01:01 0:00:12 bishe.doc - Word 下午 10:01:01 下午 10:01:11 0:00:10 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 10:01:11 下午 10:01:25 0:00:14 bishe.doc - Word 下午 10:01:25 下午 10:01:40 0:00:15 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 10:01:40 下午 10:02:02 0:00:22 bishe.doc - Word 下午 10:02:02 下午 10:02:09 0:00:07 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 10:02:09 下午 10:04:53 0:02:44 bishe.doc - Word 下午 10:04:53 下午 10:04:59 0:00:06 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 10:04:59 下午 10:05:22 0:00:23 bishe.doc - Word 下午 10:05:22 下午 10:05:33 0:00:11 EndNote X9 - 下午 10:05:33 下午 10:05:45 0:00:12 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 10:05:45 下午 10:20:35 0:14:50 Windows 资源管理器下午 10:20:35 下午 10:20:41 0:00:06 EndNote X9 - 下午 10:20:41 下午 10:20:47 0:00:06 Windows 资源管理器下午 10:20:47 下午 10:20:52 0:00:05 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 10:20:52 下午 10:29:37 0:08:45 插入附件下午 10:29:37 下午 10:29:42 0:00:05 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 10:29:42 下午 10:29:54 0:00:12 插入超链接下午 10:29:54 下午 10:30:05 0:00:11 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 10:30:05 下午 10:30:28 0:00:23 插入超链接下午 10:30:28 下午 10:30:35 0:00:07 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 10:30:35 下午 10:30:53 0:00:18 编辑超链接下午 10:30:53 下午 10:31:03 0:00:10 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 10:31:03 下午 10:35:05 0:04:02 雨课堂 _百度搜索 - Google Chrome 下午 10:35:05 下午 10:35:17 0:00:12 螺旋波 _百度视频搜索 - Google Chrome 下午 10:35:17 下午 10:35:30 0:00:13 螺旋波瑞近期 _百度视频搜索 - Google Chrome 下午 10:35:30 下午 10:35:38 0:00:08 螺旋波推进器 _百度视频搜索 - Google Chrome 下午 10:35:38 下午 10:35:53 0:00:15 螺旋波推进器 _百度视频搜索 - Google Chrome 下午 10:35:53 下午 10:37:23 0:01:30 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 10:37:23 下午 10:37:41 0:00:18 云炬导航 | 让搜索更高效！ - Google Chrome 下午 10:37:41 下午 10:37:50 0:00:09 螺旋波推进器 _百度视频搜索 - Google Chrome 下午 10:37:50 下午 10:38:05 0:00:15 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 10:38:05 下午 10:42:04 0:03:59 螺旋波推进器 _百度视频搜索 - Google Chrome 下午 10:42:04 下午 10:42:12 0:00:08 成员介绍 – 等离子体物理理论与数值模拟研究室 - Google Chrome 下午 10:42:12 下午 10:42:18 0:00:06 成员介绍 – 等离子体物理理论与数值模拟研究室 - Google Chrome 下午 10:42:18 下午 10:43:36 0:01:18 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 10:43:36 下午 10:50:23 0:06:47 bishe.doc - Word 下午 10:50:23 下午 10:50:45 0:00:22 20191128 学号姓名调研主题.docx - Word 下午 10:50:45 下午 10:51:11 0:00:26 任务切换下午 10:51:11 下午 10:51:16 0:00:05 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 10:51:16 下午 10:58:46 0:07:30 3.1 相关网页 - 为知笔记: 收藏知识，分享快乐下午 10:58:46 下午 10:59:44 0:00:58 创建群组下午 10:59:44 下午 10:59:51 0:00:07 3.1 相关网页 - 为知笔记: 收藏知识，分享快乐下午 10:59:51 下午 10:59:56 0:00:05 1 - 为知笔记: 收藏知识，分享快乐下午 10:59:56 下午 11:02:25 0:02:29 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 11:02:25 下午 11:04:43 0:02:18 查找和替换下午 11:04:43 下午 11:05:08 0:00:25 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 11:05:08 下午 11:13:18 0:08:10 1 - 为知笔记: 收藏知识，分享快乐下午 11:13:18 下午 11:13:24 0:00:06 3.1 相关网页 - 为知笔记: 收藏知识，分享快乐下午 11:13:24 下午 11:13:34 0:00:10 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 11:13:34 下午 11:14:32 0:00:58 编辑超链接下午 11:14:32 下午 11:14:37 0:00:05 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 11:14:37 下午 11:14:48 0:00:11 编辑超链接下午 11:14:48 下午 11:14:55 0:00:07 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 11:14:55 下午 11:15:09 0:00:14 插入超链接下午 11:15:09 下午 11:15:15 0:00:06 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 11:15:15 下午 11:17:30 0:02:15 任务切换下午 11:17:30 下午 11:17:36 0:00:06 海研网 -全球科研项目数据库|科研项目|申报信息|最早最权威门户网 - Google Chrome 下午 11:17:36 下午 11:17:46 0:00:10 海研科研项目 - 科研项目查询 - 科研项目检索 - 全球科研项目 - 海研 - 整合世界资讯，分享学术知识 - Google Chrome 下午 11:17:46 下午 11:17:54 0:00:08 3.1 相关网页 - 为知笔记: 收藏知识，分享快乐下午 11:17:54 下午 11:18:00 0:00:06 Windows 资源管理器下午 11:18:00 下午 11:18:05 0:00:05 海研科研项目 - 科研项目查询 - 科研项目检索 - 全球科研项目 - 海研 - 整合世界资讯，分享学术知识 - Google Chrome 下午 11:18:05 下午 11:18:10 0:00:05 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 11:18:10 下午 11:18:32 0:00:22 螺旋波推进器 _百度视频搜索 - Google Chrome 下午 11:18:32 下午 11:18:45 0:00:13 螺旋波 or等离子体or 电推进 and 大会or论坛or研讨会_百度搜索 - Google Chrome 下午 11:18:45 下午 11:19:04 0:00:19 https://www.baidu.com/link?url=c3HRChETt12J2x885vzzYGaVTlVZCvNdeCjurH2QvLaIqIlJgb8d0_ysMbKIGC_4eLOu_9lQS3lgBI31fW8pPawd=eqid=868588540046ba0d000000035ded1465 - Google Chrome 下午 11:19:04 下午 11:19:11 0:00:07 2019年项目指南 - Google Chrome 下午 11:19:11 下午 11:19:20 0:00:09 国家自然科学基金委员会 -2019年度项目指南 - Google Chrome 下午 11:19:20 下午 11:19:46 0:00:26 国家自然科学基金委员会 -2019年度项目指南 - Google Chrome 下午 11:19:46 下午 11:19:59 0:00:13 国家自然科学基金委员会 -2019年度项目指南 - Google Chrome 下午 11:19:59 下午 11:20:27 0:00:28 国家科研指南 _百度搜索 - Google Chrome 下午 11:20:27 下午 11:20:39 0:00:12 https://www.baidu.com/link?url=c1B5DbCE3znxwK-JeuGmNHawj_YntI0n5WWcE91mTlX4gLXzpZdkmg5qTRHOVy6mwd=eqid=9dc150c0006ee253000000035ded14c6 - Google Chrome 下午 11:20:39 下午 11:20:46 0:00:07 中华人民共和国科学技术部 - Google Chrome 下午 11:20:46 下午 11:20:57 0:00:11 中华人民共和国科学技术部 ▪站内检索 - Google Chrome 下午 11:20:57 下午 11:21:24 0:00:27 关于征集 2020年度国家科学技术学术著作出版基金项目的通知 - Google Chrome 下午 11:21:24 下午 11:21:32 0:00:08 无标题 - Google Chrome 下午 11:21:32 下午 11:21:37 0:00:05 关于征集 2020年度国家科学技术学术著作出版基金项目的通知 - Google Chrome 下午 11:21:37 下午 11:21:50 0:00:13 360安全通知下午 11:21:50 下午 11:22:06 0:00:16 W020190711669335315041.doc - WPS 教育版下午 11:22:06 下午 11:22:46 0:00:40 中华人民共和国科学技术部 ▪站内检索 - Google Chrome 下午 11:22:46 下午 11:24:08 0:01:22 ManicTime - TRIAL 下午 11:24:08 下午 11:24:17 0:00:09 关于对 “科技冬奥”重点专项2020年度项目申报指南征求意见的通知 - Google Chrome 下午 11:24:17 下午 11:24:23 0:00:06 另存为下午 11:24:23 下午 11:24:31 0:00:08 关于对 “科技冬奥”重点专项2020年度项目申报指南征求意见的通知 - Google Chrome 下午 11:24:31 下午 11:24:44 0:00:13 W020191030353723752033.doc - WPS 教育版下午 11:24:44 下午 11:25:33 0:00:49 3.1 相关网页 - 为知笔记: 收藏知识，分享快乐下午 11:25:33 下午 11:25:40 0:00:07 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 11:25:40 下午 11:25:50 0:00:10 3.1 相关网页 - 为知笔记: 收藏知识，分享快乐下午 11:25:50 下午 11:25:56 0:00:06 W020190711669335315041.doc - WPS 教育版下午 11:25:56 下午 11:26:02 0:00:06 W020191030353723752033.doc - WPS 教育版下午 11:26:02 下午 11:26:25 0:00:23 任务切换下午 11:26:25 下午 11:26:30 0:00:05 W020191030353723752033.doc - WPS 教育版下午 11:26:30 下午 11:26:35 0:00:05 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 11:26:35 下午 11:27:36 0:01:01 W020191030353723752033.doc - WPS 教育版下午 11:27:36 下午 11:28:41 0:01:05 关于对 “科技冬奥”重点专项2020年度项目申报指南征求意见的通知 - Google Chrome 下午 11:28:41 下午 11:28:46 0:00:05 中华人民共和国科学技术部 ▪站内检索 - Google Chrome 下午 11:28:46 下午 11:29:12 0:00:26 关于对国家重点研发计划 “主动健康和老龄化科技应对”重点专项2020年度项目申报指南征求意见的通知 - Google Chrome 下午 11:29:12 下午 11:29:18 0:00:06 无标题 - Google Chrome 下午 11:29:18 下午 11:29:25 0:00:07 W020191030353723752033.doc - WPS 教育版下午 11:29:25 下午 11:29:36 0:00:11 360安全通知下午 11:29:36 下午 11:30:46 0:01:10 W020191030353723752033.doc - WPS 教育版下午 11:30:46 下午 11:30:56 0:00:10 任务切换下午 11:30:56 下午 11:31:01 0:00:05 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 11:31:01 下午 11:31:25 0:00:24 关于对国家重点研发计划 “主动健康和老龄化科技应对”重点专项2020年度项目申报指南征求意见的通知 - Google Chrome 下午 11:31:25 下午 11:31:36 0:00:11 W020190930630666095575.docx - WPS 教育版下午 11:31:36 下午 11:33:33 0:01:57 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 11:33:33 下午 11:33:49 0:00:16 W020190711669335315041.doc - WPS 教育版下午 11:33:49 下午 11:33:55 0:00:06 W020190930630666095575.docx - WPS 教育版下午 11:33:55 下午 11:34:03 0:00:08 任务切换下午 11:34:03 下午 11:34:08 0:00:05 W020190930630666095575.docx - WPS 教育版下午 11:34:08 下午 11:34:18 0:00:10 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 11:34:18 下午 11:34:50 0:00:32 任务切换下午 11:34:50 下午 11:34:55 0:00:05 中华人民共和国科学技术部 - Google Chrome 下午 11:34:55 下午 11:35:05 0:00:10 无标题 - Google Chrome 下午 11:35:05 下午 11:35:11 0:00:06 科技部关于发布国家重点研发计划 “政府间国际科技创新合作/港澳台科技创新合作”重点专项2019年度第二批项目申报指南的通知 - Google Chrome 下午 11:35:11 下午 11:35:21 0:00:10 科技部关于发布国家重点研发计划 “政府间国际科技创新合作/港澳台科技创新合作”重点专项2019年度第二批项目申报指南的通知 - Google Chrome 下午 11:35:21 下午 11:35:29 0:00:08 中华人民共和国科学技术部 ▪站内检索 - Google Chrome 下午 11:35:29 下午 11:35:38 0:00:09 关于对国家重点研发计划 “大科学装置前沿研究”重点专项2020年度项目申报指南征求意见的通知 - Google Chrome 下午 11:35:38 下午 11:35:46 0:00:08 另存为下午 11:35:46 下午 11:35:51 0:00:05 关于对国家重点研发计划 “大科学装置前沿研究”重点专项2020年度项目申报指南征求意见的通知 - Google Chrome 下午 11:35:51 下午 11:35:56 0:00:05 中华人民共和国科学技术部 ▪站内检索 - Google Chrome 下午 11:35:56 下午 11:36:05 0:00:09 科技部关于发布国家重点研发计划 “战略性国际科技创新合作”重点专项2019年度联合研发与示范项目申报指南的通知 - Google Chrome 下午 11:36:05 下午 11:36:28 0:00:23 中华人民共和国科学技术部 ▪站内检索 - Google Chrome 下午 11:36:28 下午 11:36:44 0:00:16 JisuWorkCommon 下午 11:36:44 下午 11:37:10 0:00:26 W020190930512082504475.pdf - 极速PDF阅读器下午 11:37:10 下午 11:37:56 0:00:46 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 11:37:56 下午 11:38:17 0:00:21 W020190930512082504475.pdf - 极速PDF阅读器下午 11:38:17 下午 11:38:31 0:00:14 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 11:38:31 下午 11:38:40 0:00:09 W020190930512082504475.pdf - 极速PDF阅读器下午 11:38:40 下午 11:38:47 0:00:07 选择性粘贴下午 11:38:47 下午 11:38:52 0:00:05 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 11:38:52 下午 11:39:06 0:00:14 Windows 资源管理器下午 11:39:06 下午 11:39:11 0:00:05 W020190806547287188399.pdf - 极速PDF阅读器下午 11:39:11 下午 11:41:12 0:02:01 中华人民共和国科学技术部 ▪站内检索 - Google Chrome 下午 11:41:12 下午 11:41:43 0:00:31 科技部关于发布国家重点研发计划 “可再生能源与氢能技术”等重点专项2019年度项目申报指南的通知 - Google Chrome 下午 11:41:43 下午 11:42:17 0:00:34 科技部关于发布国家重点研发计划 “可再生能源与氢能技术”等重点专项2019年度项目申报指南的通知 - Google Chrome 下午 11:42:17 下午 11:42:25 0:00:08 360安全通知下午 11:42:25 下午 11:43:13 0:00:48 科技部关于发布国家重点研发计划 “可再生能源与氢能技术”等重点专项2019年度项目申报指南的通知 - Google Chrome 下午 11:43:13 下午 11:43:34 0:00:21 科技部关于发布国家重点研发计划 “可再生能源与氢能技术”等重点专项2019年度项目申报指南的通知 - Google Chrome 下午 11:43:34 下午 11:43:48 0:00:14 W020190619561763435669 (1).pdf - 极速PDF阅读器下午 11:43:48 下午 11:44:31 0:00:43 W020190621526499064130.pdf - 极速PDF阅读器下午 11:44:31 下午 11:44:41 0:00:10 任务切换下午 11:44:41 下午 11:44:48 0:00:07 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 11:44:48 下午 11:44:56 0:00:08 W020190621526499064130.pdf - 极速PDF阅读器下午 11:44:56 下午 11:45:03 0:00:07 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 11:45:03 下午 11:45:09 0:00:06 W020190621526499064130.pdf - 极速PDF阅读器下午 11:45:09 下午 11:45:41 0:00:32 选择性粘贴下午 11:45:41 下午 11:45:47 0:00:06 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 11:45:47 下午 11:46:06 0:00:19 ManicTime - TRIAL 下午 11:46:06 下午 11:46:18 0:00:12 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 11:46:18 下午 11:50:34 0:04:16 ManicTime - TRIAL 下午 11:50:34 下午 11:51:47 0:01:13 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 11:51:47 下午 11:52:27 0:00:40 ManicTime - TRIAL 下午 11:52:27 下午 11:53:25 0:00:58 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 11:53:25 下午 11:55:02 0:01:37 WPS Office 下午 11:55:02 下午 11:55:07 0:00:05 新建 - WPS 教育版下午 11:55:07 下午 11:55:15 0:00:08 ManicTime - TRIAL 下午 11:55:15 下午 11:57:05 0:01:50 TIM 下午 11:57:05 下午 11:57:27 0:00:22 ManicTime - TRIAL 下午 11:57:27 下午 11:57:38 0:00:11 TIM 下午 11:57:38 下午 11:57:46 0:00:08 W020190930630666095575.docx - WPS 教育版下午 11:57:46 下午 11:57:52 0:00:06 www.yunju.net + 科大云炬 +helicon.docx - WPS 教育版下午 11:57:52 下午 11:59:16 0:01:24

个人分类: 科研笔记|5189 次阅读|0 个评论

图谋博客的检索与利用

libseeker 2018-9-13 07:04

图谋按：图谋博客不仅仅是图谋个人的资料库，还可以是圕人共有的资料库，她具有检索功能，稍事梳理，供参考。 1 图谋博客简介：图谋博客大致分为三阶段：2005.1.28——2009.2.9，主要是在博客网写博客；2009.2.9——2013.1.30，同时在博客网、科学网写博客(各有侧重，内容不尽相同)；2013.1.30——现在，主要是在科学网写博客。2014年5月10日圕人堂QQ群建立，设圕人堂专题。 2012年11月14日，图谋博客（http://libseeker.bokee.com/）访问量逾300万人次。2018年9月13日，图谋博客（http://blog.sciencenet.cn/u/libseeker），已有 4899218来访过，科学网博客总排行58。 2 科学网图谋博客的检索功能有多种途径，且效果较好。（1）科学网博客内部检索功能有3种：按时间检索；“按标题搜索”（ http://blog.sciencenet.cn/home.php?mod=spaceuid=213646do=blogview=mefrom=space ）；站内搜索（ http://blog.sciencenet.cn/blog.php ）。（2）借助百度搜索，参考方法：检索框内输入“图谋博客”+检索词。 3 博客网图谋博客的检索功能博客网内部提供：按时间检索。图谋“特制”了索引（2013年1月曾公开过），供参考。博客网图谋博客总目录20130128.htm 本文档提供doc版及htm版，建议直接使用htm版。索引（目录）有三大作用： 1、便于浏览，因为是htm格式，可以直接点击相应的超链接便捷访问； 2、便于查找，可以搜索文本，也可以按时间顺序找寻； 3、便于下载，通过该目录可以使用下载工具，可以迅速下载图谋博客全部内容，生成简易图谋博客htm版电子书。本文档相当于图谋博客电子书html版。时间范围：2005年1月28日-2013年1月28日。本地使用本文档的方法： 1、打开图谋博客总目录(图谋博客总目录20130128.htm) 2、查找所需文件。 3、点击所需文件。假定本文件夹的位置在F盘。只需将“http://libseeker.bokee.com/”用“F:\\图谋博客20130128\\”替换即可。假如可以直接访问图谋博客（http://libseeker.bokee.com），直接点击对应链点即可。需要说明的是，博客网中2005年2月14日以前的日志消失了，总目录中2005.1.28-2005.2.14无法直接打开，但可以通过图谋博客之博客大巴备份中的链接访问( http://libseeker.blogbus.com/logs/2005/ )。也可以根据总目录搜索百度等搜索引擎，通过访问缓存获取。关于图谋：原名：王启云。网名:a。自1999年启用，曾活跃于寒网（寒心网络论坛）、学网（大学图书馆学报读者沙龙）、一网（网络图苑）、e线图情论坛等图情论坛。笔名：图谋。自2006年启用。主要活跃于《图书馆报》图林漫步专栏。其它笔名所写文字与图情无关。虚名：libseeker。“图谋博客”总店在博客网，另有分店若干家，设于科学网、新浪网、博客大巴、网易、百度、小木虫等，均以“libseeker”为标识。馆员。图书馆学硕士。中国图书馆学会会员、江苏省图书馆学会会员。研究方向：数字图书馆、信息网络、管理信息系统。图谋博客（http://libseeker.bokee.com/）撰写者，《图书馆报》图林漫步专栏作者。曾在图情专业期刊发表论文40余篇；被《情报学报》2006年2期列为图情档学发文量最多的前20位学者；出版专著3部；主持或参与完成国家社科基金、省社科基金等近10项科研项目；2007-2009年中国图书馆学会优秀会员。图谋博客相关资料：图谋简介.http://libseeker.bokee.com/viewdiary.46205014.html 图谋记忆——论文题录.http://libseeker.bokee.com/viewdiary.16237593.html 2018年9月13日补充说明: 博客网图谋博客，当前的名字叫：图谋的博客.http://libseeker.bokee.com/,所有的网址，当前应删去“viewdiary.”，比如前述“图谋简介”网址现为： http://libseeker.bokee.com/46205014.html 延伸阅读： 1 与圕人堂相关内容的检索与利用参见：《圕人堂周讯》辑录 http://blog.sciencenet.cn/blog-213646-837007.html 注：为节省《圕人堂周讯》篇幅，直接链接至“科学网圕人堂专题《圕人堂周讯》辑录”（第1期至最近一期。并提供word版“合辑”下载。），各期对应网址动态更新。 2 图谋图书信息辑录. http://blog.sciencenet.cn/blog-213646-1083698.html 图谋博客14年，结集出版了4本书。图谋以为，结集出版部分只是图谋博客的“附产品”。 1 王启云著.图书馆学随笔——图谋博客精粹._北京：国家图书馆出版社，2011.12 2 王启云著.图书馆学笔记——科学网图谋博客精粹._北京：知识产权出版社，2013.8 3 王启云著.图书馆学散论——科学网图谋博客精粹.知识产权出版社，2015.12 4 王启云著.图书馆学短论——科学网图谋博客精粹.知识产权出版社，2017.9

个人分类: 圕人堂|2804 次阅读|0 个评论

关于高校图书馆信息检索课的思考

热度 3 libseeker 2016-5-29 12:06

作为高校图书馆员，一直认为信息检索课很重要。在作一些关注与思考，且开展了一些实践与探索。《普通高校图书馆规程》（教高【2015】14号）“第三章工作人员”的第十一条中有“高等学校应根据发展目标、师生规模和图书馆的工作任务，确定图书馆工作人员编制。”“专业馆员的数量应不低于馆员总数50%。专业馆员一般应具有硕士研究生及以上层次学历或高级专业技术职务，并经过图书馆学专业教育或系统培训。”《普通高校图书馆规程》（教高【2015】14号）“第六章服务”中有“第三十一条学校图书馆应全面参与人才培养，充分发挥第二课堂的作用，采取多种形式提高学生综合素质。图书馆应重视开展信息素质教育，采用现代教育技术，加强信息素质课程体系建设，完善和创新新生培训、专题讲座的形式和内容。”。我认为，高校图书馆“专业馆员”的数量与质量，一定程度上体现在信息素质教育开展方面，“信息素质教育”一定程度上又是由信息检索课承载。当前，许多高校的信息检索课为全校性公选课。此外，图书馆针对各院系师生的专业需求举办相关专场培训与讲座，由图书馆馆员或数据库培训人员主讲，面向各院系师生举办有针对性的专题讲座，介绍各类电子资源以及操作技巧，提高其获取文献以及自如地利用各种图书馆资源和网络学术资源的能力。此外，师生可根据自身需要，与信息咨询部联系，举办专题培训讲座。专题讲座的内容、时间与地点均可根据师生的要求，由院系与信息咨询部负责人进行协商安排。据个人了解，不少高校，信息检索公选课的选课情况并不理想，甚至有的学校因选的学生过少，已多年未开成课。至于专场培训与讲座，有少部分做得很出色，但更多的似乎更像是“例行公事”，种种原因，捧场的用户太少了。信息检索课，很多学校无法纳入必修课范畴，原因有很多，教学改革要求精简课程等等。也有部分学校部分专业纳入了必修课或专业选修课范畴，但师资与图书馆无关。每年九月份图书馆都要开展迎新工作。新生入学教育的主要内容包括介绍图书馆的服务项目及图书馆的规章制度，以及带领新生参观图书馆。某高校近年改革了，由学生通过网络学习，参加新生入馆教育考试，考试通过后开通读者证，至于带领新生参观图书馆“省略”了。2016年5月中旬发现该校2015级学生未激活借书证的学生占该级学生总数的27.8%！这意味着什么？一定程度上是否“代表”这些学生不需要图书馆的资源与服务？当前图书馆的资源，由纸质资源及数字资源组成，数字资源（包括数字化图书、数字化期刊、学位论文及其它多媒体资源）可以通过网络利用。假如使用移动图书馆，可以随时随地利用图书馆的资源与服务，但前提是需要与借书证建立关联（取得授权），假如借书证未激活，是无法登陆的。根据《高校图书馆文献资源发展概况（2010-2014）》（大学图书馆学报，2016(2)）：2014年文献资源经费，“985工程”及“211工程”高校图书馆均值为1778.7万元；普通本科高校图书馆均值为484.5万元。高校图书馆之间，资源的差距是非常大的。通常还有版权约束，比如“禁止将个人网络帐号提供给校外人员使用本校电子资源，更不允许利用获得的文献资料进行非法牟利；禁止私设代理服务器提供校外人员使用本校电子资源”。高校图书馆的中外文数据库，数量从几种、几十种、上百种、甚至近千种不等。信息检索课旨在培养用户的信息素养，帮助用户系统了解和较为熟练地掌握各类数据库的浏览、检索和使用方法，提高学习者的自学能力和研究能力。这门课并不能做到“面面俱到”，但确实有举一反三，触类旁通之效。比如，可以通过公共图书馆（尤其是大型公共图书馆）、网络搜索引擎等拓宽信息获取渠道。当前高校图书馆的年度文献资源建设经费，数字资源经费所占的比例愈来愈重，不少高校在60%左右。然而，图书馆人力资源仍主要集中在印刷型资源方面，而且图书馆现有的人力资源中能够胜任信息检索课教学的比例亦是比较低的。良性的发展，亟待进一步重视高校图书馆信息检索课。希望本文粗浅的思考，能有所助益。

个人分类: 圕人堂|7105 次阅读|5 个评论

替代计量指标用于检索应用的实例

yuhouq 2015-12-4 02:38

我们很高兴地看到，除了热火朝天的评价研究之外，终于有机构开始了检索应用。 https://www.scienceopen.com/search?0q=diabetesbase-header:header:type=articlesort=18

个人分类: 个人观点|2567 次阅读|0 个评论

教育部“爱课程网”信息检索类精品资源共享课

libseeker 2015-11-26 20:08

1 山东理工大学图书馆开设的《信息检索与利用》课程，2007年、2013年被评为国家精品课程。中国大学精品开放课程（信息检索与利用. http://www.icourses.cn/coursestatic/course_3888.html ）。课程简介：信息检索课是一门与时俱进的网络通识课程，内容具有实用性、权威性和趣味性。通过课堂讲授和机房实习，使学生了解网络信息资源概貌，熟悉权威信息网站，练习检索技巧，掌握常用数据库的使用。教学目的是让学生把网络资源当作知识存储的“外脑”。课程的口号是：掌握信息检索，拥有网络世界。 2 西南交通大学图书馆开设的《信息检索》课程，2010年评为国家精品课程。中国大学精品开放课程（信息检索. http://www.icourses.cn/coursestatic/course_3189.html ）。该课程主要采用多媒体教学与网络实时演示相结合的方式，以及“项目活动模式”与“Library Pathfinder”实习方法，开展以学生为中心的启发式教学、互动式教学。同时，通过专题与个案实战练习，指导学生采用学习小组的形式完成任务，培养学生适应团队合作的精神，全面提升学生的信息素养和能力。 3 信息检索. http://www.icourses.cn/coursestatic/course_3487.html 武汉大学信息管理学院副院长、教授、博士生导师黄如花主讲。主讲的“信息检索”类课程分别于2010、2013和2014被评为国家级精品课程、国家精品资源共享课程和“全国大学素质教育优秀通选课”；主编的《信息检索》入选教育部“十二五”规划教材。 4 文献信息检索 http://www.icourses.cn/coursestatic/course_6097.html 成都航空职业技术学院精品资源共享课程课程属性：公共基础课课程学时：32.0。

个人分类: 圕人堂|12964 次阅读|0 个评论

如何检索与利用科技报告文献？

热度 1 libseeker 2015-6-4 07:41

科技报告是描述科研活动的过程、进展和结果，并按照规定格式编写的科技文献，其目的是实现科技知识的积累、传播和交流，其类型包括专题报告、进展报告、最终报告和组织管理报告。科研人员依据科技报告中的描述能重复实验过程或了解科研结果。万方数据知识服务平台含科技报告（ http://c.wanfangdata.com.cn/NSTR.aspx ），它可以检索中外文科技报告。中文科技报告：中华人民共和国科学技术部已公开的中文科技报告 20000 余份，数据将陆续增加。外文科技报告：美国政府四大科技报告 AD 、 DE 、 NASA 、 PB ，共计 1100000 余份，数据将陆续增加。中文科技报告检索结果提供“ NSTRS 免费获取原文 ”链接， NSTRS 为国家科技报告服务系统简写。国家科技报告服务系统（ http://www.nstrs.cn/ ）于 2014 年 3 月 1 日正式上线。系统开通了针对社会公众、专业人员和管理人员三类用户的服务。向社会公众无偿提供科技报告摘要浏览服务，社会公众不需要注册，即可通过检索科技报告摘要和基本信息，了解国家科技投入所产出科技报告的基本情况。向专业人员提供在线全文浏览服务，专业人员需要实名注册，通过身份认证即可检索并在线浏览科技报告全文，不能下载保存全文。科技报告作者实名注册后，将按提供报告页数的 15 倍享有获取原文推送服务的阅点。向各级科研管理人员提供面向科研管理的统计分析服务，管理人员通过科研管理部门批准注册，免费享有批准范围内的检索、查询、浏览、全文推送以及相应统计分析等服务。外文科技报告检索结果提供“ ISTIC 获取原文 ”链接， ISTIC 为中国科学技术信息研究所简写。链接的网址是中国科学技术信息研究所、国家工程技术数字图书馆（ http://www.istic.ac.cn/ ）。获取原文需要注册，计费方法为：“单文章实际价格＝原价 * 文章折扣 * 用户折扣”。上述中外文科技报告，可以直接登录国家科技报告服务系统、国家工程技术数字图书馆网站进行检索利用，不一定要经过万方数据知识服务平台。

个人分类: 圕人堂|9607 次阅读|1 个评论

近视眼手术治疗方面的学术期刊论文到底有多少？

rbwxy197301 2015-6-3 12:54

http://weike.enetedu.com/play.asp?vodid=180153e=3 ### 这个链接是南京大学信息管理学院华薇娜老师的一节微课，是全国高校微课教学比赛的一个作品。以下是该作品的介绍：查全查准是文献信息检索成功与否的关键，但往往被常规的课堂讲授所忽视，很多的教材也仅以很小的篇幅介绍查全率查准率这一主题，本课件以实例分析的方法，演示了一个检索命题从4篇结果到3000余篇全面准确结果的过程，既步步深入又深入浅出地说明了检索词与检索结果的密切关系，用事实证明了文献信息检索过程中正确选择检索词的重要性。华老师的讲解非常清晰，通过一个具体的案例为我们介绍了针对一个特定内容，如何来选择检索策略。信息检索看起来很简单，尤其是现在的数据库功能越来越丰富，但实际上要做好检索是非常有讲究的。文献检索应该是每个人都需要掌握的基本技能，是信息素质中非常重要的一个方面。相信大家从这个简短的微课当中能够有所收获。

个人分类: 图情学教育|2987 次阅读|0 个评论

《医学信息检索与利用》出版

热度 4 terahertz 2015-4-24 11:14

日前，本人主编的《医学信息检索与利用》教材由江苏大学出版社出版。本书为现代信息检索与利用丛书分册，主要介绍了信息检索在医学上的相关应用，采用了许多案例进行导读，增加了“小贴士”等内容，为读者拓展知识、发展能力留有充分的空间。全书共分为 7 章：第 1 章绪论；第 2 章　信息资源检索概述；第 3 章　中文期刊信息资源检索；第 4 章　外文期刊信息资源检索；第 5 章　图书及特种文献信息资源检索；第 6 章　网络信息资源检索；第 7 章　信息资源利用。

个人分类: 教材专著|3701 次阅读|9 个评论

UIUC图书情报研究生院(GSLIS)学术报告:音乐信息检索

热度 1 terahertz 2015-2-7 09:04

当地时间2015年2月6日下午4时，地点位于美国伊利诺伊大学香槟分校图书情报研究生院的126报告厅。本学期CIRSS系列研讨会首先由GSLIS的访问学者，来自华东理工大学信息科学与技术学院副教授陈宁开讲，题目是“基于音频内容的音乐信息检索”。在日常生活中人们喜欢听音乐。但是作为个人如何从全球巨大的音乐库中选择是一个棘手的问题。基于音频内容的音乐信息检索技术能够帮助我们解决上述问题。本次报告主要讲述2方面的问题：音频指纹和翻唱歌曲的识别。音频指纹系统最大挑战来自抵抗时间尺度(时间延伸和转变)的鲁棒性，基于计算机视觉分析提出一个音频指纹识别算法并进行研究，结果表明分辨率高、且易于计算。对翻唱歌曲识别中最常见的特征——音阶轮廓特征(PCP特征)，应用听力心理物理学的两个概念组合(时变等响曲线和耳蜗频率选择性)进行改进研究。与基于传统的PCP相比，本实验结果能够获得较高的识别准确率。

个人分类: 出国留学|3665 次阅读|2 个评论

2014全国医学文献检索教研会

terahertz 2014-10-16 08:51

2014 全国医学文献检索教研会第十三次学术研讨会于 2014 年 10 月 15-16 在江苏大学图书馆举行。研讨会分为三部分：第一部分是主题报告，由吉林大学于双成教授主讲《医学方法范畴下的文献检索课教学——学习与思考》。分为 4 个部分展开：医学知识体系与医学之目的、医学方法学课程群及其特点、文检课的功能及教学模式、医学文检课教师的全面发展。第二部分是论文交流：共有 6 份登台交流。分别是：复旦大学《大数据时代医学文献检索教学改革探讨》、中山大学《微视频——应用于信息素养教育的思考》、中山大学《医学信息素养教育在全媒体时代的探索与实践》、河北联合大学《翻转课堂中的知识内化效应》、第四军医大学《“竞赛型”文献检索教学模式》、滨州医学院《基于全球医学教育最低标准的医学生信息素养教育改革》。第三部分是讲课比赛。共有 10 个学校的 16 位教师讲课。讲课内容包括： Noteexpress 、关键词语言、检索策略、临床信息、 Pubmed 、医学专利检索、 Mesh 、文献概述、循证医学、 CBM 、网络信息资源概述、 CNKI 检索结果优化等。评出了一二三等奖。

个人分类: 信息检索|3625 次阅读|0 个评论

安全科学技术信息检索基础

热度 1 terahertz 2014-10-12 19:57

2014年10月12日收到首都经贸大学李杰博士主编寄来的《安全科学技术信息检索基础》赠书。本人参与了小部分的编写。全书共分为7章。第1章：信息检索基础知识。第2章：常用全文数据库。第3章：索引数据库及学术期刊。第4章：特种文献数据库。第5章：搜索引擎及开放获取资源。第6章：科学文献管理与分析。第7章：论文写作及学术规范。链接：安全科学技术信息检索基础 http://blog.sciencenet.cn/blog-554179-828943.html

个人分类: 信息检索|5360 次阅读|2 个评论

文献阅读笔记（13）-消去网页模板以提升信息检索性能

FangliXie 2014-7-3 18:47

消去网页模板以提升信息检索性能 Yu S,Cai D,Wen J R,etal.Improving pseudo-relevance feedback in Web information retrieval using Web page segmentation Proc of the 12th World Wide Web Conf.New York:ACM,2003. Pseudo-Relevance Feedback 从初始查询结果中选取 k 个页面 , 并抽取 20-30 个词语作为查询扩展 , 再次进行检索并将最终结果返回给用户 . 这样做是为了提高查询结果与用户 query 之间的相关性 . 论文思路 :InitialRetrieval à Page Segmentation (VIPS) à Segment Selection à ExpansionTerm Selection à Final Retrieval. VIPS 页面中存在很多视觉提示 (visual cues) 便于区分页面中的不同部分 , 如线条、空白区、图像、不同字体大小、不同颜色等 . 基于视觉的内容结构跟树形结构相似 , 每个节点代表页面中的一个区域 , 并用内聚度反映节点内容的一致性 . 基于视觉的内容结构树能对页面进行语义上的分块 , 是 DOM 结构和语义结构的桥梁 . 其有三个步骤 : 视觉块抽取 à 分隔符检测 à 内容结构创建 . 第一步运用一些启发式规则 ( 包括标签提示、颜色提示、文本提示、大小提示 ) 来判定是否需要对 DOM 叶子节点作进一步划分 , 该步骤结束后每个节点就代表一个视觉块并且具有相应的 DoC 值 . 第二步运用一些启发式规则 ( 包括距离模式、标签模式、字体模式、颜色模式 ) 来选择视觉块之间的分隔符 . 第三步在第二步的基础上把分隔符同一侧的视觉块合并 , 并且作为内容结构树的一个节点 . 数据集来源 Bailey, P., Craswell, N., and Hawking, D., Engineering a multi-purpose test collection for Web retrieval experiments , Information Processing and Management, in press. 实验分析 1) 数据集 . 选取 Okapi 作为检索系统 ,TREC-9 的 WT10g 和 TREC 2001 Web Track 作为数据集 . WT10g 中有 169 万个页面 . 从 TREC 2001 Web Track 中选取 50 个 queries . 2) 衡量指标 . 将传统的方法 (FULLDOC), 基于 DOM 的方法 (DOMPS) 和基于 VIPS 的方法对页面进行处理后检索得到的结果进行对比 . Ma L,Goharian N,ChowdhuryA,et al.Extracting unstructured data from template generated Web documents Procof the 12th Int Conf on Information and Knowledge Management.NewYork:ACM,2003:512-518. Pagelet : a self-contained logical region within a page that has a well-defined topic or functionality. ( 页面中一个独立的逻辑区域且有明确的主题或者功能 .) Template: a template is a consecutive group of text tokens that: (a) appear in every page belonging to that template, (b) share the same geometrical location and size within the web pages, (c) serve primarily as navigation, trademark, or advertising without providing otherinformation. Table text chunk: A table text chunk is consecutive terms extracted between a pair of closest HTML table tags. ( 表间文本块是指从相邻 TABLE 标签之间抽取出的一段连续性短语 ). 论文思路思路说明：首先运用 IMatch 算法检测网页集合中的重复页面 (duplicate page) 并去除 , 然后对页面进行两次遍历 , 第一遍将遇到的 Table text chunk 进行存储 , 并对其在页面集合中出现的次数计数 , 第二遍识别出现次数大于阈值的 Table text chunk( 这些就是模板类的 Table text chunk), 并对低于阈值的 Table text chunk( 内容类的 Table text chunk) 建立索引 , 并且作为输出结果 . 接下来进行 queries 检索实验 , 对比处理模板前和处理模板后的检索结果 . 实验分析 1) 数据集 . 选用 cnnfn 网站的 55711 个页面作为检索源 . 从 10000 条该网站用户的 queries 中得到了 800 条与模板相关的 query, 去掉诸如 ”bill gates”,”interest rate cut” 等 520 个具体名词类的 queries, 剩余 280 个抽象名词类的 queries, 基于此进行检索实验 . 2) 衡量指标 . Froelich (1994) 提出的衡量文档相关性的标准：话题性 (topicallity), 感知有效性 (perceived validity), 新颖性 (novelty).Su (1998) 提出评估模型 , 该模型包括对 effectiveness( 效用 ),efficiency( 效率 ),user satisfaction( 用户满意度 ),reliability of connectivity( 连通可靠性 ),user characteristics( 用户特征 ) 的测量 . NAVEENSUNDAR,G., D. NARMADHA, and AP HARAN. SIMPLIFIED SCHEME FOR PERFORMANCE AUGMENTATION OF WEB DATA EXTRACTION . Journal of Theoretical Applied Information Technology 60.3 (2014). 本文提出了一种用于网页模板检测的新的页面表示方法 , 使用 DOM 树的路径 (path). 如图左边是两个页面的 HTML 标签列表 , 右边则是页面对应的 path 及 pathno( 代表 path 出现的次数 ). 每个页面会定义一个 LPT(least path threshold) 和 MST(minimum support threshold) , 前者是每个页面路径中的 pathno 值的众数 (mode), 后者是每个页面路径的支持度 (support). 如果一条路径满足 LTP 那么它是 non-content path , 如果一条路径满足 MST 那么它是页面的关键路径 . 论文思路思路说明 : 对从 5 个网站中获取的页面进行读取和解析 , 根据解析结果 LPT 和 MST 被确定 , 进一步找出页面的关键路径并用矩阵表示 . 接着用 TEXT-MDL 进行聚类 , 从聚类结果中可以确定页面的模板 . 然后用另一个与此方法近似的 MinHash 再做一次聚类 . 为了提高整体的性能用 LSH 方法又做了一次聚类 . 最后比较三种方法在执行时间和内存使用上的表现 .

个人分类: 科研笔记|2467 次阅读|0 个评论

《信息检索研究进展》讲座总结

热度 2 leileiya 2014-6-5 23:54

今天下午（ 2014 年 6 月 5 日）在南京理工大学经济管理学院听取了美国长岛大学储荷婷教授的《信息检索研究进展》的讲座。随着互联网的发展，如何提高用户信息检索的效率和效果，变得尤为重要。褚老师从信息检索大众化、个性化、简易化、移动化、智能化 5 个方面的特点进行了分别详细的介绍。根据《 2013 年中国网民搜索行为研究报告》显示中国搜索引擎网民规模达到了 4.7 亿，信息检索已经变成上网必备的服务，这就要求搜索引擎能够满足大众化和个性化的要求，并且要求搜索引擎能够满足不同阶层用户的需要，使得用户方便的进行信息检索，并且在检索时可以进一步减少所付出的努力。同时，随着手机等移动设备的使用，需要使信息检索移动化，可以为用户提供随时随地的检索服务。最终，实现信息检索的智能化是信息检索服务的最高境界，可以实现由信息检索系统自动执行检索任务，并检得我们所需信息。最后，储老师提出我们信息管理可以在信息检索智能化中发挥的作用有信息的搜集与选择、信息组织与整理、信息分析与评估。

个人分类: 讲座心得|5403 次阅读|3 个评论

储荷婷教授学术报告《信息检索研究进展》

xuechunxiang 2014-6-4 08:23

学术讲座信息讲座题目：信息检索研究进展报告人：储荷婷　教授、博导时间：2014年6月5日周四 16：00－18：00 地点：经济管理学院614 储荷婷，美国长岛大学教授、博导；2013年荣膺长岛大学“终身研究奖”。储教授在信息管理领域成绩斐然，主要研究领域包括信息表示与检索、科学交流研究方法、数字图书馆、网络搜索引擎、web2.0应用与学术交流。自1997年至今已出版专著、合著7部，先后在本领域高质量期刊上发表多篇学术论文；是美国图书馆学会、美国信息科学技术学会、美国计算机学会、美国图书情报教育学会等专业学会委员，多次担任国际学术会议和领域期刊评审。

个人分类: 学海泛舟|3628 次阅读|0 个评论

生物医学文本挖掘相关概念辨析

zilu85 2013-12-16 13:37

文本挖掘与信息检索和文本总结不同，信息检索和文本总结（text summarisation）侧重于文本的更大单位，如整篇文章，而文本挖掘则侧重于较小的粒度水平并检查文章内部和文章之间特定信息之间的关系。文本挖掘也与自然语言处理不同，因为自然语言处理试图从整体上理解文本的含义，而文本挖掘则是注重解决特定重要领域中的特定问题（也许会用到一些自然语言处理的技术）。例如，通过选择最可能含有感兴趣信息的文章，文本挖掘可以数据库维护人员提供帮助；或者通过寻找与偏头疼的特定生物学过程相关的药物，发现偏头疼的潜在的新治疗方法。因此上，生物医学文本挖掘的目标就是帮助研究人员更加有效地确认所需信息，发现隐藏在大量信息中的关系，更加宽泛地说，通过给存在于文献和生物医学数据库中的自由文本字段中的大量生物医学知识应用应用算法、统计方法和数据管理的方法，去除信息过量给研究人员造成的障碍。

个人分类: 生物医学文本挖掘|4528 次阅读|0 个评论

OHSUMED TestCollection

zilu85 2013-9-22 16:41

信息研究中用到许多语料库，如著名的 TREC 中有很多用于检索的语料库， The BioCreAtIvE (Critical Assessment of Information Extraction systems in Biology) 是用于信息抽取的。一直以来知道OHSUMED也是个针对MEDLINE数据库的语料库，但是一直没有找到比较合适的说明介绍。只好把它们网站首页上的文字翻译下来。网址是： http://ir.ohsu.edu/ohsumed/ohsumed.html，可以免费使用。 OHSUMED实验集用于信息检索研究，为偏重临床的 MEDLINE 文献子集，包括 348,566 条文献记录（从 7 百多万条记录中抽取），涵盖了 270 种医学杂志 5 年间（ 1987-1991 ）发表的文献记录。实验集大小为 400M 。去掉了文献记录中一些与内容检索无关的字段，仅仅包括：标题、摘要、 MeSH 标引词、作者、来源及出版类型。该数据集既不完整也不更新，不能用于实际检索，只用于研究。该实验集是一项评估医生在临床使用 MEDLINE 情况的研究之一部分。使用 MEDLINE 的新手医生根据 106 个问题进行了检索。在他们开始检索之前，请他们提供病人的信息以及自己的信息需求。然后由 4 位检索人员（ 2 个有经验的医生和 2 个医学图书馆员）重新检索每一个问题，然后由另一组医生评价检索到的每一篇文献与提问之间的相关性，评价等级包括肯定相关、可能相关和不相关三个级别。总共有 12 ， 565 条提问 - 文献对；为评估观察者之间的信度，又对其中超过 10% 的提问 - 文献对进行了重复评价。原始试验集后来用于 SMART 检索系统的实验中。如我们所期待的， SMART 检索到了一些原始检索中没有找到的文献记录。在这些实验之后，进行了第二轮的相关性评判，新增了 3 ， 575 条经过评价的提问 - 文献对，其中超过 10% 又进行了重复评价以评估观察者之间的信度。这样，现在总共有 16 ， 40 对判定为相关的提问 - 文献对。这些内容都放在一个文件中（ judged ），文件里每一条记录都给予相关性评判。还有一些列出提问 - 文献对的文件（ drel.i, drel.ui, pdrel.i, and pdrel.ui ）。这些文件中只使用了原始相关性评价。（注意：有 5 个提问没有确定相关的文献，你可能希望从实验中删除这些文献记录。这些提问被放在提问文件中，因为今后的进一步分析会发现这些提问的相关文献。某些系统，如 SMART ，会自动从分析中去除没有检索到相关文献的提问。这 5 个没有相关文献的提问为 8, 28, 49, 86, 和 93 号。国立医学图书馆同意在实验集中使用 MEDLINE 记录用于实验，并受到下列条款约束： 1. 数据不可用于任何非实验性临床、图书馆或者其他单位。 2. 该数据的任何人类用户应明确告知数据是不完整和过时的。实验数据集包括 13 个文件，分别描述如下：（对那些接收压缩文件的用户，只会获得 7 个文件。下面 1-5 个文件中每一个都是独立压缩的，后缀为 .tar.Z ， 6-12 号的所有这些文件都压缩在一个文件中，名为 hsumed.rest.tar.Z 。最后一个文件为本文件，即 readme 文件，未压缩）下面是文件，压缩后大小，内容描述： 1) ohsumed.87 (60,303,307) ：包括 MEDLINE 的 1987 年文献。每一个 MEDLINE 文献文件的格式都遵循 SMART 系统的约定，字段名定义如下（括号里是 NLM 对应名称）： .I 系列号 .U MEDLINE 标识号 (UI) .M 手工标引 MeSH 词 (MH) .T 标题 (TI) .P 文献类型 (PT) .W 文摘 (AB) .A 作者 (AU) .S 来源 (SO) ( 注意：有些文献记录的摘要在 250 个单词后截断，有些记录没有摘要。 ) 2) ohsumed.88 (78,585,929) ： 1988 年的 MEDLINE 文献，格式同上。 3) ohsumed.89 (84,719,077) ： 1989 年的 MEDLINE 文献，格式同上。 4) ohsumed.90 (86,754,890) ： 1990 年的 MEDLINE 文献，格式同上。 5) ohsumed.91 (89,761,122) ： 1991 年的 MEDLINE 文献，格式同上。 6) 查询提问 (11,591) ：包含 106 个实验集合中的检索提问，包括病人和主题信息，格式如下： .I 序列号 .B 病人信息 .W 信息需求 7) drel.ui (26,919) ：包含了评级为明确相关的查询 - 文献对，按照文献的 MEDLINE UI 号排列，格式如下： querytabdocument-ui 8) drel.i (21,709) 包含了评级为明确相关的查询 - 文献对，按照文献的系列号（ .I 字段）排列，格式如下： querytabdocument-i 9) pdrel.ui (57,831) ：包含了定义为明确相关或者可能相关的查询 - 文献对，按照 MEDLINE UI 排列，格式为： querytabdocument-ui 10) pdrel.i(46,664) ：包含了定义为明确相关或者可能相关的查询 - 文献对，按照序列号排列（ .I 字段），格式为： querytabdocument-i 11) judged(368,366) ：包含 5 个原始检索者或 SMART 系统检索到的所有文献记录列表，按照查询号排列，同查询号则按照文献号排列，带有相关性评判，分别为 d （明确相关）、 p （可能相关）或者 n （不相关）。相关性评判为对最原始检索者检索到文献的最原始的相关性评判，相关性评判 2 （ relevance 2 ）的评判则是对相关性评判观察者间信度评价所做的第二次评判，相关性评判 3 （ relevance3 ）的评判则是对通过 SMART 而非原始检索者检索到文献的相关性评判，或者在观察者信度评估中对原始检索到的文献另外做出的相关性评判。 querytabdocument-uitabdocument-itab relevance1 12) ui(3,137,094) ：包含本实验集中所有 348,566 篇文献记录的 MEDLINE UI ，逐行列出。 13) readme ：本文件。由于在构建本实验集过程中使用了相对召回程序，以及相关性评判的主观特性，我们深深感到在对相关性确定上一定会有不同看法。我一定要更新数据集，但是要系统地做，以使研究者之间的数据可以比较。因此，我寻求关于本实验集的报告，如果你发现新的文献感到是相关文献的记录，或者你对某个相关性评判有不同意见，请尽管通过 email 或者写信告知我。我们会定期地更新想关性评判并发表更新版本。

个人分类: 生物医学文本挖掘|3724 次阅读|0 个评论

求解决方案，检索行为跟踪和自动分析

热度 1 hahasalon 2013-8-28 16:46

各位大侠大师，我是西南大学图书馆的小周(周剑)，请求指点一个问题或方向。我一直对学生“信息素养能力分析”感兴趣，也申请到校内项目，3万经费。我的研究思路是，通过网络测试，跟踪学生搜集、评估、利用信息解决其生活学习娱乐问题的，随后根据学生表现自动给学生信息素养能力评分，给他们打等级的。以前我是利用抓屏软件，10秒自动抓屏，保留在本地硬盘，随后我Copy走再分析，但这不适合大范围测试和应用，另外，就是，事后的分析评估很耗人力和精力，并且肯定有主观偏差。我不知道，如今是否有那种技术，也就是在我的测试网站，嵌入什么插件，自动跟踪学生的点击啊、视觉重心啊，还会自动上传到后台服务器，还做分析等等。我知道眼动仪，但这个贵，也不能一次大范围用。我想探寻其他解决方案，求扩散。谢谢。最终，我想做一个公开的网站，有试题，有学习资料，有学生自测，判断其信息素养能力处于哪个阶段，该学习啥。谢谢！我联系电话13983694890 QQ 99593398，请多指点。周剑

个人分类: 学术研究|1481 次阅读|1 个评论

《Information Access on the Social Web》报告听后感

热度 1 leileiya 2013-7-14 21:09

6月28日在南京理工大学我们听取了何教授有关social information access的报告。何教授提出随着互联网的发展，产生了大量的用户生成内容（UGC），其可以分为两类，一类是显性的UGC包括社会化标签、评论、排序，一类是隐性的UGC包括用户查询式、点击浏览情况，这些信息就给我们提供了大量可供我们研究用户的数据，通过研究这些数据可以帮助用户更好的获取社会信息。接着何教授给我们报告了他的研究组4个相关项目，第一个是开发的一个协同检索系统，以2个人共同参与检索一个话题为基础，通过提供实时沟通以及检索结果的存储实现协同，何教授提出现在的协同检索主要集中在两个人的协同，而对于3个人及其以上的协同情况比较复杂，是以后需要进一步研究的方向。第二个是一个找专家的系统，通过收集文献信息，利用文献作者之间的关系，利用pagerank等算法找出各个领域的专家，用户可以在系统中设置自己需要查找的专家权威度的大小。第三个是一个结合图片标签和subject headings的检索系统，比较利用标签和subject headings进行检索的异同。第四个是分析比较图书馆的虚拟参考咨询和问答系统，如百度知道，soso问问等，对用户提问回答情况进行对比，发现其异同。

个人分类: 讲座心得|3958 次阅读|2 个评论

《现代信息检索-研究进展》课程总结

热度 1 leileiya 2013-7-14 21:01

6月24日到28日每天上午8:30-12:00，美国匹兹堡大学何大庆副教授给我们讲授了《现代信息检索研究进展》课程。课程共五天，每天一个研究话题，依次为信息检索中用户建模和推荐系统、交互检索系统、协同检索行为、社会检索、公民科学，每一个话题都是信息检索领域的最新最前沿的话题，现将每天课程进行总结。第一天话题为用户建模和推荐系统。何老师给我们讲解了信息检索相关的基础知识。信息检索即为根据用户的需要从按一定方式组织起来的信息中找出有关信息的过程和技术。随着大数据时代的到来以及非结构化数据量急剧增大，给信息检索的研究提出了更大的挑战，如何从大量的信息中准确的找到用户需要的信息，是信息检索研究的核心内容。接着何老师给我们具体讲解了信息检索中用户建模和推荐系统的相关内容。用户建模就是明确、理解和定义用户的信息需要的过程。用户建模具体包括3个方面，第一个为用户信息需求，即为通过用户提交的查询式明确具体的用户信息需求；第二个是用户的基本信息，包括用户的教育背景、工作、年龄、技能等；第三个是用户对现有资源和系统的评价。对于用户信息的收集可以通过两者方式，一种是利用显性方式，直接让用户填写相关信息，一种是利用隐性方式，通过用户的浏览、点击、保存等行为推测用户的相关信息。接下来一个重要的问题就是在信息检索的过程中何时使用构建的用户模型，何老师给我们讲解了三者方式：第一种是应用于用户的查询式，第二种是应用于搜索引擎，第三种是应用于查询结果。每一种方式都有其优缺点，没有形成统一的认识，值得深入讨论。推荐系统根据用户的兴趣特点和行为，向用户推荐用户感兴趣的信息和商品。推荐算法有很多种，但是基础的是三种，第一种是基于内容的推荐系统，根据用户的购买历史、用户的好恶进行推荐；第二种是协同推荐系统，根据其他相似用户的购买行为进行推荐；第三种是上述两种方法的结合。最后何老师就用户建模和推荐系统相关研究中可以提升的部分进行了讲解，包括如何使推荐系统透明化，让用户明确推荐系统的用途；如何鼓励用户多进行资源评价；以及跨领域推荐和用户信息安全与保密工作。第二节课讲授了交互检索系统相关内容。现有的检索系统缺乏与用户动态的交互，仅仅只是查询式与文档的匹配过程。信息检索本身就是一个用户和系统进行交互的过程，首先是用户提交查询式的过程，用户在此过程中需要用查询式明确的表达自己的信息需求，系统可以通过与用户交互，使用户提供更多的信息，例如系统可以通过提供搜索提示，来丰富用户的查询内容。接着就是查询结果表达的过程，在此过程中系统需要高效的识别用户需要的信息，并以用户可以理解的方式展示出来。例如google使用的KWIC资源表示方式,是一种一维的展现方式，同样的也可以使用二维、三维的展现方式。由于资源的类型多种多样，也可以将不同的资料类型分类检索出来，也可以将检索结果按照已有的分类体系进行分类展示，也可以对检索出的结果进行聚类处理，以便用户可以选择自己需要的类别。查询出的结果如果用户不是很满意，下一步的想法就是更改查询式，此时系统可以在上次查询出的界面中显示相关查询式以便用户更改查询式。接着何老师给我们简单的讲解了手机的检索交互问题，用户在手机端进行检索时有着特殊的特点，注重时效性、位置信息、没有很多的时间来浏览网页等，这件要求界面的设计简单明了，要提供更多的查询结果信息而不是链接，提供更多的查询途径，例如通过语音的方式等，此领域还有很大的提升途径，值得深入研究。最后何老师就交互检索系统相关研究中可以提升的部分进行了讲解，包括提供全球信息检索服务、将国外检索信息翻译成本国语言进行检索等。第三节课讲授了协同检索行为相关内容。现有的检索系统只是针对一个用户的查询目标，现实情况中存在一些人同时完成一个查询目标的情况，可能是同时进行，也可能是异步进行。根据协同检索行为参与者的分工不同可以将协同检索系统分为对称协同检索和非对称协同检索，对称协同检索中参与者的分工相同，一般为两人，而非对称协同检索中参与者分工不同，一般为多人。协同检索的参与者可能处于同一地点，也可能位于不同的地点。何老师讲到现有的研究主要集中在两个人协同检索的行为上，对于多个人由于分工的不同情况复杂，值得深入研究。接着何老师讲解了已有的协同检索系统，包括参与者交流部分、检索历史、推荐查询式、查询结果关键词表示、当前的检索页面及其相关评论和排序。最后何老师就协同检索行为相关研究中可以提升的部分进行了讲解，包括不同年龄、地位、知识水平参与者的协同系统设计、使用不同设备的协同检索系统设计等。第四节课讲授了社会信息检索相关内容。何老师提出随着互联网的发展，产生了大量的用户生成内容（UGC），其可以分为两类，一类是显性的UGC包括社会化标签、评论、排序，一类是隐性的UGC包括用户查询式、点击浏览情况，这些信息就给我们提供了大量可供我们研究用户的数据，通过研究这些数据可以帮助用户更好的获取社会信息。首先讲解了社会化标签和信息检索的关系。社会化标签已经普遍利用在图片、图书、视频、URL上，已有对delicious上URL的标签与用户查询式重合度进行研究、将标签与主题词进行比对研究。接着讲解了社会检索的相关问题，最有代表性的就是Google++检索，Google++是一个SNS社交网站，在这个社交网站上你可以和不同兴趣的好友分享好玩的东西。其中一个功能就是用户提交了一个问题，系统可以在你的好友中寻找可以回答此问题的人，然后将回答结果第一时间返回给用户。下来讲解了社会问答系统，如中国的百度知道、soso问问等，国外的yahoo answers，都是社会问答系统，何老师讲解了现有对问答系统的研究集中在对问答系统中用户的研究、问题领域研究、回答速度研究、回答质量研究以及将社会问答系统与图书馆参考咨询服务的比较研究。最后何老师就社会信息检索相关研究中可以提升的部分进行了讲解，包括社会信息获取方式会越来越广泛、如何鼓励用户参与网络社交活动、如何保护用户的隐私、如果组织社会信息等方面。第五节课讲授了公民科学相关内容。何老师首先给我们介绍了公民科学的基本概念。大量没受过专业训练的业余科学爱好者，通过网络组织的号召，去参与科研任务，这种科研组织模式被称为公民科学。例如最早的圣诞节数鸟工程，就是由公民自发参与的科研活动，参与者通过网络传输数据；将古籍上的文字取出，由不同地域的参与者共同翻译；从航海日志中分析过去的天气信息。公民科学项目可以分为四类，分别是Community-based field work、Observation Network、Virtual Data Processing、Participatory Sensing。最后何老师就公民科学相关研究中可以提升的部分进行了讲解，包括参与者的动机、地域的问题、数据的使用维护和更新问题等。通过这一周的学习，我们受益很多，了解了信息检索领域的前沿热点问题，对我们以后的科研有很多的启示，值得我们好好学习回顾。

3936 次阅读|2 个评论

《知识抽取及其应用》报告听后感

热度 4 leileiya 2013-6-19 12:29

6月18号在南京大学仙林校区听取了美国印地安纳大学刘晓钟博士报告——知识抽取及其应用。首先讲了信息检索相关内容，提出了信息检索面临的3个Task，Task1：用户提供的查询式并不能很好的表达用户的信息需要；Task2：系统可以在最短时间内找到用户需要的相关文档；task3：怎样把用户最需要的相关文档列到查询结果前列。因此用户的信息需要、查询式、查询结果三者之间就形成了一个三角关系，现在主要的研究集中在用系统的方法解决用户问题。从用户的角度进行研究主要集中在如何更好的理解用户的信息需要，从文档的角度研究主要集中在如何选择出的检索结果更具有代表性。刘博士又讲到在前几年研究者认为NLP将是未来解决信息检索问题的有效途径。NLP从最基础的Morphological(词根)到lexical(词法)、syntactic（句法）、semantic（语义）、discourse（语篇）、pragmatic（语用），从最底层向上检索需要的时间长，算法的复杂度高并且准确性也不高，所以现在的搜索引擎都还是集中在底层上，自然语言处理并没有很好的应用到信息检索中。接着刘博士讲了最近的研究，在对论文检索中，提出了在用户信息需求之上建立一个知识层，在文档之上也建立一个知识层，将两个知识层进行匹配，选择医药领域进行研究，因为此领域已经有了很完善的知识关系网可以直接使用。首先给每篇论文建立类似维基百科的一个全自动的词条系统，将每篇文章涉及到的内容、方法、结论等列出，但其中肯定有不准确的地方，然后可以请一些用户来进行修正，利用机器学习的方法根据用户修正的少部分然后改变其余的论文词条，这就是一种human intelligence与computer之间的交互。接着刘博士还讲了另外两个研究内容，一个为用户给出摘要，系统可以给用户推荐相关论文；一个为帮助用户理解论文的系统，系统可以给出与此篇论文相关的资源，包括有关的文档、PPT、视频等。刘博士的研究工作实用性很强，值得我们好好学习。

个人分类: 讲座心得|4321 次阅读|7 个评论

何大庆博士学术报告通知：Information Access on the Social Web

timy 2013-6-17 17:27

学术报告通知题目： Information Access on the Social Web ( 社会化 Web 信息获取 ) 报告人：何大庆博士 Associate Professor Director, Information Retrieval,Integration and Synthesis Lab School of Information Sciences, Universityof Pittsburgh 时间： 2013 年 6 月 28 日（星期五）下午 3 ： 00~5 ： 00 地点：南京理工大学经管楼 105 会议室报告提要： SocialWeb not only provides user generated contents for people to use, but alsofundamentally changed information access in people’s mind and on the Web.Consumers of information can at the same time be the participants of informationproduction, organization, retrieval and utilization. It is under thisinnovative infrastructure that social information access thrives and becomesone of the most actively developed topic in both academia and industry. In thistalk, I will using four research projects conducted in my research lab as the examplesto illustrate some interesting recent developments on this topic. My goal is tointroduce social information access, to discuss some of its findings, and toelicit potential collaborations on this topic. 报告人简介： Dr.Daqing He is an associate professor at the School of Information Sciences(iSchool), and associate professor at the Intelligent Systems Program, both ofwhich are at the University of Pittsburgh. He earned his PhD degree in ArtificialIntelligence from the University of Edinburgh, Scotland. Prior joining theUniversity of Pittsburgh in 2004, he served on the research faculties of theRobert Gordon University, Scotland and the University of Maryland at CollegePark, United States. His work centered on adaptive and interactive monolingual/multilingualinformation retrieval. Currently, Dr. He’s main research interests coverinformation retrieval (monolingual and multilingual), information access on thesocial web, adaptive Web systems and user modeling, interactive retrievalinterface design, and Web log mining and analysis. Dr. He is the PrincipalInvestigator (PI) and Co-PI for more than ten research projects, funded by theNational Science Foundation (NSF), United States Defense Advanced Research ProjectsAgency (DARPA), University of Pittsburgh, and other agencies. He has publishedmore than 100 articles in internationally-recognized journals and conferencesin these areas. Dr. He has served as a member on the program committees formore than 15 major international conferences in the area of informationretrieval and web technologies, and has been called upon to be a reviewer formany top-ranked international journals in the same areas. Dr. He is also thechair of the SIS council, the faculty governing body for the iSchool. 欢迎校内外各界人士参加！南京理工大学经济管理学院信息管理系二零一三年六月十七日

个人分类: 同行交流|9423 次阅读|0 个评论

匹兹堡大学何大庆副教授课程预告

timy 2013-6-17 17:21

匹兹堡大学何大庆副教授课程预告 1. 课程名称 : 现代信息检索研究进展 2. 时间 : 6 月24-28日（共5天）每天上午8:30-12:00 3. 地点 : 经管院408(6月28日下午在105听学术报告) 4. 课程内容：详见课程表课程安排 6.24 6.25 6.26 6.27 6.28 星期一星期二星期三星期四星期五上午 8:30~12:00 信息检索（用户建模和推荐系统）信息检索（交互检索系统）信息检索（协同检索行为）信息检索 ( 社会检索 ) 信息检索 ( 公民科学 ) 5. 授课语言 : 英文/中文 6. 主讲人及简介 : 匹兹堡大学副教授何大庆博士何大庆博士现为匹兹堡大学信息科学学院 (iSchool) 和智能系统项目（ Intelligent Systems Program ）副教授，并担任 iSchool 图书馆与信息博士计划委员会主任。何教授在苏格兰爱丁堡大学获得人工智能专业的博士学位。在 2004 年加盟匹兹堡大学之前，何教授曾在苏格兰罗伯特戈登大学、美国马里兰大学等地从事研究工作。何教授的研究工作主要集中在单语言或多语言信息检索的自适应和交互方面。目前，他的主要研究领域包括：信息检索（单语言和多语言）、自适应 Web 系统与用户建模、交互检索界面设计、 Web 日志挖掘与分析。何博士是十余个研究项目的主持人或共同主持人，研究项目包括：美国国家科学基金会项目 (NSF) 、美国国防部高级研究计划署资助项目 (DARPA) 、匹兹堡大学以及其他机构资助的项目。何教授在国际公认的期刊与会议上发表论文 100 余篇，他是 SCI 索引杂志《 InternetResearch 》的编委，信息检索及 Web 技术领域的十多个主要的国际会议程序委员会成员，并且是该领域多个国际一流期刊的审稿人。请情报学、图书情报、管理科学与工程等相关专业2012级所有研究生准时参加，欢迎广大老师和同学听课和交流！

个人分类: 信息检索|8707 次阅读|0 个评论

[转载]信息检索课件大汇总

热度 2 tengyi1960 2013-3-20 15:57

第一章信息检索概述查新咨询与文献检索 . ppt Internet 简介 .ppt 文献检索 .ppt 从文献检索到信息素质教育 . pdf 信息检索 .ppt 信息检索知识 .ppt 电子资源检索与利用 .ppt 文献检索 2.ppt 科技查新工作简介 .ppt 开展信息素质教育 .ppt 网络检索基础 .ppt 网络信息检索与文献 .ppt 文献检索与情报检索的区别 .pdf 文献检索 3.ppt 文献检索介绍 .ppt 如何从网上获取文献资源 .ppt 文献收集和整理 .ppt 信息检索基础 .ppt 现代信息技术在图书馆的应用 .ppt 信息存储与检索 .ppt 信息检索知识 .ppt 信息资源与服务推介 .ppt 信息资源与利用 .ppt 知识发现与信息检索 .ppt 第二章印刷型文献检索工具化学文摘 .ppt 科学引文索引 .ppt ca 数据库检索方法 .ppt EIVillage2 的使用方法 . doc EI,SCI,JCR 检索 .ppt EI 工程信息公司 .ppt 科学引文索引 2.ppt sci 数据库检索 .ppt 科学引文索引 3.ppt 化学文摘 2.ppt 化学文摘 3.ppt 全国报刊索引 .pdf 第三章科学文献检索 Calis 学位论文 .ppt Acs 数据库 .ppt Cnki 数据库 .ppt Ebsco 数据库 .ppt Ebsco 数据库 .ppt Kluwer 数据库 .ppt 超星数字图书馆 .ppt Apabi 数字图书馆 .ppt 中国学术期刊 .ppt 中文科技期刊 .ppt Calis 学位论文 .ppt Calis 学位论文 .ppt 中国学术期刊 .ppt Acm 全文数据库 .ppt Acs 数据库 .ppt Acs 数据库 .doc Acs 网络版 .pdf Apabi 数字图书馆 .ppt CalisOnline.ppt Calis 学位论文 .ppt Cnki 中文期刊 .ppt Csdl 物理信息资源 .ppt Ebsco 说明 .doc Ebsco 简介 .ppt Ebsco 数据库 .ppt Ebsco 数据库使用 .doc Ebsco 外文数据库 .doc Elsevierscience.ppt ElsevierSdos.ppt Emerald 数据库 .ppt Engineeringvillage.ppt EngineeringVillage.ppt FirstSearch 数据库 .doc Firstsearch 检索 .ppt IEEE 数据库 .ppt Iopiop 电子期刊 .ppt KluwerOnline 电子期刊 .doc KluwerOnline.ppt Kluwer 数据库指南 .doc Kluwer 数据库 .ppt OCLC.ppt OCLC.ppt VIp 中文科技期刊 .ppt WorldScinet 电子期刊 .ppt 万方数据库 .ppt 维普数据库 .ppt 维普信息资源 .pdf 维普中文期刊 .ppt 第四章技术文献数据资源检索特种文献检索 .ppt 中国专利检索 .ppt Internet 上的文献资源 .pdf 美国专利商标局资料库 .ppt 中外专利检索途径与方法 .ppt 专利信息检索 .ppt 专利资料检索与应用 .ppt 专题信息的检索与利用 .doc 第五章光盘文献检索 CAonCD 数据库 .ppt PubMed 数据库 .ppt BIOSIS 检索 .ppt Blackwell 电子期刊 .ppt CATCH 电子期刊 .ppt CSA 剑桥科学文摘使用 .ppt SCI 及 BA 光盘检索 .ppt Elservier 简介 .ppt ElsevierScienceDirect.ppt INSPEC 数据库 .ppt INSPEC 数据库 .ppt MEDLINE 光盘检索 .ppt MEDLINE 光盘检索 .ppt OCLC 数据库指南 .ppt OVID 文摘与全文数据库 .ppt PQDD 博硕论文数据库 .ppt SAE 数字图书馆介绍 .ppt 常用中文数据库简介 .ppt 光盘文献检索 .ppt 国家科技图书文献中心网站 .ppt 环境科学信息资源服务 .ppt 机检形式与发展 .ppt 剑桥科学文摘 .ppt 经济信息检索的原理 .ppt 科技查新专题 .pdf EI 光盘检索 .doc 人大复印资料全文数据库 .ppt 人文社科学术资源检索与利用 1.ppt 人文社科学术资源检索与利用 2.ppt 人文社科学术资源检索与利用 3.ppt 人文社科学术资源检索与利用 4.ppt 书目数据库检索 .ppt 数字信息资源 .ppt 网络数字资源及其检索 .ppt 网络信息检索概述 .doc 网络信息检索基础 .ppt 网络信息综合利用 .ppt 网络医学资源获取 .ppt 网上生物医学信息资源 .ppt 网上医学文献数据库检索 .ppt 信息技术对土图书馆的影响 .ppt 医学情报调查与研究 .ppt 医学文献和文献检索概论 .ppt 医学文献检索绪论 .ppt 医学信息检索与利用 .ppt 中国生物医学文献光盘检索 .ppt 中国生物医学文献数据库 .ppt 中文生物医学期刊数据库 .ppt 第六章在线信息检索 DESE 嵌入式数据库搜索引擎 .pdf WEV 搜索引擎综述 .pdf WEB 全文信息检索技术 .doc 基于 DNS 的网页搜索引擎 .pdf 基于搜索引擎的个性化 _.ppt 利用网络技术制作期刊搜索引擎 .doc 面向主体的搜索引擎 .ppt 搜索引擎 .ppt 搜索引擎技术 .ppt 搜索引擎优化知识手册 .pdf 网络信息的检索 .ppt 网络信息检索概述 .ppt 中国的互联网 .doc 中文搜索引擎 .doc 主要的英文搜索引擎 .pdf 主要的中文搜索引擎 .pdf

个人分类: 信息资源整合图文解读|1674 次阅读|4 个评论

如何通过中国知网获取期刊封面及目录页

热度 5 libseeker 2013-2-26 16:08

笔者前不久接到一个求助，希望提供某期刊某期的封面及目录页信息，该刊有其发表的论文，现急需。所在馆 2012 年期刊已经下架打捆（尚未送出装订），无功而返。笔者另行求助，得到中国知网产品经理吕蜜女士的帮助。她根据我提供的题录信息，迅速得到检索结果，发给我一个相应的网址就很好地解决了问题，满足了需求。在科研成果统计及职称申报材料准备过程中，通常需要提供封面及目录页（有的单位还需要提供封底）复印件。图书馆及期刊编辑部经常会被求助。当前江苏省高校已进入职称申报季。笔者特此粗略介绍如何通过中国知网获取期刊封面及目录页。据悉，中国知网（ CNKI ）针对 2010 年以后的文献扫描的封面和目录信息可以直接打印。检索方法：在中国知网（ CNKI ）进行检索，找到任何一本期刊，点击期刊名称，会进入该刊的详情页，然后选择具体的刊期，会有“目录页浏览”的功能项。使用该功能需要安装 FLASH 插件，“如果该页不能正常显示或者目录下的文献没有链接，请下载完整安装 V7.2 版或以上版本 CAJViewer 全文浏览器”，目前无法只保存图片，提示是安装 CAJ7.2 以上的版本可以显示检索出来的结果，可以“原版预览”、“打印本页”、“打印全部页”。也就是结合该功能，可以获取封面、目录、正文，暂无封底。可以按需打印出来，因扫描清晰度比较高，打印出来的效果要比复印的效果要好得多。需要补充的是，在任何一篇文献的知网节页面，也会有目录页浏览的功能钮。现在的目录浏览功能，大部分 2008 年以后的刊期都可以实现。除了找到一个期刊具体的刊期点击目录页浏览之外，在文献检索结果页面点击 2008 年以后的文献，弹出的文献知网节页面中，也会有目录页浏览的功能。两处都可以获取。又悉，期刊封面及目录页，在职称评定的时候用的较多，翻纸刊工作量比较大啊。有些图书馆想做期刊封面数据库，为了做这个事情的时候好查。目前是否有图书馆做了，做出来的具体效果如何不详。这样的数据库价值多大，个人存疑。因为个体的某一馆，所购期刊非常有限。但也有人认为，一方面可以丰富馆藏，一方面封面信息也的确有检索的价值。在图书馆期刊管理工作中，有的馆的期刊架位上，直接撕下某期的封面贴在架位上，方便读者利用。这种做法，个人赞同。因为合订本的时候，第一期的封面，一定程度上起的作用仍为封面，第一期封面不能撕掉。今后，但凡中国知网能找到封面的期刊，将其打印（彩打也许更美观）出来，效果也许更好。至于目录页功能，在文献计量学等方面亦有一定应用价值。

个人分类: 学海泛舟|67939 次阅读|16 个评论

Lemur查询语言模型评价命令

bruisefree 2013-1-11 12:35

即： Query Model Evaluation Application ，翻译得有些拗口，请见谅。来源网页： http://www.lemurproject.org/doxygen/lemur/html/QueryModelEval.html 该命令为 QueryModelEval ，加载一个扩展的查询语言模型（例如通过 GenerateQueryModel 计算得到的查询语言模型），然后通过 KL-divergence 检索模型进行计算。从另一方面来看，通过该命令与 GenerateQueryModel 结合，该方法也能为 Lemur 自带的各种语言模型的执行检索并返回最终的结果。参数说明：（ 1 ） index ：索引数据库的全名，包含索引内容文件列表；（ 2 ） smoothSupportFile ：平滑支持文件名，例如由 GenerateSmoothSupport 命令生成的文件；（ 3 ） queryModel ：待评价的 query model 文件（ 4 ） resultFile ：结果文件（ 5 ） resultFormat ：结果格式要么是 TREC 格式（ 6 栏格式），要么是简单的 3 栏格式 queryID, docID, score 。可以是布尔值， false 代表非 TREC 格式， true 代表 TREC 格式。默认值为 true ，即 TREC 格式。（ 6 ） resultCount ：每个查询返回的结果集文档数。以下参数为文档模型的平滑参数：（ 7 ） smoothMethod ：以下四个值之一： o Jelinek-Mercer ： jelinikmercer 、 jm 或者 0 o Dirichlet 先验值： dirichletprior 、 dir 或者 1 o 绝对折合方式（ Absolute discounting ）： absolutediscount 、 ad 或者 2 o 两阶段方式（ two stage ）： twostage 、 2s 或者 3 （ 8 ） smoothStrategy( 平滑策略 ) ：插值方式（值为 interpolate 、 0 ）或者退避法（值为 backoff 、 1 ）（ 9 ） adjustedScoreMethod （文档得分调节方法）：指明输出哪种格式的分数，值为以下之一： o query likelihood ： "querylikelihood" 、 "ql" o 交叉熵： "crossentropy" 、 "ce" o 负 KL 距离： "negativekld" 或 "-d" （ 10 ） JelinekMercerLambda ： JM 插值法中的文档集模型（ Collection Model ）权重，默认值为 0.5 （ 11 ） DirichletPrior ： Dirichlet 先验平滑方法的先验参数值，默认为 1000 （ 12 ） discountDelta ：绝对折合方式中折合常量 delta 的值，默认为 0.7 使用示例： QueryModelEval E:\IR_EXP\qmeval.txt 参数为： parameters indexe:\index\ohsumed4/index queryModelE:\IR_EXP\exp_qm_iid05\q_1_qm.txt/queryModel resultFileE:\IR_EXP\exp_rs_iid05\q_1_rs.txt/resultFile resultFormat0/resultFormat resultCount500/resultCount smoothMethodjelinikmercer/smoothMethod smoothStrategyinterpolate/smoothStrategy adjustedScoreMethodquerylikelihood/adjustedScoreMethod JelinekMercerLambda0.6/JelinekMercerLambda /parameters 结果为： 1 F:\dataset\Ohsumed\Ohsumed\87\87097544.txt -5.21955 1 F:\dataset\Ohsumed\Ohsumed\89\89201700.txt -5.2203 1 F:\dataset\Ohsumed\Ohsumed\89\89182887.txt -5.2205 1 F:\dataset\Ohsumed\Ohsumed\91\91229114.txt -5.22287 1 F:\dataset\Ohsumed\Ohsumed\91\91310766.txt -5.22553 1 F:\dataset\Ohsumed\Ohsumed\88\88103805.txt -5.22575 ……

个人分类: lemur Indri|4324 次阅读|0 个评论

Lemur 平滑支撑文件生成命令（GenerateSmoothSupport）

bruisefree 2013-1-6 21:11

该命令是 GenerateSmoothSupport ，为语言模型检索方法生成两个支撑文件。两个文件都包含一些预计算的数值，用于加速检索过程。一个文件是平滑一元语言模型检索时用到的，其名字由参数 smoothSupportFile 提供。如果运行基于 Markov 链查询模型，则另一个文件则是需要的，并带有后缀 "tt.mc/tt" 。这个文件中的每一行都包含了一个词和文档库中所有文本中该词的概率值之和，即所有 d 下 p(w|d) 值之和。按照 Lemur 命令的一般步骤执行该命令，并在参数文件中设置如下的变量： index ：索引文件，记录了索引内容 smoothSupportFile ：生成的平滑支持文件路径位置，例如 /usr0/mydata/index.supp 实例： GenerateSmoothSupport e:/ir_exp/genSmoothSupport.txt 参数文件： parameters indexe:\index\ohsumed4/index smoothSupportFileE:\IR_EXP\smoothSupportFile.txt/smoothSupportFile tt.mc/tt /parameters 通过运行以上命令，共生成两个文件： smoothSupportFile.txt 和 smoothSupportFile.txt.mc 其中 smoothSupportFile.txt 格式为： 1 97 0.0655744 2 104 0.0690776 3 114 0.0909539 第一列为文档 ID ，第二列为文档中词的种类数，即不同的词的个数，第三列为该文档在文档库中的权重，计算公式为： smoothSupportFile.txt.mc 格式如下： 1 1991 2 4122.48 3 2604.25 4 2500.84 第一列为词 ID ，第二列为所有文档中该词的 MLE 值，计算公式为： p(t)=∑p(t|d) 具体计算方法，可以参见GenerateSmoothSupport源代码： //平滑文件 ofs.open(LocalParameter::smoothSupportFile.c_str()); //MC平滑文件 char mcSuppFileName ; strcpy(mcSuppFileName, LocalParameter::smoothSupportFile.c_str()); strcat(mcSuppFileName, ".mc"); ofstream mcOFS; mcOFS.open(mcSuppFileName); TERMID_T i; // 所有d下p(w|d)值之和 double *wdPr = new double ; for (i=1; i=ind-termCountUnique();i++) wdPr =0; //文档中所有词在语料库中出现的总频次与语料库中词的总频次之比 double prSum=0; for (i=1; i= ind-docCount(); i++) { prSum = 0; TermInfoList *tList = ind-termInfoList(i); tList-startIteration(); int size=0;//文档中包含的不同词的个数，与文档长度docLength不一样 while (tList-hasMore()) { TermInfo *info = tList-nextEntry(); //sum of p(t|d) wdPr += info-count()/(double)ind-docLength(i); // compute Markov chain support // 所有词在语料库中出现的次数之和 prSum += ind-termCount(info-termID()); // cout i "\t" ind-termCount(info-id()) "\t" ind-term(info-id()) endl; size++; } // should be ML here // prSum = prSum / (double)(ind-termCount()+ind-termCountUnique()); prSum = prSum/(double)ind-termCount(); ofs i " " size " " prSum endl; delete tList; } for (i=1;i=ind-termCountUnique();i++) mcOFS i " " wdPr endl; mcOFS.close(); ofs.close();

个人分类: lemur Indri|3461 次阅读|0 个评论

[转载]第八届全国信息检索学术会议青年学者主题报告

timy 2012-11-30 21:24

From: http://ccir2012.jxnu.edu.cn/s/213/t/590/73/02/info29442.htm 感觉国内IR青年学者的这几个报告都不错，转载一下。 ----------------------------------------------------------------------------------------- 青年学者主题报告（一）报告题目互联网垃圾网页识别刘奕群博士，清华大学计算机系助理研究员、党委副书记摘要面对海量繁杂的网络数据与千差万别的用户行为，传统的信息检索、机器学习、自然语言处理技术在搜索引擎系统中的应用面临着极大的挑战。为应对这一挑战，利用搜索引擎海量规模的用户行为数据信息，发挥 “ 用户群体智慧 ” 的作用是非常必要的。我们将与听众探讨搜索引擎性能改进与用户行为分析之间的密切联系，并介绍我们从 2008 年以来在互联网垃圾网页识别方面的主要研究成果。刘奕群个人简历 : 2003 年从清华大学计算机系本科毕业后在本校直接攻读博士学位， 2007 年毕业后留校任教至今。主要研究兴趣集中在网络搜索引擎技术，尤其是基于用户行为分析方法改进搜索引擎性能这一研究领域。在 “ 互联网页面质量评估 ” 、 “ 互联网垃圾网页与非法资源识别 ” 、 “ 搜索引擎检索效果与广告效果评估 ” 、 “ 搜索引擎查询推荐 ” 、 “ 互联网用户浏览推荐 ” 等搜索引擎技术领域开展了相关研究，取得了较好的研究成果，并应用于搜狗搜索、人民搜索等实际搜索引擎项目中。以第一作者或通讯作者在 ACM TWeb, Information Retrieval, JASIST, IJCAI, WWW, CIKM, WSDM, WI 等相关领域高水平期刊、会议上发表论文 50 余篇。申请专利 13 项，其中 7 项已获得授权。与百度公司合作著有普通高等教育 “ 十一五 ” 规划教材《搜索引擎技术基础》并获得清华大学优秀教材一等奖。 2010 年获得 “ 钱伟长中文信息处理科学技术奖 ” 青年创新奖一等奖。青年学者主题报告（二）报告题目 Cross-Object Learning and Extern Cues 洪宇博士，苏州大学副教授摘要报告尝试陈述一种利用外界线索的跨目标学习策略（ Extern Cue based Cross-Object Learning ）以及两种应用。内容如下： 1 ）什么是外部线索； 2 ）什么是跨目标学习； 3 ）跨目标学习在事件抽取任务中的应用； 4 ）跨目标学习在隐式篇章分析任务中的应用。洪宇个人简历：苏州大学副教授，博士；曾就读于哈尔滨工业大学计算机科学与技术学院 - 信息检索研究室（现为社会计算与信息检索研究中心 SCIR ），师从刘挺与张宇教授，从事个性化信息检索与舆情分析研究；目前，就职于苏州大学计算机科学与技术学院 - 江苏省自然语言处理重点实验室，主要从事用户检索行为分析、广告搜索、语义篇章理解及相应的舆情检测与跟踪研究。对检索行为机器自学习以及事件语义关系识别和预测有着浓厚兴趣。青年学者主题报告（三）报告题目大规模部分文本拷贝检测张奇博士，复旦大学计算机科学技术学院摘要文本拷贝检测可以帮助发现相似的文本或文本片段，可以帮助有效地降低存储空间、减少重复数据分析，提高检索效率和精度，提升用户体验。然而，传统的文本拷贝检测工作中，基本没有涉及部分文本拷贝检测这一问题。但是，随着用户生成数据（ UGC ）数量的不断增多，部分文本拷贝大量出现，如何能够从海量的文本数据中发现部分拷贝，并确定其起始位置，是一个亟待解决的问题。张奇个人简历：男， 1981 年出生，山东泰安人。 2009 年于复旦大学计算机科学技术学院，获得博士学位。 2005 年 2 月至 2006 年 2 月在美国 BOSCH 研发中心做学生访问学者，从事自然语言相关研究。现受聘于复旦大学计算机科学技术学院。自 2003 年起开始从事自然语言处理和信息检索的科研工作，在自然语言和信息检索国内外权威学术会议和期刊 SIGIR ， ACL ， EMNLP ， COLING 等发表了二十余篇论文，申请 4 项美国专利。青年学者主题报告（四）报告题目树到树统计机器翻译研究肖桐博士，东北大学信息学院博士后摘要基于句法的统计机器翻译是近些年自然语言处理领域的热点。特别是如何在翻译中有效地使用源语言及目标语言句法信息仍是有待解决的基本问题之一。本报告将对树到树统计机器翻译的基本问题进行介绍及分析，并且给出这些问题的解决方案及实验结果。内容包括：无指导子树对齐、树到树翻译模型训练、基于模糊匹配的解码等。最后本报告将介绍一套由东北大学自然语言处理实验开发的统计机器翻译平台，为学术界同仁使用。肖桐个人简历：博士，现为东北大学信息学院博士后。先后于 2005 年、 2008 年和 2012 年获得东北大学计算机本科、硕士及博士学位。 2005 年进入东北大学自然语言处理实验室进行自然语言处理、机器翻译及机器学习方面的研究。现主要从事基于句法的统计机器翻译、基于句法的语言模型方面的研究。在自然处理语言领域重要期刊及会议发表论文近十篇（如 ACL 、 EMNLP 、 COLING 、 TALIP ）。作为项目技术负责人，开发 NiuTrans 开源统计机器翻译系统， 2011 年 7 月开源至今被全世界 600 余家研究单位与个人下载使用。 2008-2012 年间，作为技术负责人主持多套机器翻译评测系统的研发，并在国内外机器翻译比赛 CWMT 和 NTCIR 中取得多项第一、第二的成绩。青年学者主题报告（五）报告题目信息检索中的排序学习 —— 近期研究进展兰艳艳博士，中国科学院计算技术研究所助理研究员。摘要排序是很多实际应用所面临的核心问题，排序学习 (learning to rank) 就是使用机器学习的方法来解决排序问题。它不仅在工业界取得了巨大的成功（例如，很多知名的搜索引擎公司如必应，雅虎搜索， Yandex 等都在很大程度上依赖排序学习技术为用户提供高质量的搜索结果），在学术界也引起了广泛的关注，已成为信息检索和机器学习领域一个热点研究方向。本报告将从学术的角度，介绍排序学习方向的一些近期研究进展，包括 Top-k 的排序学习框架以及排序学习算法的泛化能力与统计一致性等，旨在揭示排序学习的独特算法与理论体系，以及该领域的一些未来发展方向。兰艳艳个人简历：博士毕业于中国科学院数学与系统科学研究院，主要从事排序学习，统计学习理论，互联网搜索与挖掘等方向的相关研究，在 ICML ， NIPS ， SIGIR ， WSDM ， CIKM 等国际顶级会议发表多篇论文，论文 ”Top-k Learning to Rank: Labeling, Ranking and Evaluation” 获得 ACM SIGIR 2012 最佳学生论文奖。青年学者主题报告（六）报告题目排序学习方法的研究与应用林原博士，大连理工大学信息与通信工程博士后流动站师资博士后摘要随着互联网的迅猛发展，它已经成为人类获取知识，了解世界的主要途径。如何从互联网上及时、高效、准确的获取所需资讯是信息检索所要研究的主要问题。排序是信息检索的核心，针对其进行优化的排序学习方法对于信息检索的研究以及互联网的发展都有着重要的意义。本次报告内容包括以下三方面：基于排序样本的损失函数的构造、排序模型的特征构造以及排序学习方法在其他领域的应用。其中排序学习方法损失函数分成三个子问题介绍：多损失函数融合模型研究、直接优化评价方法的研究以及基于组的排序学习方法的研究。排序学习方法的特征构造分为两个子问题进行讨论：通过主成分分析等方法对原有的特征进行优化；以多文本域，多种检索方法，多种参数选择方法为基础对于检索任务的排序特征进行构造。排序学习方法的应用研究主要内容为基于词排序模型的社会化标注查询扩展技术。林原个人简历：男，博士，就读于大连理工大学，获得学士、硕士、博士学位，现为大连理工大学师资博士后。自2008年进入大连理工大学信息检索研究室，师从林鸿飞教授，从事从事信息检索和自然语言处理方面的研究，主要研究方向是信息检索中Learning to Rank及其应用。发表论文17篇，包括SIGIR、CIKM、JASIST等国际会议和学术期刊。

个人分类: 信息检索|3667 次阅读|0 个评论

信息检索著名学者聂建云教授应邀到北理工做学术报告

drkevinzhang 2012-6-29 12:54

应张华平博士的邀请，信息检索国际著名学者、加拿大蒙特利尔大学聂建云教授在北京理工大学研究生教学楼 203 ，于 2012 年 6 月 13 日晚 7 点至 9 点，作了主题为“从跨语言信息检索到通用检索”（ FromCross-LanguageInformationRetrievaltoGeneralIR ）的学术报告。该报告是 “ 21 世纪学科前沿”系列学术报告的一部分，由研究生工作部主办，计算机学院承办。本次报告由计算机学院院长黄河燕教授主持，张华平博士、赵燕平教授、莫倩博士、商建云副教授等多位老师及 30 多名学生参加了此次报告会。聂建云教授是国际知名的信息检索领域专家，此次他深入讲解了跨语言检索前沿的主要理论与技术，并介绍了如何将跨语言检索扩展到通用的信息检索中，有效地实现了查询扩展，极大地提高了单语言信息检索的效率。聂建云教授的报告非常精彩，内容丰富，形式灵活，贴近学术研究的前沿 , 深深吸引了在座的各位老师与学生，现场气氛活跃，学术气氛浓厚，整整持续了将近两个小时，获得了在场师生的一致好评。报告结束后，聂建云教授还和现场人员进行合影留念，会后持续与北理工的老师同学做了进一步的深入交流。聂建云教授是蒙特利尔大学全职教授，主要的研究领域为信息检索与自然语言处理。 25 年来，聂教授一直致力于研究信息检索模型，以及不同语言的信息检索问题，同时也研究了网络搜索中大量的工程应用问题。聂教授在国际期刊与会议上先后发表了 150 多篇研究论文，并在 1999 年 ACM-SIGIR 会议上获最佳论文奖 ,2010 年，他出版了跨语言信息检索的学术专著。聂建云教授担任了 SIGIR,ACL,CIKM 等知名国际会议的程序委员，众所周知， SIGIR 是信息检索领域的顶级会议，聂教授担任了 SIGIR2011 会议的大会主席。同时，聂教授还是七家国际期刊的编委.

4876 次阅读|0 个评论

《现代信息检索与利用》课程学生评价辑录

热度 1 libseeker 2012-5-30 15:26

信息来源：所在学校课程质量网上监控系统（该系统提供对课程满意度的在线测评及结果查询服务。）时间课程教学中最突出的优点教学中有待改进的地方 2012-5-26 现代信息检索与利用容易懂没有 2012-5-25 现代信息检索与利用讲课有激情，负责，教学内容详细可以增加考勤次数 2012-5-22 现代信息检索与利用非常认真负责，非常用心课程本身有点枯燥 2012-5-21 现代信息检索与利用老师对待教学的态度极为认真，很有责任心 2012-5-20 现代信息检索与利用上课认真 2012-5-20 现代信息检索与利用有耐心，热情，认真没有实践比较枯燥 2012-5-20 现代信息检索与利用很认真负责最好能够联系实践 2012-5-20 现代信息检索与利用讲课内容实际，备课充分。过于平淡。没有课堂活跃气氛。 2012-5-18 现代信息检索与利用好好 2012-5-17 现代信息检索与利用没激情没 2012-5-17 现代信息检索与利用好啊无 2012-5-17 现代信息检索与利用无无 2012-5-15 现代信息检索与利用如果能幽默一点就好了 2012-5-15 现代信息检索与利用认真不太吸引人 2012-5-14 现代信息检索与利用老师对学生认真负责，上课幽默风趣。有较强的责任心无 2012-5-14 现代信息检索与利用讲的仔细不清楚附：教学及考试总体情况、取得的经验和存在的问题、今后的改革设想按教学大纲和授课计划进度组织教学；上课精神饱满，态度认真，作风严谨，责任心强；思路清晰，重点突出；备课认真、充分；理论联系实际，能结合自身实践及科研成果；较为合理、有效地使用教学手段；较为熟练的驾驭教学内容；启发引导学生积极思维及师生交流效果方面有所欠缺；由于教学经验不足，对自身教学的总体评价一般。对学生上课评价：尊敬老师，举止文明；出勤率较差；认真听课、积极思考的学生较少。课程论文体现大多数同学能够学以致用，本课程切实有助于提高大学生的信息素质、信息道德和信息处理能力（收集和分析信息的能力，获取知识和知识创新的能力，文字表达能力等）。本课程在我们学校属于首次开设公共选修课，存在诸多不足之处，比如选课人数较多、选课对象涉及多个学科门类且主体为低年级本科生、教学条件受限（多媒体教室教学机不能上网且缺乏实践课）。在今后的教学中，我将进一步调整授课内容，改进教学方法，更好地做到因材施教、教学相长。

个人分类: 学海泛舟|5149 次阅读|3 个评论

《现代信息检索与利用》学生意见辑录

libseeker 2012-5-22 08:57

图谋按：选修课课程论文中出了一道选做题让学生提意见和建议，特此作一辑录。制药102班何同学：老师如果能够对学生再要求严格一点觉得效果会更好些。我觉得老师上课注意与学生的互动还蛮有必要的。希望老师能够联系我们大学生的现如今切实需要去举例。本门课程对我们是非常有帮助的一门课程，在该课程当中学习到了很多有用的东西，我想将来一定会用得到的。测控111班赵同学：通过一个学期的学习我觉得还是颇有收获的，我对信息技术检索与利用的认识大大提升了。以前我不是很喜欢查资料，因为我觉得很难找到，这样反而浪费了很多时间，所以我比较喜欢问别人。通过这个学期的学习我发现是我没有真正掌握信息技术检索与利用的技巧，尤其是图书馆，这么丰富的资源宝库我却没有好好利用。其次，信息技术检索掌握得当的话不仅可以在有限的时间和空间里找到自己想要的资料，而且相对较权威，更准确。最后，让我感到很满足的是我还初步掌握了写毕业论文的方法，虽然花了不少时间，但我觉得很有收获。虽然我还没有熟练的掌握它的技巧，不过以后我会多加实践，希望在这个信息化时代里能够合理有效地利用资源为自己服务，使自己的滋生能力得到提升。整体感觉老师的讲课还是比较好的，无论是从事前准备还是上课质量都很满意。不过我还是想提一些小小的建议。首先，希望老师可以上课更加生动活泼一些，让这门课更有趣味。比如可以多举一些身边的例子。其次，如果能在讲解实际技巧的时候能找一些具体例子来阐述，这样能加深我们的理解。然后，如果学校条件允许老师能在大屏幕上亲自展示的机会就更好了（笔者注：估计是指希望多媒体教室能上网）。工程101杨同学：通过学习，感觉本课程有很大的实用性，但觉得学习过程有些枯燥乏味，如果能同生活和学习中的一些具体问题相结合，增加上课过程中的师生互动，学习效果可能会更好。海洋科学111班严同学：学了这个课程掌握了一些信息搜索的技巧，给生活和学习带来了更多的便利。图书馆和网上资料的翻阅等操作起来更加娴熟，这样有时可以将节省我很多时间。对于这门课程我希望老师上课的方式可以更加多样些，可以增多具体事例来讲解，这样可以让学生对知识点的理解不再笼统，同时也可以调动学生的兴趣。艺视111班庄同学：虽然我并没有学好信息检索这门课，但我从中感觉到了很多东西。最重要的是关于学校图书馆的使用。图书馆是大学里文化的大部分，是最大利于学习的。在生活中，我通过信息检索查到很多我想要的资料，我觉得这门课对我真的是受益匪浅。食品112班田同学老师，其实您教的课很认真，不管是课前还是课后相信您都下了很大的一番功夫，这点我们都知道，都知道您很辛苦。而我们不听课的原因并不是说对想您不尊重，主要是一方面对公选课不重视，认为能过了就行了，还有就是您考勤不严，以至于我们要不就不来，要么就做自己的事，不听课，另一方面是感觉有些时候您讲课的内容距离我们很远，或者说在生活中我们很少会用到（至少现在是），就比如说您讲的关于外文搜索的相关内容，并不是说您讲的东西不重要，我知道在您看来这些都是上这门课程所必须了解的基础知识，但仅仅以目前我们所能用到的而言，那些似乎我们都用不到，或者说不想用。化工111班庞同学：对于这门课，我觉得老师您很用心，从每次的ppt就可以看出来，老师是想把自己所会的都交给我们。不过，我个人来说，虽然每次课都有去上，不过并不敢保证每次都听的很认真。有些专业的知识对我们来说很重要，不过真的很难认真听下去。我觉得吧，可以把理论与实际相结合，不一定要开这么多人的一个大班，相反，可以根据图书馆或者借用计算机楼的电脑，限制一下人数，上几次理论课以后就上一次实践课，这样学习的效果更好。对于老师的认真很感动，尤其是到最后没什么人来了，老师还是那么认真的讲课，谢谢老师！相关信息： 1 《现代信息检索与利用》教学小结 .http://bbs.sciencenet.cn/blog-213646-564895.html 2 难上的文献检索课. http://blog.sciencenet.cn/blog-213646-545323.html

个人分类: 学海泛舟|4934 次阅读|0 个评论

[转载]【研究】机器学习改变工作与生活

热度 1 timy 2012-3-21 02:20

转载于： http://www.infzm.com/content/72566 作者: 李航最后更新：03-20 17:38:17 机器学习是关于计算机基于数据构建模型并运用模型来模拟人类智能活动的一门学科。随着计算机与网络的飞速发展，机器学习在我们的生活与工作中起着越来越大的作用，正在改变着我们的生活和工作。 1．日常生活中的机器学习我们在日常生活经常使用数码相机。你也许不知道，数码相机上的人脸检测技术是基于机器学习技术的！我认识的三位了不起的科学家与工程师：Robert Schapire,Paul Viola,劳世竑。他们的研究都与人脸检测技术有关。Robert与Yoav Freund一起发明了非常有效的机器学习算法AdaBoost。Paul将AdaBoost算法成功地应用到人脸检测。劳世竑和他领导的Omron团队将AdaBoost人脸检测算法做到了芯片上。据说现在世界上有百分之六七十的数码相机上的人脸检测都是用Omron的芯片。在我们的工作与生活中，这种例子曾出不穷。互联网搜索、在线广告、机器翻译、手写识别、垃圾邮件过滤等等都是以机器学习为核心技术的。不久以前，机器学习国际大会（International Conference on Machine Learning，ICML 2011）在美国华盛顿州的Bellevue市举行。约有7百多位科研人员、教授、学生参加，创造了历史最高纪录。大会的三个主题演讲分别介绍了机器学习在微软的Kinect游戏机用户感应系统、谷歌的Goggles图片搜索系统、IBM的 Watson自动问答系统中的应用。这些事实让人预感到机器学习被更广泛应用的一个新时代的到来。 2．机器学习与人工智能智能化是计算机发展的必然趋势。人类从事的各种智能性活动，如数学、美术、语言、音乐、运动、学习、游戏、设计、研究、教学等等，让计算机做起来，现在还都是很困难的。这是几十年来人工智能研究得到的结论。人工智能研究中，人们曾尝试过三条路。我将它们称之为外观(extrospection)、内省(introspection)和模拟(simulation)。所谓外观，指的是观察人的大脑工作情况，探求其原理，解明其机制，从而在计算机上“实现”人类大脑的功能。比如，计算神经学（computational neuroscience）的研究就是基于这个动机的。然而，人脑的复杂信息处理过程很难观测和模型化。就像我们仅仅观测某个计算机内的信号传输过程，很难判断它正在做什么样的计算一样。内省就是反思自己的智能行为，将自己意识到的推理、知识等记录到计算机上，从而“再现”人的智能，比如专家系统（expert system）的尝试就属于这一类。内省的最大问题是它很难泛化，也就是举一反三。无论是在什么样的图片中，甚至是在抽象画中，人们能够轻而易举地找出其中的人脸。这种能力称为泛化能力。通过内省的方法很难使计算机拥有泛化能力。自己的智能原理，对人类来说很有可能是不可知的（agnostic）。笼子里的老鼠可能认为触动把手是得到食物的“原因”，但它永远也不能了解到整个笼子的食物投放机制。模拟就是将人的智能化操作的输入与输出记录下来，用模型来模拟，使模型对输入输出给出同人类相似的表现，比如统计机器学习（statistical machine learning）。实践表明，统计机器学习是实现计算机智能化这一目标的最有效手段。统计学习最大的优点是它具有泛化能力；而缺点是它得到的永远是统计意义下的最优解（例如：人脸检测）。现在当人们提到机器学习时，通常是指统计机器学习或统计学习。 3．机器学习的优缺点下面看一个简单的例子。由这个例子可以说明统计学习的基本原理，以及由此带来的优缺点。假设我们观测到一个系统的输出是一系列的1和0，要预测它的下一个输出是什么。如果观测数据中1和0各占一半，那么我们只能以0.5的准确率做出预测。但是，如果我们同时观测到这个系统有输入，也是一系列的1和0，并且输入是1时输出是0的比例是0.9，输入是0时输出是1的比例也是0.9。这样我们就可以从已给数据中学到“模型”，根据系统的输入预测其输出，并且把预测准确率从0.5提高到0.9。以上就是统计学习，特别是监督学习的基本想法。事实上，这是世界上最简单的统计机器学习模型！条件概率分布P(Y|X)，其中随机变量X与Y表示输入与输出，取值1与0。可以认为所有的监督学习模型都是这个简单模型的复杂版。我们用这个模型根据给定的输入特征，预测可能的输出。统计学习最大的优点是它具有泛化能力，对于任意给定的X，它都能预测相应的Y。Vapnik的统计学习理论还能对预测能力进行分析，给出泛化上界。但从这个例子中也可以看到统计学习的预测准确率是不能保证100%的。比如，人脸检测会出错，汉语分词会出错。统计学习是“乡下人”的办法。有个笑话。一个乡下人进城，到餐馆吃饭，不知如何在餐馆用餐，就模仿旁边的人。别人做什么，他也就学着做什么。邻桌的一位故意戏弄他，将桌上的蜡烛卷在饼里，趁乡下人不注意时把蜡烛扔到地上，然后咬了一口卷着的饼。乡下人也跟着学，大咬了一口自己的饼。统计学习只是根据观测的输入与输出，“模仿”人的智能行为。有时能够显得非常智能化。但它本质上只是基于数据的，是统计平均意义下的“模仿”。如果观测不到关键的特征，它就会去“咬卷着蜡烛的饼”。 4．机器学习与互联网搜索我与同事们在从事互联网搜索相关的研究。据调查，60%的互联网用户每天至少使用一次搜索引擎，90%的互联网用户每周至少使用一次搜索引擎。搜索引擎大大提高了人们工作、学习以及生活的质量。而互联网搜索的基本技术中，机器学习占据着重要的位置。在我看来，互联网搜索有两大挑战和一大优势。挑战包括规模挑战与人工智能挑战；优势主要是规模优势。规模挑战：比如，搜索引擎能看到trillion量级的URL，每天有几亿、几十亿的用户查询，需要成千上万台的机器抓取、处理、索引网页，为用户提供服务。这需要系统、软件、硬件等多方面的技术研发与创新。人工智能挑战：搜索最终是人工智能问题。搜索系统需要帮助用户尽快、尽准、尽全地找到信息。这从本质上需要对用户需求（如查询语句），以及互联网上的文本、图像、视频等多种数据进行“理解”。现在的搜索引擎通过关键词匹配以及其他“信号”，能够在很大程度上帮助用户找到信息。但是，还是远远不够的。规模优势：互联网上有大量的内容数据，搜索引擎记录了大量的用户行为数据。这些数据能够帮助我们找到看似很难找到的信息。比如，“纽约市的人口是多少”，“约市的人口是多少”,“春风又绿江南岸作者是谁”。注意这些数据都是遵循幂函数分布的。它们能帮助Head（高频）需求，对 tail（低频）需求往往是困难的。所以，对tail来说人工智能的挑战就更显著。现在的互联网搜索在一定程度上能够满足用户信息访问的一些基本需求。这归结于许多尖端技术包括机器学习技术的成功开发与应用，比如排序学习算法、网页重要度算法等等。这些机器学习算法在一定程度上能够利用规模优势去应对人工智能挑战。但是、当今的互联网搜索距离 “有问必答，且准、快、全、好”这一理想还是有一定距离的。这就需要开发出更多更好的机器学习技术解决人工智能的挑战，特别是在tail中的挑战。展望未来，机器学习技术的研究与开发会帮助我们让明天更美好！（本文图片来源网络，作者李航是微软亚洲研究院互联网搜索与挖掘组高级研究员及主任研究员，研究方向包括信息检索，自然语言处理，统计机器学习，及数据挖掘）

个人分类: 机器学习|3262 次阅读|1 个评论

[转载]信息检索技术专利现状及发展趋势分析

rbwxy197301 2012-3-13 22:53

当今世界正处于信息时代，每天都有海量的数据，并以指数级速度增长。如何有效地获取、管理这些数据，是信息时代各国面临的主要问题之一。因此，信息检索技术，尤其是搜索引擎，越来越成为计算机技术发展的重点。　　搜索引擎所带来的不仅仅是技术上的进步,还有市场份额的巨大提升。据艾瑞咨询集团（iResearch）的统计结果显示，2007年，中国搜索引擎市场规模达29亿元人民币，2008年这一数字增长到50.2亿，即便是在经济危机条件下的2009年，我国搜索引擎市场规模仍高达69.5亿元人民币。　　最近几年，信息检索技术的研发及应用在我国备受重视。《国家中长期科学和技术发展规划纲要（2006-2020年）》中将信息产业及现代服务业确定为国民经济和社会发展的重点领域之一，并将现代服务业信息支撑技术及大型应用软件、下一代网络关键技术与服务作为优先发展的主题。另外，国家工业和信息化部制定的《2006-2020年国家信息化发展战略》中也提到了关键信息技术的自主创新计划。而信息检索正是上述优先发展主题的重点支撑技术，其重要程度不言而喻。　　本文以中国专利检索数据库（CPRS）中公开的专利文献为切入点，对主要申请人及其相关技术进行了分析，所有数据截止到2010年3月1日。　　专利申请量逐年增加　　在专利申请方面，基于G06F1730分类号（信息检索与数据库结构）下的专利申请，从1992年开始提出后，年申请量逐年增加，尤其于2004年之后迅速增长，2006年，该领域年专利申请量超过2000件，具体参见图1。　　由于我国发明专利申请通常是自申请日起18个月后公开，因此，2008年至2009年申请的相关专利未被完全公开，由此导致图中2008年至2009年的专利申请量有所下降，但这并不能说明该领域的专利申请进入下降通道。　　截至2010年3月1日，在我国提出并公开的信息检索领域的相关专利申请共计1.5498万件。　　主要专利申请人　　笔者经检索、分析发现，在信息检索领域的相关专利申请人中，国内申请人与国外申请人所占比例相差不多，其中国外申请人占57%，国内申请人占43%。　　根据图2和图3可知，在国外申请人中，来自美国和日本的申请人提交的专利申请所占比例最大，均有2000件以上，占国外在华专利申请总量的71%；在国内申请中，信息技术（IT）产业发达且知识产权发展较为成熟的深圳与北京也各有2000件以上的申请，所占比例最大，排名其次的是台湾地区与上海。　　图4列出了在中国提交信息检索相关专利申请最多的前15位申请人。其中，国际商业机器公司（IBM）和微软公司的申请量最大。大量的专利申请无疑为他们在该领域形成较强的知识产权堡垒提供了可靠的支撑。　　另外，国外在华主要申请人中，来自美国和日本的申请人所占比例最大，这种分布特点也与计算机产业的国际发展态势相吻合。谷歌公司（Google）的信息检索相关专利申请量达110件，而国内著名搜索引擎公司——百度公司（未在图中示出），仅有19件相关专利申请，但是，其在国内的推广力度、市场份额等方面具有较大的优势。　　技术创新是企业持续发展的重要支撑，国内相关申请人应当充分利用我国在这一领域的学术研究成果和广阔的市场前景，提升知识产权产出与保护的意识和能力。（知识产权报　作者　玄梓　斐煦）转自：http://www.sipo.gov.cn/ztzl/zxhd/2011zlsq/analysisreport/201202/t20120222_646117.html

个人分类: 信息检索|3014 次阅读|0 个评论

《科技信息检索与利用》--机械学院

terahertz 2011-11-1 08:47

欢迎机械学院测控 0801 、 0802 的 55 位同学们。 1, 课程教材：袁润 , 刘红光 . 理工科信息检索与利用教程 . 镇江 : 江苏大学出版社 ,2008 . 图书馆借阅： http://202.195.165.18:8080/opac/item.php?marc_no=0000708892 2 ，教学日历： 3, 实习报告： 4，上机第11 . 13 . 15周的周二 3.4 节上机课（老图书馆）

个人分类: 信息检索|3654 次阅读|0 个评论

[转载]美国匹兹堡大学何大庆副教授应邀来院讲学

热度 3 timy 2011-5-30 16:39

2011年5月23~27日，美国匹兹堡大学信息科学学院的何大庆副教授应邀来我院访问交流一周。2011年5月25日下午，何教授在经管院105为做了一场融知识性和前沿性为一体的学术报告，深得师生们的喜爱和一致好评。南理工经管学院、图书馆以及南京农业大学的相关教师以及相关专业的研究生参加了此次学术交流活动。何博士现为美国匹兹堡大学信息科学学院的副教授，研究工作主要集中在单一语言或多语言信息检索系统的自适应和交互设计方面。这场报告分为两部分。第一部分何教授简单介绍了美国匹兹堡大学信息科学学院（iSchool）的学术研究概况，包括专业设置、学科建设、学生培养、师资力量等。在报告的第二部分，何教授以“Toward More Intelligent Access to Information”（迈向智能信息获取）为主题，讲述他及其所在团队在智能信息存取系统设计中所做的一系列研究工作。在主题报告中，何教授从“智能信息存取系统的架构”、“跨语言信息存取中的关键技术”、“面向任务驱动的信息开发与利用”等三方面详细阐述该团队的主要研究工作。报告中，何教授以其渊博的学识、独特的视角、流畅的表达吸引了大家。其间，何教授还对与会者的提问及时进行耐心和翔实的解答。何教授独到精辟的见解、一丝不苟的精神、谦虚谨慎的态度赢得了在场师生们由衷的敬意。报告结束后，何教授和师生们一起在经管院楼前进行了合影留念。（何教授正在进行主题演讲）（会后何教授与部分与会师生合影留恋）（撰稿人：刘飒，章成志）

个人分类: 同行交流|4491 次阅读|2 个评论

[转载]中国计算机学会《学科前沿讲习班》: 信息检索前沿

热度 2 timy 2011-5-26 21:45

From: http://www.ccf.org.cn/resources/1190201776262/fujian/信息检索学科05202011-05-20-09_44_22.doc 中国计算机学会《学科前沿讲习班》 The CCF A dvanced D isciplines L ectures 主题　信息检索前沿 2011 年 7 月 29-31 日北京信息检索是计算机学科相关研究中的一大热点，也是各种互联网应用服务（例如搜索引擎）的关键技术。信息检索技术的发展，拉近了不同地域、阶层和职业的人们与信息之间的距离，在消除信息鸿沟和加速知识化进程过程中发挥着越来越重要的作用，正日益渗透到社会生活和国家发展的各个层面，成为衡量一个国家信息技术发展水平的重要标志。本期 CCF 学科前沿讲习班《信息检索前沿》与国际信息检索大会 (SIGIR 2011) 密切合作，邀请到了信息检索领域重量级的专家学者做主题报告。他们将对信息检索的热点问题、相关理论和方法进行深入浅出的介绍，并对如何开展本领域前沿技术研究等进行探讨。使参加者在了解学科热点、提高学术水平的同时，增加信息检索的交流机会和实践体验。特邀讲者 l Dr. Susan Dumais 微软雷德蒙研究院首席研究员，人机交互和信息检索方面的国际知名专家。美国计算机学会信息检索专委会前主席，国际信息检索大会（ SIGIR ） 2006 的程序委员会主席，美国计算机学会院士，美国国家工程院院士，格拉德•撒尔顿奖（ Gerard Salton Award ，信息检索领域最高奖项）得主。 l Dr. Ricardo Baeza-Yates 雅虎欧洲、中东、拉美研究院副总裁，信息检索和数据挖掘方面的国际知名专家。国际信息检索大会 2011 年的程序委员会主席，美国计算机学会院士，国际电子电气工程师学会院士，信息检索领域经典著作《现代信息检索》 (Modern Information Retrieval) 的作者。 l Dr. Stephen Robertson 微软剑桥研究院高级研究员，信息检索模型方面国际公认的先驱，著名的信息检索模型 Okapi BM25 的发明人。英国剑桥哥顿学院院士，格拉德•撒尔顿奖得主。 l 杨益铭教授（ Prof. Yiming Yang ）美国卡耐基梅隆大学教授，文本分类领域国际公认的先驱，多篇经典论文已被引用千次以上。多次担任国际信息检索大会领域主席。 l 翟成祥教授（ Prof. Chengxiang Zhai ）美国伊利诺伊大学香槟分校副教授 , 语言模型方面的国际知名专家。国际信息检索大会 2009 年的程序委员会主席，美国计算机学会杰出科学家。学术主任 l 刘铁岩博士微软亚洲研究院研究主管。信息检索和排序学习领域的国际知名专家，曾获得国际信息检索大会最佳论文奖和国际图像通信和视觉表达期刊的最高引用论文奖。多次担任国际信息检索大会 (SIGIR) 和国际互联网大会 (WWW) 的领域主席，现任国际信息检索期刊 (IR Journal) 编委，美国计算机学会信息系统期刊 (TOIS) 副主编，国际电子电气工程师学会高级会员。 l 张敏博士清华大学计算机科学与技术系副教授，信息检索和数据挖掘领域的专家。曾多次担任亚洲信息检索大会的领域主席，国际信息检索大会 (SIGIR) 、国际互联网大会 (WWW) 、知识发现与数据挖据大会（ KDD ）、网络搜索与数据挖掘（ WSDM ）等会议的程序委员会成员。在国际文本检索会议中连续多年多次获得最佳结果。计算机学会中文信息技术专业委员会委员、人工智能学会机器学习专业委员会委员、中文信息学会信息检索与内容安全专业委员会委员。时间： 2011 年 7 月 29 - 31 日上课地点：北京市海淀区丹棱街 5 号，微软大厦 1 号楼多功能厅（参见地图，新东方大厦西侧，注：参会者需要在 X 号楼 1 楼前台登记）注册费：　（含资料和 3 天的午餐） 1 、 7 月 20 日前报名并缴费：会员 900 元，非会员 1200 元 2 、 7 月 28 日前缴费：会员 1035 元，非会员 1380 元 3 、 7 月 29 日缴费：会员 1200 元，非会员 1560 元优惠办法： 1 、同一单位一次有 5 人报名者，可免交 1 人的注册费（当天不办理此项业务，缴费‘额度见上标准） 2 、 2010 年参加过讲习班学员可在原缴费标准基础上降低 100 元。 3 、 2011 年参加 3 次讲习班的学员，第四次免费。 4 、学员每推荐一名新学员，推荐者当期注册费优惠 100 元（以被推荐者参加讲习班为有效）。食宿自理缴费方式：邮寄：北京 2704 信箱，邮编： 100190 收款人：中国计算机学会，银行转账：开户行：北京银行北京大学支行；户名：中国计算机学会帐号： 01090519 5001 201 097 020 28 请务必注明： ADL- 信息检索前沿现场：报到时缴纳（需事先在报名表中承诺栏中填写名字）报名方式：即日起至 2011 年 7 月 20 日，报名者请填写附表并发送至： ccf-yx@ict.ac.cn ，按报名先后录取。学会秘书处将与邮寄联系确认。联系人：余遐 E-Mail: ccf-yx@ict.ac.cn 电话： 010-6256 2503-22/ 010-6260 0336 /139 1065 9011 传真： 010-6252 7485 地址：北京科学院南路 6 号计算所大楼 336 室日程安排 2011 年 7 月 29 日 8:30-9:00 开班仪式 9:00-9:15 合影 9:15-12:15 学术专题讲座 1 网络挖掘（ Web Mining or The Wisdom of the Crowds ） Ricardo Baeza-Yates ，雅虎欧洲、中东、拉美研究院副总裁 12:30-14:00 午餐及信息检索前沿技术演示 14:00-17:00 学术专题讲座 2 文本分类综述（ Tutorial on Text Categorization ）杨益铭，美国卡耐基梅隆大学教授 2011 年 7 月 30 日 9:00-12:00 学术专题讲座 3 从概率的观点看信息检索（ On taking a probabilistic view of information retrieval ） Stephen Robertson ，微软剑桥研究院高级研究员 12:30-14:00 午餐 14:00-17:00 学术专题讲座 4 面向信息检索的统计语言模型（ Statistical Language Models for Information Retrieval ）翟成祥，美国伊利诺伊大学香槟分校副教授 2011 年 7 月 31 日 9::00-12:00 学术专题讲座 5 时间动态信息检索（ Temporal Dynamics and Information Retrieval ） Susan Dumais ，微软雷德蒙研究院首席研究员 12:30-14:00 午餐 14:00-16:00 专题讨论 16:00 结业式附：学术专题讲座详细信息学术讲座 1 ： Web Mining or The Wisdom of the Crowds ， Ricardo Baeza-Yates 摘要 : The Web continues to grow and evolve very fast, changing our daily lives. This activity represents the collaborative work of the millions of institutions and people that contribute content to the Web as well as the one billion people that use it. In this ocean of hyperlinked data there is explicit and implicit information and knowledge. Web Mining is the task of analyzing this data and extracting information and knowledge for many different purposes. The data comes in three main flavors: content (text, images, etc.), structure (hyperlinks) and usage (navigation, queries, etc.), implying different techniques such as text, graph or log mining. Each case reflects the wisdom of some group of people that can be used to make the Web better. For example, user generated tags in Web 2.0 sites. In this talk we walk through this process and give specific examples. 讲者简介 : Ricardo Baeza-Yates is VP of Yahoo! Research for Europe, Middle East and Latin America, leading the labs at Barcelona, Spain and Santiago, Chile, as well as supervising the newer lab in Haifa, Israel. Until 2005 he was the director of the Center for Web Research at the Department of Computer Science of the Engineering School of the University of Chile; and ICREA Professor at the Dept. of Technology of the Univ. Pompeu Fabra in Barcelona, Spain. He is co-author of the best-seller book Modern Information Retrieval, published in 1999 by Addison-Wesley with a second edition in 2010, as well as co-author of the 2nd edition of the Handbook of Algorithms and Data Structures, Addison-Wesley, 1991; and co-editor of Information Retrieval: Algorithms and Data Structures, Prentice-Hall, 1992, among more than 200 other publications. He has received the Organization of American States award for young researchers in exact sciences (1993) and with two Brazilian colleagues obtained the COMPAQ prize for the best CS Brazilian research article (1997). In 2003 he was the first computer scientist to be elected to the Chilean Academy of Sciences. During 2007 he was awarded the Graham Medal for innovation in computing, given by the University of Waterloo to distinguished ex-alumni. In 2009 he was awarded the Latin American distinction for contributions to CS in the region and became an ACM Fellow. Finally, in 2011 he also became IEEE Fellow. 学术讲座 2: Tutorial on Text Categorization ， Yiming Yang 摘要 : Text categorization (a.k.a. text classification) is the task of assigning predefined categories to free-text documents. It can provide conceptual views of document collections and has broad applications in the real world. For example, news stories are typically organized by subject categories (topics) or geographical regions; academic papers are often indexed by technical domains and sub-domains in a concept hierarchy; search queries can be classified based on both content words and empirical associations from queries to different types of search engines and data sources in the Internet environments. This lecture will be a tutorial, introducing fundamental concepts and techniques in supervised learning for text categorization, with concrete examples such as linear classifiers (e.g., Nave Bayes or NB) vs. non-linear classifiers (e.g., k-nearest neighbor or kNN), generative models (e.g., NB) vs. discriminative models (e.g. logistic regression or LR), eager learning (NB and LR) vs. lazy learning (kNN), and large-margin classification (e.g., Support Vector Machines and regularized LR). We will also discuss open research topics such as multi-label classification with learning-to-rank algorithms, and large-scale classification with distributed computing (if time permits). 讲者简介 : Yiming Yang is a professor in the Language Technologies Institute and the Machine Learning Department in the School of Computer Science at Carnegie Mellon University. Her research has centered on statistical learning methods and their applications to a broad range of challenging problems, including large-scale text categorization, utility (relevance and novelty) based retrieval and adaptive filtering, personalization and active learning for recommendation systems, social network analysis for personalized email prioritization, etc. She received her Ph.D. in Computer Science from Kyoto University (Japan), and has been a faculty member at Carnegie Mellon University since 1996. 学术讲座 3 ： On taking a probabilistic view of information retrieval ， Stephen Robertson 摘要 : Why is it so useful to think of information retrieval as a probabilistic process? This talk will start from basics (ideas about the evaluation of IR systems, the probabilistic model of Maron and Kuhns, the Probability Ranking Principle) and go on to develop the probabilistic relevance model (the binary independence model of Robertson and Sprck Jones, BM25, and its successors). The emphasis will be on the reasons for choosing certain conceptualizations, the assumptions involved, the strengths and limitations of the resulting models. It will not attempt to cover in detail all probabilistic models that have been used in IR, but it will provide pointers to some other models, such as the language modeling approach and learning-to-rank models. 讲者简介 : Stephen Robertson . First degree in mathematics from Cambridge; masters in information science from City University; doctorate from University College London, with BC Brookes (all a very long time ago now!). Researcher at Aslib for five years, then held a research fellowship at University College London. Began collaborations with Karen Sprck Jones and Nick Belkin at this time. Then returned to City University. Three months on a Fulbright at the University of California Berkeley, collaborating with Bill Cooper and Bill Maron. Started the Centre for Interactive Systems Research at City, and built a research group with a strong focus on the design and evaluation of information retrieval systems. Other members of the Centre included Micheline Beaulieu and Stephen Walker; the Okapi system was our main vehicle for research. Developed the BM25 ranking function. Also head of department of information science during part of this time. Joined Microsoft Research Cambridge in 1998. Tony Kent STRIX award (Institute of Information Scientists) 1998. Gerard Salton Award (SIGIR) 2000. Fellow, Girton College Cambridge, 2003. Professor Emeritus, City University, 2010. 学术讲座 4 ： Statistical Language Models for Information Retrieval ， Chengxiang Zhai 摘要 : Statistical language models have been successfully applied to many problems in information retrieval in the past decade. A great deal of work has shown that statistical language models not only achieve superior empirical performance, but also facilitate parameter tuning and provide a principled general way for modeling various kinds of complex and non-traditional retrieval problems. The purpose of this tutorial is to systematically review the major progress in applying statistical language models to information retrieval with an emphasis on the underlying principles and framework, empirically effective language models, and language models developed for non-traditional retrieval tasks. Tutorial attendees can expect to learn the major principles and methods of applying statistical language models to information retrieval, the outstanding problems in this area, as well as obtain comprehensive pointers to the research literature. Attendees will be assumed to know basic probability and statistics. 讲者简介 : Chengxiang Zhai is an Associate Professor of Computer Science at the University of Illinois at Urbana-Champaign, where he also holds a joint appointment at the Graduate School of Library and Information Science, the Institute for Genomic Biology, and Department of Statistics. He received a Ph.D. in Computer Science from Nanjing University in 1990, and a Ph.D. in Language and Information Technologies from Carnegie Mellon University in 2002. He worked at Clairvoyance Corp. as a Research Scientist and a Senior Research Scientist from 1997 to 2000. His research interests include information retrieval, text mining, natural language processing, machine learning, and biomedical informatics. He has published over 100 papers on these topics in major conferences and journals. He serves as an Associate Editor for ACM Transactions on Information Systems, and Information Processing and Management, and is also on the Editorial Board for Information Retrieval Journal. He is a program co-chair of ACM CIKM 2004 , NAACL HLT 2007, and ACM SIGIR 2009. He is an ACM Distinguished Scientist, and a recipient of an Alfred P. Sloan Research Fellowship, the ACM SIGIR 2004 Best Paper Award, and the 2004 Presidential Early Career Award for Scientists and Engineers (PECASE). 学术讲座 5 ： Temporal Dynamics and Information Retrieval ， Susan Dumais 摘要 : Many digital resources, like the Web, are dynamic and ever-changing collections of information. However, most of the information retrieval tools that have been developed for interacting with Web content, such as browsers and search engines, focus on a single static snapshot of the information. In this course, I will present analyses of how Web content changes over time, how people re-visit Web pages over time, and how re-visitation patterns are influenced by changes in user intent and content. These results have implications for many aspects of information retrieval and management including crawling, ranking and information extraction algorithms, result presentation, and evaluation. I will describe a prototype system that supports people in understanding how the information they interact with changes over time, and a new retrieval model that incorporates features about the temporal evolution of content to improve core ranking. Finally, I will conclude with an overview of some general challenges that need to be addressed to fully incorporate temporal dynamics in information retrieval systems. 讲者简介 : Susan Dumais is a Principal Researcher and manager of the Context, Learning and User Experience for Search (CLUES) Group at Microsoft Research. Prior to joining Microsoft Research, she was at Bellcore and Bell Labs for many years, where she worked on Latent Semantic Indexing (a statistical method for concept-based retrieval), interfaces for combining search and navigation, and organizational impacts of new technology. Her current research focuses on temporal dynamics of information, user modeling and personalization, context and information retrieval, interactive retrieval, and novel evaluation methods. She has worked closely with several Microsoft groups (Bing, Windows Desktop Search, SharePoint Portal Server, and Office Online Help) on search-related innovations. Susan has published more than 250 articles in the fields of information science, human-computer interaction, and cognitive science, and holds several patents on novel retrieval algorithms and interfaces. Susan is also an adjunct professor in the Information School at the University of Washington. She is Past-Chair of ACM's Special Interest Group in Information Retrieval (SIGIR), and serves on several editorial boards, technical program committees, and government panels. She was elected to the CHI Academy in 2005, an ACM Fellow in 2006, a member of the National Academy of Engineering (NAE) in 2011, and received the Gerard Salton Award from SIGIR for Lifetime Achievement in 2009.

个人分类: 信息检索|4550 次阅读|4 个评论

《科技信息检索与利用》--能动学院

terahertz 2011-5-17 09:27

欢迎动力（热能） 0801 、 02、动力（热物理） 0801 、 02的103位同学们。 1,课程教材：袁润 , 刘红光 . 理工科信息检索与利用教程 . 镇江 : 江苏大学出版社 ,2008 . 图书馆借阅： http://202.195.165.18:8080/opac/item.php?marc_no=0000708892 2，教学日历： 3, 实习报告 4，上机上机地点老图书馆 2楼

个人分类: 信息检索|3768 次阅读|0 个评论

何大庆博士学术报告通知：迈向智能化的信息获取

热度 3 timy 2011-5-16 09:42

学术报告通知题目： Toward More Intelligent Access to Information （迈向智能化的信息获取）报告人：何大庆博士时间： 2011 年 5 月 25 日（星期三）下午 2 ： 30 地点：南京理工大学经管楼 105 室报告提要：尽管 We b 搜索引擎（如 baidu.com ）已经在人们的日常生活中得到广泛使用，但这些搜索引擎提供的服务实际上还是初级的，大量的负担被不公平地转移到用户身上。来自学术界和实业界的人士都一致指出：迈向智能信息获取所面临的下一个重大挑战在于打破语言障碍、提供自适应的个性化搜索服务。然而，在多语言和个性化真正用于智能信息获取服务之前，尚有很多重要问题需要解决。在本报告中，何教授将会介绍他的团队在该领域所做的研究工作。本报告的目的在于：就如何设计有效和直观的智能信息获取系统，与大家交流思想和见解。报告人简介：何大庆博士现为匹兹堡大学信息科学学院 (iSchool) 和智能系统项目（ Intelligent Systems Program ）副教授，并担任 iSchool 图书馆与信息博士计划委员会主任。何教授在苏格兰爱丁堡大学获得人工智能专业的博士学位。在 2004 年加盟匹兹堡大学之前，何教授曾在苏格兰罗伯特戈登大学、美国马里兰大学等地从事研究工作。何教授的研究工作主要集中在单语言或多语言信息检索的自适应和交互方面。目前，他的主要研究领域包括：信息检索（单语言和多语言）、自适应 Web 系统与用户建模、交互检索界面设计、 Web 日志挖掘与分析。何博士是十余个研究项目的主持人或共同主持人，研究项目包括：美国国家科学基金会项目、美国国防部高级研究计划署资助项目、匹兹堡大学以及其他机构资助的项目。何教授在国际公认的期刊与会议上发表论文 70 余篇，他是 SCI 索引杂志《 Internet Research 》的编委，信息检索及 Web 技术领域的十多个主要的国际会议程序委员会成员，并且是该领域多个国际一流期刊的审稿人。（更多的信息，请参见何大庆博士的主页： http://www.sis.pitt.edu/~daqing/ ）欢迎校内外各界人士参加！南京理工大学经济管理学院信息管理系二零一一年五月十六日

个人分类: 同行交流|4694 次阅读|0 个评论

文献看两头

热度 2 rbwxy197301 2011-4-22 16:29

这两年一直在给学生上信息组织与检索的相关课程，课堂上同学经常会问到一个问题：在中国知网、万方等全文数据库中做检索时，返回的结果非常多。那么如何从较多的结果中挑选一些质量较好的论文呢？文献看两头，这是我挑选文献时的一种方法。对于近三年的论文，主要看论文发表的期刊。每个领域都有一些同行认可的质量较高的学术期刊。如情报学领域的《情报学报》、《图书情报工作》、《情报理论与实践》、《现代图书情报技术》、《情报资料工作》、《情报科学》、《情报杂志》《图书情报知识》。从作者的角度出发，大家都愿意把好的成果发表在学科领域好的期刊上，无论是论文以后的影响力还是如今的科研评价机制都会促使大家做出这样的选择。另外，这些刊物的审稿机制和水平较大程度上确保了论文的质量。三年以上的论文，主要看论文的被引频次，现在中国知网和万方的期刊论文检索结果中都提供了论文被引频次的信息，学术google检索的中文论文也提供被引次数。尽管被引有一些问题存在，但总的来看，被引频次较高的论文应该是得到同行认可的。当然这儿主要是参考被引次数排序的结果，而不是关注具体的次数。不同的研究主题、不同的学科，被引次数不具直接可比性。被引次数多少为好，这个看结果和自己的需求而定。有兴趣的话，可以尝试一下用H指数来筛选。除此之外，论文的作者、作者所在机构、基金资助等信息也可以在文献选择时提供参考。当然，这种方法可能主要是在论文写作采用比较合适。如果检索论文的目的是为了教学需要，那就要根据其它标准来选择。有些论文，其创新性不一定很强，但其对实际工作有参考价值。如信息检索领域有些论文是对国内外相关数据库的分析比较或使用的介绍，其学术价值不一定有多高，但在信息检索教学中还是有利用价值的。一篇学术论文的价值固然有大家普遍认可的的情况，但也会因人而异、因需求而异。某种程度上，对于检索者个体在特定时间点而言，不一定学术价值高的论文就是合适的，而是满足其需求的才是最合适的。

个人分类: 信息检索|3471 次阅读|3 个评论

《科技信息检索与利用》--化学学院

terahertz 2011-4-20 09:25

欢迎化学 ( 师 )1001 、应化 1001 、应化 1002 的85位同学们。 1,课程教材：袁润 , 刘红光 . 理工科信息检索与利用教程 . 镇江 : 江苏大学出版社 ,2008 . 图书馆借阅： http://202.195.165.18:8080/opac/item.php?marc_no=0000708892 2，教学日历： 3, 实习报告 4，上机上机地点老图书馆 2楼

个人分类: 信息检索|3642 次阅读|0 个评论

《科技信息检索与利用》--食品学院

terahertz 2011-2-21 11:28

欢迎食品学院生物技术 0801, 食品 0801, 0802, 食品质安 0801的同学们。 1,课程教材：袁润 , 刘红光 . 理工科信息检索与利用教程 . 镇江 : 江苏大学出版社 ,2008 . 图书馆借阅： http://202.195.165.18:8080/opac/item.php?marc_no=0000708892 其它参考书：沙振江 , 张晓阳 . 人文社科信息检索与利用教程 . 镇江 : 江苏大学出版社 ,2007. 周金元 . 医药信息检索与利用教程 . 镇江 : 江苏大学出版社 ,2008. 沈固朝 . 信息检索 ( 多媒体 ) 教程 . 北京 : 高等教育出版社 , 2002. 花芳 . 文献检索与利用 . 北京：清华大学出版社 , 2009. 葛敬民 . 信息检索实用教程 . 北京 : 高等教育出版社 ,2 005. 祁延莉 , 赵丹群 . 信息检索概论 . 北京 : 北京大学出版社 ,2006. 谢德体 , 陈蔚杰 , 徐晓琳 . 信息检索与分析利用 . 北京 : 清华大学出版社 ,2007. 2，教学日历： 3, 实习报告 4, 注意第8周的上机改在了老图书馆。第9周结束后请各班班长把纸质考核报告交到图书馆615房间。

个人分类: 信息检索|4021 次阅读|0 个评论

热度 4 timy 2011-2-17 19:32

新书介绍：Modern Information Retrieval (Second Edition)

近日Baeza-Yates B. Ribeiro-Neto 出版了Modern Information Retrieval第二版。以前读书时曾细读过该书的第一版多遍，感觉是一本非常好的介绍信息检索相关内容的技术书籍。大牛门总是能比较及时总结最新的进展，以简易的语言，系统而且全面将相关内容介绍给读者。希望能尽快买到该书，细读一番。单纯从封面可以看出，第二版体现了网络的新特性，即Web2.0下的一些特性。巧合的是, 最近（2011年2月11日）出版的《科学》杂志上的 “Dealing with Data”专题 ,其封面也体现了Web2.0的特色（尽管内容和Web2.0关系并不是太大）。设想一下，Semantic Web和物联网都成为现实之前，海量数据处理与信息检索上面临的新问题，都值得研究。期待这方面的成果尽早问世。以上仅供参考，欢迎指正和讨论。 --------------------------------------------------------------------------------------------------------------- 注：以下内容转载于网络。一、《科学》 “Dealing with Data”专题 From: http://www.sciencemag.org/content/331/6018.cover-expansion COVER A word cloud generated from all of the content from the Dealing with Data special section beginning on p. 692 . The size of each word relates to the frequency with which it appears in the combined texts. References and figure legends were included; common words, authors, and affiliations were excluded. All words are lowercase. See an expanded version of this cloud and other features at www.sciencemag.org/special/data/ . Credit: Yael Fitzpatrick, using www.wordle.net --------------------------------------------------------------------------------------------------------------- 二、 Modern Information Retrieval 第二版新书网址： http://www.mir2ed.org/ 1、内容目录 From: http://www.mir2ed.org/ Preface and Acknoledgments (Download) 1 Introduction (Download) (R. Baeza-Yates B. Ribeiro-Neto) 2 User Interfaces for Search (Download) (Marti Hearst) 3 Modeling (R. Baeza-Yates B. Ribeiro-Neto) 4 Retrieval Evaluation (R. Baeza-Yates B. Ribeiro-Neto) 5 Relevance Feedback and Query Expansion (R. Baeza-Yates B. Ribeiro-Neto) 6 Documents: Languages Properties (with Gonzalo Navarro Nivio Ziviani) 7 Queries: Languages Properties (with Gonzalo Navarro) 8 Text Classification (with Marcos Gonalves) 9 Indexing and Searching (with Gonzalo Navarro) 10 Parallel and Distributed IR (with Eric Brown) 11 Web Retrieval (Download) (with Yoelle Maarek) 12 Web Crawling (with Carlos Castillo) 13 Structured Text Retrieval (with Mounia Lalmas) 14 Multimedia Information Retrieval (Dulce Ponceleón Malcolm Slaney) 15 Enterprise Search (Download) (David Hawking) 16 Library Systems (Edie Rasmussen) 17 Digital Libraries (Marcos Gonalves) A Open Source Search Engines (with Christian Middleton) B Biographies References (Download) --------------------------------------------------------------------------------------------------------------- 2、教学PPT From: http://www.mir2ed.org/ Slides for Teaching 1 Introduction (PDF) (34 slides) 2 User Interfaces for Search (PDF) (87 slides) 3 Modeling (PDF) (263 slides) 4 Retrieval Evaluation (PDF) (144 slides) 5 Relevance Feedback and Query Expansion (PDF) (104 slides) 6 Documents: Languages Properties (PDF) (147 slides) 7 Queries: Languages Properties (PDF) (67 slides) 8 Text Classification (PDF) (157 slides) 9 Indexing and Searching (PDF) (153 slides) 10 Parallel and Distributed IR (PDF) (138 slides) 12 Web Crawling (PDF) (91 slides) 13 Structured Text Retrieval (with Mounia Lalmas) (PDF) (135 slides) 14 Multimedia Information Retrieval (PDF) (164 slides) 15 Enterprise Search (PDF) (128 slides) 16 Library Systems (PDF) (35 slides) A Open Source Search Engines (PDF) (25 slides) --------------------------------------------------------------------------------------------------------------- 3、其他以下转载于： http://www.newsmth.net/bbstcon.php?board=NLPgid=11722 发信人: zibuyu (得之我幸), 信区: NLP 标题: 新书：现代信息检索（英文版·第2版）发信站: 水木社区 (Wed Feb 16 19:05:59 2011), 站内现代信息检索（英文版·第2版）丛书名：经典原版书库原书名：Modern Information Retrieval: The Concepts and Technology behind Search, Second Edition 作者：（西班牙） Ricardo Baeza-Yates　（巴西）Berthier Ribeiro-Neto ISBN：978-7-111-33174-2 定价：78.00 页数：940 出版社：机械工业出版社【内容简介】本书不仅详细介绍了信息检索的所有主要概念和技术，以及有关信息检索面的所有新变化，而且其组织使读者既可以对现代信息检索有一个全面的了解，又可以获取现代信息检索所有关键主题的详细知识。本书的主要内容由信息检索领域的代表人物Baeza-Yates和Ribeiro-Neto编写，对于那些希望深入研究关键领域的读者，书中还提供了由其他主要研究人员编写的关于特殊主题的发展现状。与上一版相比，本版在内容和结构上都有大量调整、更新和充实，其中新增内容在60%到70%左右。具体更新情况如下： ● 新增了文本分类、网络信息爬取、结构化文本检索和企业搜索等章节，以及关于开源搜索的一个附录。 ● 全面改写了用户界面、多媒体检索和数字图书馆等内容。 ● 拓展了一些章节，介绍了信息检索方面的新的重要进展，如语言模型、新的评价方法、查询的特点、基于聚类和分布式信息检索等。【作者简介】 Ricardo Baeza-Yates于加拿大滑铁卢大学获得计算机科学博士学位，现为Yahoo！欧洲和拉丁美洲研究院副总裁，主管Yahoo！在巴塞罗纳（西班牙）和圣地亚哥（智力）的研究中心，并监管海法研究中心。他曾担任智利计算机科学学会主席、智力大学计算机科学系Web研究中心主任、ICREA教授，并且他还在巴塞罗纳发布拉大学创立了信息与通信技术系Web研究组。现在他仍是智力大学和发布拉大学的兼职教授。他的主要研究方向为算法与数据结构、信息检索、用户界面以及可视化在数据库中的应用等。 Berthier Ribeiro-Neto于加利福尼亚大学洛杉矶分校获得计算机科学博士学位，现任巴西Minas Gerais联合大学计算机科学系副教授，同时也是ACM、ASIS及IEEE会员。他的主要研究方向是信息检索系统、数字图书馆、Web界面及视频点播。

个人分类: 信息检索|13468 次阅读|8 个评论

呼吸仪治疗睡眠呼吸暂停症的研究动态与信息检索策略

xupeiyang 2011-1-2 16:01

美研究发现：呼吸仪可缓解睡眠呼吸暂停症 http://news.sciencenet.cn/htmlnews/2011/1/242272.shtm (Reuters) - People with breathing problems that disrupt their sleep were less tired after three weeks of treatment with a breathing device compared to those treated with a placebo, U.S. researchers said on Saturday. http://www.reuters.com/article/idUSTRE7000BY20110101 http://www.ncbi.nlm.nih.gov/pubmed/details Search Details 详细检索策略 Query Translation: (therapy OR therapy OR treatment OR therapeutics OR therapeutics ) AND (obstructive sleep apnoea syndrome OR sleep apnea, obstructive OR (sleep AND apnea AND obstructive ) OR obstructive sleep apnea OR (obstructive AND sleep AND apnea AND syndrome ) OR obstructive sleep apnea syndrome ) AND (respiration OR respiration OR breathing ) AND (equipment and supplies OR (equipment AND supplies ) OR equipment and supplies OR device ) Search URL Result: 334 检索结果 Stopword(s) Ignored: and Translations: breathing respiration OR respiration OR breathing device equipment and supplies OR (equipment AND supplies ) OR equipment and supplies OR device obstructive sleep apnea syndrome obstructive sleep apnoea syndrome OR sleep apnea, obstructive OR (sleep AND apnea AND obstructive ) OR obstructive sleep apnea OR (obstructive AND sleep AND apnea AND syndrome ) OR obstructive sleep apnea syndrome treatment therapy OR therapy OR treatment OR therapeutics OR therapeutics Database: PubMed User query: 检索课题 treatment and obstructive sleep apnea syndrome and breathing device

个人分类: 信息检索|2972 次阅读|0 个评论

毒物（毒理学）信息和数据的检索与分析

xupeiyang 2010-12-29 09:59

http://toxnet.nlm.nih.gov/index.html TOXNET - Databases on toxicology, hazardous chemicals, environmental health, and toxic releases. Select Database Additional Resource 通过学习这个检索实例，你就可以了解如何检索分析毒物、毒理学的文献和数据。面粉增白剂过氧化苯甲酰美国毒物学数据库检索结果 http://www.sciencenet.cn/blog/user_content.aspx?id=398592

个人分类: 信息检索|4720 次阅读|0 个评论

如何获取我的信息检索教学资料？给楚光华同学的回信

xupeiyang 2010-12-2 08:04

尊敬许老师：您好！！我是协和2010级的研究生：楚光华(协和医院妇产科的)，今年选了您的临床班的文献检索课，我觉得您有关医学方面的好的免费医学网站总结的特别好，不知能不能发给我一份，我觉得特别值得保存。谢谢！！祝好！！学生：楚光华光华同学，你好。我的教学资料，你可以看看我的博客和视频教学资料，比较全。许培扬的博客 http://www.sciencenet.cn/blog/xupeiyang.htm 许培扬的教学视频 http://video.medres.me/?s=vod-play-id-220-sid-0-pid-0.html ； http://v.ku6.com/show/BqCok_pPNeU_Zx1M.html 祝你学业有成。许培扬 2010年12月2日

个人分类: 信息检索|3251 次阅读|0 个评论

PUBMED数据库中检索到2011年的医学论文2065篇

xupeiyang 2010-12-1 12:31

2011年的2000多篇论文已发表在77种医学期刊上，读者可以检索到最新的医学研究论文。 http://www.gopubmed.org/web/gopubmed/ http://www.gopubmed.org/web/gopubmed/1?WEB04wjjllxchklwI2cI4jI00h001000j100200010 2,065 documents semantically analyzed Term: 2011 Description: year 2011 Top Years Publications 2011 2,065 2010 44 2009 2 1 2 3 4 Top Countries Publications USA 536 China 157 Germany 132 United Kingdom 119 Japan 111 France 88 Canada 77 Italy 74 India 69 Brazil 45 Spain 43 Australia 41 Sweden 36 South Korea 35 Ireland 35 Taiwan 34 Netherlands 28 Switzerland 26 Iran 26 Belgium 16 1 2 3 4 1 2 3 ... 34 Top Cities Publications Boston 29 Beijing, China 28 London 28 Dublin, Ireland 25 Tokyo 23 New York City 21 Stockholm, Sweden 19 Ann Arbor 16 Paris 16 San Francisco 15 Los Angeles 15 Seoul, South Korea 14 Guangzhou 14 Chicago 13 Durham 13 Shanghai, China 13 Cambridge 12 Houston 12 Montreal 12 Barcelona 12 1 2 3 ... 34 1 2 3 4 Top Journals Publications Methods Mol Biol 462 Ultrason Sonochem 107 J Colloid Interface Sci 80 Neuroimage 76 Handb Clin Neurol 75 Evid Based Complement Alternat Med 70 Behav Brain Res 66 J Pharm Biomed Anal 65 Bioresour Technol 60 Appl Radiat Isot 44 Acta Biomater 44 Acta Neurochir Suppl (wien) 41 J Cogn Neurosci 40 Colloids Surf B Biointerfaces 39 J Cell Physiol 36 Cell Signal 34 Epigenetics 32 Int J Cancer 31 J Environ Manage 29 J Biomed Biotechnol 27 1 2 3 4 1 2 3 ... 451 Top Terms Publications Proteins 382 Evaluation Studies as Topic 269 Genes 255 Tissues 212 Patients 206 Pharmaceutical Preparations 186 mannosyl-oligosaccharide 1,2-alpha-mannosidase activity 177 DNA 142 Methods 141 Mice 130 Nature 128 Neoplasms 127 Therapeutics 122 signal transduction 115 Membranes 113 membrane 113 Animals 111 Peptides 105 Technology 103 Enzymes 103 1 2 3 ... 451 1 2 3 ... 18 Top Authors Publications Lamme V 2 Yu H 1 Li W 1 Sheng G 1 Liu X 1 Everling S 1 Phillips J 1 Johnston K 1 Rockmore D 1 Graham D 1 Petrosini L 1 Torriero S 1 Oliveri M 1 Koch G 1 Lo Gerfo E 1 Salerno S 1 Ferlazzo F 1 Caltagirone C 1 Kawashima R 1 Tsukiura T 1 1 2 3 ... 18

个人分类: 信息检索|3855 次阅读|0 个评论

信息检索策略

热度 1 xupeiyang 2010-11-29 08:04

（四）信息检索策略信息检索策略是指为实现检索目标制定的全盘计划和方案，是在分析检索信息需求的基础上，选择适当的数据库并确定检索途径和检索词，确定各词之间的逻辑关系与检索步骤的一种计划或思路，以制定出检索表达式并在检索过程中修改和完善检索表达式。高效的信息检索过程应以一份完善的信息检索策略为基础，好的检索策略能使检索过程达到最优化。图1-2-3 检索策略构建流程 1. 检索策略的构建检索策略的构建流程如图1-2-3所示。 (1)理解检索课题，确定检索目标检索课题的分析与理解是把握检索目标、正确选择检索工具、确定检索词、构造检索表达式的先决条件，也是使检索策略的质量和效果达到最优化的基础。通过理解检索课题，应做到以下几点： ①分析课题的主要内容和所涉及的学科范围，以选择适合的检索工具。如，若检索课题只涉及某个专业领域的内容，那么首选与该专业领域相一致的数据库；若检索课题涉及的内容全面而广泛，则最好选择综合性的数据库，或同时选择几个不同的数据库。 ②明确所需文献的类型、语种、年代范围、著者及机构等外部特征，以便确定合适的检索途径或进行相应的检索限定。 ③明确检索目标，选择查准或查全的侧重点。同时保证查全率与查准率是比较困难的，须根据课题需要，在查全和查准上做出侧重。如要解决研究中的具体问题，希望有一定范围的文献量，但不希望有误查，则要强调一个准字；如要了解全过程、写综述、做鉴定等，希望获得所有的相关文章，则要强调一个全字。 (2)选择合适的检索工具在充分理解检索需求之后，需要根据课题特征选取合适的检索工具。不同检索系统或数据库所覆盖的学科领域、资源类型、数量规模等不尽相同。正确选择数据库，是保证检索质量的基础。所以应在检索之前阅读有关数据库的使用介绍，从以下几个方面进行考虑： ①按照课题的检索要求和目的，选择所需数据库的类型。如，需要统计数据，应检索数值型数据库；需要某一疾病的诊断标准，应检索指南类数据库；只需要摘要信息，可检索文摘型数据库；而需要原文者，检索全文型数据库。 ②选择收录的学科范围、年代跨度符合要求的数据库。 ③选择所需文献的类型，如期刊论文、专利、会议文献、科技报告等，一些数据库收录的文献类型侧重不同。 ④当需要查找最新文献信息时，选择数据更新周期短的数据库。 ⑤当需要获取原文时，选择原文获取较容易的数据库，一些文摘型数据库提供全文链接功能。 ⑥当几个数据库内容交叉、重复率较高时，要弄清数据库的标引特征、检索方法与特点等，选择比较熟悉的数据库。 ⑦还要注意数据库的收费标准和收费方式。 (3)分析主题概念，确定检索用词检索词是表达文献信息需求的基本元素，也是计算机检索系统中进行匹配的基本单元。检索词选择正确与否，直接影响着检索效果。在全面理解分析检索课题的相关问题后，提炼主要概念与隐含概念，排除次要概念，确定检索用词。检索词的选择，一般有以下几种途径： ①首选主题词。主题词是规范化的受控词汇，它取自于主题词表。同一主题的文献，不受文献中使用何种名称、不同词形、拼写、单复数等的限制，都会被标引到同一个规范的主题词下，主题词检索能提高文献的查准率和查全率。当所选的数据库具有规范化词表时，应优先选用该数据库词表中与检索课题相关的规范化主题词，从而可获得最佳的检索效果。 ②选用数据库规定的代码。许多数据库的文档中使用各种代码来表示各种主题范畴，有很高的匹配性。例如，世界专利文摘数据库中的分类代码，化学文摘数据库中的化学物质登记号等。 ③选用自由词。自由词是非受控的自然语词，符合人类的自然语言习惯。使用自由词检索能够利用检索工具的篇名、文摘甚至全文查找的功能。尤其是当数据库没有专用的主题词表或词表中没有可选的词时，有必要利用自由词进行辅助性检索。 ④选用同义词与相关词。在某些情况下，同义词、近义词、相关词、缩写词、词形变化等应尽量选全，以提高查全率，避免漏检。 (4)选择检索途径，构建检索表达式分析检索课题，选择合适的检索途径，即主题词途径、自由词途径、作者途径、期刊名途径、分类途径等，制定相应的检索表达式。检索表达式是计算机信息检索中用来表达用户检索需求的逻辑表达式，由检索词和各种布尔逻辑算符、位置算符、截词符以及系统规定的其他组配连接符号组成。检索表达式构建是否合理，将直接影响着查全率和查准率。检索式在检索中可一次完成，也可分多步完成。例如，在CBM系统中查找杨辉在2000年后发表的有关社区卫生服务的文献，可以自由词检索状态下构建检索表达式社区卫生服务 and PY=2000 and 作者=杨辉，一次完成检索；同样，也可以分别在基本检索、著者检索等状态下，分别完成社区卫生服务、PY=2000和作者=杨辉的检索，然后将三个分步检索式用逻辑与AND组合起来，完成最终检索，得到的检索结果与一步检索表达式是相同的。 2. 检索策略的评价检索策略在信息获取的过程中起着至关重要的作用。衡量检索策略质量的好坏有两个重要的指标：查全率和查准率。查全率是指系统在进行某一检索时，检出的相关文献量与系统文献库中相关文献总量的比率，它反映该系统文献库中实有的相关文献量在多大程度上被检索出来；查准率是指系统在进行某一检索时，检出的相关文献量与检出的文献总量的比率，它反映该系统排除不相关文献的能力。查全率与查准率是两个近乎矛盾的指标。要想做到查全，势必会要对检索范围和限制逐步放宽，则结果是会把很多不相关的文献也带进来，影响了查准率。查全率和查准率难以同时提高。为了保证检索结果，应根据具体要求，合理地调节查全率和查准率。 3. 检索策略的优化在经过反复思考制定出的检索策略输入检索系统后，检出的结果不一定能够满足课题的检索要求，可能输出的篇数过多，而且不相关的文献所占比例较大，也可能输出的文献数量过少，有时甚至为零。这就需要检索人员分析漏检与误检的原因，在排除一些不可控制的条件外，不断地调整检索策略，以达到更好的检索效果。 (1)检索策略的影响因素影响检索结果的因素有很多种，可能是信息检索人员制定的检索策略不够合适，也可能是数据库信息加工人员的原因等。 ①影响查准率的因素从信息检索方面来看，检索时所用检索词专指度不够，检索面宽于检索要求；检索系统不具备逻辑非功能和反馈功能；检索式中使用逻辑或不当；截词部位不当；检索限定条件偏少等。从数据库自身的信息加工来看，索引词不能准确描述文献主题和检索要求；组配规则不严密；选词及词间关系不正确；标引过于详尽；主题词与副主题词组配错误等。 ②影响查全率的因素从信息检索方面来看，隐含概念挖掘不够，不能全面地描述检索要求；选词不当或选词覆盖面不全；检索途径和方法太少；检索策略过于简单；逻辑组配检索不当；检索限定条件过多等。从数据库自身的信息收集和加工来看，数据库收录文献不全；索引词汇缺乏控制和专指性；词表结构及功能不完善；词间关系模糊或不正确；标引不详；标引前后不一致；标引人员用词不当或遗漏了原文的重要概念等。 (2)缩小检索范围，提高查准率如果某项检索需要尽可能准确地检索到相关信息，即较高的查准率，或初步检索得到的结果太多，需要缩小检索范围时，可从以下几方面调整检索式： ①提高检索词的专指度，增加或换用下位词和专指性较强的自由词、主题词；或采用较专指的副主题词进行组配限定检索。 ②增加概念词，并用AND运算符连接一些能够进一步限定主题概念的相关检索项，用逻辑非NOT来排除一些无关的检索项。 ③减少同义词、近义词和同族相关词。 ④使用字段限定检索，将检索词限定在如题名、关键词等字段中进行检索。 ⑤使用限定字符，通过对关键词间的位置、年代、文献类型、学科、语种等的限定有效地缩小查询范围，使检索结果更接近需求。 ⑥采用加权检索：在文献加工的时候，信息标引人员给每个检索词一个数值表示其重要性程度，称为权值。加权检索仅能检索出权值较高的文献，提高了文献的查准率，但往往会造成漏检。 (3)扩大检索范围，提高查全率如果某项检索需要尽可能全面地检索到相关信息，即较高的查全率，或初步检索得到的结果为零或数量太少时，需要扩大检索范围，可从以下几方面来调整检索式： ①自由词检索：增加选取检索词的同义词、近义词及相关词，并利用逻辑运算符OR 将其与前者联系起来；采用截词算符，减少以不同写法所表达的检索词，同族相关词；减少检索表达式中的AND运算，逐渐减少一些不太重要的概念词的限定。 ②主题词检索：降低主题词的专指度，从词表或检出文献中选择一些上位词或相关词；利用检索系统的扩展检索功能(主题词扩展、副主题扩展)，将该主题词(或副主题词)及其下位的主题词(或副主题词)全部检索出来，以扩大检索范围；减少副主题词的限定，或采用副主题词的上位副主题词进行限定，如药物治疗转为治疗。 ③减少限定：若在检索当中采用了字段限定、年代范围限定、位置算符限定等，可取消限定，或放宽限定的范围。 ④巧用分类检索，将某一主题及其下位分类主题的文献全部检索出来，实现族性检索，有效降低漏检率。 ⑤针对同一个检索提问选用多种检索工具，访问多个数据库，以弥补单一检索工具和单个数据库在覆盖面、容量和规模上的限制从而达到扩大检索范围的目的。摘自《医学信息检索与利用》主编代涛副主编许培扬阮学平编者（按姓氏汉语拼音字母顺序排列）阿丽塔安新颖代涛方安葛红梅侯丽黄利辉李军莲李越刘晓婷倪素云钱庆任慧玲阮学平孙海霞唐小利王敏许培扬张玢张燕舞周琴秘书张玢

个人分类: 信息检索|11559 次阅读|3 个评论

期刊界(www.alljournals.cn)

xupeiyang 2010-9-28 08:34

期刊界( www.alljournals.cn )是全球第一期刊垂直搜索网站，期刊界努力将分散在互联网上的期刊数据集中搜索，带给用户有轻松的文献查询体验，2010年4月搜索数据达6000万篇文章，包含3万5千余种杂志，基本涵盖了国内外主流数据库文章，期刊界的目的是搜索全球的所有期刊，为传播学术成果做贡献。期刊界( www.alljournals.cn )开创性地和期刊办公软件相整合，为期刊编辑部提供一体化的期刊信息化解决方案，不仅全面实现在线办公，期刊界在提供搜索服务的同时，智能的为期刊编辑部办公系统推送信息，让期刊网站与全球期刊信息相链接，实现被引文献的追踪、为审稿人推送相似文献等功能，信息服务贯穿于收稿工作、稿件审理、发表文章的整个工作流程。成为中国互联网界位居前列的搜索引擎与期刊信息化服务提供商。期刊界一直致力于以创新、专业、全面的网络应用，为读者和期刊工作者提供专业、人性化的信息服务。期刊学科分类医药、卫生工业技术数理科学和化学天文学、地球科学航空、航天交通运输　农业科学生物科学环境科学、安全科学自然科学总论哲学、宗教政治、法律军事经济文学艺术　历史、地理社会科学总论文化、科学、教育、体育语言、文字马克思主义、列宁主义、毛泽东思想、邓小平理论

个人分类: 信息检索|6009 次阅读|0 个评论

Cambridge《自然语言工程》被SCI、SSCI、A&HCI收录

wanyuehua 2010-9-4 08:17

1995 年创刊的Natural Language Engineering 《自然语言工程》， ISSN: 1351- 3249，季刊，英国剑桥大学出版社（CAMBRIDGE UNIV PRESS, EDINBURGH BLDG, SHAFTESBURY RD, CAMBRIDGE, ENGLAND, CB2 8RU）出版， 2010 年入选 Web of Science 的 Science Citation Index Expanded 、 Social Sciences Citation Index 、 Arts Humanities Citation Index ，目前在SCI数据库可以检索到该期刊2009年的第15卷第1期到2010年第16卷第2期共40篇论文。该刊是 EI 收录期刊， EI 从 1996 年开始收录， 1997 年被 EI 剔除， 2003 年开始被 EI 重新收录， EI 共收录了该刊 1996 ， 2003-2010 年 170 篇论文。 40 篇文章包括学术论文31篇、书评6篇、社论2篇、更正1篇。 40 篇文章的主要国家分布：美国15篇，英国13篇，德国、意大利、荷兰各4篇，法国、土耳其各2篇，中国、瑞士、加拿大、奥地利、澳大利亚、芬兰、以色列各1篇等。中国学者以通讯作者单位在Natural Language Engineering《自然语言工程》上发表论文的是哈尔滨工业大学（Harbin Inst Technol）1篇。 40 篇文章共被引用8次（其中2009年被引用2次、2010年被引用6次），平均引用0.20次。 Natural Language Engineering《自然语言工程》投稿指南：该刊主要刊登自然语言工程方面的研究论文、评论、社论、会议论文等，涉及计算机的机器翻译、信息检索、语言识别及生成、对话系统、自然语言加工基础、文本分析、集成系统等。网址： http://journals.cambridge.org/action/displayJournal?jid=NLE 编委会： http://journals.cambridge.org/action/displayMoreInfo?jid=NLEtype=eb 作者指南： http://journals.cambridge.org/action/displayMoreInfo?jid=NLEtype=ifc

个人分类: SCI投稿|8924 次阅读|1 个评论

一份科学、合理、准确的信息检索策略

xupeiyang 2010-9-2 09:09

杜建等研究人员的这份信息咨询报告做的非常好，特别是信息检索策略的制定科学、合理、全面、准确，这是做好信息分析的基础和保证。治疗丙肝的蛋白酶抑制剂国内外研究进展（信息咨询报告）丙型肝炎是由丙型肝炎病毒 (hepatitis C virus ， HCV) 引起的经血液传播的一类肝脏疾病，患者具有易疲劳、恶心、呕吐等症状，持续感染会导致肝硬化甚至肝细胞癌 (hepatocellular carcinoma) 。目前，临床上采用聚乙二醇化干扰素 (pegylated interferon) 和利巴韦林 (ribavirin) 联合用药治疗丙型肝炎，但存在治疗周期长、选择性差、不良反应大等缺点。近年研发了一系列 HCV 蛋白酶抑制剂，如 NS3 丝氨酸蛋白酶抑制剂、 NS5B RdRp 聚合酶抑制剂、 NS3 解旋酶 / 核苷三磷酸酶抑制剂等。咨询要求包括： 1 、国内、外已上市的蛋白酶抑制剂； 2 、国内、外在研的蛋白酶抑制剂的种类和研发阶段； 3 、国内、外蛋白酶抑制剂的临床治疗方案； 4 、国内、外蛋白酶抑制剂的临床试验情况； 5 、国内、外蛋白酶抑制剂的专利情况。委托人提供的中英文关键词中文关键词英文关键词蛋白酶抑制剂 Protease inhibitor 丙肝 hepatitis C 丙型肝炎 hepatitis C 进展 progress 联合用药 combination drug 联合治疗 combination therapy 信息检索系统与年限 1. 中国生物医学文献服务系统（ SinoMed ） 2005 2010 年 2. 中国知识资源总库（ CNKI ） 2005 2010 年 3. 万方数据知识服务平台 2005 2010 年 4. 国家知识产权局专利检索系统 2005 2010 年 5. 上海知识产权公共服务平台 2005 2010 年 6. 美国国立医学图书馆 PubMed 检索系统 2000 2010 年 7. 荷兰医学文摘检索系统（ EMBASE ） 2000 2010 年 8. ISI Web of Knowledge 平台 2000 2010 年 9. MICROMEDEX 《美国临床暨循证医药学数据库》 2000 2010 年 10. Pharmaprojects 数据库 2000 2010 年 11. R D Insight 数据库 2000 2010 年 12. NIH Clinical.Trial 网站 2000 2010 年 13. Derwent Innovation Index 2000 2010 年 14. Google Patents, http://www.google.com/patents 2000 2010 年中文检索策略 1. ( 中文标题 : 丙肝 OR 丙型肝炎 OR HCV ) OR ( 关键词 : 丙肝 OR 丙型肝炎 OR HCV) OR( 主题词 : 肝炎 , 丙型 / 全部树 / 全部副主题词 ) 2. 主题词 : 蛋白酶抑制药 / 全部树 / 全部副主题词 OR 蛋白酶抑制剂 OR 蛋白酶抑制药 3. #1 AND #2 4. #1 AND ( 主题词 : 整合酶抑制剂 / 全部树 / 全部副主题词 OR 聚合酶抑制剂 ) 5. #1 AND ( 主题词 : 核酸合成抑制剂 / 全部树 / 全部副主题词 OR 核酸合成抑制剂 ) 专利检索策略 1. (AB=( 丙肝 OR 丙型肝炎 OR HCV) OR TI=( 丙肝 OR 丙型肝炎 OR HCV)) AND (AB=( 蛋白酶抑制剂 ) OR TI=( 蛋白酶抑制剂 )) 2. (AB=( 丙肝 OR 丙型肝炎 OR HCV) OR TI=( 丙肝 OR 丙型肝炎 OR HCV)) AND (AB=( 聚合酶抑制剂 ) OR TI=( 聚合酶抑制剂 )) 3. (AB=( 丙肝 OR 丙型肝炎 OR HCV) OR TI=( 丙肝 OR 丙型肝炎 OR HCV)) AND (AB=( 核酸合成抑制剂 ) OR TI=( 核酸合成抑制剂 )) 英文检索策略 1. Hepatitis C OR Hepatitis C OR HCV 2. Protease Inhibitors OR Protease Inhibitors OR polymerase Inhibitors 3. #1 AND #2 专利检索策略 ( 主题 =(Ciluprevir or vaniprevir or Boceprevir or Narlaprevir or Telaprevir or Valopicitabine or Filibuvir or Nitazoxanide or Silibinin or polymerase inhibitor* or protease inhibitor*)) AND ( 主题 =(Hepacivirus) OR 主题 =(Hepac* C)) 许老师：您好。谢谢您的鼓励，我们会继续努力，我们感觉每天都在创新，丰富自己的知识体系，特别是信息归纳、整理能力的锻炼，真的很有意义。我的研究生阶段只有两年，知识体系比较薄弱，我觉得在这样的信息咨询报告的完成过程中，自己受到了很大的锻炼。许老师，您总是在鼓励我们年轻的一代，我每次都受到您的鼓励，觉得心里很踏实，很感动，再转化为工作的动力。谢谢许老师，请您多保重身体，祝您工作愉快！杜建 2010-09-01 杜建好。我初步看了你们做的咨询报告，非常好，非常规范。具有重要的参考价值。今后多做这样的研究分析，积累经验，有的可以去发表论文。许老师杜建写: 尊敬的各位老师：大家好！附件中是完成的北京凯因生物技术公司委托的蛋白酶抑制剂咨询报告终稿，请各位老师查收。祝工作顺利！杜建 2010-9-1

个人分类: 信息检索|3833 次阅读|1 个评论

小狗与信息检索

rbwxy197301 2010-8-2 08:54

父母九年前养了一只小狗，它长得不太好看，但非常可爱。很有意思，只要是家里人回来，小狗会视而不见，或者有时会中跑到家人跟前撒撒娇。我每年假期都会回家住一段时间。其实，对小狗而言，我应该是一个陌生人，这些年回家呆的时间并不多。每次刚进家门时，小狗也会象对其它人一样，叫几声，但过不了多长时间，它就把我和家人一起看待了。动物的神奇有时很难理解。我想，小狗其实每天都在做一件对它来说非常重要的事情信息检索。如果嗅到不是主人家成员的气味时，它就会不听地叫，希望主人知道有陌生人进入了它所管辖的领地。有时，它也会出遛弯，不管走多远，多长时间，它也能准确地找到回家的路。不知小狗在履行它的职责时，用的是什么样的检索模型、检索式，但它的检索结果总是那样准确。狗做为人类的朋友不知已经陪伴了我们多少年，但它们总是恪尽职守，用它们不是非常强壮的身边守护着自己的领地。查准率和查全率是我们衡量信息检索结果的两个重要指标。但愿有一天，人工设计的检索系统能够象小狗一样，让用户的信息检索结果，既全又准。

个人分类: 生活随想|3070 次阅读|2 个评论

深大图书馆听课总结

skymoon619 2010-7-25 23:36

暑期深大图书馆请来了中大图书馆的老师来有关图书馆讲课，按馆里的领导的要求，非图书馆专业的馆员要去听课，因为在图书馆的职责是科技查新，特选了武琳老师讲的有关信息检索、科技查新的三天课程。总结了一下武琳老师的课程，大多中规中矩，而武琳老师也似乎不想将太多大家都熟悉的东西，而选取了大家平时可能不注意的东西来讲，这点颇让我感到兴趣盎然。武琳老师在讲到将来信息检索的时候，认为将来的检索不仅仅局限于基于文本，还有可能是基于图片、照片、音频等其它检索方式。例如在网上选取一个人物的头像，虽然你可能不知道他的名字、生平、成就，但只要你留下了他的外貌印象，就可以通过图像进行检索；又如你对某些哼唱的歌曲感兴趣，但有不知道歌名等一切可以进行文本检索的信息，则可以通过麦链接电脑进行检索，称之为哼唱检索武琳老师还讲到了其它的一些东西，令我这个喜欢新事物的门外汉食指大动，眼神发亮。网络检索技术发展到这地步，令我们这些从事信息服务的图书馆员来说是一件幸福的事情。这是其中一个令我印象深刻的地方。我常常会到中国科技大学罗昭峰老师的博客猎奇，其讲解的RSS、ENDNOTE、igoogle、google wave、Web3.0等新事物已经让我开了眼界，真是没有做不到的，只有想不到。（罗昭峰老师的博客新奇事物 http://www.sciencenet.cn/m/user_index1.aspx?typeid=116519userid=304685 ）程焕文将图书馆分成了三个时代，似乎随着web3.0的开发，lib3.0已经不远了（ http://blog.sina.com.cn/s/blog_4978019f0100jz35.html ）在开篇介绍中，武琳老师讲到了CNKI的数字搜索、图形搜索和表格搜索，也引起了我的极大兴趣，以前常用CNKI翻译和学术趋势，她讲的这三个功能确实没有去注意，之所以感兴趣，是因为近期研究科学知识图谱，需要大量的知识图谱研究范本，google图片搜索确实很不错，但信息量太广太杂，不易于拿来研究，而CNKI的图形来自学术论文，学术价值较高，回家亲自试验了一下这个检索功能，有意外惊喜，确实是个好东西。此亮点2 第三，就是讲到科技查新了，科技查新是个综合检索技巧和情报调研的深层次知识服务，不仅需要熟练的检索技巧和方法，还要有一定情报分析能力，对检索技巧中的位置算符、逻辑算符、截词技术要能充分把握，这点武琳老师都在后面有讲到，但这都不是让我深思的地方。反而武林老师在讲到科技查新报告是一件不能轻易盖章时讲到的东西，颇让我感到认同。做科技查新的不能轻易盖上那个肯定人家课题新颖性的章，这是有法律效率的，你给人家的报告下了定论，必须是确有新颖性，要么有创新，要么有突破，如果仅仅是为了寻求所查课题与所查文献文字上的不同，试图这样去寻找查新课题新与不新的交叉边缘，是不明智的，是可以被起诉的，因为白纸黑字红章在那嘛。其后果轻则可能是撤销查新站的查新资格，重则查新员和审核员等同受罚，各种缘由就不细说了武琳老师没有完全按ppt讲解数据库的使用，而是采用平常工作中的实例来说明她所讲的主题，这对非图书馆学专业背景的图书馆员来说是很有启发的。补充一点：武琳老师讲到了 LISA : Library and Information Science Abstracts 中文全称: 图书馆与信息学文摘数据库，这个是图书馆员开展图书馆研究的一个很好的数据库，第一次听说回头好好研究一下

个人分类: 图书馆学与情报学杂志|5234 次阅读|0 个评论

《中国生物医学信息检索多媒体系列教程》已出版

xupeiyang 2010-7-13 07:15

《中国生物医学信息检索多媒体系列教程》简介《中国生物医学信息检索多媒体系列教程》（简称教程）是医学信息检索与利用课程的计算机辅助教学课件，于 2010 年 6 月已经由北京协和医学音像电子出版社正式出版。该教程由中国医学科学院 / 北京协和医学院医学信息研究所 / 图书馆和华北地区高校医学图书馆协会共同牵头，组织北京大学医学图书馆、首都医科大学图书馆、解放军医学图书馆、山西医科大学医学信息管理专业 / 图书馆、华北煤炭医学院、天津医科大学图书馆六家单位参与开发，并得到美国健康基金项目经费资助。该教程包括生物医学信息检索概论、中国生物医学文献服务系统、中国生物医学期刊数据库、 CA 网络数据库、 BIOSIS Previews 美国生物学文献网络数据库、 EMBASE.com 、国际药学文摘数据库、 CNKI 中国期刊全文数据库、维普资讯中文科技期刊全文数据库、万方数据医药信息系统、 OVID 平台、 EBSCO 、中国生物医学期刊引文数据库、 Web of Science 、 PubMed 、 NCBI 分子生物学信息资源、国外循证医学数据库、 MDConsult 等 18 个章节。该教程由 50 位具有丰富教学经验的医学文献检索教师撰写课件脚本，华北地区高校医学图书馆协会组织召开数次会议讨论和审核课件内容，并聘请中国国际传播电台、中国传媒大学的专业人员配音，由专业软件公司制作。课件集图、文、声、像为一体，具有交互式、形象直观和信息量大的特点，采用生动的多媒体效果演示了各生物医学信息数据库的特点和使用方法。具备内容全面、技术先进、制作精良等特点，其中部分章节已在全国医学文献检索教学会中获奖。主审人员：中国医学科学院/北京协和医学院图书馆蔡汾岚中国医学科学院医学信息研究所许培扬北京大学医学部图书馆谢志耘首都医科大学图书馆马路联系地址：北京东城区东单北大街 69 号联系单位：北京协和医学音像电子出版社 010-65133258 北京协和医学院图书馆信息服务部张玢010-52328950 黄利辉 010-52328911

个人分类: 信息检索|4756 次阅读|1 个评论

《医学信息检索与利用》即将出版

xupeiyang 2010-7-12 07:18

该教材即将由人民卫生出版社出版北京协和医学院精品教材立项项目医学信息检索与利用主编代涛副主编许培扬阮学平编者（按姓氏汉语拼音字母顺序排列）阿丽塔安新颖代涛方安葛红梅侯丽黄利辉李军莲李越刘晓婷倪素云钱庆任慧玲阮学平孙海霞唐小利王敏许培扬张玢张燕舞周琴秘书张玢人民卫生出版社目录前言第一章概论第一节信息概述一、信息的概念二、信息的特征三、信息的类型四、信息与知识、文献的关系第二节信息组织与检索一、信息组织二、信息检索第三节医学信息的特征及作用一、医学信息的特征二、医学信息的作用第四节医学信息素养一、信息素养的基本概念二、医学信息素养的内涵三、信息素养评价标准四、医学生信息素养评价标准第二章图书馆信息资源与服务第一节医学图书馆文献信息资源一、概述二、主要文献类型三、电子资源第二节图书馆信息服务一、概述二、常见信息服务项目第三节图书馆信息门户一、图书馆信息查询二、联合目录查询三、整合检索服务系统查询第四节文献资源保障体系一、文献资源保障体系建设意义二、我国文献资源保障体系建设第三章文摘数据库第一节中国生物医学文献数据库一、概况二、使用方法三、检索实例第二节 PubMed 一、概况二、使用方法三、检索实例第三节 Embase 一、概况二、使用方法三、检索实例第四节 BIOSIS Previews 一、概况二、使用方法三、检索实例第五节 SciFinder 一、概况二、使用方法三、检索实例第四章全文数据库第一节中国医院知识仓库一、概况二、使用方法三、检索实例第二节中文科技期刊数据库（全文版）一、概况二、使用方法三、检索实例第三节万方数字化期刊一、概况二、使用方法三、检索实例第四节 ScienceDirect 一、概况二、使用方法三、检索实例第五节 SpringerLink 一、概况二、使用方法三、检索实例第六节 OVID 一、概况二、使用方法三、检索实例第七节电子图书一、概况二、方正 Apabi 数字资源平台三、 NetLibrary 电子图书第八节其他全文数据库一、 Nature.com 二、 BMJ Journals 三、 Proquest 第五章引文数据库第一节引文检索概述一、引文及其相关概念二、引文检索的作用第二节 Web of Science 一、概况二、使用方法三、检索实例第三节 Scopus 一、概况二、使用方法三、检索实例第四节中国科学引文数据库一、概况二、使用方法三、检索实例第五节中国生物医学期刊引文数据库一、概况二、使用方法三、检索实例第六节其它引文检索资源一、 Journal Citation Reports 二、 Google 学术搜索三、国际引文数据库四、中文社会科学引文数据库五、中国科技论文与引文数据库六、中国科技期刊引文数据库七、中国引文数据库八、中国科学期刊引证指标数据库第六章学科专题信息资源第一节生物信息学资源一、概述二、生物信息学数据资源介绍三、序列比对检索第二节循证医学信息资源一、概述二、循证医学专业数据库三、临床实践指南数据库四、循证医学期刊资源五、其它循证医学网络资源第三节药学信息资源一、概述二、药物综合信息数据库资源三、临床用药数据库资源四、药物研发事实数据库资源第四节公共卫生信息资源一、概述二、公共卫生专业数据库三、公共卫生相关网站信息资源第五节护理学信息资源一、概述二、 CINAHL 三、循证护理资源四、护理学网站资源第七章特殊类型信息资源第一节专利信息资源一、概述二、国内专利信息资源三、国外专利信息资源第二节学位论文信息资源一、概述二、国内学位论文信息资源三、国外学位论文信息资源第三节学术会议信息资源一、概述二、国内学术会议信息资源三、国外学术会议信息资源第八章网络信息资源第一节搜索引擎一、概述二、通用搜索引擎三、综合学术搜索引擎四、主要医学专业搜索引擎第二节医学网站一、综合性医学网站二、医学专业网站第三节开放获取资源一、概述二、国内主要开放获取资源三、国外主要开放获取资源第九章医学信息分析与利用第一节医学文献信息分析一、概述二、常用文献信息分析方法三、常用医学文献信息分析工具四、文献信息分析主要应用第二节医学文献信息利用一、医学科技信息跟踪二、医学科技查新第三节医学科研论文写作一、医学科研论文概述二、医学科研论文的基本结构与要求三、医学科研论文写作注意事项四、医学科研论文的投稿第四节个人文献信息管理一、概述二、常用参考文献管理软件的使用第十章医学信息利用的新发展第一节新型学术交流模式一、数字出版二、开放获取三、虚拟社区四、信息共享中心五、 E-learning 第二节图书馆 2.0 一、图书馆 2.0 的基础理论二、图书馆 2.0 的应用模式三、图书馆 2.0 在信息服务中的实现途径四、图书馆 2.0 的应用实例第三节知识检索与信息可视化一、知识检索二、信息可视化第四节医药卫生决策支持系统一、医学信息决策二、医学决策支持系统第五节移动信息服务一、应用原理与技术二、移动图书馆三、移动医疗第十一章医学信息应用实例第一节医学科研选题一、医学科研选题的意义二、医学科研选题中信息获取利用途径三、医学科研选题案例第二节医学进展调研一、医学进展调研的意义二、医学进展调研中信息获取利用途径三、医学进展调研案例第三节临床病例实践一、临床病例实践的意义二、临床病例实践的方法和途径三、临床病例实践案例第四节新药研发调研一、新药研发的意义二、药学数据库资源利用的方法与途径三、实际案例参考文献附录医学生信息素养能力指标体系（修订稿）

个人分类: 信息检索|4713 次阅读|0 个评论

干细胞研究国内相关科研项目的信息检索与分析

xupeiyang 2010-7-9 14:23

相关研究项目，科研人员应当特别关注正在进行中的科研项目（2010 - 2014年的在研项目），了解在研项目的研究动态，跟踪科技进展。目前，国内还没有一个在研科技项目数据库可供检索查阅的，在CNKI平台查阅比较方便。相关信息分析: 完成时间资助发文数申请专利数科技成果数资助经费总额数详细信息见： http://elib.cnki.net/grid2008/DetailProject/DetailView.aspx?projectid=160927001 组织干细胞识别、谱系重编程和示踪研究及相似科研项目

个人分类: 创新评论|2912 次阅读|0 个评论

肿瘤基因研究国内相关科研项目的信息检索与分析

xupeiyang 2010-7-9 14:16

相关研究项目，科研人员应当特别关注正在进行中的科研项目（2010 - 2014年的在研项目），了解在研项目的研究动态，跟踪科技进展。目前，国内还没有一个在研科技项目数据库可供检索查阅的，在CNKI平台查阅比较方便。相关信息分析: 完成时间资助发文数申请专利数科技成果数资助经费总额数详细信息见： http://elib.cnki.net/grid2008/DetailProject/DetailViewMore.aspx?type=sametable=1id=162106006 人肿瘤细胞中HILI基因在逆转座基因LINE1表观遗传调控中的作用及调控相关piRNA的鉴定和功能研究及相似科研项目

个人分类: 创新评论|2698 次阅读|0 个评论

[转载]科研人员常用的学术搜索引擎

xupeiyang 2010-7-4 07:37

1、 http://scholar.google.com/ 2、 http://qns.cc/ 科研人员的良好助手，上此网站的90%是从事科研的学生与老师。其词典搜索集成了目前市面上最好的在线英汉写作及科研词典，用此搜索引擎写作英文论文相当方便；其文献搜索集成了目前最优秀的数据库。 3、 http://www.scirus.com Scirus是目前互联网上最全面、综合性最强的科技文献搜索引擎之一，由 Elsevier科学出版社开发，用于搜索期刊和专利，效果很不错！Scirus覆盖的学科范围包括：农业与生物学，天文学，生物科学，化学与化工，计算机科学，地球与行星科学，经济、金融与管理科学，工程、能源与技术，环境科学，语言学，法学，生命科学，材料科学，数学，医学，神经系统科学，药理学，物理学，心理学，社会与行为科学，社会学等。 4、 http://www.base-search.net/ BASE是德国比勒费尔德(Bielefeld)大学图书馆开发的一个多学科的学术搜索引擎，提供对全球异构学术资源的集成检索服务。它整合了德国比勒费尔德大学图书馆的图书馆目录和大约160 个开放资源（超过200 万个文档）的数据。 5、 http://www.vascoda.de/ Vascoda是一个交叉学科门户网站的原型，它注重特定主题的聚合，集成了图书馆的收藏,文献数据库和附加的学术内容。 6、 http://www.goole.com/ 与 google比较了一下发现，能搜索到一些google搜索不到的好东东。它界面简洁，功能强大，速度快，YAHOO、网易都采用了它的搜索技术。 7、 http://www.a9.com Google在同一水平的搜索引擎。是Amazon.com推出的，Web result部分是基于Google的，所以保证和Google在同一水平，另外增加了Amazon的在书本内搜索的功能和个性化功能：主要是可以记录你的搜索历史。现在还是Beta，不过试用后感觉很好，向大家推荐一试，不过缺憾是现在书本内搜索没有中文内容。 8、 http://www.ixquick.com 严格意义上讲不是搜索引擎，是连接搜索引擎和网络用户的信息立交桥。新一代的搜索引擎应运而生，Ixquick meta－search正是目前最具光芒的新星。但是对于大多数国内用户来说，Ixquick还很陌生。 Ixquick众多独特的功能我不一一介绍了，只介绍我们最关心的，搜索数据库密码。使用方法：先进入 Ixquick，以Proquest数据库为例。填入Proquest Username Passw ord History Online后点击search，看看出来的结果，第一页中第6个，proquest的usern ame和password赫然在目，别急，再看第4个结果HB Thompson Subscription Online Databases，即 http://homework.syosset.k12.ny.us/onlinedbs/HBTDatabases/ ，进入后发现这是一个密码页，选择Magazines Journals栏，就有 EBSCO、Electric Library E lementary、Electric Library Elementary、ProQuest Platinum (in school)、ProQues t Platinum (remote)等众多数据库的密码，都有uesrname和password，随便试一下EBSCO，OK，成功登陆。 9、 http://vivisimo.com/ cmu的作品，对搜索的内容进行分类，这样可以有效地做出选择，比较有特色。可实现分类检索，检索速度也很好，如EBSCO 密码几分钟就可找一大堆 . 　　 http://search.epnet.com/ 　　 User ID: mountain 　　 Password: ridge 　　这个密码可以试试。 10、 http://www.findarticles.com/ 一个检索免费paper的好工具。进入网页以后，可以看到他有三个功能，driectory web article ，其中article对我们很有帮助，你可以尝试输入你要找的文章，会有很多发现的！ 11、 http://www.sciseek.com/Sample 感觉不是很好用，内容也不是太多，主要靠用户添加网址，提供信息的搜索引擎，搜索功能也比较差，输入常见的关键词，往往找不到相匹配的内容。 12、 http://www.chmoogle.com 现点击后或跳转到 http://www.emolecules.com ，在此搜索引擎里可以搜索到超过千万种化学品信息或相应的供应商，与Chemblink有点相似，但提供的化学品理化信息没有Chemblink 详细，与其不同的是该搜索引擎可提供化学品结构式搜索（主页上有在线绘制化学结构式的搜索框）。 13、 http://www.ojose.com/ OJOSE (Online Journal Search Engine，在线期刊搜索引擎)是一个强大的免费科学搜索引擎，通过OJOSE，你能查找、下载或购买到近60个数据库的资源。但是感觉操作比较复杂。 14、 http://citeseer.ist.psu.edu/ 一个关于计算机和信息科学的搜索引擎。 15、 http://hpsearch.uni-trier.de/ 专家个人主页搜索引擎 16、 http://cnplinker.cnpeak.com/ 为了给读者用户提供一个方便快捷的查阅国外各类期刊文献的综合网络平台，中图公司组织开发了cnpLINKer（cnpiec LINK service）在线数据库检索系统，并正式开通运行。cnpLINKer即中图链接服务，目前主要提供约3600种国外期刊的目次和文摘的查询检索、电子全文链接及期刊国内馆藏查询功能.并时时与国外出版社保持数据内容的一致性和最新性. 点评：只提供了外文检索的功能，但是无法得到全文。个人认为不是很理想。 17、 http://guoxue.baidu.com/ 百度国学目前能提供上起先秦、下至清末历代文化典籍的检索和阅读。内容涉及经、史、子、集各部。 18、 http://infomine.ucr.edu/ NFOMIN 是由加州大学、维克森林大学、加州国立大学、底特律大学等大学图书管理员建立的学术搜索引擎。它主要为大学职员、学生和研究人员提供在线学术资源。 http://emuch.net/html/201004/1927265.html

个人分类: 信息检索|3796 次阅读|3 个评论

[转载]开放信息检索课程资源

icstu1 2010-7-1 11:47

开放信息检索课程资源 http://jpkc.zju.edu.cn/k/244/

个人分类: D 种种最爱的知识（概念）列表|984 次阅读|0 个评论

[转载]-----【译作推荐】搜索引擎：信息检索实践

timy 2010-6-26 00:50

From: http://ir.hit.edu.cn/phpwebsite/index.php?module=announceANN_user_op=viewANN_id=327 近日，由我中心（博主注：哈工大研究检索研究中心）翻译的《搜索引擎：信息检索实践》一书由机械工业出版社正式出版。近年，越来越多的学者、研发人员、研究生和大学生们投入到搜索引擎的研究与实践中来，他们希望掌握搜索引擎背后的理论和技术，希望了解在搜索引擎设计和开发中的原则和经验，从而为搜索引擎在各个行业的应用以及更具颠覆性的下一代搜索引擎的研发创造条件。本书恰好可以满足这些读者的迫切需求。本书英文版原作者W. Bruce Croft于1979年在英国剑桥大学获得计算机科学博士学位，同年加入University of Massachusetts（Amherst分校）计算机科学系，曾任系主任多年，目前担任该系的特聘教授。1992年，他创建了智能信息检索研究中心，其研究兴趣覆盖信息检索中的多个领域，包括检索模型、Web搜索、查询处理、跨语言检索和搜索架构等。他在1997年被选为ACM Fellow，2000年获得美国信息科学与技术学会的研究奖，2003年获得ACM SIGIR（ACM关于信息检索的特殊兴趣组）的Gerard Salton奖，Salton奖是信息检索领域最受关注的奖励。从作者的简历中可以看到这是一位国际信息检索领域顶尖的学者，他的这本新书一经出版，就以其深入浅出，理论与实践密切结合，覆盖了诸多最新的搜索引擎技术等鲜明特色而获得了业内的普遍好评。机械工业出版社迅速出版了该书的英文版，同时委托我研究中心将其译为中文，以飨读者。在本书的翻译过程中，除四位主要译者外，李正华、伍大勇、郎君、赵妍妍、宋巍等多位高年级博士生也参与了部分章节的翻译工作。本书也得到了译者们的恩师李生教授的支持，并得到了他主持的国家自然科学基金重点项目下一代信息检索研究（编号60736044）的资助。译者水平有限，书中疏漏在所难免，敬请读者批评指正。 ---------------------------------------------------------------------------------------------------------------------------------------- From: http://www.china-pub.com/196769 基本信息原书名： Search Engines: Information Retrieval in Practice 原出版社： Addison Wesley 作者：（美）W. Bruce Croft Donald Metzler Trevor Strohman 译者：刘挺;秦兵;张宇;车万翔丛书名：计算机科学丛书出版社：机械工业出版社 ISBN： 9787111288084 上架时间： 2010-6-18 出版日期： 2010 年6月开本： 16开页码： 309 版次： 1-1 内容简介本书介绍了信息检索（IR）中的关键问题，以及这些问题如何影响搜索引擎的设计与实现，并且用数学模型强化了重要的概念。对于网络搜素引擎这一重要的话题，书中主要涵盖了在网络上广泛使用的搜索技术。本书适用于高等院校计算机科学或计算机工程专业的本科生、研究生，对于专业人士而言，本书也不失为一本理想的入门教材。作译者作者: Donald Metzler Donald Metzler马萨诸塞大学阿默斯特分校博士，是位于加州Santa Clara的雅虎研究中心搜索与计算广告组的研究科学家。.. 查看详细作者: Trevor Strohman Trevor Strohman马萨诸塞大学阿默斯特分校博士，是Google公司搜索质量部门的软件工程师。他开发了Galago搜索引擎，也是Indri搜索引擎的主要开发者。... 查看详细作者: W．Bruce Croft W．Bruce Croft马萨诸塞大学阿默斯特分校计算机科学特聘教授、ACM会士。他创建了智能信息检索研究中心，发表了200余篇论文，多次获奖，其中包括2003年由ACM SIGIR颁发的Gerard Salton奖。.. 查看详细目录出版者的话译者序前言第1章搜索引擎和信息检索 1 1.1 什么是信息检索 1 1.2 重要问题 2 1.3 搜索引擎 4 1.4 搜索工程师 5 参考文献和深入阅读 6 练习 6 第2章搜索引擎的架构 8 2.1 什么是软件架构 8 2.2 基本的构件 8 2.3 组件及其功能 10 2.3.1 文本采集 10 2.3.2 文本转换 12 2.3.3 索引的创建 13 2.3.4 用户交互 14 2.3.5 排序 15 2.3.6 评价 16 .2.4 搜索引擎是如何工作的 17 参考文献和深入阅读 17 练习 17 第3章信息采集和信息源 18 3.1 确定搜索的内容 18 3.2 网络信息爬取 18 3.2.1 抓取网页 19 3.2.2 网络爬虫 20 3.2.3 时新性 22 3.2.4 面向主题的信息采集 24 3.2.5 深层网络 24 3.2.6 网站地图 25 3.2.7 分布式信息采集 26 3.3 文档和电子邮件的信息采集 27 3.4 文档信息源 28 3.5 转换问题 30 3.6 存储文档 31 3.6.1 使用数据库系统 32 3.6.2 随机存取 32 3.6.3 压缩和大规模文件 33 3.6.4 更新 34 3.6.5 BigTable 35 3.7 重复检测 36 3.8 去除噪声 39 参考文献和深入阅读 42 练习 43 第4章文本处理 45 4.1 从词到词项 45 4.2 文本统计 46 4.2.1 词表增长 49 4.2.2 估计数据集和结果集大小 51 4.3 文档解析 53 4.3.1 概述 53 4.3.2 词素切分 53 4.3.3 停用词去除 55 4.3.4 词干提取 55 4.3.5 短语和n元串 59 4.4 文档结构和标记 62 4.5 链接分析 63 4.5.1 锚文本 64 4.5.2 PageRank 64 4.5.3 链接质量 68 4.6 信息抽取 69 4.7 国际化 72 参考文献和深入阅读 73 练习 74 第5章基于索引的相关排序 76 5.1 概述 76 5.2 抽象的相关排序模型 76 5.3 倒排索引 78 5.3.1 文档 79 5.3.2 计数 81 5.3.3 位置 82 5.3.4 域与范围 83 5.3.5 分数 84 5.3.6 排列 85 5.4 压缩 85 5.4.1 熵与歧义 86 5.4.2 Delta编码 87 5.4.3 位对齐码 88 5.4.4 字节对齐码 90 5.4.5 实际应用中的压缩 90 5.4.6 展望 91 5.4.7 跳转和跳转指针 92 5.5 辅助结构 93 5.6 索引构建 94 5.6.1 简单构建 94 5.6.2 融合 95 5.6.3 并行与分布式 96 5.6.4 更新 99 5.7 查询处理 99 5.7.1 document-at-a-time评价 100 5.7.2 term-at-a-time评价 101 5.7.3 优化技术 102 5.7.4 结构化查询 107 5.7.5 分布式的评价 108 5.7.6 缓存 109 参考文献和深入阅读 109 练习 110 第6章查询与界面 113 6.1 信息需求与查询 113 6.2 查询转换与提炼 114 6.2.1 停用词去除和词干提取 114 6.2.2 拼写检查和建议 117 6.2.3 查询扩展 121 6.2.4 相关反馈 126 6.2.5 上下文和个性化 128 6.3 搜索结果显示 130 6.3.1 搜索结果页面与页面摘要 130 6.3.2 广告与搜索 132 6.3.3 结果聚类 134 6.4 跨语言搜索 137 参考文献和深入阅读 139 练习 140 第7章检索模型 142 7.1 检索模型概述 142 7.1.1 布尔检索 143 7.1.2 向量空间模型 144 7.2 概率模型 148 7.2.1 将信息检索作为分类问题 148 7.2.2 BM25排序算法 151 7.3 基于排序的语言模型 153 7.3.1 查询项似然排序 154 7.3.2 相关性模型和伪相关反馈 158 7.4 复杂查询和证据整合 162 7.4.1 推理网络模型 163 7.4.2 Galago查询语言 165 7.5 网络搜索 169 7.6 机器学习和信息检索 171 7.6.1 排序学习 172 7.6.2 主题模型和词汇不匹配 174 7.7 基于应用的模型 175 参考文献和深入阅读 176 练习 178 第8章搜索引擎评价 179 8.1 搜索引擎评价的意义 179 8.2 评价语料 180 8.3 日志 184 8.4 效果评价 186 8.4.1 召回率和准确率 186 8.4.2 平均化和插值 189 8.4.3 关注排序靠前的文档 192 8.4.4 使用用户偏好 194 8.5 效率评价 195 8.6 训练、测试和统计 196 8.6.1 显著性检验 196 8.6.2 设置参数值 200 8.6.3 在线测试 201 8.7 基本要点 201 参考文献和深入阅读 203 练习 203 第9章分类和聚类 205 9.1 分类 206 9.1.1 朴素贝叶斯 207 9.1.2 支持向量机 212 9.1.3 评价 216 9.1.4 分类器和特征选择 216 9.1.5 垃圾、情感及在线广告 219 9.2 聚类 224 9.2.1 层次聚类和K均值聚类 225 9.2.2 K近邻聚类 231 9.2.3 评价 232 9.2.4 如何选择K 233 9.2.5 聚类和搜索 234 参考文献和深入阅读 236 练习 236 第10章社会化搜索 238 10.1 什么是社会化搜索 238 10.2 用户标签和人工索引 239 10.2.1 搜索标签 241 10.2.2 推测缺失的标签 242 10.2.3 浏览和标签云 243 10.3 社区内搜索 244 10.3.1 什么是社区 244 10.3.2 社区发现 245 10.3.3 基于社区的问答 248 10.3.4 协同搜索 251 10.4 过滤和推荐 253 10.4.1 文档过滤 253 10.4.2 协同过滤 258 10.5 P2P搜索和元搜索 262 10.5.1 分布式搜索 262 10.5.2 P2P网络 264 参考文献和深入阅读 267 练习 268 第11章超越词袋 270 11.1 概述 270 11.2 基于特征的检索模型 270 11.3 词项依赖模型 271 11.4 再谈结构化 275 11.4.1 XML检索 276 11.4.2 实体搜索 277 11.5 问题越长，答案越好 278 11.6 词语、图片和音乐 281 11.7 搜索能否适用于所有情况 286 参考文献和深入阅读 287 练习 289 参考文献 290 译者序记得1996年，我在北京图书馆的电子阅览室里付费上机检索，查到了一些我感兴趣的英文文献的题录。当时感觉很兴奋，用电脑检索比手工卡片检索方便了许多，但实在无法想象，短短几年后信息检索技术就冲破了科技情报领域的局限，成为普通民众每天都要使用的信息搜索工具。是互联网这项人类历史上伟大的发明，是网上浩如烟海的信息给人类带来的挑战，推动了信息检索技术向海量、高效、多媒体、个性化等方向突飞猛进地发展。在21世纪第二个十年到来的今天，越来越多的学者、研发人员、研究生和大学生们投入到搜索引擎的研究与实践中来，他们希望掌握搜索引擎背后的理论和技术，希望了解在搜索引擎设计和开发中的原则和经验，从而为搜索引擎在各个行业的应用以及更具颠覆性的下一代搜索引擎的研发创造条件。本书恰好可以满足这些读者的迫切需求。本书英文版原作者W. Bruce Croft于1979年在英国剑桥大学获得计算机科学博士学位，同年加入University of Massachusetts（Amherst分校）计算机科学系，曾任系主任多年，目前担任该系的特聘教授。1992年，他创建了智能信息检索研究中心，其研究兴趣覆盖信息检索中的多个领域，包括检索模型、Web搜索、查询处理、跨语言检索和搜索架构等。他在1997年被选为ACM Fellow，2000年获得美国信息科学与技术学会的研究奖，2003年获得ACM SIGIR（ACM关于信息检索的特殊兴趣组）的Gerard Salton奖，Salton奖是信息检索领域最受关注的奖励。从作者的简历中可以看到这是一位国际信息检索领域顶尖的学者，他的这本新书一经出版，就以其深入浅出，理论与实践密切结合，覆盖了诸多最新的搜索引擎技术等鲜明特色而获得了业内的普遍好评。机械工业出版社迅速出版了该书的英文版，同时委托我研究中心将其译为中文，以飨读者。在本书的翻译过程中，秦兵教授付出的心血最多，她除了要翻译自己负责的部分以外，还要负责组织、校对等工作，她高度的责任心是本书得以顺利出版的关键。除四位主要译者外，李正华、伍大勇、郎君、赵妍妍、宋巍等多位高年级博士生也参与了部分章节的翻译工作。本书也得到了译者们的恩师李生教授的支持，并得到了他主持的国家自然科学基金重点项目下一代信息检索研究（编号60736044）的资助。译者水平有限，书中疏漏在所难免，敬请读者批评指正。译者 2010年3月1日于哈尔滨工业大学前言本书综述了信息检索中的重要问题，并介绍了这些问题如何对搜索引擎的设计与实现产生影响。本书并不是按照相同的详细程度描述每个主题，相反，我们侧重于那些对于实现搜索引擎组件以及组件背后的信息检索模型最重要的部分。网络搜索引擎显然是一个重要的话题，我们主要覆盖了在网络上使用的搜索技术，但搜索引擎在其他场合中也有应用，这就是为什么我们重点强调各种搜索引擎背后的信息检索理论与概念的原因。本书的目标读者群主要是计算机科学或计算机工程的本科生，但研究生也会发现本书是有用的，此外，本书也适合多数情报科学专业的学生。最后，无论读者是什么背景，通过阅读本书都可以对他们动手开发搜索引擎有所帮助。本书中涉及数学知识，但并不深奥。书中也有代码和程序设计的练习，但对于那些已经完成了基本计算机科学与程序设计课程的人来说，完全可以掌握。每章末尾的练习使用了被称为Galago的基于Java的开源搜索引擎。Galago既是为本书所设计的，也借鉴了Lemur和Indri项目的经验。换句话说，这是一个功能齐全的能够支持真正应用的搜索引擎。许多编程练习都是针对Galago组件的使用、修改和扩展。内容在第1章，我们对信息检索及它与搜索引擎的关系做了一个高层次的回顾。在第2章，我们描述了搜索引擎的架构，这一章全面介绍搜索引擎的各个组件，但没有涉及细节问题。在第3章，我们关注于爬取、文档信息源和其他用于获取被检索信息的技术。第4章描述了文本的统计特征，以及用来处理和识别重要特征的技术，并为建立索引做准备。第5章描述了怎样为有效的搜索建立索引，以及怎样利用索引处理查询。在第6章，我们描述了怎样处理查询，并把它们转换为更好的形式，以表达用户的信息需求。第7章介绍排序算法及以这些算法为基础的检索模型。这一章也概述了机器学习技术以及机器学习与信息检索、搜索引擎的关系。第8章描述了用于比较和调整搜索引擎的评价指标和性能指标。第9章覆盖了分类、过滤、聚类和垃圾信息处理等重要技术。社会化搜索一词用于描述一种搜索引擎的应用，这种应用涉及对内容进行标注或者回答问题的社区人群。第10章描述了为这些应用服务的搜索技术以及P2P搜索。最后，在第11章，我们介绍了一些高级搜索技术，这些技术能够从文档中捕获更多内容，而不只是简单地基于词进行计算，其中包括使用语言学特征、文档结构和非文本媒体的内容，如图像和音乐。信息检索理论以及搜索引擎的设计、实现、评价和使用覆盖了太多的话题，以至于无法在一本书中做全部深入的描述。我们试图集中于最重要的主题，同时，对于这些充满挑战也非常有价值的课题，我们也兼顾到各个主题的方方面面。补充材料本书提供了一定范围的补充材料，这些材料既可以供那些选修这门课的学生使用，也可以供讲授这门课的教师使用，其中包括： ?课程胶片（PDF或PPT格式） ?每章末尾问题的参考答案（仅供教师使用） ?Galago搜索引擎致谢首先，也是最重要的，如果没有我们夫人们（Pam Aselton、Anne-Marie Strohman和ShelleyWang）的支持和鼓励，本书是无法完成的。Massachusetts Amherst大学提供了本书准备工作中的素材支持，并给Croft颁发了ContiFaculty Fellowship奖，这显著地提高了本书的成书进程。智能信息检索中心的员工们（Jean Joyce、Kate Moruzzi、Glenn Stowell和Andre Gauthier）在很多方面对我们帮助很大，中心的同事和学生们提供了充满激情的环境，使我们在这个领域的工作很有价值。很多人审阅了本书的部分章节，我们感谢他们给出的建议。最后，不得不提及我们的孩子（Doug、Eric、Evan和Natalie），谢谢他们带来的快乐。 Bruce Croft Don Metzler Trevor Strohman

个人分类: 信息检索|5766 次阅读|5 个评论

[转载]第四代搜索引擎前沿综述[ZZ]

timy 2010-5-27 13:51

From: http://www.newsmth.net/bbstcon.php?board=SearchEngineTechgid=23434 第四代搜索引擎前沿综述发信站: 水木社区 (Wed May 26 00:39:14 2010), 站内一个课程论文，我把长久以来关于下一代搜索引擎的想法总结了下，希望和大家交流。我只是入门水平，不正确之处望指正。下面贴上我的主要想法：另外推荐下文中提到的问答平台Quora.com,上面有个帖子很有意思 Could two smart CS PhD students create a search engine that unseats Google? How vulnerable is Google to this possibility? 需要邀请的站短我邮件地址吧。登录要翻墙用facebook一次，以后就不用了。 2.3 第三代搜索引擎的缺陷基于链接分析的第三代搜索引擎呈现出以下几点局限性： 1，一个关键字查询词对所有用户呈现的搜索结果均相同。但是实际上，比如一个计算机用户搜索树可能指数据结构，与其他用户有很大区别。 2，Pagerank基于链接反映网页质量的方法，只反映了网页制作者对于网页质量的评价，并没有反映网页浏览着对于网页的评价。对于一些不善于进行链接优化的网站，虽然内容可能很优质，但是Pagerank可能并不高。同时，一些新网站很难在短期内提高 Pagerank，而一些擅长优化技术的网站会用大量垃圾链接作弊。 3，基于关键词的搜索方法是建立在用户对于搜索有明确目的，并能清晰表述这种目的的假设上。但是实际上，用户的搜索引擎使用水平参差不齐；并且由于存在同义词等现象，同一个搜索请求有不同的表示方法，搜索结果也大为不同。 4，现在的图像搜索，视频搜索，音乐搜索也都是基于关键字，如图像Tag，音乐电影介绍等，而文字对于这些信息的表现能力是很有限的，也不直观。 5，并不是所有有价值的信息都能被搜索引擎爬取到，比如学校论坛，公司内网资料等有价值的资料就无法被搜索引擎检索，这叫做Hidden Web现象；同时一些信息需要经过人脑的加工，这方面问答平台更能胜任。这部分不能被爬取的信息实际上占了人类所有信息的大部分。 2.4 下一代搜索的趋势此处的下一代搜索即指第四代搜索引擎，一个主要的变化是从信息检索(Information Retrieval)到信息推送（Information Supply）的转变，信息推送将主要通过个性化搜索和社交搜索实现。第四代搜索将呈现出以下几个主要趋势： 1，个性化的搜索。基于个人的网页浏览历史，搜索关键词历史，个人档案信息，使得即使是同一个搜索关键词，也能为不同用户呈现不同的搜索结果。个性化搜索将基本解决2.3节提到的第一点局限。 2，社交搜索大大提高网页排序质量，其影响主要在两方面：a,网页浏览者（普通用户）对于网页的评价（收藏行为，评分，举报等）将可以作为排序的依据b,通过用户的社交圈推测用户兴趣，通过用户间的不同程度信任关系为其提供不同权重的网页排序推荐。社交搜索也包括问答系统，用优质的设置提高信息的质量。社交搜索将基本解决 2.3节中提到的2，3，5中Pagerank和关键字搜索的局限。 3，跨媒体搜索将打通文字，图像，声音，视频间的界限，使得用图像搜图像，用声音搜声音，用图像搜视频等都成为可能。本文的以下3，4，5节就将分别从个性化搜索，社交搜索，跨媒体搜索三个主要趋势进行探讨，并且尝试探讨基因搜索，移动搜索，情绪搜索。 3．个性化搜索（Personalized Search）个性化搜索是搜索引擎根据用户搜索的历史记录，包括用户所搜索的关键词，在搜索结果中的点击情况，在各个网站的访问情况，书签情况等，然后对这些信息进行分析，在用户搜索新的关键词时，能返回更有针对性的搜索结果，从而提高用户体验个性化搜索主要存在两个难点：a,搜索引擎怎样才能准确猜测用户在特定时间的搜索目的？人的需求是不断变更的，依据历史记录完全可能得出相差十万八千里的猜测。b,如何在利用用户信息为其提供个性化服务的同时，保护用户的隐私？对于第二个问题，Yabo Xu 等人的文章中进行了有益的探讨。首先，他们观察到两个有趣的现象： a,如果能够提供个性化的服务，用户愿意牺牲一些隐私。 b,不一定需要用户隐私的细节来猜测用户兴趣，实际用更普遍的信息也可推测用户兴趣。 4．社交搜索 (Social Search) 随着Facebook为代表的社交网站兴起，互联网用户通过网络进行社交的时间大大增加，并且在网络上留下了真实社交关系的数字表达，这使得利用社交关系改善搜索质量成为了可能。如第2节所说，社交关系将从三个方面大大改善搜索质量。 4.1用户对网页评价改善搜索结果排序质量用户对网页的评价包括主动评价和行为暗示。主动评价包括通过delicious收藏夹的评分，评论等，行为暗示则包括用户对网页的收藏等。Shenghua Bao 通过delicious收藏夹的数据，进行了这方面的研究。他们引入了两个评价指标及相应算法：SSR(SocialSimRank)评价搜索关键词和用户对收藏夹评价的关联性，SPR(SocialPageRank)揭示了网页在浏览者中的热度。他们的结果显示，通过SSR和SPR建立的搜索引擎，更容易发现优质但是外链较少的网页。比如这个网页 http://37signals.com/papers/introtopatterns//index 虽然内容很少，但是Pagerank为0，而SPR为10，这样有效的发掘出了内容优质但是不善于搜索引擎优化的网页，并且新网站也更容易得到推广。但是Shenghua Bao等人的这篇论文也存在一定的局限性，首先数据集delicious仅有用户对网页的文字评论而没有评分，因此无法对网页质量进行较大区分。其次没有考虑不同的社交圈子对于网站的不同评价。另外可以做的提升就是对用户的评价进行opinion mining。 4.2 根据用户社交圈推测用户兴趣一个社交圈子通常有相似的喜好，在社交关系的基础上，可以通过用户的社交圈子来推测其兴趣，从而有产生更准确的搜索结果。同时，用户之间可以建立信任关系，也可改善搜索效果。信任关系的应用比如如下情景：A是搜索引擎专家，B是一个本科生，B通过twitter与A建立了信任关系,同时A又通过delicious对很多搜索引擎研究网站进行了评价和打分；因此，B可以声称在搜索引擎领域对A十分信任，从而在B搜索此领域关键词时A推荐的网页将有更高的排序权重。 4.3 高效的问答系统问答系统是另一个高效的获取信息的渠道，我们熟知的问答系统包括百度知道， AskJeeves等，但是他们主要存在两个关键问题：1，问答者水平参差不齐，十分缺少领域专家的参与；2，通过积分奖励的办法并不能吸引有价值的回答，经常看到的回答都是互联网上的复制粘贴，而缺乏思考。现在我发现的最好的问答系统是美国Quora.com。 Quora的优势主要体现在：1，新用户需要通过原有用户的邀请才能加入，并且通过 Facebook Connect登录，自然地在问答系统内形成了社交关系；同时由于初始用户都是硅谷的IT人士，因此从一开始就聚集了大量领域专家，保持了问答的水平。2，由于社交关系的引入，即使系统并没有设置积分奖励，用户仍然十分活跃，他们的参与完全是因为对知识的渴望和分享的欲望，进一步保证了信息质量。3，良好的信息组织形式，包括类似wiki的用户自主建立，编辑Topic,每个Topic下有一系列问题，问题之间又通过Related Question联系起来。4，在现有Quora的信息架构上，未来还可以利用机器学习推测用户的话题喜好等。 5．跨媒体搜索 (Cross Media Search) 传统的文本、图像、音频和视频分析与检索技术都是相互独立的，缺乏面向多种媒体的跨媒体搜索技术。这些多媒体信息应用的发展，要求信息搜索必须是跨媒体的，也就是说用户通过统一的界面和单一的提问，就能够获得以各种媒体形式存在的语义相似的结果。为了提供支持多种检索方式和多模态用户信息需求的跨媒体检索，跨媒体搜索技术研究涉及海量多媒体数据的智能处理、多通道信息的融合和集成、快速准确的跨媒体索引等关键问题研究和应用。最终，跨媒体将打通图像，文字，声音，视频的界限，使得用图像搜图像，用声音搜声音，用图像搜视频等都成为可能。 6．其他趋势 Jeonghee Yi 等人发现在移动用户的搜索关键词通常在2.35个词，短于通过PC提交的关键词。另外移动用户的搜索集中在娱乐领域（44%）及旅游（7%）。移动互联网将是新的科技周期，如何根据移动设备的特点优化搜索将是重要的课题。同时基于地理位置的广告和聚会建议也大有可为。生物信息的发展方兴未艾，测定大众基因序列有可能在近10年普及。当基因信息也可用时，个性化搜索将更有可为，比如根据基因的药物建议，餐饮建议等。 NLP的发展有助于更准确理解用户搜索意图。参考文献 The Next Generation Web Search and the Demise of the Classic IR model Andrei Broder Yahoo! Research March, 2007 The Anatomy of a Large-Scale Hypertextual Web Search Engine Sergey Brin and Lawrence Page Stanford University 网页链接分析算法的研究进展孟涛北京大学 2005年 Privacy-Enhancing Personalized Web Search Yabo Xu，Benyu Zhang, Zheng Chen，Ke Wang SFUMSRA WWW2007 Optimizing Web Search Using Social Annotations Shenghua Bao, Xiaoyuan Wu1 etc 上海交大/IBM中国 WWW2007 Personalized Social Search Based on the Users Social Network David Carmel,etc IBM Haifer/L3S research CIKM09 Image Retrieval: Ideas, Influences, and Trends of the New Age Ritendra Datta etc The Pennsylvania State University ACM Computing Surveys Deciphering Mobile Search Patterns:A Study of Yahoo! Mobile Search Queries 附件: 第四代搜索引擎前沿综述-刁轶夫-3061401080.pdf (889KB)

个人分类: 研究方法|4407 次阅读|0 个评论

学术研究趋势和学术研究热点检索

热度 1 rbwxy197301 2010-5-22 12:18

　　在科学研究的过程中，我们都希望能够及时了解所在学科的研究趋势和研究热点问题。现在有不少成果出现。下面推荐一个可以检索这方面信息的资源，与大家分享。一、学术研究趋势　　登录 http://trend.cnki.net/ 　，在出现的界面输入某个主题词，可以了解到以下信息。上面的图形从文献数量和用户下载数量两个角度提供了有关研究内容的信息。　什么是学术关注指数？学术关注度是以 cnki 知识资源总库中与关键词最相关的文献数量为基础，统计关键词做为文献主题出现的次数，形成的学术界对某一学术领域关注度的量化表示。什么是用户关注指数？用户关注指数是以用户在 cnki 系列数据库中所下载文章的数量为基础，统计关键词做为主题的文章被下载的次数，形成的用户对某一学术领域关注度的量化表示。二、学术研究热点　　登录CNKI的学科学术要点可以查询到一些研究主题及相关信息。　　初步的查询结果不一定能够非常准确地满足用户的需求，但它还是为我们确定学科的研究趋势和研究热点提供了很有价值的信息。图中的数字还没有相应的链接，这是一个小遗憾。

个人分类: 信息检索|11865 次阅读|4 个评论

科学网信息检索系统 ----- 强大的科学知识库

xupeiyang 2010-5-11 08:43

科学网信息检索系统请点击科学网博客主页的博文搜索科学网已经成为一个强大的科学信息知识数据库，应当充分利用中国科研人员自己生产的宝贵的科学信息和知识资源，从中获取有价值的科学文献、数据、信息、情报和知识。科学网信息检索系统可以用关键字检索科学时报电子版、新闻、博文、论坛、论文中的文献和信息。检索方便、快速、信息全面、准确。例如：在博文中检索地震，检索结果为2129条信息（检索时间：2010年5月11日8：34）例如：在博文中检索黄安年，检索到黄安年的博文4585篇。

个人分类: 学习方法|4361 次阅读|0 个评论

备战工程技术领域的情报战争

热度 1 maywuyi 2010-5-5 16:25

我们出版的《工程信息检索教程》已经有段时间了，有些老师用过这本书作为教材，河北工程大学的殷老师就是其中之一，他后来写了一篇很好的文章，使我很受教育，特转载在下面。我们处在这样一个瞬息万变的信息时代，虚拟的网络世界如此切近地渗透进我们的生活，无孔不入的信息搅动着、酿造着我们的人生。它远远不止于改变我们的通讯方式、交友范围、购物途径，也不限于偷菜、写博或CS网游等娱乐形式的更新换代，它是对我们的智力、感情、时间、空间的彻底颠覆和重构。许多情况下，爆炸的信息如同泛滥的洪水，污染、吞噬着我们的时间和精力，让我们倍感疲惫和怅惘。越来越严酷的竞争和创新压力，促使我们对有价值的、有针对性的特定信息孜孜以求。然而，它们却像散落汪洋的细针，或是遗失鱼篓的珍珠，似是而非地和我们玩起捉迷藏。因为我们精力有限、活力不足，顽固的习惯、怠惰的性情和失控的潜意识在信息湍流面前往往迷失自我。不少时候，上班族或莘莘学子坐在电脑前以完善的计划开始一天的工作或学习，却以加班或熬夜匆匆挥别疲惫的星空，因为一天当中更多的时间花费在玩游戏或者追逐计划之外的无聊信息上。其实，只要掌握了普通的信息或文献检索方法或技巧就能解决不少问题。特定的、实用的信息是如此富有价值和意义，它不仅可以象磁铁一样将我们生活和工作中的各种元素活化、取向，汇聚成一股强大的前进力量，甚至可以弥补学历、阅历、资金、时间、工作或实验条件等方面的不足或欠缺。尽管信息检索可以帮助我们探险神秘的神农架、领略美丽的异国风光，或者带领我们走访玄奘的西行苦旅、探寻美索不达米亚文明的远古城墙，但是它并不是热情好客、滔滔不绝的导游，也不是和善可亲、诲人不倦的导师。尤其对于工程技术领域的学生或研发人员来说，它不啻是一把锋利的宝剑，但是惊鬼神、泣天地的武功需要持剑人脚踏实地的修炼和参悟。清华大学数学系的两位大一学生正是借助深入、持续的信息检索工作实现了他们的计算机代数系统的梦想。他们从一个校内SRT项目开始，针对计算机代数这一新兴数学领域开始了全面深入地文献信息检索。中英文文献专著很少，期刊和会议论文信息不够系统，不同论文内容上的冲突常常令人如坠云雾，他们克服了一个又一个障碍。日复一日的研究、探讨、归纳、总结，他们把自己理解好的内容整理成文章，撰写了约30万字、包含约200篇参考文献的计算机代数理论文档，最终汇编成《计算机代数系统数学原理》一书，并由清华大学出版社出版发行。在数学系饶辉老师的指导和法国Jacques Peyriere教授的帮助下，他们这个壮大为7名本科生成员的课题组推出了maTH计算机代数系统。该系统不依赖任何第三方系统，具有多项创新性，在一些基本性能指标上已经接近目前国际最为先进的计算机代数计算软件，填补了国内计算机代数系统相关领域的空白，在第十一届挑战杯全国大学生课外学术科技作品竞赛中一举获得特等奖。挑战杯是由共青团中央、中国科协、教育部、全国学联和地方政府共同主办的一项具有导向性、示范性和群众性的全国大学生课外学术科技作品竞赛活动，被誉为当代大学生科技创新的奥林匹克盛会。很显然，大学生甚至硕士生进行工程技术领域的学术科研活动，除了需要掌握基本的信息检索理论和技能外，还需要综合检索训练以及科研能力的拓展训练加以辅佐提高。近年由机械工业出版社出版的《工程信息检索教程》就是一本可以满足这种需求的书。作者是南开大学商学院信息资源管理系博士生导师王知津教授，该书是作者继编写《科技信息检索》、翻译《现代信息检索》之后的又一力作。作者在竞争情报与竞争战略、信息管理与信息系统、战略信息管理等领域颇有建树，并以其深厚的学术造诣、睿智的现代化视角，融汇了南京大学、浙江大学、清华大学、天津大学等理工科师生的科研工作心得与实践案例，使本书不仅具有信息检索教材所具备的系统、综合、实用的特点，而且针对工程技术领域，适用理工类本科及硕士研究生，同时也是从事工程技术领域的研究、设计和开发专业人员的实用参考书。这本书敬飨给读者的不只是系统的检索理论和实战技能技巧，也不单是检索特定信息所需要的准确的对靶命中技术，它还引导、训练读者动态地、综合地、系统地调研某个课题文献。从饮誉全球的克隆羊多利到令人唏嘘疑虑且尴尬的金凤汉学说，从地球科学世界的变性土到光学工程的光学相干层析，从核实最早原始文献的实验数据到个性化信息检索服务，无不呈现给读者一个又一个五彩斑斓的世界，领略蓦然回首，那人却在灯火阑珊处的奇境妙趣。最后，工程信息检索早已不再是高校和科研院所的独门秘笈，对于有志于进入企业的毕业生和企业研发人员来说，它是一切关乎企业生存和发展的竞争情报战争的必备物资。王教授在其主持的国家自然科学基金项目基于战争游戏法的企业竞争情报作战室设计模式与运行机制研究中认为，战争游戏法是企业综合利用竞争情报、预测竞争趋势、制订竞争战略、评估战略结果的最有效工具之一，该方法一个最基本的要求是输入的信息情报具有高度可靠性。电脑界对此有个说法，即输入的是垃圾，输出的也是垃圾，只有输入可靠的信息，才能得出可靠的战争游戏结果。可以预见，没有系统、全面、深入的工程信息检索，缺乏可靠的信息输入，企业竞争情报战争游戏终将滑向一场不折不扣的真实游戏或企业灾难。借助《工程信息检索教程》的帮助，相信企业界的朋友一定能够赢得一场又一场竞争情报战。详细信息参考： http://www.china-pub.com/195181

个人分类: 读书笔记|2965 次阅读|0 个评论

医学临床诊疗案例文献检索策略专家点评分析

xupeiyang 2010-4-16 10:52

前几年博主参加了对这些临床诊疗病例研究的文献检索方法、检索选词、检索策略进行分析点评，希望临床医生通过学习这些文献检索方法和分析，有所启发和收获。请见 http://www.chkd.cnki.net/jtai/00111.asp?idid=1id=1#11 一、心脑联合卒中一例二、血液透析合并冠心病患者行心脏介入检查的方法三、马方氏综合征一例四、脑桥中央髓鞘溶解症一例五、进行性掌跖角皮症诊断一例六、静息性甲状腺炎合并甲状腺右叶肿物七、猫抓病八、主动脉夹层误诊一例九、左氧氟沙星致双手水肿后过敏性休克一例十、老年浅静脉留置的护理要点十一、化疗所致静脉炎十二、烧伤合并气道损伤气管切开后吸痰法十三、妊娠剧吐合并韦尼克脑病十四、踝臂指数与冠状动脉病变严重性诊断一例十五、痛风的饮食治疗十六、胼胝体变性一例一、新生儿先天性大疱性表皮松懈症诊断一例二、肺泡蛋白沉着症误诊一例三、人感染猪链球菌病抢救一例四、气囊尿管拔出困难操作一例五、中药干预内皮细胞粘附分子表达的研究分析六、头孢曲松纳致急性肾功能衰竭七、不宁腿综合征治疗一例八、急性脑血管病并发应激性溃疡九、产后出血十、假性癫痫确诊一例十一、颈静脉球瘤确诊一例十二、交替性预激综合征确诊一例十三、体外循环术后周围神经损伤确诊一例十四、更年期综合症激素替代疗法一例十五、胰腺囊腺癌治疗一例十六、肺癌副癌综合征一例十七、斑蝥中毒治疗一例十八、颅脑损伤合并耳膜穿孔十九、髋关节中心性脱位二十、甲型副伤寒确诊一例二十一、变态反应性血管炎二十二、低血糖昏迷二十三、性传播性疾病病原微生物分布二十四、心包缺如二十五、肺癌合并低钠血症二十六、多发性动脉炎二十七、格林巴利综合征辅助科研一例二十八、大剂量镇静药中毒后脑电图改变二十九、亚硝酸盐中毒脑电图检查三十、Fabry 病一例三十一、腹型紫癜一例三十二、甲亢误诊病例一例三十三、急性心梗一例三十四、鱼胆中毒一例心脑联合卒中一例单位：北京市普仁医院科室：心血管内科接诊时间：2006年4月3日病例：患者女，82岁，因突然摔到后昏迷2小时送至我院急诊室，行头CT示左侧大面积脑梗塞，心电图示急性下壁心肌梗死，心脑联合卒中诊断成立，患者病情危重应立即溶栓治疗，但患者高龄，心脑联合梗塞时溶栓的风险较大，这是摆在医生面前的一个难题。时间紧迫，如在发病后6小时溶栓已无意义。为求得同行的经验以确定最佳的治疗方法，医生立即登陆《中国医院知识仓库》。检索步骤：第一步、检索项：全文；检索词：昏迷，检索结果为 120186 篇；第二步、在第一步的检索结果中检索，检索项：主题词；检索词：心肌梗死；检索结果为1066篇，浏览后发现与心肌梗死有关的昏迷现象主要有糖尿病急症、脑出血、脑梗死。第三步、由于本患者心肌梗死的特点为无痛性心肌梗死，故在第二步中的检索结果中将检索项改为：全文检索；检索词为：无痛性；检索结果为144篇，其中包括无痛性心肌梗死、非典型心肌梗死、心脑卒中等，均包括了心脑联合梗塞的内容，已基本满足了需要，但仍偏多，有关治疗方面的内容不突出。第四步、在上述结果中检索，检索项为：全文检索；检索词为：溶栓；检索结果为49篇，已非常满意。第五步、由于有知网节功能，也可如下检索：在第三步的其中一篇文章急性脑血管意外与无痛性急性心肌梗死关系的探讨的文献分类导航中选择急性脑血管意外（中风）共28993篇。第六步、在上述结果中按并且检索项为：篇名关键词摘要；检索词为：心肌梗死；检索结果为450篇。第七步、在上述结果中按并且检索项为：篇名关键词摘要；检索词为：脑梗死；检索结果为264篇第八步、在上述结果中按并且检索项为：全文；检索词为：溶栓；检索结果为58篇，比第四步多9篇检索结果体会：通过文献检索可知急性心肌梗死合并急性脑梗塞其实并不少见，经常由于一方面的症状不典型而被忽略。本病例由于患者是以昏迷为首要表现而就诊，故检索的最初范围应为昏迷而不仅是脑梗塞，这样能保证查全。在上述基础上限定范围为急性心肌梗死，由于该患者心肌梗死的特点为无痛性，故再次限定检索范围为无痛性，这样心脑联合梗塞的内容均包括在无痛性心肌梗死、非典型心肌梗死、心脑卒中等文章中，这样能保证查准，如果仅用脑梗塞检索会漏检很多内容。 CHKD的另一重要功能是知网节，熟练应用知网节可方便我们随时得到相关链接内容，从不同的角度检索，是常规检索程序的有益补充。通过对这份病例的检索，我们吸收了同行的经验，给予患者包括小剂量溶栓治疗在内的综合治疗，患者心脑血管奇迹般地同时恢复了再通，效果显著，患者及家属非常满意。我们感到CHKD对于医生开阔思维、积累经验、提高医疗水平及医院的知名度起到了有利的推动作用。专家点评：根据本病例的病情和临床分析诊断，为了迅速作出正确的治疗方法，立即检索CHKD，是临床医生非常明智的选择。在进行文献检索之前，进行全面细致的临床病情分析，选择正确的检索用词是非常关键的，制定合理的检索策略也是非常重要的。本例正确地采用了全文检索和主题词检索方法，将自然语言（关键词）与控制语言（主题词）紧密结合起来进行检索，达到了专业化检索的水平，值得其他医务人员很好的学习。利用知网节功能的相似文献检索或文献分类导航检索能够保证查全，并进行文献浏览，选择更有针对性的文献，是获取文献信息的好途径和好方法。根据本案例分析如下: 案例表述:心脑联合卒中诊断成立，患者病情危重应立即溶栓治疗，但患者高龄，心脑联合梗塞时溶栓的风险较大，这是摆在医生面前的一个难题。时间紧迫，如在发病后6小时溶栓已无意义。以上表述四点：一诊断成立，二需要溶栓治疗，三风险大，四时间紧迫。此案例寻求心脑联合卒中行溶栓治疗有效依据的相关资料且要快准。第一步：检索项：主题词；检索词：溶栓治疗；检索结果：15005篇。第二步：在第一步检索结果中进行检索，检索项：主题词：检索词：无痛性心肌梗死；检索结果：5030篇。第三步；在第二步检索结果中进行检索，检索项：主题词：检索词：脑梗塞；检索结果：53篇。

个人分类: 信息检索|2750 次阅读|0 个评论

[转载]CFP: 第六届全国信息检索学术会议(CCIR 2010)

timy 2010-4-9 10:40

http://ir.hit.edu.cn/ccir2010/index.php 第六届全国信息检索学术会议CCIR 2010 中国中文信息学会信息检索学术会议原全国信息检索与内容安全学术会议哈尔滨工业大学信息检索研究中心承办征文通知为促进国内信息检索和内容安全技术的研究和应用，加强同行间的学术交流与合作，中国中文信息学会信息检索与内容安全专业委员会拟定于2010年8月13~15日在哈尔滨召开第六届全国信息检索学术会议。本次会议由中国中文信息学会信息检索主办，哈尔滨工业大学信息检索研究中心承办。会议论文的工作语言为中文，但可接受英文论文。会议向全国征集有关大规模文本计算、信息检索与信息挖掘方面的论文。征文要求论文须未公开发表过，全文不超过8000字，每篇论文均应有中英文两种文字标题、作者、姓名、单位、电子邮件和不超过300字的摘要，具体格式参见论文模板(下载模板，或从左边相关下载菜单处下载)。所有录用论文将以专门的论文集形式出版。会议被录用论文的1/3以上论文（中文论文）推荐到《中文信息学报》、《计算机研究与发展》、《计算机学报》、《上海交通大学学报》、《哈尔滨工业大学学报》、《模式识别与人工智能》、《智能系统学报》等期刊的正刊上发表。其余的论文将全部收录到中文核心期刊《微型电脑应用》的增刊中。会议还将评出5篇左右的优秀学生论文。投稿方式：直接登录会议网站 http://ir.hit.edu.cn/ccir2010/ 上传论文。时间表发征稿通知：4月9日论文截止日期：6月9日审稿通知日期：7月9日会议报到：8月12日开会日期：8月13日-15日征文范围论文包括但不限于以下内容： 1. 信息检索及文本挖掘的模型、算法及基础理论； 2. 大规模信息搜索系统的体系架构、性能、可扩展性等问题研究； 3. 信息检索评价测试集、评价方法和标准、实验设计、数据收集和分析； 4. 交互式检索、用户界面和可视化、用户模型及分析、基于任务的信息检索； 5. WEB信息检索、企业搜索、应用和链接分析、 Adversarial IR； 6. 分布式信息检索、信息融合； 7. 数字图书馆； 8. 跨语言和多语言信息检索、面向信息检索的机器翻译技术； 9. 视频、图象、语音、声音、音乐等多媒体的检索； 10 .文本挖掘、文本分类、文本聚类、倾向性分析及相关的机器学习方法； 11. 文本过滤、协同过滤、主题检测和跟踪、人物跟踪； 12. 自动文摘、文本综述、信息抽取； 13. 基于文本知识库的问答系统、问答式检索； 14. 面向信息安全、情报分析领域的信息内容处理技术、系统及应用； 15. 个性化、社会化信息检索技术与基于隐私保护的信息处理技术； 16. 移动应用。会议网站 http://ir.hit.edu.cn/ccir2010 会议联系方式刘挺（总负责）电话：0451-86413683-801 E-mail： tliu@ir.hit.edu.cn 秦兵（会议组织）电话：0451-86413683-809 E-mail： qbin@ir.hit.edu.cn 李冰（咨询）电话：0451-86413683-800 E-mail： bli@ir.hit.edu.cn

个人分类: 研究方法|4323 次阅读|2 个评论

新书推荐：情报检索语言与智能信息处理丛书

timy 2010-3-9 10:20

2009年底东南大学出版社出版了一套情报检索语言与智能信息处理丛书，该丛书由南京农业大学信息管理系侯汉清教授主编，涉及情报检索与智能信息处理相关话题，丛书共分8本书，分别为： (1) 薛春香著《网络环境下知识组织系统构建与应用研究》; (2) 陆勇著《面向信息检索的汉语同义词自动识别》; (3) 杜慧平、仲云云著《自然语言叙词表自动构建研究》; (4) 章成志、白振田著《文本自动标引与自动分类研究》; (5) 张雪英著《情报检索语言的兼容转换》; (6) 刘华梅、戴剑波著《受控词表的互操作研究》; (7) 何琳著《领域本体的半自动构建及检索研究》; (8) 李运景著《基于引文分析可视化的知识图谱构建研究》。这8本书基本上是从情报学角度，结合计算机科学、语言学等多学科方法，进行某一具体问题的研究，对信息检索、信息组织、文本挖掘等方面的研究者和爱好者可能有一定帮助。感兴趣的读者，可以点击相应链接查看内容简介和章节目录。情报检索语言与智能信息处理丛书目录： http://press.seu.edu.cn/book.search.php?code=978-7-5641-1913-3

个人分类: 研究方法|5336 次阅读|2 个评论

定制医学文献信息的方法建立My NCBI （每日、周、月电子信箱接收）

xupeiyang 2010-2-22 13:47

http://www.ncbi.nlm.nih.gov/sites/myncbi/searches/ 建立 My NCBI My NCBI Home Saved Data Saved Searches Saved Searches PubMed Searches Name Last Searched Schedule H1N1 FLU ( Settings ) yesterday daily lung cancer and radiotherapy ( Settings ) today daily breast cancer and therapy ( Settings ) today daily Delete PubMed Searches Show What's New 将检索策略保存到 My NCBI http://www.ncbi.nlm.nih.gov/sites/entrez U.S. National Library of Medicine National Institutes of Health Search: aids and therapy Search: All Databases PubMed Protein Nucleotide GSS EST Structure Genome BioSystems Books CancerChromosomes Conserved Domains dbGaP 3D Domains Gene Genome Project GENSAT GEO Profiles GEO DataSets HomoloGene Journals MeSH NCBI Web Site NLM Catalog OMIA OMIM Peptidome PMC PopSet Probe Protein Clusters PubChem BioAssay PubChem Compound PubChem Substance SNP SRA Taxonomy ToolKit ToolKitAll UniGene UniSTS Search Clear RSS Settings Search: aids and therapy Number of items displayed: 5 10 15 20 50 100 Feed name: var d = document.getElementById('search_term'); if (d) {d.focus();} 有什么问题吗？看看My NCBI Help http://www.ncbi.nlm.nih.gov/sites/myncbi/about/ My NCBI Help Topics About My NCBI Accesskeys About My NCBI Linked Accounts Registering for My NCBI Signing in and out of My NCBI Forgot your My NCBI username or password Changing your My NCBI password Saving your searches automatic e-mail updates Running a saved search and checking for new results Deleting a search Changing a saved search Creating collections Viewing collections Creating Bibliographies Editing collections Merging collections Sharing collections Managing your recent activity User preferences including storing or changing an e-mail address, highlighting search terms changing the Links menu display Changing your filter preferences Setting LinkOut preferences Setting your document delivery provider preference and setting an outside tool preference Sharing filters, highlighting, document delivery, and outside tool settings

个人分类: 信息检索|4609 次阅读|0 个评论

计算机音乐建模与检索(CMMR 2010)国际会议预报

wanyuehua 2009-12-7 06:10

7th International Symposium on Computer Music Modeling and Retrieval (CMMR 2010) 会议网址： http://www.icad.org/node/3106 论文提交截止日期：2010年1月15日，录用通知：2010年3月1日会议地点：西班牙马拉加，2010年6月21日2010年6月24日该会议基本是每年召开一次，CMMR 2010已是7届，历届会议论文均刊登在Springer出版的丛书丛刊《Lecture Notes in Computer Science》上，2010年的7届会议论文仍旧刊登在《Lecture Notes in Computer Science》，该会议论文均被EI、ISTP收录。 2008年5届CMMR会议刊登在Lecture Notes in Computer Science，2009年Volume 4969被EI、ISTP收录23篇，其中芬兰5篇，丹麦、德国各3篇，法国2篇，比利时、巴西、意大利、挪威、西班牙、突尼斯等各1篇。会议主题： Auditory perception and cognition * Virtual reality, augmented reality and human-computer interaction * Digital music libraries * New methods for music representation and visualization * Retrieval and recommendation tools * Games and interactive learning * Music production and composition tools * Structuring of audio data * Cooperative music networks * Analysis, recognition, comparison, classification, and modeling of sound and music * Music and sound data mining * Sound synthesis * Optical music recognition * Semantic music technologies * Sound source separation * Music structure analysis * Music transcription * Artificial intelligence and cognitive science for sound and music

个人分类: 国际会议预报|4823 次阅读|0 个评论

专利信息的检索与应用

icstu1 2009-11-23 14:36

专利信息的检索与应用

个人分类: F 描述场景与回溯某个实例|945 次阅读|0 个评论

情报语言学专家对术语学的论述

timy 2009-10-21 18:21

转摘于：张琪玉，情报语言学的若干研究心得和收获张琪玉学术思想自述，《图书情报工作》2009年10月【专家视点】 4. 术语学我认为，术语学对情报语言学极其重要。术语是指称概念的规范化符号，情报检索语言的语词则是指称文献主题概念的规范化符号（标识），术语与情报检索语言的语词两者存在着本质的一致性。从这一角度看，术语学与情报语言学的研究对象可以说是同一事物，情报语言学所研究的是如何编制用于情报检索领域的术语词典──分类表、词表、代码表。　　情报检索语言的编制可以说是术语整理（规范化、统一化、标准化）工作成果的诸多应用领域之一。术语整理工作的原则，要求术语具有：单义性、标准化术语的字面意义同它所表达的概念的一致性、系统性（术语应尽可能反映概念之间实际存在的、在系统化过程中确定下来的关系）、稳定性和普遍性、简洁性、语言的正确性、借用外来语的不可取性等，这些要求与情报检索语言的选词、规范化处理和显示概念关系等的要求都是一致的。所以，术语整理工作成果（术语标准、推荐术语集、术语词典等，特别是有术语定义和分类体系的术语文献）是情报检索语言选词的主要来源和进行规范化处理及建立概念间关系的重要依据。情报检索语言编制中的失误，有很多是忽视对术语整理工作成果的利用所造成的。　　所以，术语学与情报语言学有着极为密切的关系，情报语言学研究者对术语学的研究必定会获益匪浅。附：该文的全文链接： http://www.lis.ac.cn/CN/article/downloadArticleFile.do?attachType=PDFid=10356 张琪玉先生介绍：　　张琪玉，男，１９３０年６月７日生，１９５４年７月毕业于北京大学图书馆学系。曾任武汉大学图书情报学教授、图书馆学情报学研究所所长、空军政治学院图书档案系（现南京政治学院上海分院军事信息管理系）主任、教授，２００１年３月退休。从２０世纪７０年代末起开拓情报语言学新领域。学术观点对我国情报检索语言领域的理论与实践起到了积极的导向和推动作用。出版专著２０部，主编参编专著１６部，发表论文、译文约４００篇，《张琪玉文库》光盘１张。

个人分类: 信息检索|5271 次阅读|1 个评论

信息检索领域的又一个重要奖励：Karen Sparck Jones奖

timy 2009-10-15 10:11

信息检索领域最著名的奖是Gerald Salton奖，由信息检索领域顶级会议SIGIR发布，获得Salton奖的，毫无疑问是IR里公认的大牛，比如仙逝的Salton与Karen、Rijsbergen、Robertson、Dumais、Croft等。欧盟向来有与美国争夺科技制高点的传统，老美搞SIGIR，EU就搞ECIR（European Conference in Information Retrieval），SIGIR设立SALTON奖，ECIR就出来了Karen Sparck Jones奖。无论从纪念Karen教授的角度，还是从推动IR研究与应用的角度来说，这都是大好事。关于Karen奖的情况可以参见下面附件。 -------------------------------------------------------------------------- 附： Karen Sparck Jones Award情况 BCS / BCS IRSG Karen Sparck Jones Award An Award to Commemorate Karen Sparck Jones *** Information Retrieval and Natural Language Processing **** *** Deadline for nominations 30 October, 2009 **** The British Computer Society Information Retrieval Specialist Group (BCS IRSG) in conjunction with the BCS has created an award to commemorate the achievements of Karen Sparck Jones. Karen was an Emeritus Professor of Computing and Information at the University of Cambridge and one of the most remarkable women in computer science. Her contributions to the fields of Information Retrieval (IR) and Natural Language Processing (NLP), especially with regards to experimentation, have been outstanding and highly influential. Karen's achievements resulted in her receiving a number of prestigious accolades such as the BCS Lovelace medal, for her advancement in Information Systems, and the ACM Salton Award for her significant, sustained and continuing contributions to research in information retrieval. In order to honour Karen's achievements, the BCS/BCS-IRSG has established an annual award to encourage and promote talented researchers who have endeavoured to advance our understanding of Information Retrieval and Natural Language Processing with significant experimental contributions. To celebrate the commemorative event, the recipient of the award would be invited to present a keynote lecture at the BCS-IRSG's annual conference the European Conference in Information Retrieval (ECIR). This forum provides an excellent venue to present and announce the award as the conference attracts many new and younger researchers. The recipient would also be presented with a prize consisting of a certificate, a trophy and a cash prize of 1000 plus expenses to travel to ECIR. BCS/BCS-IRSG Karen Sparck Jones Award: Eligibility: Open to all IR/NLP researchers, who have no more than 10 years post doctoral or equivalent experience. Criteria: To have endeavoured to advance our understanding of IR and/or NLP through experimentation. Nominations: The following should be provided - name, position, affiliation, years since completing PhD, a short case for the award (composed of a short description of why the individual should receive the award), a short description of what contributions the individual has made, a list of the individuals top five publications reflecting the relevant contributions, and two referees. The nomination text should not exceed 2500 words. If you are intending to nominate someone or yourself, it would be helpful, at this stage nearing the deadline, if you could let us know in as soon aspossible in advance (contact as per further below ayse.goker.1@soi.city.ac.uk). Award Panel: The Panel Chair, appointed by the BCS IRSG Committee, will invite panel members from amongst representatives of the BCS main council, the BCSIRSG Committee, sponsoring organisation(s), as well as at least two experts appointed by the BCS-IRSG committee and the Awards Coordinator of the BCSIRSG. Prize: The recipient of the award would receive a certificate, a trophy, a cash prize of 1000 plus expenses to travel to ECIR to present the keynote lecture. Presentation: The recipient of the award is expected to give a keynote lecture at ECIR when he/she would also be presented with their trophy, and cash prize. Timeline: 8 April, 2009 - Call for nominations. 30 October, 2009 - Deadline for nominations. 15 December, 2009 - Notification of the prize winner. 28-31 March, 2010- Winner presents keynote at ECIR. Sponsors: Currently, the award is being sponsored by the BCS IRSG and Microsoft Research Cambridge. Contact: Ayse Goker, ayse.goker.1@soi.city.ac.uk http://irsg.bcs.org/ksjaward.php http://irsg.bcs.org/ksjaward/KSJ_Award_Flyer_final.pd

个人分类: 研究方法|6009 次阅读|0 个评论

中文Web信息检索评测CWIRF

rbwxy197301 2009-10-6 10:09

中文Web信息检索评测CWIRF 资料来源： http://www.cwirf.org/Evaluation/CWT.html 2009年3月-2009年5月,SEWM2009中文Web信息检索评测评测通知, 评测结果海量查询评测指南文档集：CWT200g网页集合查询集: 海量查询相关结果集 2007年10月-2008年4月,SEWM2008中文Web信息检索评测评测通知主题型网页发现任务和网页内容信息块发现评测指南, 附加说明, 评测结果文档集：CWT70th网页集合, 说明训练集：网页内容信息块训练集相关结果集：主题网页,网页内容信息块非网页数字资源分类评测指南文档集：CDAL16th中待评测数据集, 说明训练集：CDAL16th中数字资源训练集垃圾邮件过滤请访问， http://www2.scut.edu.cn/antispam/ 2006年10月-2007年3月,SEWM2007中文Web信息检索评测评测通知, 评测指南附加要求评测结果及说明文档集：CWT200g网页集合查询集，包括：主题提取, 和导航搜索相关结果集包括:主题提取答案(docid形式) 以及主题提取答案(url形式)(说明：总计70个任务，保留了56个主题并提供答案。) 导航搜索答案导航搜索答案(url形式)，采用pooling方法构造完成 other information. 会议报告 2006年3月-7月，SEWM2006中文Web检索评测评测通知, 评测指南, CWT200g检索工具和浏览工具说明评测结果及说明文档集：CWT200g网页集合查询集，包括: 主题提取, 和导航搜索相关结果集包括:TD在20g上的相关结果集以及 TD在200g上的相关结果集(说明：总计70个任务，保留了65个主题并提供答案。) 导航搜索在20g上的答案(说明：在20g上只有34个主题并提供答案。) 导航搜索在200g上的答案，采用pooling方法构造完成会议报告 2005年4月-9月，SEWM2005中文Web检索评测评测通知, 评测指南, 附加要求, 提交结果检查程序, 评测结果文档集：CWT100g网页集合, CWT100g文档编号查询集，包括: 主题提取, 和导航搜索 (导航搜索包括主页和指定页面查询,混合在一起是为了增加难度). 构造方法是首先从2002年4月到2004年6月天网日志中采样获得待选集合，然后人工挑选编辑完成. 相关结果集，包括: 以docid形式给出的主题提取答案, 以url形式给出的主题提取答案 (说明:总计75个主题任务，最后保留了60个主题并提供答案。原因是有2个主题没有找到相关网页，有13个主题的答案少于3个) 导航搜索(包括主页和指定页面查询)答案. (说明:没有提供网页内容一样，URL不同的答案), other information. 采用Pooling方法构造完成。 2004年6月-11月，SEWM2004中文Web检索评测评测指南, 评测结果. 文档集：CWT100g网页集合. 查询集，包括: 主题提取和导航搜索(包括主页和指定页面查询). 相关结果集，包括: 主题提取答案 (说明:总计70个主题任务，最后保留了50个问题并提供答案。原因是有些问题的答案过少，没有通过评测人员第二轮的检查被去掉,或者个别评测人员没有按时提交答案)和导航搜索(包括主页和指定页面查询)答案. (说明:没有提供网页内容一样，URL不同的答案). 采用Pooling Plus方法构造完成, 即：将搜索引擎转换为虚拟参赛队，参与结果集合成。这样，即使参加队数量不多，也能合成质量较高的结果集，达到检验参与系统检索质量的目的。

个人分类: 信息检索|4890 次阅读|0 个评论

我的“信息检索与分析讲课资料”全在博客里

xupeiyang 2009-9-23 10:41

不少朋友想了解或需要我的信息检索和信息分析方面的讲课资料，我都放在博客里了，欢迎你获取资料，与你共享信息。需要协和许培扬医学文献网址PPT 更多相关内容请访问医药家园论坛 2007.3.19第九期《临床科研课题设计与实施》协和医大信息所许培扬的有关医学文献网址PPT挺好,哪位网友奉献出来,谢谢不一定上传或者外传了吧,再等等看?http://www.wsj.chengdu.go.cn:88/webnew/bgxz... web.degree-distance.net/dxyz-b-6-t-8535828 42K 2009-1-8 - 百度快照互联网上的医学信息资源互联网(Internet)是当今世界上最大的信息网络.按照国际公认的提法,互联网是一个没有***,没有法律,没有国界,也没有总统的电脑空间(Cyberspace).由美国国防部高级研究计划管理局建立的ARPANET发展而来. 自1982年建立以来,目前覆盖包括我国在内的150多个国家,网上有150多万个网址,3.5亿个网页,上网人数超过二亿.网上有600个以上的大型图书馆,400个联网的学术文献库,6000多种网上期刊杂志,900多种新闻媒体的网络版,总计约100多万个信息资源.其中30%以上为生物学和医学类的信息,仅医学类网站就超过4000个. ☆数量巨大,分布广泛,呈很高的离散程度; ☆组织形式五彩缤纷,囊括了人类社会所能接触到所有信息资源(电子邮件, 实时交谈,公告,文献期刊,多媒体等; ☆利用方便,更新速度日新月异,非其他信息资源所能相比; 网络医学信息资源的特点 ☆检索方式多种多样,同一种信息资源可用多种方式访问,界面更加用户友好; ☆质量参差不齐,内容纷繁芜杂,信息内容不完整,不明确,名不符实; ☆检索无统一格式,规范化程度较低,各种搜索引擎的检索策略各不相同, 查全查准率不高, 需与其他品牌数据库结合使用. _ 互联网上常用医学资源简介网上医学信息资源一般分为四大类: 检索工具类:主要包括搜索引擎,虚拟图书馆和导航系统等; 文献类:主要包括数据库和网上(电子)期刊; 数据类:如GenBnak 综合类:包括重要的机构网站,商务网站和图书网站等. 检索工具类网站常用医学搜索引擎和导航系统: 最常用的有Yahoo, Go(Infoseek), Medical Matrix, Health AtoZ, Achoo, Excite, 天网(WebGather)和中国生物医学信息网等. Yahoo (http://www.yahoo.cn/) 据统计,这是互联网上访问量最大的网站(7千万人次/月),目前,各类网站总数达22,366个.由美国斯坦福大学研制的世界上最著名的信息资源查询系统. 共有20多万个条目,卫生组有48组栏目.其最大特色是提供优秀的主题浏览工具,对网点信息按主题建立分类索引,其分类科学,准确,类目详尽,提供类目交叉显示,网站提要简练,严格. Go(Infoseek) (http://www.go.com) 是1995年由Infoseek公司推出, 可对2500万个www,FTP,Gopher和NewsGroups网点进行全文索引的搜索引擎,是网上第一家收费的查询系统.1998年被迪斯尼公司收购,并入Walt Disney Internet Group's (WDIG)信息网. 天网(WebGather) (http://pccms.pku.edu.cn:8000),由北京大学研制开发,主要提供检索中国教育和科研计算机网络上的 Web资源. 目前搜集了100多万个WWW页面和14万NewsGroup文章,其特点为:信息更新较快,功能规范;反馈内容完整,支持电子邮件查询,无分类查询. Medical Matrix (医源) (http://www.medmatrix.org) 由美国医学信息学会主办,是目前最重要的医学专业搜索引擎. 目前共收录了以美国为主的临床医学站点3800多个.是一个可免费进入的临床医学数据库,提供了关键词搜索和分类目录搜索,最适合临床医师使用.内容全面专业,是首选的国外医学专业搜索引擎. Cliniweb International (国际临床网) (http://www.ohsu.edu/cliniweb/): 一个基于分类目录的临床医学搜索引擎,由美国Oregon医学院组建.其特点是: 采用统一医学语言系统(Unified medical language system)标引系统,可使用户输入的不规范词自动转换成Mesh词进行检索, 避免了用户查找规范词的麻烦和漏,误检的可能. 连接了10,000多个临床资源节点,可通过逐级浏览(browsing)和查找(searching)两种方式进行检索.特别适用于预防保健专业的医学生和开业医生,不适于科研人员. Achoo ( http://www.achoo.com/ ) Achoo是加拿大安大略MNI系统公司1996年创建并维护的医学搜索引擎节点,其目的是向用户提供全面可靠的卫生保健信息,涉及临床,替代医学和医药经营等方面. 是Internet上用户较多的医学专业搜索引擎.在Lycos的Top5%排行榜中,Achoo不但列医学搜索引擎的首位,而且是整个医药卫生健康类节点的冠军.Achoo收录了数以千计的医学资源,还辟专栏介绍每周新入节点和反映医学最新进展,最新发现的页面. Health A to Z (http://www.healthatoz.com/)_ 1994年由美国Medical Network公司开发,是一个功能强大原因特网上免费全文医学信息资源搜寻器,可对医学信息进行准确,有效的搜索,为医学工作者和健康消费者提供搜索医学信息的网站,它提供了50000多个Internet上的健康和医学相关网址,可根据主题词进行检索,或疾病名的首个字母进行检索. Medscape(医景)_ (http://www.medscape.com/_) 美国Medscape公司1994年研制,1995年6月投入使用,由功能强大的通用搜索引擎Altaista支持,可检索图像,声频,视频资料,至今共收藏了近20个临床学科25000多篇全文文献,拥有会员50多万人,临床医生12万人.是Web上最大的免费提供临床医学全文文献和继续医学教育资源(CME)的网点. 可选择Fulltext,Medline,DrugInfo,AIDSLine,Toxline,Whole,Web,News,Medical Images,Dictionary,Bookstore,等10多种数据库进行检索,同时还可浏览每日医学新闻,免费获取CME各种资源,免费获取Medpulse,同时网上查找医学词典和回答用户咨询,提供根据疾病名称,所属学科和内容性质(会议报告,杂志文章的全文或摘要等)分类检索(The Medscape Index)._ MedFinder (http://www.netmedicine.com/ medfinder.htm_) 1996年Triple Star System公司研制,是一个由专家手工编制的免费全文医学专业搜索引擎,提供了数千个医学网址,可按主题词进行检索,短语直接输入,词间加空格.其特点是影像学方面的内容特别丰富,该网站提供了大量的病理切片,ECG,CT,MRI,核医学,超声医学方面的内容,共形式包括各种图片,照片,视频和动画. Medweb (http://www.medweb.emory.edu/medweb_) 美国Emory大学卫生学中心图书馆1994年推出,分快速检索(Quick search)和高级检索(Adanced search),单个词或词组用快速检索,多个词的组配用高级检索,界面友好,简单易学易用.还提供了按关键词检索(Browse by keyword)的功能,是查找网络医学信息尤其是预防医学,物理疗法和运动医学信息的一种常用检索工具. Medseekirectory to physicians (http://www.medseek.com/specsear.stm)_ 美国Medseek LLC于1996年推出,主页提供因特网/内部网服务,医生指南,医院指南,医学服务,出版服务,新闻,会历等栏目,用于检索全美各州及各个城市医生和医院信息的网络信息资源搜索器,收集了250,000多名医生的相关信息,同时还收录了有关各州所属医院信息,所提供检索的临床医生数据库和医院指南均由美国数据库公司提供,旨在为医生和病人提供最精确的信息.是了解美国各个州的医院信息及医生信息的重要途径,是网上求医找药的好去处._ Medhunt (http://www.hon.ch/MedHhunt_) 这是瑞士日内瓦的非盈利性组织健康网络基金1996年建立的一个免费全文医学搜索引擎,专为医学工作者使用.在网上址上提供了完整的医学主题词表(MeSH)供使用,同时提供国际上即将举行的医学会议的详细信息.该搜索引擎提供了两个独立的数据库Honoured databast和Auto-Indeced datdbase._ Put Preention Into Practice Preentie Serices http://www.ahcpr.go/clinic/ppipix.htm 美国健康和人类服务部主办,为医生和患者提供服务,用于改善预防性临床服务,内容包括PIP介绍,相关资源链接,预防性护理向导等. 中国医科大学医学导航系统 www.cmu.edu.cn/ 中国医科大学信息中心1999年创立,目前连接了却6295个中外医学专业网址,2300多个医学期刊杂志网址. 中南大学湘雅医学院导航系统 http://www.xymu.net/lib/zz/medguide/ index.htm 文献类医学网站主要包括各类医学专业数据库,专利数据库和网上期刊等. Medline (http://www.ncbi.nlm. nih.go/PubMed/) 由美国国立医学图书馆,国际MEDLARS成员(中国为第16个成员国)及合作的专业组织共同研制开发,涉及医学,护理学,牙科学,兽医学,卫生保健和基础医学等领域,收录了自1960年中期以来七十一个国家出版的约4000余种生物医学期刊的1200多万条引文和文摘,是目前国际上公认的检索生物医学文献的权威性数据库,也是我国卫生部认定的科技查新必须检索的国外医学数据库. 1997年六月在因特网上提供了该库的免费检索服务. 我们可以利用PubMed和Internet GratefulMed查询此库,与该库的光盘版相比,不仅其更新时间快,而且可以检索PreMedline收录的文献. 万方数据资源系统 (http://www.scitechinfo.com.cn/)由中国科技信息研究所的一家公司研制,主要有三大部分,即科技信息子系统,商务信息子系统,数字化期刊系统.其中科技信息子系统和数字化期刊系统是我们检索国内医学科技文献的重要工具. 数字化期刊子系统(http://www.periodicals.com.cn/) 万方数字化期刊全文内容采用HTML和PDF两种国际通用格式上网,方便读者随时阅读和引用.所有期刊按理,工,农,医,人文等5大类划分,共集纳了70多个类目的2000多种期刊全文内容上网(其中绝大部份是进入中国科技论文统计源的核心期刊),形成了网上期刊的门户特征.目前可通过手机号码上网查询资料. 中文生物医学期刊文献数据库 (简称CMCC) (WWW.MLPLA.ORG.CN)由解放军医学图书馆开发的中文生物医学文献目录型数据库,,收录了自1994年以来1200余种中文生物医学期刊, 约180万条文献记录,,并以每年26余万条速度递增,含盖中国内地全部重要刊和核心刊. 收录范围涵盖基础医学,临床医学,预防医学,医学生物学,中医药学,药学,医院管理,医学信息学等卫生相关信息.收刊全,更新快是该数据库的主要特点.CMCC自1994年创建以来在中国内地和港澳拥有广泛的用户,是国家卫生部门认可的重要检索工具之一,同时也是信息资源共享,检索查新的必备工具. 中国医院数字化图书馆 (HDL)(www.chkd.cnki.net) 由清华同方光盘有限公司和中华医学会研制,CHKD期刊知识库遴选收录我国公开出版发行的医学专业期刊类,生物科学类医院管理类,图书情报类,计算机应用类和外文学习类期刊.收录期刊整刊1227种,部分刊2000多种.1994年至今,累计文献量200多万篇,每年新增50多万.网上数据每日更新.可免费检索期刊题录. _ 《中文科技期刊数据库》源于重庆维普资讯有限公司1989年创建的《中文科技期刊篇名数据库》,包含了1989年至今的8000余种期刊刊载的830余万篇文献,并以每年150万篇的速度递增.涵盖自然科学,工程技术,农业,医药卫生,经济,教育和图书情报等学科的8000余种中文期刊数据资源.全面解决了文摘版收录量巨大但索取原文繁琐的问题. 美国专利文献数据库(http://www.uspto.go/patft/ index.html) 由美国专利与商标局在Internet上免费提供的专利信息检索重要工具,收录了1976年以来的美国专利文献200多万篇,其文献的著录项均可作为检索字段,检索非常方便快速.此外,较著名的还有世界专利索引(WPI)(WWW.beici.go.cn/patent). 中国专利信息网 (www.patent.com.cn) 包括发明和实用新型两个数据库,由国家知识产权局(原专利局)出版社开发,发明数据包括了从1985年至今授理的全部共406234条发明专利数据信息.包含专利公开(公告)日,公开(公告)号,主分类号,分类号,申请(专利)号,申请日,优先权等数据项.实用新型数据库包括了1985年至今授理的全部共543263条实用新型专利信息. 补充及替代医学(complementary and alternatie medicine CAM) 数据库: _ ( http://www.pitt.edu/~cbw/internet.html) 由美国Pittsburgh大学医学图书馆的一名馆员Charles B. Wessel创立,,在数据库及网上资源部分与全球多个CAM信息信息网站(包括中医)相联. 此外,较知名的还有: 美国国立卫生院(http://www.nih.go/)补充及替代医学研究所和Yahoo的Health栏目下也有一个替代医学信息资源库. 中国中医药信息网(http://www.cintcm.ac.cn), 由中国中医药研究院信息中心研制,是国内外存储量最大和内容全面的中医药数据库,收录了自建国以来国内公开出版的800多种医学期刊中有关中医和替代医学的共42万条信息.台湾也有一个中医药数据库收录了自70年代以来台湾发表的中医药信息. _ 网上常用医学期刊资源 Internet网上期刊资源极为丰富,种类超过万种,其中有关医学的超过5000种.此外还有以WWW方式制作的电子版刊物. 国际上最著名的网上免费医学期刊网站是Free Medical Journals (http://www.FreeMedicalJournals.com),收录了1300余种生物医学期刊,按分类和刊名(按英文字母顺序排列)检索. Medbioworld (www.sciencekomm.at) 世界上最大的生命科学期刊资源点.包括80多个医学领域5404种医学期刊,1556个医学数据库,4075个医学专科学会网站,此外尚有大量医学新闻和医学会议消息. High Wire Press (http://intl.highwire.org) 世界上最大的联机提供免费学术论文全文的出版商之一,其中4500种期刊可免费检索目次和摘要,有323种可以得到全文,包括生物,医学等领域的核心期刊. 数据类及综合类医学信息资源 1,基因库(Genbank) (www.ncbi.nlm.nih.go) 2,中华人民共和国卫生部 (www.moh.go.cn) 3,世界卫生组织(http://www.who.int/en/) 3,中国生物器材网 (www.bio-equip.com) 4,生命科学图书网 (www.lifescience.com.cn) 美国生物技术信息中心(NCBI)) http: //www.ncbi.nlm.nih.go NCBI 1982年创始了GenBank数据库,1991年开发出Entrez Sequences数据库,可获取基因序列,蛋白质序列以及蛋白质三维结构等生物学研究信息. 世界卫生组织网站简介 WHO在预防医学,世界卫生事业,重大疾病防治,各种标准,全球卫生统计数据信息等方面特色突出,无一能比.主要包括:新闻与卫生政策,卫生主题(Health Topics )分别介绍不同疾病的发病,预防,流行情况和最新研究进展等,还有卫生统计信息等. 互联网其他医学信息资源电子邮件:科研人员之间交流学术思想的Email ; 电子论坛和网络消息组:如newsgroup等所有生物医学有关的讨论组信息; 文件传输协议(FTP):与医学有关的软件或重要文档; 远程登录(Telnet ):包含许多大型文献或数值数据库; Gopher: 一种菜单驱动的信息查询工具. 分类途径:以文献内容在分类体系中所属类别为线索来查找文献的方法,较好地体现学科的系统性,简明易记,层次分明,便于查全某一学科或专业方面的文献.适合于普通专业技术人员网上资源多有此类分类,多采用中国图书资料分类法.R类为医学. 医学文献检索方法与途径主题途径:通过文献内容学科性质的主题来进行文献检索.主题是从文献中抽取出来,并能代表文献内容实质的词汇(主题词,关键词等)作为检索标识.主题词是一种经过规范化处理的名词术语. 目前医学界多采用美国国立医学图书馆的MeSH词表(约有1.5万个主题词).该法适于检索比较具体专深的文献,能满足特性检索,查准率较高.专业情报所和图书馆文献检索多用此法. 其他途径:书刊名,著者名,序号(专利和标准文献等),化学分子式和基因标识符号等均可作为检索词使用. 常用检索方式: 基本检索:关键词检索(可使用单词,词组或短语) 高级检索:主题词,布尔逻辑式,字段截词,通配符,大小写敏感检索等布尔逻辑算符:逻辑与 and ; 逻辑和 or(+);逻辑非 not (-) 通配符: 替代任一半角字符或任一中文字符不同的资源所用的检索符号略有不同,且各有千秋,请大家在使用时一定要阅读用户指南,FAQ等帮助文件. __网上信息资源检索方法基本检索 _ 检索入口可输入任意的关键词,主题词,著者姓名,期刊名,布尔表达式及字段限定等. 作者名输入格式为:姓加上名的缩小字母(Smith ja);刊名可用全称或MeSH期刊名缩写,以及ISSN号码. 截词检索功能:在一个单词后跟上星号,可以检索所有带有这个词头的单词;词组检索时要将该词组用双引号()括起来;检索词和完成菜单选择以后,按回车键或点击search,检索结果自动显示. _ 检索实例 1. PubMed: SARS control 2. 美国专利文献库:Eyebath (洗眼杯) 3. 中国医院知识库:胃癌预防 4. 中国科技期刊数据库:冠心病治疗了解国际国内医学科研水平成果和动向各学科权威的协会,学会,政府机构网页的News,Conference和Meetings都是跟踪当代医学发展前沿的敏锐窗口;其次要重视学术会议消息,如医师指南(Doctor's Guide) . (www.docguide.com)中的会议资源中心栏目中就有几十个国家的几千条医学会议信息此外,德国的Fairbase Database Ltd的MediConf (http://www.mediconf.com)也收录了全世界160个国家的未来12个月的10000条医学会议消息,需要付费,约1990美元/年. 如何申请医学科研基金和求职美国国立卫生研究院(NIH)的网页上的Grant/Contract项目下,有Request for Applictation/Proposals and Program Announcements, Collaboratie opportunities, training and Career Deelopment Program 均为科研基金,合作研究,接受培训的申请人提供各种信息和条件等. 国内的各级科技管理部门的政府网站上也有公开招标的项目指南等. 如何正确看待网上获得的医学信息严格分析网络医学信息,剔除学术质量不可靠的成分; 一般说来,政府机构,权威学术机构,权威出版社和著名杂志上的网上信息可信度和科学性较强; 搜索引擎由于技术的原因,提供的信息资源不够系统和完整,数据的存取方式流于简单化,检索词的规范化程度低, 影响了检索质量,只能作为正规检索的一种补充,更不能取代正规的专业信息部门的查新检索; 网上医学资源更新快于印刷版和光盘版,但某些内容的稳定性较差,要持分析和审慎的态度. 结束语学习与掌握医学文献特别是网上信息检索的知识,是人类迈入知识经济新时代中生存和发展的需要,也是检验我们是否是一名合格的现代知识分子的标志之一,我们应通过不断的努力和实践,提高自己文献检索的技能. 医学文献检索课程已经正式列入国家教学大纲,本科生约需50个学时,本课程介绍的只是一个基本的知识和概念,要系统掌握这一技能,尚需进一步学习和实践. 主要参考文献: 1.王铁成,等. Internet生物医学应用. 人民卫生出版社 2000年版 2. 夏云,等. Internet实用技术与生物医学应用军事医学科学出版社 1997年版致谢本讲座在制作过程中承蒙成都市医学信息所范戎副研究馆员和罗晓堪副研究员的指导和帮助,在此表示衷心的感谢! 谢谢大家! 2005年9月22日 http://lib.lzmc.edu.cn/lib20061012bk/wxjs/WEBjiansuogongju.ppt Web检索工具文献学教研室 2006.10 WWW Web检索工具 Web检索工具是指提供万维网信息查询的计算机系统. 类型包括: 搜索引擎目录型检索工具多元搜索引擎搜索引擎 (search engine) 自动搜索采集网页信息,自动标引,数据量大,关键词检索功能强,查全率高,查准率低. 典型:Google 目录型检索工具 (Web directory,catalog) 以分类目录检索为主,接受网站推荐,人工参与网页信息的筛选标引,查全率低,查准率高. 代表:Yahoo!,搜狐特别提示: 多数检索工具同时具有关键词检索和目录浏览功能. 多元搜索引擎 (metasearch engine) 通过统一的用户界面,可同时查询多个独立的Web检索工具,然后对这些结果进行加权等处理后返回给用户. 例如: All-in-One,Meta crawler,Web Search 天网搜霸:强大的搜索引擎集成工具. 飓风搜索通:整合近百个各类搜索引擎,包含简体中文,繁体中文,软件,音乐,股票,新闻等类别的全方位互联网信息检索工具. Web检索工具的工作原理对采集到的网页信息数据, Robot等会自动抽取表达网页主题意义的词作为关键词来构建数据库索引.有的网络检索工具同时采用人工标引. 利用网络自动搜索软件Robot或Spider,以一个URL清单为向导,定期对Internet上的网页进行扫描搜索,记录下网页的有关事项. 信息采集数据标引数据组织检索功能 Web检索工具的工作原理标引后的网页数据形成检索工具数据库中的一条条记录,每条记录对应于一个网站或一个网页.记录内容包括网页标题,摘要或关键词,网址,网站网页与输入关键词的相关程度等 . 布尔算符检索(AND + ,OR,NOT -),截词检索,词组检索 ,自然语言检索,概念检索,分类浏览,检索限定,语种翻译,自动排序等. 数据标引数据组织检索功能信息采集综合型Web检索工具 Yahoo! Google Lycos Excite Altaista Infoseek HotBot http://www.yahoo.com http://www.google.com Http://www.lycos.com http://www.excite.com http://www.altaista.com http://www.go.com http://www.hotbot.com http://www.yahoo.com Yahoo!的两位创始人大卫费罗(Daid Filo) 和杨致远(Jerry Yang),美国斯坦福大学电机工程系的博士生,于1994年4月建立. Yahoo!(雅虎)是最早最著名的目录型检索工具,在全球共有24个网站,12种语言版本. (参见雅虎中国) http://cn.yahoo.com http://www.google.com Google 的释义 Google 是由英文单词googol变化而来.googol是美国数学家 Edward Kasner 的侄子 Milton Sirotta 创造的一个词,表示 1 后边带有 100 个零的数字.Google 使用这个词代表公司想征服网上无穷无尽资料的雄心. 两位斯坦福大学的博士生 Larry Page 和 Sergey Brin 在 1998 年创立了 Google. 关于Google Google 开发出了世界上最大的搜索引擎,提供了最便捷的网上信息查询方法.通过对 30 多亿网页进行整理,Google 可为世界各地的用户提供适需的搜索结果,而且搜索时间通常不到半秒.现在,Google 每天需要提供 2 亿次查询服务. Google特点提供搜索引擎功能,速度极快. 检索网页数量达24亿,搜索引擎中排名第一. 支持多达132种语言;包括简体和繁体中文; 具有手气不错,网页快照,图片搜索,新闻组搜索等功能; 界面非常简洁. 运算符:空格表示逻辑与;减号表示逻辑非;OR表示逻辑或;对短语或句子搜索时必须加英文引号. 中文Web检索工具百度(http://www.baidu.com) 搜狐(http://www.sohu.com) 新浪(http://www.sina.com.cn) 网易(http://www.163.com) 百度由李彦宏先生及徐勇博士于1999年底成立于美国硅谷,2000年回国发展. 百度是是世界上最大的中文搜索引擎,支持搜索1亿3千万中文网页,中国所有提供搜索引擎的门户网站中,超过80%以上都由百度提供搜索引擎技术支持. Http://www.baidu.com Http://www.sohu.com 国内著名搜索引擎之一,公司成立于1996年,提供关键词查询,分类查询(目录导航),高级搜索三种. 目前全球最大规模的中文网站.共有18个大类目录,1万多个细目.提供一般检索,进阶检索,高级搜索,图片搜索等检索功能. Http://www.sina.com 是国内较早成立的大型门户网站,提供多语言检索,同时拥有全国最大的开放式管理目录. 具有分类检索(目录导航),关键词检索功能. Http://www.163.com 使用搜索引擎注意事项 1.分类体系的差异 2.关键词标引 3.高级搜索中运算符的使用 4.不同的查询服务类目设置和划分不一:如教育大类,新浪分出44个下位类;搜狐有34个;网易只有24个. 类名表述的不同:如新浪用计算机;网易用电脑. 空格(AND),(AND), (NOT),|(OR),( ) 表示一个整体单元. 网站,网页,新闻,软件等特殊的:图片,多媒体医学搜索引擎 Medscape(医景): http://www.medscape.com Medical Matrix (医源): http://www.medmatrix.org/Index.asp Medical world search(医学世界检索): http://www.mwsearch.com/ CliniWeb International(国际临床网): http://www.ohsu.edu/cliniweb/ HealthFinder :http://www.healthfinder.go/search Medwebplus:http://www.medwebplus.com Health A to Z:http://www.healthatoz.com/ Medscape http://www.medscape.com 简介:共收藏了近20个临床学科2.5万篇文献,是Web 上最大的免费提供临床医学全文文献和继续医学教育资源的网点. 特点:可检索图像,声频,视频资料.提供Fulltext,Medline,DrugInfo AIDSLine,Toxline,Whole,Web,News,Medical Images,Dictionary,Bookstore等10多种数据库进行检索,同时还可浏览每日医学新闻,免费获取CME各种资源,免费获取Medpulse,同时网上查找医学词典和回答用户咨询,提供根据疾病名称,所属学科和内容性质(会议报告,杂志文章的全文或摘要等)的英文按26个字母顺序进行分类检索(The MedscapeIndex)._ Medical Matrix http://www.medmatrix.org/index.asp 简介:由美国医学信息学会主办,1994年创建,是目前最重要的医学专业搜索引擎.它是一种由概念驱动和免费全文智能检索工具,包括4600多个医学网址. 可免费进入但第一次要注册. 特色:提供了关键词搜索和分类目录搜索,最适合临床医师使用.分类目录搜索是它的主要特色,按各种医学信息分为专业,疾病种类,临床实践,文献,教育等8大类.每一大类下再根据内容的性质分为新闻,全文和多媒体,摘要等亚类. _ CliniWeb International http://www.ohsu.edu/cliniweb 简介:这是由美国The Polytechnic Research Institute 1997年建立的一个医学专业搜索引擎,收集了数以千计的医学网点近10万个Web页面. 特点:它采用了NLM研制的一体化医学语言系统,可以使用540000多具医学主题词,包括各种同义词进行检索,在检索时可根据词表扩大或缩小检索范围,搜索的准确性很高.同时还提供扩展检索,精细检索功能,大小写无差别,免费全文检索,结果进行相关排序. 通过PubMed免费检索Meline,提供HotBot,infoseek,Altaista\Webcrawler的检索. 对注册的用户能自动记住最近的十次检索和最近通过Medical world Search进入的十个网页,以供随时调用. 小结: 1.了解Web检索工具类型 2.了解工作原理 3.熟悉常用中文Web检索工具 4.了解外文Web检索工具网络信息资源的获取 Web检索工具(搜索引擎) 专业网站虚拟图书馆及学科专业导航库电子期刊,电子图书网络数据库(文摘数据库,全文数据库) 下节预报 http://202.202.129.11/ziliao/网上免费生物医学资源介绍0610.ppt 信息技术部欧荣免费全文期刊网站介绍期刊发行现状外文期刊价格昂贵,逐年上涨开放式存取, 读者免费获取免费资源特点大部分网上免费学术期刊的质量较高,但是各提供商所供免费期刊的质量差别比较大. 免费资源特点来源有限过刊较多(发表3月或2年之后) 各网站收录重复较多一起淘宝去! PubMed Central Highwire Press Freemedicaljournals Freebooks4doctors(图书) BioMed central DOAL Bioisa 含宝量高的站点图书馆网站 http://202.202.129.11 图书馆网站 PubMed Central PMC 网上免费生物医学资源 http://www.pubmedcentral.nih.go/ 关于PMC PubMed Central是免费生命科学电子期刊全文数据库.由美国国家生物技术信息中心(NCBI)建立. PMC采取自愿加入的原则,一旦加入,必须承诺期刊出版后一定时期内(最好六个月,不超过1年)将其全文提交给PMC,由PMC提供免费全文检索和访问.目前加入PMC的期刊130种,10万多篇全文. PMC访问方式 http://www.pubmedcentral.nih.go/ PMC访问方式 PMC访问方式关于PMC 期刊起止卷期免费开放时间 PMC的界面组成检索框按期刊名字母顺序浏览期刊,期刊列表高级检索入口 PMC的检索途径关键词作者名期刊名期刊名浏览 PMC检索结果的输出 PubLink:连接到期刊网站 PDF:下载PDF全文 HTML PDF:全文 PMC与PubMed PMC与PubMed的关系:两者都是NCBI建立的数据库. PubMed是一个基于互联网的文献检索系统,它收录了几千种生命科学期刊的目次和文摘,该数据库提供了与PMC全文的链接以及与数千种期刊网站的链接. HighWire Press 网上免费生物医学资源 http://highwire.stanford.edu/ HighWire Press是提供免费全文的,全球最大的学术文献出版商之一,于1995年由美国斯坦福大学图书馆创立. 目前已收录电子期刊882多种,文章总数已达282多万篇,其中超过103万篇文章可免费获得全文,这些数据仍在不断增加. 收录的期刊覆盖以下学科:生命科学,医学,物理学,社会科学. 了解Highwire Press Free site: 全免费/31种 Free issues: 免费过刊/203种 Free trail:/11种试用免费 HighWire Press的界面组成检索区期刊浏览注册登录 HighWire Press的检索途径关键词作者名文章名期刊名期刊浏览 HighWire Press的检索途径同时检索PubMed HighWire Press检索结果的输出免费全文付费全文 BioMed central BMC 网上免费生物医学资源 http://www.biomedcentral.com/ BioMed central(英国伦敦生物医学中心)以出版网络版期刊为主.共出版生物医学期刊百余种,学科范围涵盖了生物学和医学的所有主要领域. BioMed Central基于开放地获取研究成果可以使科学进程更加快捷有效的理念,所有发表在 BioMed Central 刊物上的研究文章均可随时在网上免费任意查阅. 了解BMC all content open access: 可以阅读全部全文 Subscription required:需订购 free trial aailable:免费试用 BMC的界面组成检索入口选择检索PMC / PubMed 期刊浏览主题浏览 BMC新闻及动态专辑浏览用户无需注册便可浏览,下载网站上的文献.但是如果需要检索文献,则必须注册(注册是免费的). 了解BMC BMC检索结果的输出文章类型 Pubmed中的记录相关文章获取方式 BMC工具栏和google工具栏相似,适用于科研人员,可检索BMC,PubMed,PubMed Central,Faculty of 1000,google的资料. Freemedicaljournals 网上免费生物医学资源 http://www.freemedicaljournals.com/ Freemedicaljournals是因特网上免费提供生物医学全文最多的期刊集合网站. 该网站共收录1460余种生物医学全文期刊. 可提供期刊主页的链接,按年卷期浏览全文,不具备检索功能. 了解Freemedicaljournals Freemedicaljournals的界面组成 HI内科学免费电子图书按专业浏览分语种按字顺浏览高影响因子期刊检索方式按期刊名或专业逐次浏览网上免费生物医学资源 http://www.freebooks4doctors.com/ FreeBooks4Doctors简介目前该网站有650本生物医学专业领域电子图书; 可按专业或图书语种等顺序对图书进行浏览,下载; 网站提供信息定制等服务. DOAJ 网上免费生物医学资源 http://www.doaj.org/home 开放存取期刊(OAJ:Open Access Journal)是互联网上可供任何人自由访问使用(可下载全文)的电子期刊. DOAJ(Directory of OAJ)是由瑞典的隆德大学图书馆Lund Uniersity Libraries为上述资源做的一个目录系统. 释义DOAJ 至今收录的开放存取期刊达2430种,文章近119328多篇,收录包括:生物及生命科学,化学,健康科学等15种学科主题的期刊. 了解DOAJ DOAJ的界面组成检索框工具栏按刊名浏览期刊按主题浏览期刊 DOAJ的检索途径查找期刊 DOAJ的检索途径查找文章 DOAJ的检索途径关键词作者名期刊名浏览 PLoS 网上免费生物医学资源 Public Library of Science http://www.plos.org/ 美国科学公共图书馆(PLOS)是一家由众多诺贝尔奖得主和慈善机构支持的非赢利性学术组织,旨在推广世界各地的科学和医学领域的最新研究成果,使其成为一种公众资源,科学家,医生,病人和学生可以通过这样一个不受限制的平台来了解最新的科研动态. PLoS出版了8种生命科学与医学领域的期刊,可以免费获取全文. 了解PLoS PLoS的刊物 PLoS Biology PLoS Medicine PLoS Computational Biology PLoS Genetics PLoS ONE PLoS Pathogens PLoS Clinical Trials PLoS Neglected Tropical Diseases Bioisa 网上免费生物医学资源生物医学信息目录 http://www.bioisa.net/journal/journal_list.php3 c=16 生物医学信息目录Bioisa是为帮助研究人员分享生物医学信息而建立的.网站所收集的网上资源都被很好的重新编排整理过,可使用户很容易检索到所需的信息. 了解Bioisa Bioisa收集了1616种在线生物医学期刊的信息.细分为23类,并注明这23类里有核心期刊数量与期刊总数.其中有194种免费期刊,每本期刊后均注明从哪年始有免费全文. 了解Bioisa 进入Bioisa的免费期刊各免费网站对比范围广,期刊种数多 1890 学术领域 DOAJ 原创,质量高 8 生命科学,医学 PLoS 原创多,集成PubMed 250 自科,社科 HighWire 期刊分类整理 194 生物医学 Bioisa 期刊种数多,检索简单 1450 生物医学 Freemedical journarls 期刊种数多,检索功能强大含PMC BMC 生命,医学 PubMed 特色期刊种数学科范围名称 http://202.202.129.11 联系电话:68485016 68485153 联系电邮:cqumslib@sina.com 谢谢! 各位老师好,同学们好,今天我给大家介绍网上免费生物医学资源.网上免费资源很多,今天我介绍几个著名,大型的免费资源站点. 开放存取(Open_Access)是一种学术信息共享的自由理念和出版机制,在这种出版模式下,学术成果可以无障碍地进行传播,任何研究人员可以在任何地点和任何时间不受经济状况的影响平等免费地获取和使用学术成果.而将开放存取定位于学术出版模式是为了区别于赢利性的商业出版机制. 首先介绍pubmed 这就是pubmed的界面,以下出现的是它的网址. 与PUBMED只有引文与文摘的检索系统不同,PubMed Central是一个电子期刊全文数据库,获取全文是没有限制的,而且PubMed Central所收的文献在PubMed 有相应的检索口. PMC是2000年1月由美国国家生物技术信息中心(NCBI)建立的生命科学期刊文献数字化档案库,它保存生命科学期刊中的原始研究论文全文,免费提供使用.PMC的所有论文在PubMed中都有相应的记录.PMC采取自愿加入的原则,一旦加入,必须承诺期刊出版后一定时期内(最好六个月,不超过1年)将其全文提交给PMC,由PMC提供免费全文检索和访问.目前加入PMC的期刊108种,另有8种期刊即将加入,目前这些期刊免费全文访问的时间延迟是出版后0-2个月,并且由PMC直接提供全文. 与PUBMED只有引文与文摘的检索系统不同,PubMed Central是一个电子期刊全文数据库,获取全文是没有限制的,而且PubMed Central所收的文献在PubMed 有相应的检索口. PMC是2000年1月由美国国家生物技术信息中心(NCBI)建立的生命科学期刊文献数字化档案库,它保存生命科学期刊中的原始研究论文全文,免费提供使用.PMC的所有论文在PubMed中都有相应的记录.PMC采取自愿加入的原则,一旦加入,必须承诺期刊出版后一定时期内(最好六个月,不超过1年)将其全文提交给PMC,由PMC提供免费全文检索和访问.目前加入PMC的期刊108种,另有8种期刊即将加入,目前这些期刊免费全文访问的时间延迟是出版后0-2个月,并且由PMC直接提供全文. 与PUBMED只有引文与文摘的检索系统不同,PubMed Central是一个电子期刊全文数据库,获取全文是没有限制的,而且PubMed Central所收的文献在PubMed 有相应的检索口. PMC是2000年1月由美国国家生物技术信息中心(NCBI)建立的生命科学期刊文献数字化档案库,它保存生命科学期刊中的原始研究论文全文,免费提供使用.PMC的所有论文在PubMed中都有相应的记录.PMC采取自愿加入的原则,一旦加入,必须承诺期刊出版后一定时期内(最好六个月,不超过1年)将其全文提交给PMC,由PMC提供免费全文检索和访问.目前加入PMC的期刊108种,另有8种期刊即将加入,目前这些期刊免费全文访问的时间延迟是出版后0-2个月,并且由PMC直接提供全文. 与PUBMED只有引文与文摘的检索系统不同,PubMed Central是一个电子期刊全文数据库,获取全文是没有限制的,而且PubMed Central所收的文献在PubMed 有相应的检索口. PMC是2000年1月由美国国家生物技术信息中心(NCBI)建立的生命科学期刊文献数字化档案库,它保存生命科学期刊中的原始研究论文全文,免费提供使用.PMC的所有论文在PubMed中都有相应的记录.PMC采取自愿加入的原则,一旦加入,必须承诺期刊出版后一定时期内(最好六个月,不超过1年)将其全文提交给PMC,由PMC提供免费全文检索和访问.目前加入PMC的期刊108种,另有8种期刊即将加入,目前这些期刊免费全文访问的时间延迟是出版后0-2个月,并且由PMC直接提供全文. 与PUBMED只有引文与文摘的检索系统不同,PubMed Central是一个电子期刊全文数据库,获取全文是没有限制的,而且PubMed Central所收的文献在PubMed 有相应的检索口. PMC是2000年1月由美国国家生物技术信息中心(NCBI)建立的生命科学期刊文献数字化档案库,它保存生命科学期刊中的原始研究论文全文,免费提供使用.PMC的所有论文在PubMed中都有相应的记录.PMC采取自愿加入的原则,一旦加入,必须承诺期刊出版后一定时期内(最好六个月,不超过1年)将其全文提交给PMC,由PMC提供免费全文检索和访问.目前加入PMC的期刊108种,另有8种期刊即将加入,目前这些期刊免费全文访问的时间延迟是出版后0-2个月,并且由PMC直接提供全文. 期刊浏览,MESH主题词查询,期刊查询等期刊浏览,MESH主题词查询,期刊查询等期刊浏览,MESH主题词查询,期刊查询等 PubMed Central(PMC)是2000年1月由美国国家医学图书馆(NLM)的国家生物技术信息中心(NCBI)建立的生命科学期刊全文数据库,它旨在保存生命科学期刊中的原始研究论文的全文,并在全球范围内免费提供使用. HighWire Press是全球最大的提供免费全文的学术文献出版商,于1995年由美国斯坦福大学图书馆创立. HighWire Press is the largest archie of free full-text science. We assist in the online publication of 1,026,958 free full-text articles and 2,828,144 total articles. 提供My Faorite Journals窗口读者据此项可以从系统中选择自己感兴趣的杂志选择这些杂志后系统会自动作成列表,以便今后可以随时查找这些杂志中的文献.例如:您选择了Age and Anging,您能很方便地查找该刊物过去的(各种杂志,提供的以往文献时间不同,有的最早是1948年,该杂志是1972年),现刊文献(Current Issue),即将出版的文献(文摘)forthcoming articiles. 提供Email Alerts窗口供读者跟踪感兴趣的刊物的出版情况以及读者所关注的某个主题,作者,文献被引用的情况. 期刊浏览,MESH主题词查询,期刊查询等期刊浏览,MESH主题词查询,期刊查询等开放存取(Open_Access)是一种学术信息共享的自由理念和出版机制,在这种出版模式下,学术成果可以无障碍地进行传播,任何研究人员可以在任何地点和任何时间不受经济状况的影响平等免费地获取和使用学术成果.而将开放存取定位于学术出版模式是为了区别于赢利性的商业出版机制. 与非学术领域的作者不同,科研人员发表成果(尤其是以论文形式发表)的目的主要不是为了获利,而是希望在尽可能大的范围内使自己的研究成果得到传播;同时,科研人员为了开始或继续自己的研究,也希望能够方便地获取其他同行的研究成果.这种非赢利的信息传播动机和利用需求促使开放存取成为了学术出版的可能模式.目前,开放存取出版模式主要运用于网络学术期刊,这与开放存取出版的技术条件直接相关. 生物医学期刊出版中心(BioMed_Central)是一个独立的出版者,主要提供网上免费存取经过同行评议的生物医学领域的研究论文.BioMed_Central在其开放存取规章中规定:1)开放存取研究论文采用统一的格式(如XML)存贮在公共知识仓库(如PubMed_Central和INIST等),发表即上网后,其他人对其存取不受任何限制.2)作者或版权所有者应允许并保证第三方享有预先和永久使用部分或全部论文的权利,在遵守基本学术道德(如注明引文出处)的前提下,第三方拥有采取任何方式使用,复制或传播论文的权利.BioMed_Central承诺将始终如一地坚持开放存取的政策,无论在什么情况下,既便今后发生所有权变更,这一政策都将保持下去.目前BioMed_Central已经成为开放存取出版中的重要力量,在其网站上提供了143种网络期刊链接,其中113种是完全基于免费存取的. BioMed Central 刊物发表的所有研究文章都即时存档并进入 PubMed Central 的文献索引. 基因组生物信息学和网关 , 癌症门户 , 中国门户 , 网关芯片 , 神经科学,神经科及精神科门户 , 呼吸系统门户 , RNA干扰门户 , 系统生物学网关 BioMed Central 刊物发表的所有研究文章都即时存档并进入 PubMed Central 的文献索引.这就是说所有文章都可以非常方便地查阅. 加泰罗尼亚语,荷兰语,法语,德语,希腊语,意大利语,挪威语,土耳其语等等.西班牙语和葡萄牙语单列出来了.网站的中间是主要内容,我们感兴趣的东东都在这里. 由上而下依次是:免费医学杂志站点,出版后1-6个月免费的站点,出版后1年免费的站点,出版后2年免费的站点.网站的右面是新加的和取消的免费医学杂志站点. 由Lund Uniersity建立,它提供有质量控制的可免费获取的网上电子期刊资源,它的目标是建成一个无学科,无语言限制的综合性的科学期刊系统,方便科研人员使用,并可提升期刊的显示度. 该目录收录的均为学术性,研究性期刊,具有免费,全文,高质量的特点.其质量源于所收录的期刊实行同行评审,或者有编辑作质量控制,故而对学术研究有很高的参考价值. 该杂志是由位于旧金山的非盈利性组织公共科学图书馆 ,PLoS有着更高的目标,正如PLoS在今夏的美国电视广告中所称,他们将与《科学》,《自然》,《细胞》等国际上顶级水平的科学期刊进行竞争.他们计划逐步推出各个领域的科学期刊(诸如物理学,化学),并将进行学科领域的细分(诸如肿瘤学,遗传学).除了免费之外,PLoS的另一大优势是对普通读者的充分照顾:每篇论文都会附带有一篇供非专业人士阅读的大纲,某些论文还会附带关于该领域的入门性质的简介;如此一来,即使是新近的研究,普通大众也能明其要旨.

个人分类: 学习方法|4497 次阅读|0 个评论

科研论文写作、信息检索分析培训班信息（2009年 10 -- 11月）

xupeiyang 2009-9-23 08:52

《呼吸病学临床科研方法与实施》研讨会临床医学的发展离不开高质量的临床科研作为基础，而我国的传统医学教育缺乏针对这方面的系统教育。随着SARS、H1N1等新型传染性疾病的出现及医学模式的改变，呼吸病学的科学研究日益显示出重要意义。为了满足呼吸病学临床医生开展科研活动的需求，针对临床医生在基金申请、科研思路、科研立项、科研课题设计、信息查询、科研方法、临床群体学研究、医学统计、常用软件、评价指标、论文撰写、期刊评估等各个环节容易出现的问题，旨于帮助广大从事呼吸病学的临床医生更好地建立科研意识，提高立项、设计等科研能力，中华医学会继续教育视听杂志将开展《呼吸病学临床科研方法与实施》研讨会。会议基本信息会议主席：林江涛学术委员：何权瀛贺蓓林江涛沈华浩许培扬照日格图赵一鸣主办单位：中华医学会继续教育视听杂志承办单位：北京枢尔咨询有限公司学分证书：中华医学会继续教育部授予I类继续教育学分会议时间：北京 10月31日-11月1日广州 11月（具体日期待定）上海 12月（具体日期待定）会议费用：800元/人（含注册费、会议费、资料费、学分证书费、培训期间午餐等，不含交通食宿）课题内容 1. 如何申请国家自然基金 2. 呼吸病临床科研的选题思路、策略和原则 3. 临床科研设计与实施基本方法 4. 临床科研统计设计 5. COPD、哮喘的基础与临床研究 6. 肺部感染临床科研评析与改进 7. 睡眠呼吸疾病研究 8. 呼吸功能测定及其在临床科研中的应用 9. 医学科技查新系统方法与评价 10. 中英文医学论文撰写会务组联系方式联系地址：北京市朝阳区北苑路13号领地Office 1号楼C座1101室邮政编码：100107 联系电话：010-52086510-8006/8001 传真：010-52086740 联系人：梅洁胡月娥电子邮件: fzzdhy@163.com 中疾控信发〔 2009 〕 457 号中国疾病预防控制中心关于举办疾控专业人员信息素养教育培训班的通知各省（自治区、直辖市）、计划单列市疾病预防控制中心，新疆建设兵团预防控制中心、中心直属各单位：为增强疾控系统从业人员的信息意识，提高疾控信息检索、评价和有效分析利用能力，培养信息素养，促进疾控事业的发展，根据中国疾病预防控制中心公共卫生监测与信息服务中心 2009 年工作计划，我中心定于 2009 年 10 月 20 日～ 10 月 22 日在杭州市举办疾控专业人员信息素养教育培训班，现就有关具体事宜通知如下：一、内容（一）国内外信息素养概念及研究；（二）系统评价方法及 Meta 分析软件的使用；（三）资源采集、分析、利用与资源建设、整合的技术进展；（四）网络医学免费资源和中国公共卫生科学数据资源的介绍；（五）期刊影响因子研究和网站用户体验研究。二、参加人员要求参加培训的人员为主管信息工作的负责人及科研管理的负责人。各省（自治区、直辖市）、新疆建设兵团疾病预防控制中心每单位参会人员名额最多为 2 名。中国疾病预防控制中心直属单位每单位参会人员名额为 1 名。由于会议经费限制，请各单位严格控制参会人数。三、时间、地点 2009 年 10 月 19 日报到， 10 月 23 日离会。报到地点：杭州玉皇山庄。地址：杭州玉皇山路 74 号，丝绸博物馆公交车站附近。电话总机： 0571-87182688 四、其他事宜（一）请各单位通知有关人员准时参加，参加培训的人员交通费自理，食宿费用由我中心负责。（二）请务必将参加人员回执（一式两份）于 2009 年 10 月 14 日前传真或 EMAIL 给中国 CDC 联系人和浙江省 CDC 联系人。（三）本次培训班不安排接站，请代表自行前往。五、联系方式（一）中国 CDC 信息中心联系人：陈强联系电话： 010-58900426 13681504458 传真： 010-58900445 E-mail: chenqiang@chinacdc.cn （二）浙江省 CDC 联系人：金彬彬联系电话： 0571-87115125 13819110593 传真： 0571-87115121 E-mail ： bbjin@cdc.zj.cn 附件： 1. 培训班回执 2. 交通指南二〇〇九年九月二十四日中国疾病预防控制中心办公室 2009 年9 月24 日印发校对人：陈强临床科研论文写作培训班时间：2009年11月1日地点：海口时间题目讲者 8:30-8:45 开幕致词 XOLW/ JMAO 8:45 10:00 科研查新与文献检索许培扬中国医学科学院北京协和医学院 10:00-10:20 茶歇 10:20 11:35 临床科研设计与文章发表李光伟北京中日友好医院 1 1:35-13:00 午餐 13:00-14:15 临床科研中的统计应用李光伟北京中日友好医院 1 4:15-15:30 中华医学杂志投稿要求及文章撰写问题评析李群中华医学会中华医学杂志 1 5:30-15:50 茶歇 15: 50 17:00 临床研究文章发表个案分享周彦潘丽丽诺和诺德（中国）制药有限公司 17:00-17:20 结束语 XOLW/ JMAO 第六期全军医药卫生科技查新培训班时间内　　容主持人 10 月 14 日 8:30 ～ 10:00 1 ．福州总医院院长致词 2 ．军事医学科学院一所刘胡波所长讲话 3 ．颁发查新站铜牌和专用章 4 ．总后卫生部科训局领导作指示 5 ．与会代表合影吴东 10:00 ～ 12:00 6 ．医药卫生科技查新概论（许培扬） 7 ．常用数据库及检索方法（杜永莉）张桂云 14:30 ～ 17:30 1 ．基础类课题查新实例分析（王磊） 2 ．临床类课题查新实例分析（张桂云） 3 ．查新报告审核与服务沟通（吴曙霞）曹洪欣 10 月 15 日 8:30 ～ 11:30 1 ．查新管理信息系统软件培训（柏立嘉） 2 ．上机实习李刚 14:30 ～ 17:00 1 ．查新考核与业务交流 2 ．结业（领导总结、颁发证书）羡秋盛地点：福州联系电话：朱东屏 13959109163

个人分类: 学习方法|3754 次阅读|0 个评论

2009年第二期全国网络信息组织与检索高级研修班

liuysd 2009-8-10 14:17

时间：2009年9月23日至9月28日（6天）地点：湖北-宜昌网络信息技术是保证网络信息有效传播的基础，是一个完整的体系，渗透到了传播的每一个层面。所以，网络信息组织与管理技术虽然较之因特网自身的发展而言，具有明显的滞后性，但对于网络信息的无序与泛滥而言，网络信息组织技术仍然是最有效的方法与手段。我们认为，网络信息传播与组织归结到技术层面，终究要以信息组织为核心，要实现网络信息的有效利用，就必须对网络信息进行有序化组织与控制，这是网络信息有效利用与传播的必要基础和重要环节。搜索引擎通过对网络信息进行理解、提取、组织和处理，并为用户提供检索服务，不但成为了网络信息检索的首选工具，同时，也自然而然地成为了网络信息组织与利用的重要模式。因而，研究搜索引擎的信息组织对于网络信息资源的有效开发、利用与控制具有重要意义。为了帮助广大专业人员尽快提高网络信息组织与分析能力，提高各行各业对于网络信息的利用能力，中国科学技术信息研究所于2009年9月23日至28日在湖北-宜昌举办2009年第二期全国网络信息组织与检索高级研修班。经培训考核合格者，由中国科学技术信息研究所颁发全国网络信息组织与检索高级研修班结业证书。现将有关事宜说明如下：一、办班特色检索原理从根讲起，技术实例躬身示范，前沿进展踊跃探讨。掌握搜索引擎使用技巧；快速获取网络信息资源；优化本单位网站并提高在搜索引擎中的排名；分析挖掘网络信息；捕获搜索引擎研究热点及趋势；轻松搭建起自己的搜索引擎（提供一套可以搭建一个中型搜索引擎的源代码）。二、培训对象各级政府、企业、事业单位、科研院所、大专院校、咨询公司、金融证券等机构及相关部门专业从事技术开发、信息管理、信息分析、信息服务、情报研究、战略企划、产品开发、成果推广的管理与专业人员。三、课程内容 1．搜索引擎使用技巧综合运用逻辑表达式的组合检索、特征限定、范围限定等方法，大幅提高检索结果的精准率。 2．动态网页的内容获取方法网站内容下载工具的使用技巧与方法；构造URL批量下载网站数据库内容；自制浏览器获取非OpenURL的网页内容。 3．网络信息挖掘 Web结构挖掘、Web内容挖掘、Web使用记录挖掘等。结合实例介绍搜索引擎日志挖掘、BBS用户行为分析、Blog用户的社会网络特征等。 4．基于开源代码的搜索引擎构建掌握搭建搜索引擎平台所需的核心知识并且轻松搭建起自己的搜索引擎平台，从而解决费用昂贵和容易泄露机密的问题。为达到更好的培训效果，有条件的代表请自带笔记本电脑（最好具备无线网卡）。四、师资队伍邀请高校及科研院所相关领域知名专家，大型软件开发公司技术总监，著名企业高级软件工程师，实力派信息分析师，资深培训师轮流授课。五、颁发证书培训考核合格者，由中国科学技术信息研究所颁发培训结业证书。六、培训安排 1. 9月23日全天报到，9月24日至28日授课及业务交流。 2. 报到及培训地点：三峡宜昌龙泉山庄大酒店（湖北省交通职工教育培训中心，湖北宜昌市夷陵区夷兴大道71号） 3. 费用：2800元/人（含资料、结业证和业务交流等费用）培训费，请于2009年9月15日前汇至以下帐户：并注明网络信息组织研修班。户名：中国科学技术信息研究所开户行：中国工商银行北京玉渊潭支行帐号：0200232109200900593 4. 食宿统一安排，费用自理。住宿：三峡宜昌龙泉山庄大酒店（标准间260元，每人每天130元）七、参加培训人员请务必于2009年9月15日前将报名表返回会务组。邮件、从网上或传真返回均可。八、联系办法通讯地址：北京复兴路15号中国科学技术信息研究所（100038）招生网址： http://www.istic.ac.cn 邮箱地址： zzb@istic.ac.cn 联系人电话：胡老师 010-58882298 传真: 010-58882296 陆老师 010-58882299 吴老师 010-58882297 原文地址: http://168.160.16.178/EducationDetail.aspx?ArticleID=87632

个人分类: 学术报告|3869 次阅读|0 个评论

“搜索行为与用户认知研究”北京研讨会即将举办

timy 2009-6-26 20:58

明天一早准备过去学习一下，研讨会主题是搜索行为与用户认知研究，这方面的研究与经典的人机交互研究有交叉，我个人认为信息检索研究人员（主要包括为信息检索理论、方法、技术等相关的研究），对这个话题有点了解是有益的，呵呵。做主题演讲的主要包括国内搜索行为与用户认知研究相关的科研团队（主要为情报学研究领域），与相关企业（包括：两个知名搜索引擎公司，即Baidu和Google、一个咨询公司、一个做电子商务的公司）。期待到时候，各方的交流能碰出有意义的火花，研讨会具体信息附后。 --------------------------------------------------------------------------------------------- 转载于： http://www.im.pku.edu.cn/shownotice.asp?id=99 搜索行为与用户认知研究北京研讨会即将举办　　由北京大学信息管理系暨国家信息资源管理北京研究基地和南京理工大学经济管理学院信息管理系共同发起并主办，国家信息资源管理北京研究基地承办的搜索行为与用户认知研究北京研讨会（ Searching Behavior and User Cognitive Research Beijing Workshop ）将于 2009 年 6 月 27 日在北京大学召开。　　用户行为与认知研究起源于 20 世纪 70 年代，至今已有 30 余年的发展历史。它对用户的信息查寻行为，数据库使用和网络搜索行为等做出了突出的贡献，为了解用户的认知、情感、动机和行为特征，改善信息检索系统的服务质量提供了夯实的实证研究基础。对用户的研究成为情报学和信息管理领域从事信息检索研究的独具特色的组成部分。　　近年来，国内陆续涌现出越来越多从事用户行为与认知的研究团队，并在用户的网络搜索行为、用户认知与体验、信息构建和用户服务与体验等方面取得了一系列的成果。本次研讨会的主旨是汇集国内从事本领域相关研究的团队，交流分享研究经验和成果，并为研究团队之间的协作与研究资源共享搭建平台。会议筹备组 2009 年 6 月 21 日主办单位：北京大学信息管理系暨国家信息资源管理北京研究基地　　　　　南京理工大学经济管理学院信息管理系承办单位：国家信息资源管理北京研究基地会议时间： 2009 年 6 月 27 日会议地点：北京大学艺园三楼会议室（由艺园北侧楼门上三楼）报到时间： 2009 年 6 月 26 日全天报到地点：北大资源宾馆（北京大学西南门外，海淀桥北硅谷电脑城对面）

个人分类: 信息检索|4650 次阅读|2 个评论

“情境驱动的交互式信息检索集成研究框架” 奇文欣赏

tengyi1960 2009-6-15 17:35

情境驱动的交互式信息检索集成研究框架奇文欣赏由彼得英格沃森著秦喜艳等译的情境驱动的交互式信息检索集成研究框架一文，发表在《图书情报知识》-2008年6期上(原文见附件)。仅从《图书情报知识》编辑一般不发译文，但这次却放在学科前沿栏目，以及该文译自武汉大学信息管理学院这三个形式特征来看，不难判断此文值得一读。近来的研究和实践领域出现的一些热点中，图书馆实证研究和交互式信息服务似乎得到了追捧。图书馆实证研究的兴起也许就是对崇洋迷外和假大空式发展到极致后的一种逆向的学术反应回归实事求是的研究本质；而交互式信息服务则是顺应网络发展规律、追求信息增值和共赢的结果。由于更关注信息对象的情境和研究框架是基于任务行为，是情境驱动的交互式信息检索集成研究框架一文的研究方法定位，所以对于大多数图书馆工作者来讲，比较容易产生思想的共鸣，也可能会有此发现一个研究问题的出发点。情境驱动的交互式信息检索集成研究框架一文的作者认为：信息检索嵌套在信息查寻行为的情境之内，其本身则处于与工作相关或日常的工作任务情形和领域情境之中。如果将其观点放大而应用于图书馆学研究领域，那么我们就会想起一句行业老话：图书馆学是一门实践性很强的科学。本文的学院性的研究气息比较浓厚，其模型揭示全面但运行和统计的成本较高，不宜在实际工作中使用。正如将需求特征分组为：行政、科研、学生、其他用户的调查，只有助于形成报告却无助于指导实际工作。专业图书馆支持用户创新工作的核心环节究竟是什么？如果假定知识创新来源于（会得益于）知识碰撞（社会性的交互过程），那么，本文给出：人们发现，社会性的交互过程产生于个人、他／她所处的社会情境和从该情境中感知的工作任务之间。情境驱动的交互式信息检索实践的关键在于对检索用户进行分组，分组的出发点有以图书馆为中心和以用户为中心两种。以用户为中心的特点是以用户的观点和利益为交互行为的主要驱动力，辅助以项目和研究的目的。知识工作者的三种自我定向指出：尚不清楚的问题是理解个人用什么方式看待和利用知识，但知识在两方面对人是特质的，以本性定向的人为知识而求知，并不断追求知识；以地位定向的人追求功能性知识；以行动定向的人往往追求交互型社会知识。实践表明：情境驱动的交互式信息检索实践对于提升以地位定向的人追求功能性知识的用户群体的满意度基本是无效甚至是负面的。因此，区分好这三类用户群体，并选择与之相适应的情境驱动的交互式信息检索实践方式，是一种可行的工作方案。情境驱动的交互式

个人分类: 思想盆|3307 次阅读|0 个评论

2009年网络信息组织与检索高级研修班

huabolin 2009-6-3 11:42

时间：2009年6月23日至6月28日（6天）地点：山东-威海网络信息技术是保证网络信息有效传播的基础，是一个完整的体系，渗透到了传播的每一个层面。所以，网络信息组织与管理技术虽然较之因特网自身的发展而言，具有明显的滞后性，但对于网络信息的无序与泛滥而言，网络信息组织技术仍然是最有效的方法与手段。我们认为，网络信息传播与组织归结到技术层面，终究要以信息组织为核心，要实现网络信息的有效利用，就必须对网络信息进行有序化组织与控制，这是网络信息有效利用与传播的必要基础和重要环节。搜索引擎通过对网络信息进行理解、提取、组织和处理，并为用户提供检索服务，不但成为了网络信息检索的首选工具，同时，也自然而然地成为了网络信息组织与利用的重要模式。因而，研究搜索引擎的信息组织对于网络信息资源的有效开发、利用与控制具有重要意义。为了帮助广大专业人员尽快提高网络信息组织与分析能力，提高各行各业对于网络信息的利用能力。中国科学技术信息研究所于2009年6月23日至28日在山东-威海举办2009年网络信息组织与检索高级研修班。经培训考核合格者，由中国科学技术信息研究所颁发网络信息组织与检索高级研修班结业证书。现将有关事宜说明如下：一、办班特色检索原理从根讲起，技术实例躬身示范，前沿进展踊跃探讨。掌握搜索引擎使用技巧；快速获取网络信息资源；优化本单位网站并提高在搜索引擎中的排名；分析挖掘网络信息；捕获搜索引擎研究热点及趋势；轻松搭建起自己的搜索引擎（提供一套可以搭建一个中型搜索引擎的源代码）。二、培训对象各级政府、企业、事业单位、科研院所、大专院校、咨询公司、金融证券等机构及相关部门专业从事技术开发、信息管理、信息分析、信息服务、情报研究、战略企划、产品开发、成果推广的管理与专业人员。三、课程内容 1．搜索引擎使用技巧综合运用逻辑表达式的组合检索、特征限定、范围限定等方法，大幅提高检索结果的精准率。 2．搜索引擎优化（SEO）搜索引擎排名的指标体系，提高搜索引擎排名的技巧，合理设置链接，有效布局关键词，合理运用SEO技术，使你的网站得到更多的关注。 3．动态网页的内容获取方法网站内容下载工具的使用技巧与方法；构造URL批量下载网站数据库内容；自制浏览器获取非OpenURL的网页内容。 4．搜索引擎发展趋势搜索引擎爬行范围的扩展（从静态网页到动态网页）；网页分析标引的深化（从关键词到句段），检索接口的多样化（从文本到图形、音频、视频等）。 5．网络信息挖掘 Web结构挖掘、Web内容挖掘、Web使用记录挖掘等。结合实例介绍搜索引擎日志挖掘、BBS用户行为分析、Blog用户的社会网络特征等。 6．基于开源代码的搜索引擎构建掌握搭建搜索引擎平台所需的核心知识并且轻松搭建起自己的搜索引擎平台，从而解决费用昂贵和容易泄露机密的问题。四、师资队伍邀请高校及科研院所相关领域知名专家，大型软件开发公司技术总监，著名企业高级软件工程师，实力派信息分析师，资深培训师轮流授课。五、颁发证书培训考核合格者，由中国科学技术信息研究所颁发培训结业证书。六、培训安排 1. 6月23日全天报到，6月24日至28日授课及业务考察。 2. 报到及培训地点：威海电子宾馆(威海市环海路15号) 3. 培训费：2800元/人（含资料、结业证、上机实习和业务考察等费用）培训费，请于2009年6月18日前汇至以下帐户：并注明网络信息组织与检索。户名：中国科学技术信息研究所开户行：中国工商银行北京玉渊潭支行帐号：0200232109200900593 4. 食宿统一安排，费用自理。住宿：威海电子宾馆（三星级，标准间240元，每人每天120元）七、参加培训人员请务必于2009年6月18日前将报名表返回会务组。邮件、从网上或传真返回均可。八、联系办法通讯地址：北京复兴路15号中国科学技术信息研究所（100038）招生网址： http://www.istic.ac.cn 邮箱地址： kipx@istic.ac.cn 联系人电话：胡老师 010-58882298 传真: 010-58882296 陆老师 010-58882299 吴老师 010-58882297

个人分类: 信息检索|5253 次阅读|0 个评论

基于内容的三维形状检索

热度 1 njumagic 2009-4-28 01:00

1 、引言在互联网、计算机辅助设计（ CAD ）、分子生物学（ 3D 蛋白质模型）、计算机图形学、医药以及考古学等不同领域中，大型的三维（ 3D ）数据库变得越来越普遍。近期在激光扫描技术的进展使我们可以方便地构造一个物体精确的 3D 几何模型。这方面的应用包括对文化遗产的重建，例如斯坦福大学的数字米可朗基罗和数字罗马项目。激光扫描也可以生成工业和动画中人体头部、身体等真实对象的 3D 模型。其他领域也有很多 3D 数据库。例如，国立设计库为在线的 CAD 模型数据库，蛋白质数据银行是在线的 3D 生物高分子结构数据库。 HUGO 则为基于可视化人体项目的 3D 解剖体和表皮数据库。近年来，计算机科学在计算机辅助检索和分析多媒体数据方面取得了惊人的进展。例如，假设你需要为演讲准备一张马的图片。在十年前，你要么（ 1 ）绘制一张图片；（ 2 ）去图书馆复印一张图片；或（ 3 ）去农场照一张马的照片。现在你只需简单的从网络成千上万的资源中挑选一张合适的图片。虽然文本、图像和音频的搜索已较为常用，但 3D 数据信息的检索仍在起步阶段。然而，新的扫描和交互工具降低了构造精致的 3D 模型的开销；图形硬件变得越来越便宜（摩尔法则），扩大了广大用户对 3D 模型的需求；互联网为 3D 模型的传播提供了平台。这三个趋势加速了 3D 模型的繁衍，使其在不久的将来将会变得和当今其他多媒体数据一样普遍。这些进展正在改变我们对 3D 数据的观念。以前计算机图形学中主要的挑战将由以前的如何建立有趣的 3D 模型发展成如何寻找它们。例如，假设用户想创建一个城市场景的 3D 虚拟世界，他将需要骑车、街灯、路标等 3D 模型。那么，他是自己购买 3D 建模工具构造模型，还是从大型 3D 模型网络数据库中获取模型呢？与当前文本、图像、音频等其他媒体相同，信 3D 模型的检索、匹配、识别和分类的也将迅速的发展。那么接下来的问题就是人类如何搜索 3D 模型。最简单的方法仍然是基于文件名、标题或上下文的关键字检索。然而这种方法在以下情况的鲁棒性不高：包括对象无标注（例如 B19745.wrl ），对象标注不具体（例如 yellow.wrl 或 sarah.wrl ），关键字无区分性（例如搜索脸部却标注为非多边形人体），用户不知道的关键字（例如错误的拼写或外文标记），以及标注对象时还不确定其关键字。在这样的情况下，我们认为基于形状的查询将更有效的搜索 3D 对象。例如，形状可以和功能相结合来定义对象的类别（例如圆形咖啡桌），形状也可以用于区分相似的对象（例如办公椅和沙发）。有很多类别可以由形状单独定义（例如卷形物），这时一幅图片抵过千言万语。本文将研究基于形状的 3D 模型自动检索方法，其挑战有两个方面：首先，我们必须开发 3D 形状的计算表示（形状描述子），并建立相应的索引以加快查询的速度。本文将介绍新颖的采用方向不变的球面谐波描述子的 3D 数据库搜索方法。其次，我们需要支持未训练用户表达基于形状查询的交互界面。本文将 3D 草图、 2D 草图、文本和基于形状相似度的交互式修改组合起来，并将其整合到搜索引擎中，实现 3D 模型的网络检索（见图 1 ）。随着 3D 模型数量和种类的不断增长，浏览这些大型数据库的应用也越来越多。在这些大型的 3D 数据库中进行检索并不容易。虽然模型可能有相关的名字或文字描述，但多数情况下这些信息无法完整精确地描述模型本身。相比标注对象，更好的办法是让模型表达自身，也就是说，采用模型的内容而不是用户标注的主观文本信息。多数具有真实生命的对象的 3D 模型可以通过颜色、纹理和形状信息进行区分。颜色和纹理在某些模型中可能会失效，例如 3D 蛋白质模型。因此，形状是描述 3D 数据最基本的特征。用户对形状的概念并没有统一的定义。下面给出一些最常用的定义：韦氏字典形状（名词）： 1、某个或某种特定对象的可见组成特性。 2、轮廓的空间形态。 3、标注的或普遍公认的空间形态。 Kendall's 的定义：形状是对象的位置、比例、方向被去除后剩下的所有几何信息。 Kendall's 的定义认为对象的形状与其相似性变换无关，例如，汽车的 3D 模型再旋转、缩放或平移情况下应该是保持不变的。对给定的 2 个模型，直观上确定其是否相似的方法是寻找模型直接的对应关系并将模型重合。重合的程度即说明了模型的相似度。这种方法被 Besl 和 McKay 提出，称为形状注册问题。其主要应用是从多视角（例如 3D 点阵）重合模型以进行 3D 重建。但这在大型数据库的 3D 模型检索中的效率并不高。目前 3D 模型检索的方法以简洁的方式描述模型（特征向量或图等结构化描述），并比较这些简洁的描述子来加快匹配的速度。因为形状是旋转、平移和缩放无关的，描述子也应该是变换无关的，或者数据库中的 3D 模型都预先被变换到规范的坐标系中。这即为姿态规范化问题。本文对基于内容的 3D 形状检索的进行调研。上文以指出形状是 3D 数据最基本的特征，因此文中会交替使用 3D 形状、 3D 模型和 3D 对象等术语。同样，文献中 3D 模型检索或 3D 模型搜索引擎都代表同样的研究领域。荷兰乌特列支大学的 Tangelder 和 Veltkamp 在形状表示、相似度 / 不相似度度量、检索性能、部分匹配能力、鲁棒性和姿态规范化需求等方面对形状检索方法进行评价。普度大学机械工程学院的 Lyer 等人对包括具体 CAD 方法的形状搜索技术进行了概述。新加坡国立大学的 Atmosukarto 和 Naval 给出了当前技术的介绍。此外， Siggraph2004 的 3D 想着检索课程也由 Funkhouser 和 Kazhdan 在普林斯顿大学的计算机科学系开展。本文的结构如下：第二章给出 3D 形状表示技术的综述。由于 3D 形状重建（激光扫描、基于立体视觉的重建、运动结构）和建模（ CAD 根据）的方法不同，这些数据在数字环境中的组织方法也不同。文中给出静态和动态模型（摆动或变形）的表示方法，但只给出静态模型的相似度和匹配方法。第三章介绍形状相似度和匹配的概念。第四章介绍相似度匹配和模型检索中的 3D 形状描述方法。这些方法分为 2 类：直接从 3D 模型抽取（基于模型的）或从其 2D 投影中抽取（基于视图的）。基于模型的方法可以是纯几何的、结构的或两者的结合。几何方法包括全局或局部的形状描述。第五章介绍 3D 形状搜索引擎的整体结构及各部分子系统。第六章给出 3D 形状检索系统的评价和性能描述。 2 、数字世界中的 3D 形状表示许多应用都需要在数字环境中构造真实时间中的对象，这些模型的质量受到硬件和软件能力的限制。近来硬件的发展是用户可以更方便的可视化和操作复杂的模型。当前的扫描技术也可以生产几何精确的对象模型。除了硬件的发展，建模软件（例如 CAD 工具）的功能也越来越健全。由于创建对象模型有不同的方法，数字环境中数据的技术也有不同。本章将对这些技术做简单的介绍。如前所述，这里只讲述对象形状的表示方法，不包括纹理和颜色。本章的 3D 对象表示方法可用于处理 3D 形状建设系统的输入数据。由于模型生产过程本身的原因，其中一些方法比其他方法更为普遍。在数字世界中， 3D 模型的首要工作是可视化，有时也需要对模型进行编辑。 3D 模型的存储和显示的效率是主要关心的问题。不同的任务可能需要不同的表示方法。例如，如果需要识别场景中的对象，我们不需要非常细致的对象模型。本文不涉及 3D 模型重建、对象识别和相关的技术。读者可参阅这些技术的相关文献，包括 Campbell 和 Flynn ， Jain 和 Dorai ， Bennamoun 和 Mamic 以及 Pope 。形状大致可以分为 2 类：静态形状和动态形状。静态形状为不受形变和转动而改变的刚性形状。例如咖啡杯的模型为静态形状，而人脸则为动态形状，因为其形状随说话、微笑等动作而变化。本文主要考虑静态形状的检索技术，因此只会稍微提及动态形状的表示。 2.1 静态形状表示对象有 2 种不同的方法：基于模型（对象为中心）和基于试图（观察者为中心）的方法。基于模型的方法直接作用于 3D 数据，而基于试图的方法则存储 3D 模型的若干 2D 投影。 2.1.1 基于模型的表示 3D 对象可在不同抽象层次进行表示。首先是 3D 空间的原始数据点集表示，这种表示缺乏结构性，但足够进行可视化。这相当于 2D 图像中的像素。第二抽象层是形状的轮廓，也就是 3D 形状的表面，这与 2D 曲线相对应。第三抽象层为体表示，这与 2D 形状的面积相对应。 2.1.1.1 基于点的表示点集点集的定义为点 P={p1,p2,,pN} 的集合，其中 P R 3 且 pi=(xi,yi,zi) T 。图 2.1: 两个点集的 2D 抽点打印（ Bunny 兔子和 CAD 模型）范围图像范围图像与密度图像都从某个视角捕捉形状，但与捕捉颜色信息不同的是，范围图像捕捉距离的深度信息。图 2.2 由 Ohio 州立大学给出了的天使的密度和范围图像。这种表示多用于 3D 模型重建，将不同视角的图像进行合并。这是 3D 形状注册的一个例子。图 2.2: Ohio 州立大学的天使图像（密度和范围图像）范围图像中深度值根据不同的图像生成方式而变化。例如，在图 2.2 中，对象离摄像机越远，则相应的像素值越深。反之依然，见图 2.3 。图 2.3: 范围图像数据库中的多面体对象（密度和范围图像） 2.1.1.2 表面表示 3D 形状可由其外表面表示，这类似 2D 形状的轮廓。本节介绍表示形状表面的数学模型。多边形 Soups 这种表示多用于 CAD 工具，也称作多边形 Soup 模型。这种模型中所有的多边形不完全相连。 3D 模型检索中多认为这种模型是错误定义的，而网上的很多 3D 模型都是以多边形 Soups 表示的。图 2.4: 一个多边形 Soup 的 CAD 模型多边形网格多边形网格由于其简单性成为表示 3D 模型的常用方法。 3D 模型的多边形网格的定义为一对有序的链表： M= P ， V 其中， V={v1,v2,,vN} 为顶点的列表且 vn=(xn,yn,zn) T ； P={p1,p2,,pN} 为平面多边形的列表，且 pr=(v n,1 , v n,2 , , v n,kr ) 。 Kr 为多边形 pr 的顶点数目。如果所有 pr 的 k=3 ，则所有 pr 均为三角形网格。图 2.5: 人脚骨的多边形网格模型 ( ) 参数形式一般 3D 表面的参数形式由如下定义：图 2.6: 以网格形式显示的 NURBS 曲线 ( ) 其中 u 和 v 为参数变量。 3D 表面由两曲线进行笛卡尔积生成。非均匀有理 B 样条（ NURBS ）是一种参数形式，其定义如下：其中 N 和 M 为 k 阶和 l 阶的 B 样条基函数， B h i,j 为控制点的齐次坐标。参数形式通常用于最初的模型表示，之后再由此生成多边形网格的表示。子分表面由提出的子分表面的思想是很简单的：子分定义了一系列逐渐精化的光滑曲线或表面。下图介绍如何从粗略的表示构建精确的表面。左边网格中的每个三角形都根据子分规则细分成 4 个三角形，得到中间网格。再进行子分操作则得到右边的网格。图 2.7: 子分表面 ( ) 子分表面是建模和动画中非常有用的表示方法，它可以捕捉不同分辨率层的模型。具体介绍间文献隐式表面 3D 表面可隐式定义为任意函数 f 的 0 集如下：下图给出了由公式生成的模型。图 2.8: 隐式表面 ( ) 超二次曲面超二次曲面的定义为由向量包含的闭合曲面，向量的 x,y,z 由角度函数和两个 2D 参数曲线进行球积确定。超椭圆体为一种超二次曲面，其参数形式如下：其中 (a1; a2; a3) T 为缩放向量， 1 2 表示平面经纬度上的正方度。超二次曲面可以通过增加特定的加尖、扭转、弯曲等操作对多种自由形体进行建模。下图给出了由沿 z 轴加尖后绕 z 轴扭转变化后的超二次曲面。图 2.9: 变形的超二次曲面 ( ) 2.1.1.3 体表示体素体素是体绘制中最小的 3D 单元，相当于 2D 绘制中的像素。该方法是最简单的空间子分表示方法，但耗费内存。在医学应用中使用较多。图 2.10: 由体素表示的飞机模型 ( ) 八分树八分树是基于空间的子分表示方法，立方体空间被递归地分成更小的立方体，进而建立层次的数据结构。下图给出了实体模型的八分树。图 2.11: 八分树表示白色节点表示空的子立方体，黑色节点表示完全填充的子立方体，灰色节点表示部分填充的子立方体。这种方法比体素的更节省内存。空间二分树（ BSP ）空间二分树是八分树的另外一种表示方式。 BSP 树提供了对象或空间中的多个对象的搜索结构和几何表示。图 2.12: 2D 对象的 BSP 树 ( ) 非叶结点表示被二份的平面。平面可从任何方向进行子分。图 2.13: 多对象的 2DBSP 树表示 ( ) 构造实体几何 (CSG) 构造实体几何是一种层次化的表示。每个形状由形状单元通过二值操作组合而成。图 2.14: CSG 通用圆柱体这种方法也称作扫描表示，由环状轮廓 C(s, ) 沿模型主轴（样条）的空间曲线 A(s) 移动生成。图 2.15: 通用圆柱体 ( ) 2.1.2 基于视图的表示基于试图的表示的出发点是相似的 3D 形状从相同的视角看起来也是相似的，因此可采用对象的一系列视角（ 2D 投影）来表示形状。该方法通常用于对象识别，本节将介绍一些主要技术。轮廓轮廓包括对象某个视角的边界。为了表示 3D 形状，需要生成并存储轮廓的集合。相对于基于模型的表示，这种方法更加简洁。该方法通常用于对象分类，采用一系列轮廓表示模型并从匹配相应的视图。但不同的 3D 形状可能具有相同的轮廓图像组。图 2.16: 椅子的轮廓图像 ( ) 视点图 3D 形状从不同视角看起来可能是不同的。例如，立方体的上视图是一个正方形。因此，可将视图空间分成视图类或典型视图。每类的视图具有某种相同的属性，并可由聚类算法生成试图类。 1979 年 Koenderink 和 van Doorn 将视图类表示称为视点图。图中的结点表示根据视点命名的视图类，连接不同结点的边表示视点的改变。结点之间的不同称作视觉事件。但这种表示较复杂，使用受限。图 2.17: 视点图表示 2.2 动态形状在建模和视觉应用中常涉及到动态形状。这些形状可以随时间摆动或形变，且有多种表示方法。下面是一些例子。 Snakes: 主动轮廓模型对给定点集拟合其形变轮廓 (snakes) 是一个约束的能量最小化问题。主动轮廓模型由 Kass, Witkin 和 Terzopoulos 于 1987 年提出。其中总能量包括三个组成部分：弯曲或伸展轮廓的内部轮廓能量， . 轮廓和图像密度或梯度间的图像能量，和预定义约束下的外部能量。形变体模型 Park, Metaxas 和 Axel 根据心脏运动的四面体元素对人类心脏的运动进行建模。气球模型这是一种形变的网格表示，其中通过弹簧建模网格的边，使得整个网格可随用户而拉伸或压缩。 Chen 和 Medioni 给出了这种表示的例子。 3 、形状相似度和匹配概念形状匹配比较两个形状的相似性，是检索、识别和注册等应用中非常重要的概念。通常，这通过计算距离进行不相似度度量，其中距离越小不相似性越小，相似性越大。定义：给定形状集合 S={s 1 ,s 2 ,,s N } ，相似度距离由 d(s i ,s j ):S S R + 0 定义，其中 s i ,s j S ，距离函数 d 具有如下性质： (i) 自相似性 : s i S, d(s i ,s i ) = 0 (ii) 正定性 : s i , s j S, s i s j , d(s i ,s j ) 0 (iii) 对称性 : s i , s j S, d(s i , s j ) = d(s j , s i ) (iv) 三角不等性 : s i , s j ,s k S,d(s i , s k ) d(s i ,s j ) + d(s j ,s k ) (v) 变换无关性 : 对给定变换组 G ， s i , s j S,g G,d(s i ,g(s j ))=d(s i ,s j ). 自相似性表示形状与本身完全匹配。正定性表示两个不同的形状无法完全匹配。定义：具有自相似性、正定性、对称性和三角不等性的距离函数称作度量。定义：具有自相似性、对称性和三角不等性的距离函数称作伪度量。定义：具有自相似性、正定性、对称性的距离函数称作半度量。 3.1 形状匹配问题分类给定两形状 s 1 ， s 2 和不相似度度量 d ， Veltkamp 对形状匹配做了如下分类： ▲ 计算问题令 d 为变换无关的不相似度函数，计算 d(s 1 ; s 2 ). ▲ 决策问题令 d 为变换无关的不相似度函数，给定阈值 t ，判断是否 d(s 1 ; s 2 ) t 。 ▲ 决策问题给定阈值 t ，判断是否存在变换 g ，其中 d(g(s 1 ); s 2 ) t. ▲ 最优化问题寻找变换 g ，其中 d(g(s 1 ); s 2 ) 最小。很多形状匹配的应用需要以此为基础。 ● 基于形状的检索给定形状数据库 S={s1, s2, sN} 和查询形状 q ，检索与 q 相似的形状。有两种方法： 1 ）（决策问题）给定阈值 t ，寻找所有 d(q,si)t 的形状。 2 ）（计算问题）寻找 d(q,si) 最小的 k 个形状。 ● 形状识别和分类 1 ）（决策问题）给定形状 s 和模型 o ，判断是否 d(s,o) 足够小。 2 ）（计算问题）给定形状 s ， k 类形状以及各类形状表示 r1, r2, ,,,, rk ，找到类 ri ，使得 d(ri,s) 最小。 ● 形状校准和注册 ( 优化问题 ) 给定两形状 s1 和 s2 ，寻找变换 g 使得 d(g(s1),s2) 最小。如上所述，这个问题通常被 3D 形状检索的文献归为计算问题。给定查询模型，系统返回数据库中最相似的模型。形状匹配中形状的表示方法，决定了相似度度量的选择。第四章对 3D 形状检索中的匹配技术做综述。本节给出最常用的相似度度量。 Veltkamp 给出了计算几何模型中的形状匹配以及多边形和曲线匹配的相似度度量方法的综述。 ● L p 范式 (Minkowski 距离 ) 该方法用于匹配数字的向量形式的形状描述子。定义：给定 x ， y 两点，则 Lp 距离定义为：对 p1 ， Lp 距离为一种度量。若 p=1 ，称为 L1 范式或曼哈顿距离或城市块距离。若 p=2 ，称为 L2 范式或欧几里德距离。 Lp 距离不是变换无关的不相似性度量。图 3.1: 2D 空间满足 ||x||p=1 的点 ● Hausdorff 距离定义给定由点集表示的两个形状 X={x1,x2,,xM} 和 Y={y1,y2,,yN} ，则 X 和 Y 之间的 Hausdorff 距离定义为： H(X,Y) = max(h(X,Y),h(Y,X)) 其中， ||.|| 为欧几里德距离。图 3.2: Hausdorff 距离的可视化 Hausdorff 距离是一种度量。但它不是变换无关的，且对噪音不够鲁棒。这种方法的优点是可以进行局部匹配。点集 A 和 B 之间的 Hausdorff 距离定义为： H(A,B) = max(h(A,B),h(B,A)) 其中且。 ||a-b|| 表示点 a 和 b 之间的距离度量（例如欧几里德距离）。 h(A;B) 称为 A 到 B 的有向 Hausdorff 距离，等于 A 中点到 B 中点最近距离的最大值。直观上如果 h ( A;B ) = d ，则 A 中的每个点距离 B 中点的距离不超过 d 。 h(B;A) 称为 B 到 A 的有向 Hausdorff 距离，按照同样的方法计算。注意通常 h ( A;B ) h ( B;A ) ，图 5 给出了示例。 Hausdorff 距离为两有向距离中的最大值。图 5: 有向 Hausdorff 距离距离示意图。 Hausdorff 距离为两有向距离的最大值，即本图中的 h ( A;B ) . 原始 Hausdorff 距离对噪音敏感。如图 5 所示，如果两个接近的点集中有一个较远的噪音点，则 Hausdorff 距离将受噪音影响而无法确定两点集的相似性。在模式识别中，噪音和异常通常会导致这样的问题。提出了变形的局部 Hausdorff 距离来缓解这一问题，他对 A 中点到 B 中点的距离进行降序排列，并将第 k 个点的距离赋为 h ( A;B ) 。 A 到 B 的局部 Hausdorff 距离可如下定义：例如，对 k=3 ， h 3 (A,B) 将忽略 A 中较远的两点，而选择 A 到 B 第三远的距离。 h k (B;A) 按照同样方法计算。局部 Hausdorff 距离通过舍弃较远的噪声点使得距离度量更加灵活。接下来的文章中我们采用 6% 排序进行有向距离的计算，其中舍弃 6% 远的点。该数值根据我们的系统由经验确定。尽管在实现中采用局部 Hausdorff 距离代替原始 Hausdorff 距离，方便起见在下文中我们仍使用 Hausdorff 距离指代局部 Hausdorff 距离。由于 Hausdorff 距离的原始形式使用的较少，在文献中这两者的称呼也经常通用。但我们需要区分 Hausdorff 距离与接下来在下节中介绍的变形 Hausdorff 距离。不管是计算第 k 个还是最大有向距离值， h(A;B) 都需要计算 A 中每个点到 B 中点的最近距离。通过距离变换可加速计算的过程。主要思想在训练阶段预先一次计算所有需要的距离值，在识别过程中通过索引快速地获取想要的距离值。在系统中，我们通过距离的阶进行加速变换。具体的变换方法和模版匹配的应用可在 4.5 节，相似度度量之后进行介。，变形 Hausdorff 距离提出了变形 Hausdorff 距离 (MHD) ，将有向距离计算中的 max 操作符替换为距离的平均值 : 其中 N a 为 A 中点的数目。变形 Hausdorff 距离则等于两有向平均距离中的最大值 : Although 虽然当 k = 50% 时与相似，但前者为平均有向距离而后者为其中值。 Dubuisson 和 Jain 认为在对象匹配时，平均有向距离比局部有向距离更可靠，因为前者收噪音影响较小。我们仍然采用距离变换辅助距离计算。变形 Hausdorff 距离比原始 Hausdorff 距离的计算性能更高，因为无需存储最小距离信息。 ● 弹性匹配距离定义令 A={a1,a2,,aM} 和 B={b1,b2,,bN} 为有限的有序轮廓点集， f 为 A 与 B 中所有点的相关性并满足 : { ai,aj A,aiaj f(ai)f(aj)} 。伸缩 s 定义为 : 则 A 与 B 之间的非线性弹性匹配距离为 : 其中 d(a i ; b j ) 为 ai 与 bi 正切角的差。距离可通过动态规划方法计算。弹性匹配距离不满足三角不等性，因此不是度量。 ● 地面移动距离这也被称作传输距离。定义给定加权点对 A={(A1,w(A1)),(A2,w(A2)),,(AM,w(AM))} 以及 B={(B1,w(B1)),(B2,w(B2)),,(BN,w(BN))} ，其中 A i ;B i R 2 。 A 与 B 之间的传输距离为将 A 转换到 B 的所需的最小工作量。 3.2 3D 形状匹配的距离函数根据定义， 3D 对象的形状独立于任何平移、算法和旋转。因此距离函数也应具有变换无关性。独立于所有可能变换的距离函数可由如下公式给出 : 其中 G 为变换组。该距离函数对 3D 形状匹配并不十分有效。下面给出两种变换无关的定义定义 ( 姿态规整化 ) : 给定形状集合 S={s1,s2,,sN} ，度量 d(si,sj) 和变换组 G 。设 n 为多到一的函数，其中 g G ， si S,n(g(si))=?i 且 si,sj S,d(si,sj)~d(?i, ?j) ，则 d(si,sj)~d(?i, ?j)=d(g(si),g(sj)) G 为平移、缩放和旋转等变换的任意组合。 G 上定义的函数 n 即称作姿态规整化函数。定义 ( 不变特征 ) : 给定形状集合 S={s1,s2,,sN} ，度量 d(si,sj) 和变换组 G 。令 f + 为函数，其中 g G, si S,f+(g(si))=f+(si) 且 d(si,sj)~d(f+(si), f+(sj)) ，则 d(si,sj)~d(f+(si), f+(sj))=d(g(f+(si)),g(f+(sj)) 函数 f+ 称作不变特征抽取函数。 3D 形状的表示形式无法用于匹配。因此需要简化的描述子（形状描述子）来捕捉这些重要的形状特征。定义 ( 形状描述子生成 ) : 给定形状集合 S={s1,s2,,sN} ，度量 d(si,sj) 。令 f 为函数，其中 si S, d(si,sj)~d(f(si), f(sj)) 。则 f 称作形状描述子生成函数。若 f 对平移、缩放和旋转无关，则称作无关形状描述子生成函数。形状描述子可以是数字的或结构化的。数字形状描述子生成映射 X-Rn ，其中 X 为原始形状表示空间。定义 ( 基于 3D 形状的检索问题 ) : 给定 3D 形状数据库 S={s 1, s 2 ;, s N} 以及查询形状 q ，寻找与 q 相似的形状。解决方案 : （决策问题）给定阈值 t ，寻找所有 d(f(q),f(si))t 的形状。（计算问题）寻找 d(f(q),f(si)) 最小的 k 个形状。其中 d 为距离函数或度量， f 为形状描述子生成函数。若 f 不满足变换无关性，则需要先进行姿态规整化。 4 、 3D 检索中的形状匹配近年来 3D 形状检索技术取得了很大的发展，本节对这些方法进行介绍。由于计算机图形学和 CAD 应用中常使用多边形模型，因此采用多边形表示作为 3D 模型的表示方法。对给定多边形模型，可通过体素化生成体素模型，因此 3D 形状检索多采用多边形模型或体素模型作为输入。给定不同的 3D 模型数据库，需要创建简单的可高效计算的模型表示方法，用于模型的匹配。这在数据库规模庞大的时候更加重要，因为检索的环境是实时的。在 3D 形状检索的文献中，从初始模型中抽取的简化的表示方法称作形状描述子。这些描述子应该具有足够的描述能力来区分相似和不相似的形状，并且尽可能的简约。形状描述子可以是数字的（例如特征向量、直方图等）或结构的（例如图）。形状匹配的方法有两种。首先是根据 3D 模型生成基于几何或拓扑特性的形状描述子，这称作基于模型的方法。有些基于模型的方法需要先预处理，将模型放置到正交坐标系中。这称作姿态规整化，在形状描述子不满足变换无关性时是必要的。平移无关性可将对象中心移到原点满足，缩放无关性可将所有的模型都缩放到相同的维数。旋转无关性稍微复杂一些，通常需要通过主元素分析 PCA 方法计算主轴，并将模型旋转使其主轴与预定义的正交坐标系重合。但这种方法有一些问题。首先 PCA 不保证主轴的正确排序，可能导致某些模型对其错误。其次，多边形网格中每个多边形的面积可能不同，将影响模型主轴的计算。加权的 PCA 算法已提出，用于解决这些问题第二种形状匹配的方法是基于视图的方法，其中根据模型的若干 2D 投影生成形状描述子，并进行匹配。基于视图的方法一般采用 2D 形状描述子， Zhang 和 Lu 对其进行了比较详尽的介绍。这种方法需要捕捉足够多的视图来反映 3D 模型的各个方面。 4.1 基于模型的技术 3D 形状检索中基于模型的方法作用于 3D 形状本身，主要有两类方法。有些方法只考虑全局或局部的形状特性，其他方法考虑形状的结构特性，如空洞和组件等。 4.1.1 几何方法这些方法挖掘形状的量化的特性，包括从形状中抽取出的体积、纵横比、表面积、曲率或其他数字的描述子。这些特性可以是全局的或局部的。全局特性计算速度快但无法进行局部匹配，而局部的方法则刚好相反。 4.1.1.1 全局形状描述子全局方法把形状看作一个整体，已有很多描述对象全局形状的方法。本节按照主要思想对这些方法进行分类。特征给定形状，直观的方法是提取可区分不同形状的特征，例如体积、表面积或由形状表面或体积计算得到的矩。但这些特征描述里不强，因此可用于 3D 形状检索的初步过滤。 Elad 等人提出了应用于多边形网格的基于矩的方法。他们定义了近似矩，检索如下：作者首先在模型表面采用 N 的点。对一阶矩中心化可使其满足平移无关性，对采样点计算二阶矩的 3*3 矩阵进行分解可满足缩放和旋转无关性。规整化后计算 3D 模型的矩并生成特征向量，再根据欧几里德距离计算相似度。 Zhang 和 Chen 描述了有效计算多边形网格体积、表面积和矩的有效方法。特征分布这些方法采用特征的分布，本节将稍作介绍。 Osada 等人提出了全局特征的分布方法，并通过概率分布比较得到相似度。他们定义了不同的全局几何形状函数： A3: 3D 形状表面上任意三点的角度度量。 D1: 固定点与表面上任意点的距离度量。通常固定点选择形状边界质心。 D2: 表面上任意两点的距离度量。 D3: 表面上任意三点组成三角形的面积的开发度量。 D4: 表面上任意四点组成四面体体积的开立方度量。这些函数容易计算，且具有旋转和平移无关性。为了从这些函数产生形状分布，研究者在上述函数的每个形状分布中采样 N 个点，再创建 B 等宽的直方图。这些直方图即为分布的近似。形状相似度匹配也就转换为直方图匹配，可根据 Minkowski 范式、 Kolmogorov-Smirnov 距离、 Kullback-Leibler 散度、地面移动距离、 Bhattacharyya 距离、 X 2 统计等方法计算。作者实现了八种计算简单的相似度度量。设 a 、 b 为待比较的两个形状， fa 、 fb 为通过直方图近似的形状概率分布函数（ pdf ）， f^a 、 f^b 为累积分布函数。相似度度量为： ? ? Bhattacharyya 距离： ? Pdf 的 Minkowski （ Lp ）范式： ? Cdf 的 Minkowski （ Lp ）范式：这些方法不满足缩放无关性，需要进行规整化处理。作者表示 D2 函数在实验中效果最好。 Obhuchi 等人和 Ip 等人给出了 D2 方法的扩展。 Obhuchi 等人提出了一种方法，沿 3D 模型的主轴计算若干统计数据，并应用于多边形网格模型。首先他们沿主轴对其模型，再计算直方图：（ 1 ）轴惯量的矩，（ 2 ）表面到轴的平均距离，（ 3 ）表面到轴距离的方差。这样每个模型得到由 9 个特征向量组成的特征向量，并采用欧式距离和弹性匹配对其匹配。实验表示该方法仅对旋转对称的模型效果较好。空间图这些方法意图捕捉形状的空间组成。 3D 形状首先被分割，再计算各部分的点分布或其特征。相似度匹配也考虑各部分之间的关系。下面给出一个例子。 Ankerst 等人的方法包括两部分。第一部分基于离散表示产生形状直方图。第二部分定义二次距离函数。形状要事先按其质心对齐，并在表面上均匀采样以计算直方图。他们提出了三种生成形状直方图的方法。每种方法定义了不同的形状分解：壳模型（ 3D 模型被分解为绕中心点的同心壳）、扇模型（ 3D 模型被分解为从中心点出发的若干扇块）和蜘蛛网模型（前两者结合）。除了扇模型，其他两者都不是旋转无关的。作者认为欧式距离不考虑组件直接的关系而导致匹配效果不好。在这种情况下，组件反映了当前空间分解情况下点分布的空间关系，他们定义了如下的二次距离函数形式：其中 N 为特征向量维数，或空间分解模型中 bin 的个数。 A 为相似度矩阵，其中 aij 表示特征向量中组件的相似度。可以看出，如果 A 为对称矩阵，则表示欧式距离。采用该公式可根据空间关系方便为不同的 bin 设定权值。积分变换和特别函数微积分的方法也被用于数字图像识别和信号处理。在 3D 检索中，一些方法采用了积分变换（变换系数）和一些特殊的函数。本节做简单的介绍。定义一般积分变换的定义如下 : 其中函数 K(s,t) 称作核函数。根据核函数的不同积分变换也有不同的名字。常用的包括 Hough 变换、傅利叶变换、小波变换、 Radon 变换和 Laplace 变换。 3D 形状检索对离散数据进行变换，并采用系数最为形状描述子组成特征向量。 Zaharia 和 Preteux 提出了基于 Hough 变换（ 3DHT ）的 3D 形状检索系统。由于 PCA 的局限性，，他们在姿态规整化过后计算所有可能的坐标轴顺序上的 3DHT 。他们称得到的 48 个 3DHT 为优化 3DHT （ O3DHT ），满足形状无关性。再计算 48 个 3DHT 形状描述子直接的 L1 和 L2 距离，并选择其中的最小值来比较模型。 Vranic 和 Saupe 采用离散 3D 傅利叶变换 (3DDFT) 产生多边形网格模型的描述子。通过多种 PCA 算法满足旋转无关性，再对体素模型应用 3D 傅利叶变换。并由变换的实系数生成特征向量，实验中采用 L1 和 L2 距离进行度量。 Paquet 等人采用基于小波变换的 3D 模型检索。 Daras 等人则采用 3D Radon 变换和 L1 距离进行匹配。 3D 形状检索中也用到一些特殊的函数。 Kazhdan 等人提出了采用球谐函数的方法，他们首先将多边形网格模型进行体素化，采用同心球面与其相交，并根据球面包含的模型多少描述每个球面函数。接下来对其进行谐波分解（频率分解）。他们总结了每个频率的谐波并生成由球面半径和频率索引的 L2 距离的 2D 图。该描述子具有形状无关性，也可应用于任何体素网格。 Novotni 和 Klein 采用 3D Zernike 矩生成形状描述子，该方法也是旋转无关的。信息理论方法 Page 等人对 3D 模型表面的形状复杂度进行度量。他们计算曲率熵，并称其为形状信息。他们认为曲别针比球面的复杂度更大，因此可进行量化的度量，并定义了离散情况下墒的概念 : 对网格进行均匀点采样并估计这些点的高斯曲率生成 M 个等宽的 bin ，由此估计形状的曲率概率密度函数 pdf 。根据上述定义，从 M 个 bin 中计算熵 H ，表示了 3D 形状再高斯曲率方面的复杂度。作者表示球面为曲率复杂度最低的形状。因此上述公式计算球面的信息值为 0 。他们的实验证明具有不同曲率的模型比对称模型或重复曲率的模型更加复杂。体积差这种方法的前提是不同形状的空间体积构成是不同的，无法由简单的体积差技术捕捉。两个形状可能体积相同，但却不相似。为了匹配，所以的形状必须先进行姿态规整化，如下所示。 Kaku 等人的方法采用有 Gottschalk 提出的 OBB 树数据结构。姿态规整化后，数据库中每个 3D 模型表示为二叉树，其中节点表示定向包围盒 OBB 的中心。他们根据对应节点差的总和进行相似度匹配。同时也保留原始模型的纵横比以进行其他的相似度度量。最终的相似度由加权上述两种方法的结果组成。作者与 D2 方法进行了对比。 Leifman 等人提出基于体积差的 oc 树。对模型进行 oc 树表示后，根节点的体积差 D 由底向上递归计算。这种方法相对较慢。 Ichida 等人提出了交互的 3D 形状检索界面 ActiveCube 。用户可采用边长 5 厘米的立方体构建查询形状。系统实时识别用户创建的模型。数据库中的模型和查询形状均由体素表示，并通过对比体素的重叠进行匹配。对规范形状的投影（变形）基于投影的方法的思想是将一个形状变形到另一个所需的能量可用于两个形状的相似度匹配。在 3D 形状检索中，数据库中的每个模型都被变形对哦规范形状（如球面），变换所需的能量即作为匹配的描述子。计算能量的方法有很多，下面做些介绍。 Leifman 等人提出了球面投影方法。首先进行姿态规整化以满足相似变换的无关性。将形状变形为其半径为 R 的包围球面的能量定义为，其中为应用的力， dist 为对象表面到包围球面的距离。对表面上所有点的力假设是相同的。因此能量与球面与模型表面的距离成正比。他们对球面上的点进行采样并计算距离。第一个距离 d1 是球面到模型的最小欧式距离，第二个距离 d2 为从模型到球面的距离，计算如下：模型上的每个点由球面坐标 ( a,q, r) 表示，对模型上每个点，寻找球面上 a,q 最为相近的点。对应关系建立以后，球面上的每个点对应表面上的一个点集。 d 2 即为从球面点到其对应点集的平均距离 (|R-r|) 。最终距离 d 为 d1 和 d2 的平均或串联。作者从因特网收集了 1068 个任意的对象，手动将其中 258 个对象分成 17 类（人、导弹、汽车等等）。他们的方法在多数情况下性能优于形状矩和形状分布的方法，但对对不具有通用全局形状的类别效果不好，因为该法只捕捉全局性质。 Yu 等人提出了相似的方法。他们生成从对象到包围球面的距离图，事先仍然需要进行姿态规整化，还对这些距离图应用快速傅利叶变换 FFT 来处理姿态规整化中的错误对齐。这些图的规整化的加权欧式距离用于相似度计算。作者在由 34 个类、 52 个模型的数据库上进行了实验，但没与其他方法进行对比。加权点集这些方法从形状生成点集，按某种方式进行加权，并采用不同方法计算相似度。 Tangelder 和 Veltkamp 提出三种不同的生成加权点集的方法。将姿态规整化后的 3D 多边形网格放置在 3D 网格中。每个非空网格单元包含一个显著点。显著点的选取和加权有不同的方式：（ 1 ）选取高斯曲率最高的点，并将曲率值作为点的权值，（ 2 ）选择按面积加权的顶点的均值点，将面的法向方差作为权值，（ 3 ）计算所有顶点的质心，并赋权值为 1 。他们采用地面移动距离的变种来进行相似度度量，使其满足三角不等性。作者表示他们的方法由于形状分布的方法。 4.1.1.2 局部形状描述子这些方法考虑表面上邻居点之间的局部性质。曲率是局部性质的一个例子，在全局方法中也被用于表示上下文信息。在上下文环境中，将所有局部性质组合起来，可以作为形状的全局描述子。这里我们不考虑组合局部性质的方法，因此可以进行局部匹配。同时这些方法的描述能力更好，因为虽然有些耗时，但它们可以捕捉形状的细节信息。该类方法多用于聚类环境中的对象识别和表面注册问题，也有一些已用于 3D 形状检索。这些方法不需要预先进行姿态规整化。 Johnson 和 Hebert 提出了旋转图像方法。旋转图像是在模型表面某点处计算的 2D 直方图。对一个网格模型，可对网格的每个顶点检索旋转图像。表面法线可在选定作为定向点的顶点处进行估计。与定向点距离 D 最大的点集中，满足其法线和定向点法线之间夹角在允许范围内的点将作为候选点。 2D 直方图则根据到表面法线和定向点处切平面的垂直距离进行计算。该直方图可用作图像。作者给出了聚类场景中的对象识别算法。 De Alarcon 等人将旋转图像用于 3D 形状检索。对多边形 3D 网格，生成大量的旋转图像，并应用自组织映射 SOM 算法生成旋转图像的简化集合。此外，他们还采用 k 均值聚类方法对旋转图像进行聚类，以对数据库进行索引。作者在小数据库上进行了实验。 Yamany 等人的方法捕捉表面上某点的曲率，并为每个点生成表面签名图像。该方法用于表面注册。他们发现为了对齐表面，至少需要对模型的三个对应点进行表面签名匹配并对其参数进行相似度变换。 Kortgen 等人将 Belongie 等人提出的 2D 形状上下文扩展到 3D 形状上下文。他们对表面上的 N 个点计算直方图。某采样点的直方图包含其余 N-1 个点的坐标。根据采样点集的大小，该方法的局部描述功能也不同。他们的分级方法将空间分解为壳或扇区。形状匹配则通过比较形状上下文来寻找模型上的对应点。 4.1.2 结构和拓扑技术 3D 形状的几何特性无法表达形状的语义。他们描述形状的全局或局部特性，却无法表达形状各部分之间的关系，也无法区分拓扑不同的形状。例如，采用拓扑方法可以方便地区分圆环和球面。同样，拓扑相似而几何不同的形状有时需要被分成一类。例如，不同种类的桌子应属于一类。长方形或圆形桌面、三条腿或四条腿的桌子尽管几何不相似，但确实拓扑相似的。结构描述子更加直观，但匹配却比几何方法耗时。他们比几何方法的优势在于可以进行局部匹配。表面透射图 Yu 等人通过将模型变形到球面来抽取拓扑信息，这称作表面透射图，基本思想为：假设从模型中心发出射线到其包围球，则将根据模型的拓扑和凹度穿透一个或多个表面。包围球被分为多个扇区，并计算每个扇区射线穿透表面的平均值。作者没有与其他方法进行对比。图结构 Hilaga 等人提出了拓扑匹配的方法。他们构建多分辨率 Reeb 图（ MRG ）来匹配 3D 模型。 Reeb 图是对象上连续标量函数的骨架，作者采用测地距离分布作为连续函数。该方法对回转形状同样有效。 Tung 和 Schmit 加入体积和曲率对 Reeb 图进行扩展。因为在人体匹配中，仅采用拓扑相似，无法区分胳膊和腿。 Sundar 等人采用骨架图匹配 3D 模型。他们同时利用了拓扑和几何信息，生成 3D 模型骨架也有很多方法。作者采用基于参数的细化算法抽取体素 3D 模型。模型各部分的骨架图也包括半径等几何信息。关系结构 3D 模型可看作一系列单元何其关系的组合。每个单元可由面积、半径等几何属性描述。由关系匹配得到的检索框架由 Vosselman 给出。同时 Haralick 和 Shapiro 给出了基于关系距离定义的一致标记框架。 4.2 基于视图的技术在利用 3D 几何或结构的同时， 3D 形状的外观或视图也可用于形状描述，其基本思想是相似的物体在各个角度上看起来都是相近的，已有一些相关研究。本节将介绍采用 3D 模型的视图来进行模型的相似度匹配。 Chen 等人提出了基于光场的方法。光场为一个五维的函数，表示给定 3D 点在给定方向上的半径。对平移和缩放无关的 3D 模型，他们在近似包围球上均匀取 10 个点，并创建其轮廓生成光场。结合使用面积的 Zernike 矩（基于区域的描述子）和边界的傅立叶变换（基于轮廓的描述子）作为每个轮廓的 2D 描述子。这十个不同旋转球面产生十个光场的集合将保存下来。设 a 、 b 为待比较的两个模型，则相似度度量定义如下：其中 I a ik ,I b ik 为轮廓的 2D 描述子，距离 d 为 L1 范式。作者将他们的方法与 Funkhouser 提出提出的 3D 球谐函数方法做比较，并说明他们的方法的处理效率较高。 Obhuchi 等人提出应用于多边形 soup 3D 模型的方法。这些模型是平移和缩放无关的。他们计算 N=42 个深度的渲染图像，基本上包含了模型的所有视图。再对每幅图像应用傅立叶变换作为 2D 描述子。总共 42 个描述子形成 3D 模型的形状描述子。设 a 、 b 为待比较的两个模型，则相似度度量定义如下：其中 I a i , I b j 为 2D 描述子，距离 d 为 L 1 范式。因为所有的旋转是无序的，相似度度量比较所有可能的对并选取最小的 L 1 距离用来计算所有的 42 的视图。 5 、 3D 模型搜索引擎分析前面的章节讲述了数字世界中 3D 模型的表示、相似度和匹配的概念以及 3D 形状检索技术。本节给出概念框架，将这些模块组合到一起形成 3D 形状搜索引擎。 3D 形状搜索引擎的主要组件是模型数据库。模型可表示为不同形式，例如多边形网格、多边形 soup 、体素模型。数据库可以针对领域的，例如 CAD 模型，或包含各种模型。除了名字之外，模型还可以包含文本描述。对用户最重要的组件是查询界面，可有不同的形式：用户提供 3D 模型，检索所有相似的模型。草绘 3D 草图，检索相似的模型。草图一个或多个 2D 视图，检索相似的模型。用户还可以加入文本描述进行搜索，例如汽车。由于模型本身不适用于匹配，需要创建简化的形状描述子，这些描述子通常预先离线创建。因此相似度匹配可以达到在线情况下的实时性。描述子也可以建立索引，提高检索的效率。下图给出了概念框架的各个组件：图 5.1: 概念 3D 形状搜索引擎框架图 6 、 3D 形状检索性能和相关问题前面我们给出了基于形状的 3D 模型检索的方法，本章将更加细致地讨论这些系统的性能。本章的结构是： 6.1 节对 3D 模型搜索系统的检索性能做综述。 6.2 节给出检索中主观评价的方法。多数系统采用形状等底层特征进行相似度匹配，但语义特征同样不能被忽略。因此，需要将用户的喜好加入相似度匹配。 6.3 节提出根据查询选择最佳的形状描述子。 6.1 性能评估和 Benchmarking 多数 3D 形状检索检索的性能通过结果与预定义分类之间的相近程度来评估。因为数据库随不同的系统分类而不同，需要一个统一的框架来比较不同的匹配算法。普林斯顿的形状 Benchmark 对此做出了贡献，它提供了不同类别的测试数据库，还附带一些比较检索性能的工具。如果匹配算法通过计算形状之间的距离大小来进行匹配，通常有一些性能度量方法。给定形状匹配算法和 3D 模型 (M = {m 1 ;m 2 ; :::;m N }), 可以计算模型之间的距离。对任意模型 q M ，可根据距离矩阵选择 k 个最相似的模型。以下是评价 3D 形状检索性能的量化方法：最匹配的图像根据相似度递减的顺序排列。查准率 - 查全率图距离图像等级图像 6.2 主观检索 3D 模型搜索系统抽取底层的形状特征，但它们无法捕捉形状的语义。用户对形状的理解包括形状和语义两方面，同时每个人对语义的理解也可能不同。一个成功的搜索引擎应该能够适应用户的喜好。本节对这些方法做介绍。 Suzuki 等人创建了对象特征框架 OFS 和用户喜好框架 UPS 并建立两者之间的映射。在特征抽取阶段，他们只考虑多边形网格的顶点，生成模型的规整化包围立方体，并将其分割为单位单元。最后，每个立方体内规整化顶点的个数即作为模型的特征向量。算法其余部分如下 : 1. 选择数据库中的模型子集（训练集），要求用户提供这些模型的相似度，为每个用户建立相似度矩阵 2. 采用多维缩放 MDS 对上一步中建立的相似度矩阵进行降维。这是用户喜好空间。 3. 对不属于训练集中的模型进行预测。采用多元回归分析建立对象特征空间到每个用户的喜好空间的映射。 Elad 等人提出循环优化算法允许用户标记相关和不相关的结果来调整距离度量函数。他们采用的特征是规整化矩，并采用加权欧式距离进行相似度度量。用户反馈通过修改距离度量的权重是结果靠近相关匹配而远离不相关的匹配。支撑向量机 SVM 被用于训练距离函数的权重。这样，系统学习不同用户的主观相似度度量方式。 Zhang 和 Chen 提出主动式学习的概念将语义特征融合到检索过程。他们采用的底层特征是体表面纵横比、不变矩和傅利叶系数。该系统采用汽车、身体、飞机等 53 个预定义的属性，对每个对象计算其属于每种属性的概率。训练过程中，随机选择若干模型给用户进行标记。用户判断对象是否具有某种属性，给出 0 或 1 的赋值，这称作隐式标注。因为无法收到标注所有模型，系统将估计其余模型的概率。作者采用有偏核回归技术估计未标注样本的概率。有偏估计表示如果一个对象远离标注的模型，则不应受某种标记的影响。下一步即从数据库中选择最不确定的模型，并要用户进行标注。这采用知识增益进行判断，主要目的是降低数据库的不确定性。检索过程采用底层特征的加权距离度量和基于模型概率的语义相似度度量。系统性能随标注模型的数量增多而提高。 6.3 形状描述子选择前面介绍了匹配和检索 3D 形状的方法，以及比较不同形状描述子的性能评估方法和 benchmarking 技术。本节将形状描述子选择问题看作模式识别环境下的特征子集选择问题。每个形状描述子被看作一种特征，多种特征组合可进行形状检索，问题是如何进行组合以取得最好的检索效果。本文介绍文献中包含的两种形状描述子选择方法。 Vandeborre 等人从多边形网格模型生成三种形状描述子（特征），包括：由每个网格面住曲率直方图组成的曲率索引，面之间的距离直方图（距离索引），和每个面的体积直方图（体积索引）所以特征对欧式变换无关。他们采用 L1 范式度量相似度，模型数据库包括飞机、汽车、鱼、象棋等类别。作者提出两种方法组合形状描述子：将结果集中对象的排名的曲率、距离和体积索引表示为 Rc ， Rd 和 Rv 。 N 为每个查询检索到的模型， F 表示某种特征组合模式下，检索到模型与查询的相关程度。 ? OR 方法： ? MEAN 方法：上述方法返回 0 到 1 之间的实数值，因此可根据 F 的大小选择最佳的 N 个匹配。实验表面组合的形状描述子比单独使用其中任何一种的效果都要好。 Bustos 等人采用基于熵不纯度的方法进行特征选择。数据库中包括 1838 个 3D 模型，其中 292 个被预分类成汽车、飞机、海洋生物等。分类后的模型用作查询检索其同类的模型。模型特征向量之间的 L1 范式用于相似度度量。检索的有效性通过结果集的一致性进行评估。查询应返回同类的模型，有些特征的区分性可能好于其他特征，特征组合一般会取得比较好的效果。其出发点是没有一种特征抽取可以对每种查询都有效，例如有效对汽车模型描述效果好，其他则对海洋生物效果好。作者实现了 15 种特征抽取技术，并表示为特征向量。其共性是他们都描述了 3D 形状的全局特征，表 6.1 给出了这些特征和其出处。方法引用深度缓存 Heczko 等人体素 Heczko 等人轮廓 Heczko 等人体积 Heczko 等人阴影 Vranic 和 Saupe 3D 谐波 Funkhouser 等人形状复合函数 Vranic and Saupe 球谐射线 Vranic and Saupe 弦 Paquet et al. 矩 Paquet et al. D2 形状分布 Osada et al 3D FFT Vranic and Saupe 基于射线的方法 Vranic and Saupe 关系无关特征 Kato et al. 形状图谱 Zaharia and Preteux 表 6.1: Bustos 等人抽取的特征种类 . 作者采用熵不纯度度量来估计每种特征的性能，实验表面熵不纯度比 Gini 和误分类不纯度的效果要好。他们开发了两种方法：独立于查询的特征选择和组合。设 U 为 3D 模型空间， M 为 U 的有限模型子集（数据库）。对每个模型 m M ，都对应类别 c1; c2; :::; cN ，且。设 q U 为查询模型。对特征抽取函数 f ， R q f 为按照 d(f(q),f(r)) 升序排列的模型序列，其中 d 为 L1 范式距离度量， q 为查询模型， r 为检索到的模型。设 P k (c n , R q f ) 为类 cn 中属于 R q f 前 k 个模型的比例。 ? 最佳特征抽取选择的熵不纯度度量搞定查询 q ，特征抽取函数 f 的 k 熵不纯度为：若所有 k 个结果属于同一类，则 k 熵不纯度为 0 。当结果集合中不同类别的数目达到最大是，熵不纯度取得最大值。最佳特征抽取函数根据下式选择：其中 F ={f1; f2; :::; fT} 为特征抽取函数集合。 ? 最佳特征抽取组合的熵不纯度度量这里选择查询 q 的最佳特征组合，而不是最佳特征抽取函数 f 。作者采用上述 k 熵不纯度进行特征函数的加权组合。不纯度值越小则权值越大，并根据 k 熵不纯度建立查询 q 和对象 o U 之间新的距离度量函数如下：其中 i(f t ,q,k) 为特征抽取函数 f t 和查询模型 q 的 k 熵不纯度。 D max t 为 q 到数据库中模型的最大距离（ L1 范式）。 d t (q,o) 为 q 到模型 o 的距离。根据距离 d (q,o) 对结果进行排序。作者采用查准率 P 和查全率 R 图对各种特征抽取方法和 k 熵不纯度的最佳特征效果进行对比。同样，也用 PR 图对特征组合结果进行评价。结果表面，特征组合可以提高 30% 左右的性能。下图为查询的一个例子，采用赛车模型作为查询，给出了深度缓存、轮廓以及两者组合的检索效果。图 6.1: 采用深度缓存、轮廓以及两者组合的查询结果 (Bustos 等人 ) 但这种方法需要手动对数据库中的对象进行分类。对未分类的数据库，则需要预先进行分类处理。如果不知道数据库的规模，可以通过聚类算法等非监督学习技术。但分类有很多方法，也可以考虑主观信息。例如纯基于形状的聚类可能将不相关的模型分为一类，比如导弹和笔。因此需要其他的成组方法，比如基于模型功能的费力或其他相关的文本信息。参考文献 Mihael Ankerst, Gabi Kastenmuller, Hans-Peter Kriegel, and Thomas Seidl. 3d shape histograms for similarity search and classi_cation in spatial databases. In Ralf Hartmut Guting, Dimitris Papadias, and Frederick H. Lochovsky, editors, Advances in Spatial Databases, 6th International Symposium, SSD'99, Hong Kong, China, July 20-23, 1999, Proceedings, volume 1651 of Lecture Notes in Computer Science, pages 207-226. Springer, 1999. I. Atmosukarto and P. Naval. A survey of 3d model retrieval systems. not published, N/A 2003. not published. B. Bustos, D. Keim, D. Saupe, T. Schreck, and D. Vrani_c. Using entropy impurity for improved 3d object similarity search. In Proc. IEEE International Conference on Multimedia and Expo (ICME'04), 2004. P. J Besl and N. D. MacKay. A method for registration of 3-d shapes. IEEE Transactions on Pattern Analysis and Machine Intelligence, 14(2):239-256, 1992. M. Bennamoun and G. J. Mamic. Object recognition: fundamentals and case studies. Springer- Verlag New York, Inc., 2002. Serge Belongie, Jitendra Malik, and Jan Puzicha. Shape matching and object recognition using shape contexts. IEEE Transactions on Pattern Analysis and Machine Intelligence, 24(24):509-522, April 2002. Richard J. Cambell and Patrick J. Flynn. A survey of free-form object representation and recognition techniques. Computer Vision and Image Understanding, (81):166-210, 2001. Yang Chen and G_erard Medioni. Description of complex objects from multiple range images using an inating balloon model. Computer Vision and Image Understanding: CVIU, 61(3):325-334, 1995. De-Alarcon, Pascual-Montano PA, and JM Carazo. Spin images and neural networks for e_cient content-based retrieval in 3d object databases. In CIVR, 2002. Yu-Te Shen Ding-Yun Chen, Xiao-Pei Tian and Ming Ouhyoung. On visual similarity based 3d model retrieval. In Computer Graphics Forum (EUROGRAPHICS'03), volume 22, pages 223-232, September 2003. P. Daras, D. Zarpalas, D. Tzovaras, and M.G. Strintzis. Shape matching using the 3d radon transform. In 3D Data Processing, Visualization and Transmission, 2004. 3DPVT 2004, pages 953{960, september 2004. Michael Elad, Ayellet Tal, and Sigal Ar. Directed search in a 3d objects database using svm. Technical report, HP Laboratories, Israel, 2000. M. Elad, A. Tal, and S. Ar. Content based retrieval of vrml objects-an iterative and interactive approach. Eurographics Multimedia Workshop, pages 97{108, 2001. Thomas Funkhouser and Michael Kazhdan. Shape based retrieval and analysis of 3d models. Siggraph2004 Course 15, 2004. Thomas Funkhouser, Patrick Min, Michael Kazhdan, Joyce Chen, Alex Halderman, David Dobkin, and David Jacobs. A search engine for 3d models. ACM Trans. Graph., 22(1):83{105, 2003. M. Heczko, Keim, D. D., Saupe, and D. V. Vranic. Verfahren zur hnlichkeitssuche auf 3dobjekten. In Datenbank Spektrum Zeitschrift fr Datenbanktechnologie, volume 2, pages 54-63, 2002. Robert M. Haralick and Linda G. Shapiro. Computer and Robot Vision. Addison-Wesley Longman Publishing Co., Inc., 1993. Masaki Hilaga, Yoshihisa Shinagawa, Taku Kohmura, and Tosiyasu L. Kunii. Topology matching for fully automatic similarity estimation of 3d shapes. In Proceedings of the 28th annual conference on Computer graphics and interactive techniques, pages 203{212. ACM Press, 2001. Hiroyasu Ichida, Yuichi Itoh, Yoshifumi Kitamura, and Fumio Kishino. Interactive retrieval of 3d virtual shapes using physical objects. In IEEE Virtual Reality, 2004. N. Iyer, K. Lou, S. Janyanti, Y. Kalyanaraman, and K. Ramani. Three dimensional shape searching : State-of-the-art review and future trends. Computer Aided Design, 2004. Cheuk Yiu Ip, Daniel Lapadat, Leonard Sieger, and William C. Regli. Using shape distributions to compare solid models. In Proceedings of the seventh ACM symposium on Solid modeling and applications, pages 273{280. ACM Press, 2002. Anil J. Jain and Chitra Dorai. 3d object recognition: Representation and matching. Statistics and Computing, (10):167{182, 2000. A.E Johnson and M. Hebert. Using spin images for e_cient object recognition in cluttered 3d scenes. IEEE Transactions on Pattern Analysis and Machine Intelligence, 21(5):433{449, May 1999. A. Young J. Park, D. Mataxas and L. Axel. Deformable models with parameter functions for cardiac motion analysis from tagged mri data. IEEE Transactions on Medical Imaging, 15:278{ 289, 1996. J. J. Koenderink and A. J. van Doorn. The internal representation of shape with respect to vision. In Biological Cybernetics, volume 32, pages 211{216, 1979. D.G. Kendall, Barden D., Carne T.K., and Le H. Shape and Shape Theory. Wiley Series in Probability and Statistics, 1999. Michael Kazhdan, Thomas Funkhouser, and Szymon Rusinkiewicz. Rotation invariant spherical harmonic representation of 3d shape descriptors. In Proceedings of the Eurographics/ACM SIGGRAPH symposium on Geometry processing, pages 156{164. Eurographics Association, 2003. Keitaro Kaku, Yoshihiro Okada, and Koichi Niijima. Similarity measure based on obbtree for 3d model search. In International Conference on Computer Graphics, Imaging and Visualization (CGIV'04), volume I, pages 46{51, july 2004. M. Kortgen, G.J Park, M. Novotni, and R. Klein. 3d shape matching with 3d shape contexts. The 7th Central European Seminar on Computer Graphics, April 2003. Toshikazu Kato, Motofumi T. Suzuki, and Nobuyuki Otsu. A similarity retrieval of 3d polygonal models using rotation invariant shape descriptors. In IEEE International Conference on Systems, Man, and Cybernetics (SMC2000), pages 2946{2952, 2000. G. Leifman, S. Katz, A. Tal, and R. Meir. Signatures of 3d models for retrieval. 4th Israel Korea Bi-National Conference on Geometric Modeling and Computer Graphics, pages 159{163, 2003. A. Witkin M. Kass and D. Terzopoulos. Snakes: Active contour models. International Journal of Computer Vision, 1(4):321{331, 1987. Bruce Naylor. Representations of geometry for computer graphics. In Siggraph 1996 Course Notes, 1996. M. Novotni and R. Klein. 3d zernike descriptors for content based shape retrieval. Solid Modeling, 2003. Robert Osada, Thomas Funkhouser, Bernard Chazelle, and David Dobkin. Shape distributions. ACM Transactions on Graphics, 21(4):807{832, October 2002. Ryutarou Ohbuchi, Takahiro Minamitani, and Tsuyoshi Takei. Shape-similarity search of 3d models by using enhanced shape functions. In Proceedings of the Theory and Practice of Computer Graphics 2003, page 97. IEEE Computer Society, 2003. Ryutarou Ohbuchi, Masatoshi Nakazawa, and Tsuyoshi Takei. Retrieving 3d shapes based on their appearance. Proceedings of the 5th ACM SIGMM international workshop on Multimedia information retrieval, pages 39{45, 2003. Ryutarou Ohbuchi, Tomo Otagiri, Masatoshi Ibato, and Tsuyoshi Takei. Shape-similarity search of three-dimensional models using parameterized statistics. In Proceedings of the 10th Paci_c Conference on Computer Graphics and Applications, page 265. IEEE Computer Society, 2002. D. L. Page, A. F. Koschan, J. K. Paik, and M. A. Abidi. Shape analysis algorithm based on information theory. In Proceedings of the International Conference on Image Processing, volume I, pages 229{232, 2003. E. Paquet, A. Murching, T. Naveen, A. Tabatabai, and M. Rioux. Description of shape information for 2-d and 3-d objects. In Signal Processing: Image Communication, volume 16, pages 103{122, 2000. A. R. Pope. Model-based object recognition: A survey of recent research. Technical report, Univ. of British Columbia, 1994. P. Shilane, M. Kazhdan, P. Min, and T. Funkhouser. The princeton shape benchmark. SMI, 2004. Motofumi T. Suzuki, Toshikazu Kato, and Hideo Tsukune. 3d object retrieval based on subjective measures. In Proceedings of the 9th International Workshop on Database and Expert Systems Applications, page 850. IEEE Computer Society, 1998. Linda G. Shapiro and George C. Stockman. Computer Vision. Prentice Hall, 2001. H. Sundar, D. Silver, N. Gagvani, and S. Dickinson. Skeleton based shape matching and retrieval. In Shape Modeling International, 2003, 2003. T.Tung and F.Schmitt. Augmented reeb graphs for content-based retrieval of 3d mesh models,. In International Conference on Shape Modeling and Applications (SMI'04), pages 157{166, 2004. J. Tangelder and R. Veltkamp. Polyhedral model retrieval using weighted point sets. Int. Journal of Image and Graphics, 3(1), pp. 209-229 (2003)., 2003. Johan W. H Tangelder and Remco C. Veltkamp. A survey of content based 3d shape retrieval methods. Shape Modeling Conference, 2004. Jean-Philippe Vandeborre, Vincent Couillet, and Mohamed Daoudi. A practical approach for 3d model indexing by combining local and global invariants. In 1st International Symposium on 3D Data Processing Visualization and Transmission, pages 644{647, 2002. R.C Veltkamp. Shape matching: Similarity measure and algorithms. In Proceedings Shape Modelling International, pages 188{197, 2001. G. Vosselman. Relational Matching. Lecture Notes in Computer Science, vol. 628, Springer Verlag., 1992. D. V. Vranic and D. Saupe. 3d model retrieval. In Proceedings Spring Conference on Computer Graphics 2000(SCCG2000), Budmerice, Slovakia, may 2000. D. V. Vranic and D. Saupe. 3d shape descriptor based on 3d fourier transform. In Proceedings of the EURASIP Conference on Digital Signal Processing for Multimedia Communications and Services(ECMCS 2001),Budapest, Hungary, pages 271{274, september 2001. D. V. Vranic and D. Saupe. Description of 3d-shape using a complex function on the sphere. In Proceedings IEEE International Conference on Multimedia and Expo, Lausanne, Switzerland, pages 177{180, August 2002. M. Yu, I. Atmosukarto, W. K. Leow, Z. Huang, and R. Xu. 3d model retrieval with morphingbased geometric and topological feature maps. In Proc. IEEE Conf. on Computer Vision and Pattern Recognition, 2003. Sameh M. Yamany and Aly A. Farag. Free-form surface registration using surface signatures. In Proceedings of the International Conference on Computer Vision-Volume 2, page 1098. IEEE Computer Society, 1999. C. Zhang and T. Chen. E_cient feature extraction for 2d/3d objects in mesh representation. CIP, 2001. C. Zhang and T. Chen. An active learning framework for content based information retrieval. Technical report, CMU, 2002. D. S. Zhang and G. Lu. Review of shape representation and description techniques. Pattern Recognition, 37(1):1{19, 2004. T. Zaharia and F. Preteux. Hough transform-based 3d mesh retrieval. In Proceedings of SPIE 4476 on Vision Geometry X, San Diego, USA, august 2001. Dennis Zorin and Peter Schroder. Subdivision for modeling and animation. In Siggraph 1999 Course Notes, 1999. ( http://www.graphics.stanford.edu/data/mich ) ( http://www.formaurbis.stanford.edu/index.html ) ( http://edge.mcs.drexel.edu/repository/frameset.html ) ( http://www.rcsb.org/pdb ) ( http://www.viewtec.ch/meddiv/hugo_e.html ) ( http://www.nlm.nih.gov/research/visible/visible_human.html ) ( http://marathon.csee.usf.edu/range/DataBase.html ) ( http://sampl.eng.ohio-state.edu/~sampl/data/3DDB/RID/minolta/angel.0699/index.html )

个人分类: 学术动向|12489 次阅读|0 个评论

从信息检索到信息交互

njumagic 2009-2-8 16:49

信息检索成为研究热点。在40年的系统研究和发展后，经常被忽视的是，技术和全球信息经济的发展使信息检索成为全球信息空间（cyberinfrastrucure）的一个重要部分，并成为最优秀的研究者关注的热点。新的公司如Google、亚马逊（Amazon）、eBay和巨型机构如IBM、微软已经建立了信息检索的研究开发组。在许多方面，信息检索的研究已经处于稳定水平，直到WWW的发展，为信息检索技术的研究注入了新的活力，使得信息检索技术成为支撑全球市场的电子信息交互的关键技术。本文认为，信息检索的研究重点已经发生变化，一种新的信息交互策略已经产生。这种观点包括两个方面，第一，通过对现在的信息环境和信息检索研究的趋势的观察，来考虑信息检索研究的变化。第二，通过一些例子来说明信息检索作为一种交互的过程，需要激发人的注意力和精神努力。 1．信息对象与人信息检索作为一个科学研究领域，可以分成多个组成部分，我们重点关注对我们的技术很重要的部分。信息检索一直关注的重点是信息对象以及创建、发现和使用这些对象的人。然而，因为人是比较难以预测的，也难以控制，所以信息检索研究主要关注信息对象。传统的信息对象主要是文档（document）和查询，研究主要集中在两个问题上：对象的表示和对象间关系的定义。对象的描述一直是哲学、信息科学、人工智能的典型问题。信息检索研究者已经提出了许多有效的表示文档和查询的方法，包括语言的表示（如词汇集）和基于词频（term-occurrence）、相关性的估计以及超链图等大量的数学表示。信息检索研究主要关注于等同性和相似关系（对象间的相似程度），并开发了大量的匹配算法，应用于现在的检索系统。图1是一个传统信息检索问题的示意图。图1表示，来自各自对象空间的文档和查询对象的样本都表示为一定的形式，通常使用相同的表示方法。例如，在早期的商业检索系统中，一种简单的方法是把文档和查询表示为词汇集中的一些项（terms），并简单的匹配其相交性。一种更加通俗的方法是通过把文档和查询都表示为一些项集在文档中出现的频率的向量，并根据余弦相似性排序，返回按照相似性排列的检索结果。当文档和查询表示为不同的形式的时候，就必须加入翻译、转化或者中间语言。这种以内容为中心的策略已经推动了创造性的工作，并开发出有效的检索系统。然而，同时提高查准率和查全率的研究似乎已经达到了稳定状态，进展缓慢。电子信息环境中发生的两种重要的改变，拓宽了研究计划（schema），并刺激了新的信息检索类型的研究和发展。这两种改变主要是出现了新的类型和属性的信息对象，以及对信息检索过程人的参与的进一步关注。信息检索研究者已经开始意识到这些改变，体现在信息检索研究战略小组提出的信息检索所面临的两个重大的研究、发展方向：全球信息访问（global information access）和上下文信息检索（contextual retrieval）。全球信息访问是指通过与自动化的系统（这个系统对覆盖了世界范围内任何语言的结构化和非结构化的数据）进行自然、有效的交互，来满足人们的信息需求。上下文信息检索是指把搜索技术和查询知识以及用户的上下文关系结合起来，形成一个简单的框架，提供最合适的答案，满足用户的信息需要。信息检索感兴趣的信息对象范围已经扩大，性质也发生了改变(qualitatively morphed)。一方面，信息检索感兴趣的对象范围已经扩大，不仅仅局限于文本，还包括统计数据、科学数据集和序列、图像、声音、视频、动画和其他多媒体。许多情况下，这些类型的对象可以使用同样的检索策略。另外，新的对象类型已经出现，如可执行的数据模块、交互协议和窗体、智能agent和程序，每种对象都有新类型的特征，这些特征可能对检索至关重要。比新的对象类型更重要的是，所有的对象变得更加动态化，更少的静态，并依赖于信息检索目的。例如，一个动态的blog是一个不断变化的对象，它的表示形式也同样不停的更新。这种改变来源于新对象的能力，和包含这些对象的外界环境的新能力。其实，电子对象更多的设计在于展示行为根据外界环境的改变而变化。超文本是典型的例子，托付(recommender)系统是更新的例子，而环境敏感的传感器程序装置是近来的趋势。另外，全球信息空间（the global retrieval system）存储和使用上下文信息的趋势是利用更加复杂的信息对象的内在行为。？例如，一个检索系统可能不仅表示了网页内容，而且不断的更新存取时间和引用页面。另外，系统可能增量的存储详细的在线事务的状态轨迹，甚至是用户端的鼠标移动和点击等动作。对象获取历史、注释、链接的信息，这些信息可以影响检索和使用。重要的是，这些信息同样应用于查询对象和文档对象。例如，在9.11前、后查询关于世贸中心的资料的不同。信息对象这些自然的改变为信息检索提供了挑战和机遇。信息检索的研究已经在许多战线上接受这些挑战，例如，TREC的发展轨迹。明显的，所有各种新的特征类型已经开始用于对象表示。同时，对象上下文信息将对对象的表示和对象间的关系的发现起到巨大的帮助。最重要的是有机会发现对象的新的类型的特征和新的对象间关系，这些对象间关系对检索结果有重要影响。超链接和引用是由对象创建者建立的文字上（literal）的关系，这些关系已经在页面的排序和路由算法中用于表示对象。直接(explicit)的关系是指由第三方定义的对象和观点（opinion）间的关系，可以用于将相同的观点聚类。隐含的关系是根据行为（即人和对象交互的动作轨迹）建立的，这些隐含的关系对检索的目的也有重要的影响。电子对象有许多自然的特征，电子对象间有更多的关系，这些与检索目的有关。目前，信息检索的最激动人心的事情是有许多新的领域去开发，甚至初学者都可以获得重要发现。信息的这种基本的改变将使信息检索领域出现大量的可选的表示方法和匹配算法。第二个趋势是需要一种新的信息检索策略。这种趋势越来越多的考虑了使用信息检索系统的人。尽管信息检索研究中已经存在用声音表示人的研究（如主观相关性的提倡者Saracevic ，Schamber 和Harter 。关注于检索的认知过程的有Belkin ，Ingwersen 和Marchionini ），信息检索研究者更加努力的把人和检索的问题联系起来。这种表示被成熟的应用于我们的信息检索方法中，我们希望扩展我们的问题定义以包括大量的facets，这些facets因为聚焦于信息检索问题的内容facets而被长期搁置。？图2描述了一种不同的解决检索问题的策略，而不是图1中展示的典型匹配策略。这里的信息样本被表示为一片云，而不是一个固定的数据库，因为它是动态的。图中，重点在表示的变化和动作，而不是匹配问题。索引是多样的、动态的。典型的表示信息对象的技术仍然有用，但可能被用户控制和选择而不是固定在系统中的。然而，相似性关系可以由信息搜索者根据其需要和能力而灵活的决定。因而，问题从系统优化匹配转变为让信息搜索者参与整个检索过程并做选择。在这种以用户为中心的策略中，人具有职责和能力。指望在google中使用两个词的查询请求来获得需要的所有信息是懒惰的、天真的，人必须通过别的方法来达到信息搜索的目的。一种挑战是当处理复杂的单调的任务，特别是在检索任务需要大量的行为时，人往往是懒惰的、天真的。我们解决这个问题的方法是，设想信息检索是人与信息源不断交互的生命过程，正如我们的身体通过和环境高度协调的过滤和选择作用被连接到环境中一样。在这种策略中，至关重要的系统设计挑战变成了对灵活的吸引人的表示方法、交互方式的控制机制的研究。值得注意的是，结合原来的查询/结果模式的一些新的交互方式已经普遍存在。信息检索研究使用户体验各种方法。研究者们一直努力的提供一种自动的、用户可以控制的查询表示，可以从用户相关反馈中获益的系统，并努力的提供用户帮助。除了用户产生的元数据，研究者在寻找利用用户行为和有意识的注解来为对象增加额外的元数据、特征的方法。有些研究已经利用文件（profile）来为用户建模，这些文件是由用户明确（explicitly）的完成或根据用户行为来动态生成的。近来，关注于利用明确的和自动获得的用户行为来建立（recommender）系统的研究。这些努力推动了信念挖掘的研究，信念挖掘产生新的推断关系，这些关系可以作为检索的特征。其他的努力在于为用户提供一些帮助，典型的例子是获取尽量完整交互历史。其他的方法在于保存长时期的人机交互状态（网络存档文件保存网页的状态，并考虑保持所有与特定资源的长时期的交互的信息这是许多电话公司需要做的日常事务）。其他目的在于创造一个统一的环境，使用数据挖掘规则和当时（contemporaneous）行为进行上下文信息的获取。有的研究在于建立预想的信息系统，该系统可以很好的运行在可选的分发系统上，对上下文和用户的文件产生重要作用。？所有的这些努力将丰富以人为中心的信息检索策略，并推动该领域对信息搜索进行更完整的考虑。我认为，最大的进步在于将人类的能力积极的包含到信息检索过程。到目前为止，许多研究者关注于至关重要的人机交互机制，这是这种策略的关键。 2．高度交互性的界面直接操作的思想已经由Shneiderman 引入到界面设计，并被一些研究者应用于信息检索的界面设计。Shneiderman 和他的同事把直接操作技术用于检索环境，称为动态查询系统。这个高度交互性界面的关键是使用户和不断更新的视觉信息进行交互，并允许动作的撤销。对于动态的查询，结果表示和鼠标、键盘动作有紧密的关系。其他的研究者也为数据库和信息的检索建立高度交互的环境。典型的有PARC小组的系统。关于信息检索界面的综述可以参考Hearst 的文章。我们关于信息交互界面的工作的两个例子如下。 3．1 数字视频检索作为我们开发的一个开放源码的数字视频数据库的一部分，我们已经建立并系统的评价了一系列的表示视频内容的视觉表示。这些表示方式包括基于主键的情节串连图板（storyboard）和幻灯片，快进，摘要等。这些表示是用户可选择的观察方法，可以通过文本查询或者选择等交互来选择文集中的部分内容。图3展示了一个开放的视频框架。？可以通过简单的鼠标动作来改变视图。用户可以根据需要，选择某种表示方式，并快速的获取具有不同的视觉和文本重点提示的结果集。点击一个片断的按钮(surrogate)，会生成一个完整的元数据记录，以及视频的内容的三种不同的预览： 7秒的摘要、情节串连图板和快进。点击一个按钮，立即在预览画板上显示预览，而不打开新的窗口或者改变用户的上下文信息。文本元数据同时显示。检索策略允许用户快速的移动不同层次粒度的视频，不同的粒度具有不同的表示方式，强调不同的视频特征，目的在于让用户观看视频，理解特定视频的全部上下文信息，以决定是否值得下载。实际系统也考虑了其他因素，如下载的人数、基于应用的相似性，和各种标准的目录索引、适当的超链接。系统同时支持文本查询，目的不是代替有用的功能，而是扩大系统的功能，由信息搜索者决定搜索策略。我们认为这个计划最重要的是系统的设计是基于一个交互的框架，对象表示以经验为主的，并有广泛的用户测试。这种系统开发的原则和方法来源于人机交互（HCI）和信息检索领域的评价机制。用户反馈和开放式视频数据库的应用从理论和开发的角度证明了这种经验评估的有效性。？ 3．2 与网页数据库的交互另外一个例子是一个高度交互性的界面Relation Browser＋＋，该界面使查询和结果无缝结合(http://idl.ils.unc.edu/rave)。目的是给用户展示一个完整的信息空间，并允许用户与各个基于属性集的不同信息集交互。图5－7显示了在美国能源信息管理网站上的一系列检测，数据库中有超过10000个网页的描述。这些网页已经根据他们的相关性被分为四个主要类别：燃料类型、地区、部门（sector）和处理（process），每个种类都有一些属性值。屏幕显示了页面的数量和每个属性值在文集（corpus）中的相对长度。这些页面可以利用文集（facet）中或文集间的若干个属性值来建立索引。当用户移动鼠标在一个属性值上时，页面的数量和其属性值随之被更新。这允许用户探究各个方面（facets）的关系。单击一个属性值将分割数据库，使其只包括符合情况的网页。浏览、鼠标移动是连续的、动态的，用户也可以单击搜索按钮以获得检索结果。图5中，用户可以单击属性值天然气和搜索按钮。可以看到有2916个页面是和天然气相关的，其中128个与燃料有关，576个与商业部门有关，403个与进出口有关。单击后，按钮变成重新开始，结果展现在相同的窗口中。这是交互界面的重要成分保持用户的上下文信息以使交互流不被丢失。新的窗口显示将被避免直到出现转变点（until discrete transition points）。在RB＋＋中，所有的浏览和搜索动作在相同的窗口中发生，并更新优化以避免认知中断。新的窗口只当用户单击某个记录并跳转到另外一个网页的时候使用。搜索按钮左边的是结果数量，利用类似于SQL的查询表示生成的结果出现在窗口的下面。这样，用户可以不断的浏览、在结果中执行一系列的搜索，得到一个特定的网页，或从头开始。图6展示了一个例子，当用户简单的移动鼠标到与住宅有关的属性值。所有的属性值数量和bar立刻更新，得到902个网页与天然气和住宅相关，540个网页和住宅的天然气相关。此外，搜索结果的数目也被更新，以表示902个结果是可用的。每个鼠标移动的过程实际上是一个新的查询。用户可以通过鼠标或在任何三个结果集之一中输入文本检索请求，不断的缩小结果的范围。字符串检索立刻返回匹配结果，并突出显示。图7显示了用文本house检索的结果，从2916个天然气页面中得到50个结果。关系浏览器(Relation Browser＋＋)是第三个版本，这个界面包括浏览和搜索数据库中的网页内容的功能。最新的版本是用一个java applet连接到MySQL数据库。Relation browser ＋＋及其以前版本已经应用于许多应用，界面facet的数量和属性值的数量都比较小。该界面用于大约几万条记录的中型数据库。我们已经使用了大概300万条的交互日志记录，但把元数据传到客户端的applet的速度是非常慢的。对于大型的数据库，如WWW的搜索，Relation Browser+ 更适合于与一部分搜索结果集或一个种类的页面交互。我们现有的工作目标在于开发一些自动的方法来寻找更好的facet，显示数据库中合适的页面。第一个问题是种类的发现问题，第二个问题是文本的分类问题。我们已经研究了聚类方法，使用一些常用的启发性的统计研究方法。 3．结论这里的例子用于说明使用户在信息检索中不被中断（连续的）的一些初步的研究。视频搜索和网页数据库浏览的例子目的在于利用信息检索研究的成果，使机器在人的控制下做得更好，并具有识别模式、利用各种关系进行推断的能力。通过这种方法，在检索的同时，信息被创建。用户通过行为、理解和反映等来获取用户想要的信息，而不只是通过查询请求的陈述。因而，信息交互的观念比信息检索更能体现人的活跃角色，以及电子环境中信息对象的动态性质。 (李曼舞编译)

个人分类: 学术动向|6361 次阅读|0 个评论

一则学术会议征文信息有感

timy 2009-2-4 12:18

全国第五次情报检索语言发展方向研讨会将于2009年6月在上海举办，这个是国内信息组织研究人员非常关注的一个会议。相关的会议按照学科来看，可以分为图情学科和计算机学科：国内关于信息检索的研究与实践最初源于图书情报界，主要针对图书文献进行组织和检索。图书情报界有关信息检索（早期叫情报检索，它和信息组织是紧密联系的）的会议有全国计算机信息管理学术研讨会、全国情报检索语言发展方向研讨会，中国索引学会年会及学术研讨会以及其他一些非定期的相关学术会议。全国计算机信息管理学术研讨会在业内又称机检会，因为早期主要是做计算机信息检索的人聚在一起研讨信息检索的。这个会办到现在已经20几届了，早期计算机领域的人参加较多，现在基本上只有图情的研究参加。全国情报检索语言发展方向研讨会，中国索引学会年会及学术研讨会是范围比较小的会议，基本上是图书情报界的研究人员参加。计算机界主要从检索技术与实现方面进行了大量研究，并且更侧重于对海量的，通用的信息资源进行挖掘和检索。再看看国内计算机界举办的信息检索相关的学术会议：全国信息检索与内容安全学术会议，全国搜索引擎和网上信息挖掘学术研讨会，全国计算语言学学术会议（里面有信息检索的专题）。这些会议的参加人员包括计算机界、语言学界、图情界等，从构成、范围、影响力上可以看得出这些会议有很好的生命力。同样是为了解决人类的信息需求问题，不同学科针对不同的研究对象，用自己学科的基本方法来进行坚持不懈的研究与实践。学术会议是学术交流的一个缩影，通过学术会议能从一定程度看出一个学科的发展轨迹。不同学科的融合（如研究方向的交叉、研究方法博采众长等），可以算是延续一个学科生命力的有效方法之一。 08年博主曾在博文参加SEWM2008 提到计算机界的IR-NLP-DM联合大会，那么图情界、计算机界、语言学界是否能真正融合起来，对信息组织从语言认知、理论模型、技术实现等角度进行全方位的研究，组织一个类似SIGIR、CIKM等国际会议一样（该例子也不是太恰当，现在这两个会议基本上就是计算机界的天下了，即使这样，CIKM还专门设置了Best Interdisciplinary Paper，呵呵。没其他例子举了，没办法啊。），让各种学科研究人员都能广泛参与的会议呢？以上感想，仅供参考。

个人分类: 研究方法|4960 次阅读|2 个评论

《信息检索系统导论》的编辑手记

maywuyi 2009-2-4 09:49

2008-2-29 秦老师作为代表签了合同，说6月交稿。这本书论述搜索引擎的基本理论与开发方法。市场上较多的是关于图书馆的信息检索，介绍的是如何使用检索工具，而介绍搜索引擎技术的书很少。本书基础篇讲解信息检索这门课必须掌握的基本概念、基本原理和基本技能，包括：绪论、信息检索模型、信息检索的评价、文本处理、查询(Query)处理、索引与检索、Web搜索。高级篇讲解近年来出现的最新检索方法或者研究动态，包括：文本过滤、文本分类和聚类、问答系统。 2008-6-21 6月10日，秦老师按时交稿了。按时交稿值得写吗？对，按时交稿太不容易了，秦老师多忙啊。最近她牵头又接了一项新的工程，见下面的链接，他们实验室有报道：秦兵老师获得一项国家863项目资助，题目为基于实体关系的文本内容挖掘与集成技术平台。这是5月的事情，又搞科研，又教学，还有时间写教材，那需要多大的精力和能量才能作到啊，真是佩服。我们的朱编辑正好有时间加工这个稿件。朱编辑可有耐心了，还有丰富的编辑经验，更重要的是，她的责任心着实让人钦佩，稿件交给她我就放心。为了更好地了解秦老师的工作，我上到他们的网站，看到许多许多故事和成绩，让人感动。尤其是登上刘挺老师的博客，看到大家式风范的博文，让人受益匪浅。刘挺老师的博文有丰富内容，从科研方法到最新研究，从记忆中的细节到生活哲学，立体地刻画了一个博导的风貌。而且文笔流畅、朴实生动，深深打动了我，让我流连忘返，直到凌晨才离开计算机。下面有相关链接。 http://blog.sina.com.cn/tliu7221 2008-7-3 信息检索系统导论在China-pub上提前预告了，地址见下面的链接 http://www.china-pub.com/208974 。刚开始预告就有人评论了，心理特美。自己几天来连续晚上加班看稿子，心理也得到了平衡。我一定仔细做好这本书。看稿子的过程很费劲，书稿中含有大量数学公式，算法分析，别说看不懂数学公式，就光这些内容如何表达就让我和朱编辑大伤脑筋。使用怎样的字体？怎样的格式？都关乎读者的阅读体验。让一个内涵复杂的图书表达清楚，着实费劲。在读稿件的过程中，越发佩服朱编辑，她怎样在三周的时间里提出了447个问题？让作者都感到吃惊。只要有一点表达不清楚的地方、可能错漏的地方，朱编辑都不放过。没有多年编辑工作经验是发现不了这么多问题的，没有很高的责任心也是做不到这点的。朱编辑提的问题类型如下：1. 术语如何定义才清楚，语法才规范，绝不含糊。2. 英文术语不好翻译，但是规定都要翻译中文的，如何翻译才合理。3. 术语前后是否表达一致。4. 语言表达是否流畅。 2008-9-10 我们已经编辑完并校对完全稿。打算请人进行评议。我联系了几个老师，他们异口同声地说认识刘老师和秦老师，很愿意仔细读这本书。可见刘老师和秦老师在业界的影响。大连理工大学的林鸿飞教授写了一篇中肯的书评，记录如下。信息检索课程的示范教材-----读《信息检索系统导论》随着因特网的日益普及，它已经渗透到我们生活的各个角落，改变着我们的生活方式和思维方式。搜索引擎作为人们使用因特网的重要入口，引起人们广泛的重视和关注。尤其是以谷歌和百度为代表的搜索引擎公司的兴起，很多的青年学子对于搜索引擎技术产生了浓厚的兴趣，在高校的校园内，与搜索引擎相关的课程和讲座也日益火爆。在这种潮流之下，急需一本合适的教材，引导学生系统地学习基础理论和算法，冷静地思考信息检索的核心问题和未来的趋势，积极地参与因特网的搜索引擎及其相关领域的研发活动。哈尔滨工业大学的刘挺教授和他的同事编写的《信息检索系统导论》正是这样一本学习和掌握信息检索理论和技术的好书。它具有很多独到之处，颇具特色。（1）该书系统地梳理了信息检索及其相关概念，因特网的特征之一就是海量信息，同时相关概念也是目不暇接，层出不穷，本书系统地论述了这些相关概念之间的区别和联系，例如情报学领域的信息检索和计算机领域的信息检索、信息检索与搜索引擎、文本挖掘和数据挖掘、信息检索与自然语言处理、分布式计算、数据库等之间的关系、信息检索中的关键技术及其应用研究等。（2）信息检索是正在发展的技术，存在许多需要完善和改进的地方，还不断涌现新的应用需求，因此需要将学习、研究和应用集为一体。该书将最新的科研成果融入教材之中，例如隐性语义分析、统计语言模型、本体论以及信息过滤和问答系统。内容安排详略得当，深入浅出，即强化了学生对于基础理论和算法的学习，又满足了对于学生对于目前研究前沿技术的渴望，进而鼓励和引导学生去解决目前搜索引擎中存在的问题和不足。由于作者在信息检索领域取得了出色的研究成果，积累了丰富的研究经验，积淀了大量应用案例，因此举例生动、数据详实、简明有效。（3）面对因特网上海量信息，如何评价检索系统的性能优劣是人们比较关心的问题。设计检索算法是必要的，但是如何评价检索算法也是必须掌握的，这对于培养学生严谨的学风很有帮助。该书在介绍信息检索各种模型和应用的同时，详细介绍了相关的评测指标和评测办法。而且对于美国的NIST和DARPA主持的TREC，日本的NII主办的NTCIR和欧盟主办的CLEF以及国内的863评测和SEWM评测进行了比较详尽的介绍，使学生可以通过专门的技术评测来学习和评价各种信息检索技术。毫无疑问，该书的出版将会对信息检索课程建设起到示范作用，帮助更多的读者提高对信息检索的兴趣，对于信息检索领域的研究和应用将产生积极的影响。 2008-12-9 《信息检索系统导论》终于出版了。从9月到12月，反复修改多次，作者也看过三次，去印刷时还是怀着忐忑的心情。封面设计、装帧、印刷都很好，拿到样书时喜悦的心情无以言表。忽然发现在目录上有一个错字，唉，心里别提多懊恼了。最后一次样子没有看，因为只修改几处，大意了。时间拖了很长了，为了赶时间，还是由于兴奋而放松了心情，总之都不是理由。只好拉回印刷厂重新修改。为一个字重新印刷的费用很高啊，真是一字千金。

个人分类: 读书笔记|4665 次阅读|0 个评论

《工程信息检索教程》的编辑手记

maywuyi 2009-2-4 09:32

2007年底，信息检索课程已经被全国工程硕士专业学位教学指导委员会正式列为公共必修课。我们觉得出版这个课程的教材很有意义。于是联系了王知津教授，他马上就答应了。王老师很认真，组织了12人的编写小组，开了三次编委会。编委会成员除了南开大学以外，还包括天津大学、天津工业大学、天津科技大学、天津理工大学、山东建筑大学等，都是在信息检索课教学第一线的教师。第一次编委会，研究了编写原则、指导思想、编写思路以及编写大纲等。王老师还请了2位业内专家参与大纲的讨论。第二次编委会讨论了章节的结构及细节内容，第三次编委会统一体例格式。我在2008年1月27日到南开大学参加了他们的第三次编委会，与老师们讨论了格式问题和教材拓展问题，希望能编写出立体化的教材，包括教辅等内容。说起与王老师的交情，要回溯到2年前合作出版一本翻译教材。在那次合作中与王老师有很多的交往，深刻了解王老师的做事风格与态度，想必我们的工作情况也给王老师留下过不错的印象。但是我们从没见面。这次王老师带领所有参编人员一起交流，开会变成了朋友会面，愉快的场景深深印刻在了我的记忆里。 2008-2-28昨天已经把签定好的合同快递给王知津老师了。计划6月交稿。这个教材有如下特点： 1）重点介绍现代信息检索的基本理论与方法，包括信息检索领域的最新成果，强调外文信息检索的方法。（区别于本科教材和科学硕士教材。本科教材比较简单而且泛化，中文信息多，外文信息少。科学硕士教材很少，有的包含很多学科，有点杂。） 2）专门针对工程硕士领域的信息检索，包含目前40个全国工程硕士培养领域。 3）为了使工程硕士快速掌握信息检索方面，专门设计了综合示例。 4）突出实用性，注重工程硕士的科研能力的培养。 5）完全介绍电子信息检索，不包含已经落后的纸制信息检索。（旧教材中会有）王老师交稿时间很准时，6月底就交稿了。但编辑的过程很痛苦，时间很长，做了很大的修改，删掉三分之一的内容。为什么这样折磨自己呢？因为信息检索类的大学教材多如牛毛，据说有7000多种。我们的教材如何才能有自己的特色，如何能打动读者和教师。我们参考了多本教材，研究了各类教材的优劣，对读者对象问题进行了详细的讨论。最后一遍通读是在元旦的时候。现在终于定稿了。但是春节的到来，又一次推迟了书稿的进展。真是一波三折。 2009-2-2 《工程信息检索教程》就要出版了，对于封面设计我们进行了多次讨论，设计部门拿出了五种方案，才定稿。真是难为了设计部的同事。

个人分类: 读书笔记|3830 次阅读|0 个评论

现代信息检索原理与技术——出版一本科技图书的过程（待续）

maywuyi 2009-2-3 10:46

第1次见到王老师是在2008年的春天，五月的北京已经春深似海，阳光灿烂。尽管在网上与王老师聊过很多次，但是从来没有见过面。因为有过很多话语交流，王老师的形象已经在我的脑海里形成：有敏捷的思维头一般比较大，说话很快会比较瘦，话语很有吸引力两眼有神采。见面后果然有八分像，只是他独特的个人魅力只有当面才能感受到：他那睿智的双眼、微笑的嘴唇更能生动地描绘出一个智者的形象。第二次见到王老师是在2008年11月15日北京清华的NCIRCS 2008会议上。我们只用很短的时间聊了一会儿。要知道，听智者一句话胜读一年书啊，一会儿的时间我听了王老师的很多句话，真是胜读很多年书。王老师打算出书的题目是《现代信息检索的技术与实现》，计划明年交稿。这会对搜索引擎技术领域做出贡献。他的书尤其对打算进入搜索引擎技术领域的年轻人有很好的指导。我们期盼着。

个人分类: 读书笔记|4177 次阅读|3 个评论

读《信息检索系统导论》【转载】

timy 2008-12-5 13:55

转载于： http://blog.csdn.net/hzbooks/archive/2008/11/26/3380348.aspx 读《信息检索系统导论》随着因特网的日益普及，它已经渗透到我们生活的各个角落，改变着我们的生活方式和思维方式。搜索引擎作为人们使用因特网的重要入口，引起人们广泛的重视和关注。尤其是以谷歌和百度为代表的搜索引擎公司的兴起，很多的青年学子对于搜索引擎技术产生了浓厚的兴趣，在高校的校园内，与搜索引擎相关的课程和讲座也日益火爆。在这种潮流之下，急需一本合适的教材，引导学生系统地学习基础理论和算法，冷静地思考信息检索的核心问题和未来的趋势，积极地参与因特网的搜索引擎及其相关领域的研发活动。哈尔滨工业大学的刘挺教授和他的同事编写的《信息检索系统导论》正是这样一本学习和掌握信息检索理论和技术的好书。它具有很多独到之处，颇具特色。（1）该书系统地梳理了信息检索及其相关概念，因特网的特征之一就是海量信息，同时相关概念也是目不暇接，层出不穷，本书系统地论述了这些相关概念之间的区别和联系，例如情报学领域的信息检索和计算机领域的信息检索、信息检索与搜索引擎、文本挖掘和数据挖掘、信息检索与自然语言处理、分布式计算、数据库等之间的关系、信息检索中的关键技术及其应用研究等。（2）信息检索是正在发展的技术，存在许多需要完善和改进的地方，还不断涌现新的应用需求，因此需要将学习、研究和应用集为一体。该书将最新的科研成果融入教材之中，例如隐性语义分析、统计语言模型、本体论以及信息过滤和问答系统。内容安排详略得当，深入浅出，即强化了学生对于基础理论和算法的学习，又满足了对于学生对于目前研究前沿技术的渴望，进而鼓励和引导学生去解决目前搜索引擎中存在的问题和不足。由于作者在信息检索领域取得了出色的研究成果，积累了丰富的研究经验，积淀了大量应用案例，因此举例生动、数据详实、简明有效。（3）面对因特网上海量信息，如何评价检索系统的性能优劣是人们比较关心的问题。设计检索算法是必要的，但是如何评价检索算法也是必须掌握的，这对于培养学生严谨的学风很有帮助。该书在介绍信息检索各种模型和应用的同时，详细介绍了相关的评测指标和评测办法。而且对于美国的NIST和DARPA主持的TREC，日本的NII主办的NTCIR和欧盟主办的CLEF以及国内的863评测和SEWM评测进行了比较详尽的介绍，使学生可以通过专门的技术评测来学习和评价各种信息检索技术。毫无疑问，该书的出版将会对信息检索课程建设起到示范作用，帮助更多的读者提高对信息检索的兴趣，对于信息检索领域的研究和应用将产生积极的影响。林鸿飞大连理工大学计算机学院教授 (博主注：近10年来，国外已经有好几本很受欢迎的信息检索技术教材或专著，比如Manning等人今年出版的《 Introduction to Information Retrieval 》。由于中文在自然语言处理上的独特性，同时随着自然语言处理和信息检索技术今后更加紧密的结合，相信国内未来会在信息检索领域，出现更多有影响相关教材和专著。）

个人分类: 信息检索|6452 次阅读|1 个评论

情报学系列会议评介：计算机信息管理学术研讨会

huabolin 2008-12-5 10:19

化柏林第二十二届全国计算机信息管理学术研讨会于 2008年11月29日-2008 年12 月1 日在深圳召开，来自全国情报技术界的40 余位学者参加了此次会议。第二十二届全国计算机信息管理学术研讨会由中国科学技术情报学会信息技术专委会主办，圈内简称机检会，今年是第二十二届。本系列会议曾有过辉煌的历史，八十年代会议规模很大，海外参加人员也较多，在检索界的影响也是独一无二的，详情请见曾民族研究员撰写的《计算机情报检索学术活动历史回顾见证中国科技情报现代化历程》（第二十届全国计算机信息管理学术研讨会论文集）。近几年的系列会议，呈现以下几个特点： 1. 老专家的关注一如既往，新生力量热情高涨，中坚力量略显单薄曾民族、霍忠文、赖茂生等老专家坚持参会，并从宏观上把握学科发展；新生力量特别是研究生踊跃参加，并展示了具体的实验或系统。 35岁到45岁的情报技术人员略显匮乏。 2．相关公司高度关注清华同方、万方数据、拓尔思（ TRS）依然是本系列会议的主要赞助商，公司总工程师或软件研发部门经理到会祝贺并带来应用性很强的学术报告。 3．国防军口是主力本次会议除中国国防科技信息中心有十多位学者参与之外，还有解放军政治学院上海分院、军械工程学院、后勤指挥学院、第四军医大、解放军医学图书馆、兵工 202所、成都飞机研究所等很多学者。 4．交流火候很重要因为有一半的军口人员参加，加之相关公司技术人员参加，所以大家在报告时都会很注意，既要向大家展示自己的研究进展，又不能泄漏军事秘密或商业秘密。 5．在检索界的影响有所下降过去机检会是国内检索会议的一枝独秀，影响力颇大。而近几年又兴起了两个重要会议，分别为全国搜索引擎和网上信息挖掘学术研讨会议和全国信息检索与内容安全学术会议。全国搜索引擎和网上信息挖掘学术研讨会议目前已举办六届，本系列会议参照 TREC方式，以评测为主。前五届由中国计算机学会互联网专业委员会主办，从第六届开始由中国计算机学会主办，优秀论文可发表在 EI源刊上。全国信息检索与内容安全学术会议已举办四届，是由中国中文信息学会信息检索与内容安全专业委员会主办的。从会议的组织来看，三个会议隶属三个一级学会，分别为情报学会、计算机学会、中文信息学会，已形成三足鼎立的局面。 6．探索新的前沿进展既然在检索界的影响有所下降，那么一定要根据学科的特点，探索新的生长点。最近五届信息管理学术研讨会紧紧围绕知识服务做文章，包括知识服务的关键技术、知识组织的现状和趋势、知识处理技术研究、知识服务的效果评估等主题展开了新一轮的前沿探索。这也进一步验证了情报人员的信息敏感性及前沿洞察力。

个人分类: 会议感发|7317 次阅读|2 个评论

信息检索与信息抽取差异性探析

huabolin 2008-10-27 10:29

信息检索与信息抽取差异性探析郑彦宁，化柏林，张新民中国科学技术信息研究所北京 100038 （发表于《图书情报工作》2007年第10期）通过发表论文、会议组织、出入口、关键技术、发展趋势等方面对信息检索与信息抽取进行比较分析，结果发现信息抽取与信息检索有着质的不同。信息抽取不是信息检索的发展方向，但信息抽取技术可以很好地应用于信息检索系统。分析两者之间的差异有利于研究的深入，理清它们的关系有利于共同促进。 ******************************************* 论点一：信息检索强调对检索入口进行控制，并不对检索出口进行控制信息检索策略的调整只能决定检索结果的多与少，并不能决定每条检索结果的大与小。查到了相应的文献，而在文档中有许多不需要的信息，通过信息抽取把需要的信息单元抽取出来，过滤掉其它信息。 ************************************* 论点二：信息检索的粒度要比信息抽取的粒度大信息检索以篇为单位，信息抽取以篇中的信息单元为处理单位。信息检索一般返回整篇文献，而信息抽取是返回信息的某个单元。 ************************************* 论点三：信息检索的最终用户是人，而信息抽取的用户是计算机。信息检索由人构造检索式，通过系统进行检索，得到检索结果由人来查看，整个过程中体现着人机交互。而信息抽取一般是系统根据模板和预先设定的规则，通过分析文本抽取需要的内容，信息抽取系统一般不单独使用，往往是为其它系统提供技术工具，信息抽取过程往往不需要人机交互。 ************************************* 信息检索与信息抽取差异性探析

个人分类: 信息检索|5225 次阅读|0 个评论

关闭安全验证

标签: 信息检索

相关日志

帐号		自动登录	找回密码
密码			注册

关闭 安全验证

标签: 信息检索

相关日志

关闭安全验证