||||
第一节:搜索引擎使用技巧;
揭示为什么“图书馆”的检索结果比“图书”的检索结果多。除了检索词的逻辑组配外,通过范围限定、类型限定等操作,如何把搜索引擎的检索结果控制在百条之内,实现快速准确地获取所需信息。通过批量或系列检索得到综合信息,从这些信息中分析出情报。
第二节:网页信息采集方法
不可复制的网络页面信息该如何获取?网站下载工具获取批量信息;根据URL表达式通过for循环获取批量信息;通过自建网页浏览器构获取批量信息。
第三节:搜索引擎的技术实现
搜索引擎包括三部分:网络爬行、标引入库、响应检索。通过技术实现剖析搜索引擎的检索结果为什么会这么多,速度会如此快(亚秒级)?
第四节:搜索引擎的发展趋势
分别从信息采集(Input)、分析标引(Process)、响应检索(Output)三个方面讨论搜索引擎的发展趋势,以及如何实现这些新型搜索?
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-5-6 09:02
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社