学习&研究的博客分享 http://blog.sciencenet.cn/u/FangliXie 路漫漫其修远兮,吾将上下左右东西南北中所到之处无不披靡而求索。

博文

按标题搜索
文献阅读笔记(5)-网页分块相关研究综述
2014-6-24 14:05
网页分块相关研究综述 传统的网页分块方法可以分为三类:基于模板的方法、基于视觉的方法、基于标签的方法。 基于模板的方法 利用 模板(Template )和一些规则(规则由Regular Expression 表示) 从网页中抽取内容块。模板需要事先从站点中收集一些样本网页来构造。尽管这种方法简单易用很少 ...
个人分类: 科研笔记|2000 次阅读|没有评论
文献阅读笔记(4)-使用网页分割识别网页的信息内容块
2014-6-20 23:08
Identifying Informative Web Content Blocks using Web Page Segmentation 使用网页分割识别网页的信息内容块 解决问题 网页由信息内容块和非信息内容块组成。信息内容块是指网页的主题内容,非信息内容块是指网页中的广告、导航、隐私声明等等。前者是搜索引擎检索的主要目标 ...
个人分类: 科研笔记|1900 次阅读|没有评论
文献阅读笔记(3)-网页去噪效果评价方法
2014-6-3 15:59
网页去噪效果评价方法 张恒,屈景辉,张亮.网页文本信息提取及结果评价_张恒 .微计算机应用,2007(9):27-30. 1 )文章创新点: 提出了信噪比的概念作为网页去噪的性能衡量指标。信噪比的定义:要提取信息的字符总数与噪声信息的字符数之比。公式如下: 2 )评价方法: 本文并没有对 ...
个人分类: 科研笔记|2931 次阅读|没有评论
文献阅读笔记(2)-科学数据共享
2014-5-14 18:28
主题: 科学数据共享 兴趣点: “数据挖掘”与“科学数据”结合起来的研究 阅读目的: 寻求研究点,为写 论文研究计划 作准备。 文献管理软件: CNKI E-lear ning 入手文献: 40+ 今日进展: 把过去两天下载下来的文献摘要通读了一遍,部分看了全文,用了一个小时左右(其余大部分时 ...
个人分类: 科研笔记|1865 次阅读|没有评论
文献阅读笔记(1)-科学数据共享
2014-5-12 23:31
主题: 科学数据共享 兴趣点: “数据挖掘”与“科学数据”结合起来的研究 阅读目的: 寻求研究点,为写 论文研究计划 作准备。 工具: CNKI SCHOLAR(检索中文文献);WEB OF SCIENCE(检索英文文献) 检索词: “科学数据”;“DATA MINING” 入手文献: 19篇中文(第一部分10篇, ...
个人分类: 科研笔记|1972 次阅读|没有评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2023-2-8 18:03

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部