科学网

 找回密码
  注册

tag 标签: 知识抽取

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

基于篇章内容分析的文本信息处理系统差异性探析
huabolin 2008-10-24 18:42
基于篇章内容分析的文本信息处理系统差异性探析 化柏林 (中国科学技术信息研究所 北京100038) (发表于《情报杂志》2008年第9期) 摘 要 以篇章内容分析在知识抽取、自动文摘、自动问答、文献自动综述的作用为切入点,剖析这四类信息处理系统的分类、主要流程、关键技术。然后分析出知识抽取、自动问答、自动文摘、文献自动综述在处理对象、处理结果、处理过程、分析层面、分析粒度等方面的区别,总结基于篇章内容分析的四类信息处理系统之间的共性与发展现状,并探讨它们的发展趋势。 全文:基于篇章内容分析的文本信息处理系统差异性探析
个人分类: 文本分析|4046 次阅读|0 个评论
国内外知识抽取研究进展综述
huabolin 2008-10-24 13:43
国内外知识抽取研究进展综述 化柏林 (中国科学技术信息研究所,北京 100038) (发表于《情报杂志》2008年第2期) 信息泛滥与知识贫乏的问题越来越突出,用基于 NLP的技术从文献中抽取知识有望解决这一矛盾。首先对知识抽取的含义进行界定,接下来论述知识抽取的意义。通过对国内外知识抽取研究现状的分析总结知识抽取的抽取对象、抽取模式。发现国内关于知识抽取研究差距较大,从文献中抽取知识并进行实验研究的还很少,有待重视。 全文:国内外知识抽取研究进展综述
个人分类: 知识抽取|5221 次阅读|1 个评论
基于NLP的知识抽取系统架构研究
huabolin 2008-10-24 13:20
基于NLP的知识抽取系统架构研究 化柏林 中国科学技术信息研究所,北京 100038 (发表于《现代图书情报技术》2007年第10期) 摘 要 在参考自然语言处理平台及知识抽取系统的系统结构的基础上,提出一个基于 NLP 的知识抽取系统的详细设计方案。自然语言处理过程包括分词、词性标注、句法分析、语义分析等八大模块,知识抽取过程包括论文类型分析、篇章结构分析、知识抽取、知识表示等四大模块。通过对基于 NLP 的知识抽取系统架构的研究,明确自然语言处理与知识抽取的关系,分析出知识抽取的系统流程及关键技术。 全文:基于NLP的知识抽取系统架构研究
个人分类: 知识抽取|4880 次阅读|0 个评论
知识抽取中的嵌套向量分词技术
huabolin 2008-10-24 13:16
知识抽取中的嵌套向量分词技术 化柏林  赵 亮 (中国科学技术信息研究所 北京100038) (发表于《现代图书情报技术》2007年第7期)   【摘要】 向量分词算法已经比较成熟,通过在知识抽取过程中实现向量分词算法,对向量切分中的关键技术进行归纳总结,同时发现一趟向量切分的不足,并针对这些不足,设计嵌套的向量分词技术。实验证明,在知识抽取过程中,采用嵌套的向量切分方法,不但切分准确率高、切分全面,而且能从根本上解决词中有词的问题,有利于后续的句法分析。 全文:知识抽取中的嵌套向量分词技术
个人分类: 知识抽取|3700 次阅读|0 个评论
知识抽取中的停用词处理技术
huabolin 2008-10-24 13:13
知识抽取中的停用词处理技术 化柏林 ( 中国科学技术信息研究所,北京 100038) (发表于《现代图书情报技术》2007年第8期) 【摘要】 在知识抽取的分词过程中,需要提前把停用词标引出来。停用词处理的关键在于停用词的认定、停用词表的获取与组织技术以及停用词匹配技术。停用词的识别常常需要停用词表,识别过程中需要判断假停用词以降低噪声。实验表明,对停用词进行单独处理可以大大加快词语切分速度以及后续的句法分析归约速度。 知识抽取中的停用词处理技术
个人分类: 知识抽取|4644 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-16 06:46

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部