张利华
可拓数据挖掘研究综述 ——2001年可拓数据挖掘研究迎来第一次热潮
2021-9-22 21:40
阅读:1417

可拓数据挖掘研究综述

——2001年可拓数据挖掘研究迎来第一次热潮


2001年,大连海事大学管理科学与工程专业硕士研究生葛维燕在刘巍等教授的指导下发表硕士论文《数据挖掘技术及其在数据集市中的应用》,在综述主流的数据挖掘方法的基础上详细论述了数据挖掘技术中关联规则、多值属性的关联规则,并理论联系实践的探讨如何结合可拓信息,比较粗糙集、可拓集规则[2]。同年9月,该校研究该方向的硕士毕业生康松林来到中南大学铁道校区信息工程学院,与费洪晓在《长沙铁道学院学报》2001年第3期发表论文“数据挖掘的软分类方法”,进一步提炼硕士研究阶段的成果:“在可拓集合的基础上提出一种软分类方法,作为一种非经典的数据挖掘方法,弥补了经典数据挖掘方法的不足” [4]

广东工业大学经济管理学院张立厚,聂永瑜,许一敏在《广东工业大学学报》2001年第01期发表论文“知识管理中的可拓工程初探”,从知识表达和知识挖掘两个热点讨论了可拓原理与方法在知识管理中的初步应用构想。提出“把可拓学的基本原理与方法应用于知识管理,可能为解决知识管理中的矛盾问题提供有效的工具,使知识管理的形式化和规范化程度大大提高”,同时还可以进一步发展和丰富可拓学。该文首先探讨了如何进行“知识的可拓表示”,建议“融合关系表示与语义网表示的基本思想组成知识的可拓网络”,并对可拓网络进行了形式化描述。在此基础上进一步讨论了知识的可拓挖掘问题,提出“知识挖掘是把深藏着的知识开发出来”,具体包括把隐性知识显性化和数据挖掘两个部分,认为利用可拓学提供的可拓思维与可拓方法可以解决“知识管理中难以有效地揭示、分类和共享有价值的隐性知识”的难题,为隐性知识显性化提供既形式化又通俗易懂的思维方法与可操作工具。文章最后建议“为了把可拓学原理与方法应用于数据挖掘,可以建立以物元及事元为基本单元的数据仓库。”“通过不同角度对事物、特则和量值进行统计分析与预测,在运用可拓学的原理与方法来开拓、评价和优选,可以为各类决策提供具有拓展性的相关知识。” [3]

与此同时,该学院的张应利、何斌在《数学的实践与认识》期刊2001年第5期发表论文“基于物元可拓性的潜信息挖掘”,提出“潜信息挖掘是数据挖掘的核心内容”,文章应用可拓论提出了基于物元可拓性的潜信息挖掘方法这一全新课题,并利用物元的发散性、相关性、蕴含性初步探讨了相应的各种潜信息挖掘方法。具体讨论了潜信息涵义,提出潜信息这一概念是相对于已知的显信息而言,是指隐含的、事先未知的并具有潜在价值的信息,是基于显数据与显信息,经过一定的数据挖掘方法获得的,这种数据挖掘的特点是着眼于高效的算法,达到从海量的数据中发现知识的目的。而潜信息挖掘的任务是从大量显化数据中发现未知的、潜在而有价值的知识。这里的知识即可以是概念(Concepts)规则(Rules)也可以是模式(Patterns)和约束(Constraints),都可以利用物元或事元表达式给出具体的内涵表示,不仅可以直接构建知识库、方法库和规则库,还可以利用计算机人机交互接口直接为管理者提供决策支持[5]



[2]葛维燕. 数据挖掘技术及其在数据集市中的应用[D].大连海事大学,2001.

[3]张立厚,聂永瑜,许一敏.知识管理中的可拓工程初探[J].广东工业大学学报,2001(01):76-79.

[4]康松林,费洪晓.数据挖掘的软分类方法[J].长沙铁道学院学报,2001(03):69-73.

[5]张应利,何斌.基于物元可拓性的潜信息挖掘[J].数学的实践与认识,2001(05):569-575.



转载本文请联系原作者获取授权,同时请注明本文来自张利华科学网博客。

链接地址:https://m.sciencenet.cn/blog-520919-1305282.html?mobile=1

收藏

分享到:

当前推荐数:2
推荐人:
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?