随着数据收集和存储技术的不断发展,各行各业积累了大量的数据。为了从这些数据中获取有用的知识,数据挖掘技术越来越多地被数据分析人员所使用。关联规则挖掘作为数据挖掘领域的一项关键技术,目前在许多领域得到了广泛的应用 。关联规则算法可以产生大量的规则。但是由于资源的有限性,只能有部分规则可能被决策者选择出来使用 ,因此关联规则的兴趣度评价对于关联规则挖掘技术的实际应用具有重要意义。 关联规则的兴趣度可以通过兴趣度度量来评价。目前存在的兴趣度度量主要包括客观的度量和主观的度量 。客观的度量主要考虑数据的统计显著性,如关联规则挖掘中用到的支持度、置信度和提升度。主观的度量综合考虑原始数据和用户的领域知识。文 提出将用户的领域知识作为约束集成到关联规则挖掘系统中,获得用户感兴趣的规则。文 认为在挖掘的过程中,用户应该和关联规则挖掘系统进行交互,来判断规则是否感兴趣。文 和文 基于效用理论,提出了加权支持度和置信度来衡量关联规则兴趣度。 对于许多关联规则挖掘的特定应用领域,用户所感兴趣的挖掘结果可能涉及到多个方面。如在购物篮分析中,用户除了关注规则的统计显著性指标之外,可能对规则可以带来的销售利润也很关心。也就是说,对关联规则的评价应当是一个多属性决策问题。文 将PROMETHEE方法应用于关联规则评价,获得用户感兴趣的模式;文 同时考虑了客观的兴趣度度量和用户的主观偏好,将AHP-ELECTRE II方法用于关联规则排序,实现了关联规则挖掘同决策分析的集成。文 和 分别使用两个不同的数据包络分析(DEA)模型,对同一关联规则集进行了评价。 从文 和 的评价结果对比来看,对于同一关联规则集使用不同评价方法得出的评价结果存在一定程度的差异,当用户同时面临多种评价结果时,便会产生困惑,不利于决策。由于每种评价方法得出的结果都是对评价对象客观状态某个视角的反映,因此有必要综合考虑多种评价方法的评价信息,对评价结果进行集成,以得到更好的评价结果 。但如何选取合适的评价指标并建立关联规则评价指标体系,如何将现代综合评价方法与决策方法应用于关联规则评价 ,并对单一方法得到的评价结果进行综合集成,都是需要进一步研究的问题。 参考文献 Tan P N, Steinbach M, Kumar V. Introduction to data mining . Pearson Addison-Wesley, 2005. Choi D H, Ahn B S, Kim SH. Prioritization of association rules in data mining: Multiple criteria decision approach . Expert Systems with Application, 2005, 29(4): 867-878. Geng L, Hamilton H J. Interestingness measures for data mining: a survey . ACM Computing Surveys, 2006, 38(3): 1-32. Padmanabhan B, Tuzhilin A. A belief-driven method for discovering unexpected patterns . Proceedings of the 4th International Conference on Knowledge Discovery and Data Mining.1998: 94–100. Sahar S. Interestingness via what is not interesting . Proceedings of the fifth ACM SIGKDD international conference on Knowledge discovery and data mining.1999: 332-336. Lu S F, Hu H P, Li F. Mining weighted association rules . Intelligent Data Analysis, 2001, 5(3): 211-225. Shen Y D, Zhang Z, Yang Q. Objective-Oriented utility-based association mining . Proceedings of the 2002 IEEE International Conference on Data Mining.2002: 426–433. 陈中祥, 吴相林, 岳超源. 基于PROMETHEE的模式兴趣度评估方法研究 . 系统工程与电子技术, 2003, 25(9): 1090-1093. Chen MC. Ranking discovered rules from data mining with multiple criteria by data envelopment analysis . Expert Systems with Application, 2007, 33(4): 1110-1106. Toloo M, Sohrabi B, Nalchigar S. A new method for ranking discovered rules from data mining by DEA . Expert Systems with Application, 2009, 36(4): 8503-8508. 郭崇慧, 张震. 基于组合评价方法的关联规则兴趣度评价 . 情报学报, 2011, 30(4):353-360. 郭亚军, 易平涛. 一种基于整体差异的客观组合评价法 . 中国管理科学, 2006,14(3):60-64. 岳超源. 决策理论与方法 . 北京: 科学出版社, 2003.