武夷山分享 http://blog.sciencenet.cn/u/Wuyishan 中国科学技术发展战略研究院研究员;南京大学信息管理系博导

博文

几位学者对目前数据挖掘方法的“判词” 精选

已有 6405 次阅读 2011-11-1 06:50 |个人分类:图书情报学研究|系统分类:观点评述|关键词:学者| 挖掘

几位学者对目前数据挖掘方法的“判词”

武夷山

美国Montclair州立大学的John Wang和另外两所大学的两位华裔学者在International Journal of Business Intelligence and Data Mining(企业情报和数据挖掘杂志)(注:黄富强博主认为,译为“商业智能”较好,不是企业情报2007年第2期发表文章,Diminishing downsides of data mining,文章评点了几种常用数据挖掘方法的特点,尤其是缺点。

1.             神经网络方法。很多挖掘工作都是基于神经网络方法,其缺点有两个,一是神经网络的学习过程很耗时,因此,对于大规模的数据集合,这个方法效率不高;二是不直观,仿佛是个黑箱处理过程。

2.             决策树方法。其主要缺点是,如果训练集是含有噪声的,就可能找不出有效的树。

3.             遗传算法。该算法需要很大的计算量,这就是其主要缺点。

4.             模糊逻辑。这个领域的研究,日本较发达,美国落后。在英语中,Fuzzy有负面含义,在日语中,却暗含“聪明”之义。

5.             数据可视化。这种方法,在数据量很大的时候,就不易发现潜藏的模式了。所以,要采用三维表现手法,这对模式识别有帮助。

 

博主:又过去四年了,数据挖掘领域在不断发展,但上面的“判词”似乎没有被颠覆。



https://m.sciencenet.cn/blog-1557-503251.html

上一篇:[转载]中医原创思维研究列入“973”
下一篇:社会诚信缺失与政务诚信缺失--陆欣义父母的再次呼吁

22 许培扬 赵明 钟炳 陈湘明 李学宽 赵凤光 金小伟 李泳 孙广东 刘用生 化柏林 刘锋 刘玉仙 黄富强 赵星 许浚远 黄锦芳 邹谋炎 吴吉良 陈绥阳 王芳 crossludo

该博文允许注册用户评论 请点击登录 评论 (14 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-18 20:57

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部