|||
??我们在《数据挖掘技术及应用》中的分类一章介绍了神经网络和遗传算法,其实,这两个方法可以单独介绍,因为它们不仅仅可以用来进行分类。
??不过,因为课程不是在讲纯粹的方法,而是就数据挖掘中的若干方向进行介绍,所以,把这些通用型的方法放在其中的一章也就无不可了。
??首先,在课程开始的时候,我先带着大家复习上一节课的内容,先问什么是监督型的学习,什么是非监督型的学习?结果,糟糕的是,大家肯定回去都没有看书,问到的都没有回答很好,抓紧翻书的人看到了一点东西,算是回答了出来,不过也有不够贴切的地方。
??然后是决策树这个最普遍的分类方法,问了下倪慧荟决策树分支生成的基本策略,回答得很好,知道可以利用信息增益和Gini Index来进行衡量分叉的属性,以完成决策树的生长。
??复习完后,我们才来开始讲神经网络。
??Artificial Neural Network(ANN)是美国心理学家MCCulloch与数学逻辑学家Pitts于1943年提出,他建立了第一个MP模型,说到它用于分类,到了1950年,才有Rosenblatt首次将单层感知器用于分类。可以说,人工神经网络模型是模拟人脑神经元的数学模型为基础而建立的,它由一系列处理单元(节点)组成,节点间彼此互连。
??接着我们对从不同角度分类神经网络进行了介绍,对那几类典型的神经网络,如BP网络,SOM,Hopfield,ART等。然后对单层感知器这种最经典的神经网络的建模方式、训练算法等进行了介绍。最后对病人和药品之间的分类案例进行了建模分析。评价了神经网络的优点和缺陷。
??神经网络如果说是科学家通过对人类本身通过神经元进行学习的过程进行模拟而给出的一种思维方式的话,那么,遗传算法就是根据生物种群遗传和变异的规律性进行分析之后得出的一种思维方式,它们都能够部分地解释世界并模拟世界运行的规律,都不完全正确,但是有其适用范围。
??我们先介绍了遗传算法的大致思想,对于所谓适应度的评价,以及几个典型的算子:选择、交叉、变异。然后就一个分类的例子进行了说明。
??课程从3点半开始,5点半结束,因为张睿女朋友也前来听课,且是第一次我见到,这样,就一起去了物科宾馆吃饭,顺致对张睿女友的欢迎。
??大家吃饭很愉快,只是在一瓶啤酒上出现了一点问题,里面竟然有瓶口处的纸屑,经过大家的辨别,推断一定是燕京啤酒在生产过程中掉落的纸屑,于是,理直气壮地叫来服务员,有理取闹,最后服务员以赠送一个果盘对我们进行了抚慰。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-6-17 14:43
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社