陈颖频的科学网博客分享 http://blog.sciencenet.cn/u/s110500617

博文

支持矢量机在各领域的应用

已有 2455 次阅读 2015-8-17 17:05 |系统分类:观点评述|关键词:学者

    在前几篇日志中详细总结了支持矢量机优化的原理,以及如何利用启发式算法获取拉格朗日系数和阈值b(即最小序贯优化算法),可以说,支持矢量机的主要理论框架和工程实现手段,都已经在前文中详细论述了。那么SVM到底能用于哪些领域呢?前文探讨过,SVM解决的是这样一类矢量分类问题,即给出一组训练样本,每个样本相应给出特征空间的描述(即每个样本的坐标),及其标签空间,根据给定的训练样本,得出一个分类器,其中被划分为支持向量的样本点要尽可能远离分界平面,这就是SVM的名称由来,那么SVM可以如何应用于函数逼近、人脸识别、年龄估计、手写数字识别等领域呢?我们来分析一下,
     (1)SVM在函数逼近中的应用,假定要逼近或者说要拟合的函数是一维函数x_2=f(x_1),那么对于采样于该曲线的训练样本,标签就置1即可,表示这个样本点落在该曲线,对于采样于曲线外的样本点,标签写成-1即可,这样获取一组训练样本,部分落在曲线上,部分不落在上面,并且以(x_1,x_2)作为描述样本点的坐标,进行感知器训练,训练后,再拿新的样本点输入,如果训练器输出为1,就把该点描出,表示这个点属于该曲线,如果输出为-1,则不描出这个点,表示该点不落在曲线上,这样就可以完成对一维函数的逼近或者说拟合。
   (2)SVM在人脸识别方面的应用,给定一组bmp图像,这个图像可以是N*N的,假定对同一个人喜怒哀乐的不同照片作为正例训练样本,标签打1,对不是这个人的图像,标签打-1,然后将像素为N*N的二维图像转换成N*N的一维向量,以行优先为例,那就是第一行第一列为特征空间第一个特征x_1,第一行第二列为特征空间的第二个坐标x-2,到了第二行第一列,该向量就是特征空间的第N+1个特征x_N+1,这样获取的矢量(模式识别中称之为模式,其实一个意思)作为特征空间的输入,标签空间按照前面讲的,是这个人的照片就为1,不是就为-1,训练感知器,然后测试的时候再随便那个照片,如法炮制获取N*N大小的一维输入向量,如果训练器输出为1,就判决这个照片是属于训练中的正例对应的人,否则不是。
     (3)SVM在年龄估计中的应用,道理和人脸识别中的应用类似,输入仍然是图像转换后的向量,但是标签有点不一样,将0-10岁的样本标签打1,非这个年龄段的打-1,这样训练得到的感知器就可以判定一个照片的人到底是不是这个年龄段的,然后11-20岁的训练样本再重新训练一个感知器,用于判定向量属不属于这个年龄段,一直训练到99-100岁的判决器,有了这10个感知器,就可以用判决树来决策一个人的年龄了。
    (4)SVM在手写数字识别中的应用,道理跟年龄估计类似,对手写数字1做一个感知器,对手写2做一个,一直做到9,然后用判决树决策,需要注意,和年龄估计一样,对每个感知器要用对应的样本训练。
    (5)SVM在文本分类中的应用,对于一个文本,如果某个词出现的次数超过一定的阈值,比如“淘宝”这个词出现超过5词,就认为文本在x_1="淘宝"这个坐标下的坐标为1,否则为0,依次类推,如果给出200个关键字,就意味着有一维向量规模为1*200作为SVM训练的输入向量,然后对不同训练文本给定标签空间,如“IT”标签空间,如果这个文本被人为定义为关于IT的文本,那就在这个标签上打1,否则打-1,对于“健康”标签、“娱乐”标签也是依次类推的,这些标签类似于前面介绍的年龄中的10个年龄段,也类似于手写识别体的0到9这几个数字。
      本文讨论了SVM如何在多个领域的工程应用,并给出相应的识别方案,上述5个方案前后连贯,复杂程度依次递增,非常有趣,本人水平有限,理解上的错误在所难免,如有错误,请大家指正。

附录:
前文指的是:
http://user.qzone.qq.com/553702786/blog/1438414157
http://user.qzone.qq.com/553702786/blog/1437102994
http://user.qzone.qq.com/553702786/blog/1436951265
http://user.qzone.qq.com/553702786/blog/1438331517
http://open.163.com/special/opencourse/learningfromdata.html中的SVM视频讲解
http://open.163.com/movie/2008/1/M/C/M6SGF6VB4_M6SGHFBMC.html中的视频讲解



https://m.sciencenet.cn/blog-684084-913765.html

上一篇:DIY简易版SVM分类器matlab代码
下一篇:NAT模式下虚拟交换机与虚拟机IP、主机IP的关系

1 彭真明

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2022-8-14 17:04

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部