lixiangdong的个人博客分享 http://blog.sciencenet.cn/u/lixiangdong

博文

采用新的策略,分类的各项指标明显提升

已有 2413 次阅读 2012-11-21 19:22 |个人分类:weka|系统分类:科研笔记|关键词:学者| 策略, 中文, 分类, 文本

下面是交叉验证的结果:
=== Detailed Accuracy By Class ===
TP Rate   FP Rate   Precision   Recall  F-Measure   ROC Area  Class
  0.99      0.002      0.98      0.99      0.985      0.999    C11-Space
  0.75      0.001      0.923     0.75      0.828      0.979    C15-Energy
  0.704     0.001      0.905     0.704     0.792      0.972    C16-Electronics
  0.76      0.005      0.731     0.76      0.745      0.978    C17-Communication
  0.96      0.002      0.98      0.96      0.97       0.988    C19-Computer
  0.697     0.002      0.885     0.697     0.78       0.968    C23-Mine
  0.86      0.014      0.731     0.86      0.79       0.978    C29-Transport
  0.78      0.017      0.78      0.78      0.78       0.983    C3-Art
  0.99      0          1         0.99      0.995      0.999    C31-Enviornment
  0.94      0.002      0.979     0.94      0.959      0.997    C32-Agriculture
  0.9       0.007      0.909     0.9       0.905      0.968    C34-Economy
  0.725     0.004      0.881     0.725     0.796      0.987    C35-Law
  0.902     0.009      0.793     0.902     0.844      0.989    C36-Medical
  0.946     0.024      0.693     0.946     0.8        0.982    C37-Military
  0.89      0.014      0.832     0.89      0.86       0.981    C38-Politics
  0.94      0.002      0.979     0.94      0.959      0.979    C39-Sports
  0.697     0.003      0.852     0.697     0.767      0.977    C4-Literature
  0.797     0.01       0.783     0.797     0.79       0.98     C5-Education
  0.614     0.004      0.818     0.614     0.701      0.976    C6-Philosophy
  0.73      0.023      0.709     0.73      0.719      0.969    C7-History

Correctly Classified Instances        1196               86.2915 %
Incorrectly Classified Instances       190               13.7085 %
Kappa statistic                          0.8542
Mean absolute error                      0.0902
Root mean squared error                  0.2088
Relative absolute error                 95.8409 %
Root relative squared error             96.259  %
Total Number of Instances             1386    
=== Confusion Matrix ===
  a  b  c  d  e  f  g  h  i  j  k  l  m  n  o  p  q  r  s  t   <-- classified as
 99  0  0  0  1  0  0  0  0  0  0  0  0  0  0  0  0  0  0  0 |  a = C11-Space
  0 24  1  0  0  2  3  0  0  0  0  0  0  2  0  0  0  0  0  0 |  b = C15-Energy
  0  0 19  5  0  0  2  0  0  0  0  0  0  1  0  0  0  0  0  0 |  c = C16-Electronics
  0  0  1 19  0  0  4  0  0  0  0  0  0  0  0  0  0  1  0  0 |  d = C17-Communication
  1  0  0  0 96  0  0  0  0  0  0  0  1  2  0  0  0  0  0  0 |  e = C19-Computer
  0  1  0  2  0 23  4  0  0  0  0  0  1  1  0  0  0  1  0  0 |  f = C23-Mine
  0  1  0  0  0  1 49  0  0  0  0  1  2  2  0  0  0  1  0  0 |  g = C29-Transport
  0  0  0  0  0  0  0 78  0  0  0  0  0  0  2  0  0  1  0 19 |  h = C3-Art
  0  0  0  0  0  0  0  0 99  0  0  1  0  0  0  0  0  0  0  0 |  i = C31-Enviornment
  0  0  0  0  0  0  0  0  0 94  5  0  0  0  0  0  0  0  0  1 |  j = C32-Agriculture
  0  0  0  0  0  0  0  0  0  1 90  0  1  0  7  0  0  0  0  1 |  k = C34-Economy
  0  0  0  0  0  0  0  0  0  0  0 37  1 13  0  0  0  0  0  0 |  l = C35-Law
  0  0  0  0  0  0  0  0  0  0  0  0 46  4  0  0  0  1  0  0 |  m = C36-Medical
  1  0  0  0  0  0  0  0  0  0  0  2  1 70  0  0  0  0  0  0 |  n = C37-Military
  0  0  0  0  0  0  0  0  0  0  2  0  0  1 89  0  0  0  0  8 |  o = C38-Politics
  0  0  0  0  1  0  0  1  0  0  1  0  0  0  2 94  0  0  0  1 |  p = C39-Sports
  0  0  0  0  0  0  2  0  0  0  0  1  1  0  0  0 23  3  3  0 |  q = C4-Literature
  0  0  0  0  0  0  1  0  0  0  0  0  3  4  0  1  0 47  3  0 |  r = C5-Education
  0  0  0  0  0  0  2  0  0  0  0  0  1  1  3  1  4  5 27  0 |  s = C6-Philosophy
  0  0  0  0  0  0  0 21  0  1  1  0  0  0  4  0  0  0  0 73 |  t = C7-History
 
可见,只有“艺术”与 “历史”的分类出现了偏差,不到四分之一的实例跑到了对方分类中。但历史与艺术是非常相关的,这样的结果很合理。
 
今天中午到现在努力的结果。不错。


https://m.sciencenet.cn/blog-713110-634816.html

上一篇:2012年 一本高校 河南理科投档线 排名
下一篇:利用11月21日的方法,对韩新超发来的新浪新闻进行分类的结果

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-23 18:47

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部