lixiangdong的个人博客分享 http://blog.sciencenet.cn/u/lixiangdong

博文

使用DataSource和DataSink

已有 4625 次阅读 2012-5-24 09:19 |个人分类:weka|系统分类:科研笔记|关键词:学者| 文件类型, 数据集, 格式转换

weka中有许多实现数据格式转换的工具,都包含在weka.core.converters包中。
 
其中的DataSource和DataSink最值一提。
 
原来我们这样写:
     BufferedReader reader = new BufferedReader(new FileReader(trainsetfile));
     ArffReader arff = new ArffReader(reader);
     Instances dataFiltered = arff.getData(); 
其实可以这样写:
     Instances dataFiltered=DataSource.read("dataFiltered.arff");
 
输出arff文件:
     DataSink.write("dataWritten.arff", dataFiltered);
 
weka.core.converters可以实现下列文件之间的转换:
• ARFF files (ArffLoader, ArffSaver)
• C4.5 files (C45Loader, C45Saver)
• CSV files (CSVLoader, CSVSaver)
• files containing serialized instances (SerializedInstancesLoader, Serial-
izedInstancesSaver)
• JDBC databases (DatabaseLoader, DatabaseSaver)
• libsvm files (LibSVMLoader, LibSVMSaver)
• XRFF files (XRFFLoader, XRFFSaver)
• text directories for text mining (TextDirectoryLoader)


https://m.sciencenet.cn/blog-713110-574332.html

上一篇:使用独立测试集对分类模型进行评估
下一篇:WEKA的分类模型文件model中包含哪些内容

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-14 15:11

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部