博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
个人推荐的Weka教程,包含了数据格式、数据准备、分类和聚类Demo
阅读量:2395 次
发布时间:2019-05-10

本文共 2317 字,大约阅读时间需要 7 分钟。

      WEKA的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),它的源代码可通过得到

 

      同时weka也是新西兰的一种鸟名,而WEKA的主要开发者来自新西兰。

 

      WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。如果想自己实现数据挖掘算法的话,可以看一看weka的接口文档。在weka中集成自己的算法甚至借鉴它的方法自己实现可视化工具并不是件很困难的事情。

 

      我学习的过程中会持续把有用的教材上传...

 

 

------

调用weka API写了两个java程序,很基本:

package cn.edu.xmu.bdm.wekainjava.test;import java.io.FileReader;import weka.core.Instances;/** * desc:试试Weka中最基本最重要的Instance类 * InstanceTest * @version 1.0 2011/12/13 * @author chenwq * */public class InstanceTest {	public static Instances getFileInstances(String fileName) throws Exception {		FileReader frData = new FileReader(fileName);		Instances data = new Instances(frData);		return data;	}	public static void main(String[] args) throws Exception {		Instances instances = getFileInstances("C:\\Program Files\\Weka-3-6\\data\\bank-data-final.arff");		// 把数据集全部输入出		// System.out.println( instances );		// 用numInstances可以获得数据集中有多少样本		for (int i = 0; i < instances.numInstances(); i++) {			// instance( i )是得到第i个样本			System.out.println(instances.instance(i));		}	}}

 

 

 

package cn.edu.xmu.bdm.wekainjava.test;/** * desc:试试Weka的决策树类 * J48Test * @version 1.0 2011/12/13 * @author chenwq * */import java.io.File;import java.io.IOException;import weka.classifiers.Classifier;import weka.classifiers.trees.J48;import weka.core.Instances;import weka.core.converters.ArffLoader;public class J48Test {	/**	 * @param args	 * @throws Exception 	 */	public static void main(String[] args) throws Exception {		 Classifier m_classifier = new J48();	        File inputFile = new File("C:\\Program Files\\Weka-3-6\\data\\cpu.with.vendor.arff");//训练语料文件	        ArffLoader atf = new ArffLoader(); 	        atf.setFile(inputFile);	        Instances instancesTrain = atf.getDataSet(); // 读入训练文件    	        inputFile = new File("C:\\Program Files\\Weka-3-6\\data\\cpu.with.vendor.arff");//测试语料文件	        atf.setFile(inputFile);          	        Instances instancesTest = atf.getDataSet(); // 读入测试文件	        instancesTest.setClassIndex(0); //设置分类属性所在行号(第一行为0号),instancesTest.numAttributes()可以取得属性总数	        double sum = instancesTest.numInstances(),//测试语料实例数	        right = 0.0f;	        instancesTrain.setClassIndex(0);	         m_classifier.buildClassifier(instancesTrain); //训练           	        for(int  i = 0;i

 

 

转载地址:http://dpwob.baihongyu.com/

你可能感兴趣的文章
Argument of type '(Foo::)(int,int)' does not match 'void (*)(int,int)'以及静态函数问题
查看>>
今天遇到的postgresql中的备份和恢复
查看>>
正好碰到了C++的函数对象,查各路资料,总结写下来吧
查看>>
今天试vi遇到的“Sorry,the command is not available in this version : syntax on”
查看>>
今天又搞到个libDTL.so is not an ELF file - it has the wrong magic bytes at the start.
查看>>
MinGW和vc6中编译DTL的过程
查看>>
Fedora13下为postgresql添加ODBC驱动过程
查看>>
Bridge模式学习
查看>>
Virtual的一些总结
查看>>
Fedora13上折腾了下ACE
查看>>
tomcat keepAliveTimeout=0问题
查看>>
JDK1.6在SUSE11下问题跳变定时任务失效问题记录
查看>>
400 Bad request 一例
查看>>
linux文件锁定
查看>>
fedora4上安装gcc2.9,编译安装rainbow过程
查看>>
求质数算法的N种境界 (N > 10)
查看>>
一个简单的linux下原生socket的tcp程序及其修改
查看>>
JSP的入门简介
查看>>
JSP中的基本语法和3指令,6动作,9内置对象
查看>>
JSP的6个动作
查看>>