WEKA-从Java中的特征向量列表创建实例

WEKA-从Java中的特征向量列表创建实例,java,vector,weka,svm,Java,Vector,Weka,Svm,我有一个固定长度的特征向量的大列表。列表长度为1000个向量,每个向量长度为10.000个双倍值。 100个向量代表一个类(每个类100个样本),因此稍后的模型训练将涉及以下逻辑:100个正样本与900个负样本,或者简言之,一个类与所有其他类相对 如何从向量列表中创建Java实例来进行模型训练? 这是我保存所有特征向量的列表: public static List <Vector<Double>> featuresList = new LinkedList<Vect

我有一个固定长度的特征向量的大列表。列表长度为1000个向量,每个向量长度为10.000个双倍值。 100个向量代表一个类(每个类100个样本),因此稍后的模型训练将涉及以下逻辑:100个正样本与900个负样本,或者简言之,一个类与所有其他类相对

如何从向量列表中创建Java实例来进行模型训练?

这是我保存所有特征向量的列表:

public static List <Vector<Double>> featuresList = new LinkedList<Vector<Double>>();
公共静态列表功能列表=新建LinkedList();

如果我遗漏了什么,请告诉我。

要训练你的模型,你必须创建一个
实例来减速你的属性。
实例是一组
实例
s。然后可以将实例添加到实例中。 从双矢量可以创建SparseInstance或DenseInstance:

public SparseInstance(double weight, double[] attValues)

public DenseInstance(double weight,  /*@non_null@*/ double[]attValues){
可以使用双数组代替向量


您可以在

上找到创建实例的有用信息,我已经查阅了Weka简介。我以前翻页过几次,但我没有看到那里使用的
SparseInstance
s,只有
DenseInstance
s和
FastVector
s。据我所知,FastVectors已被弃用,因此信息。再也没有这么近的了。想分享更多关于SparseInstance的使用信息吗?实例权重描述了什么?我是Weka的新手,所以每一条信息。这会有很大帮助。我已经完成了对数组的向量解析(没有问题)。谢谢你。你也可以用双向量来创建一个DenseInstance。稀疏实例类似于密集实例(或密集双向量),但值为0的数据不会显式表示。e、 密集格式:0,X,0,Y,“class A”0,0,W,0,“class B”和稀疏格式:{1 X,3 Y,4“class A”}{2 W,4“class B”}您可以在ARFF文件中找到更多信息实例权重很好,例如,当您的训练集不平衡时,例如,负面实例(或尝试分类实例时的一个类)的代表性过高。在这种情况下,您可以增加积极实例(或稀有类)的权重,以帮助您的ML模型学习。但是,您主要只设置为1.0。再次感谢您的回答。如果我理解正确,我可以创建这两个实例中的任何一个(密集或稀疏),为实例设置权重实际上就像赋予它们“更负”或“更正”的属性一样。例如,将我的所有正项的权重设置为{5.0},将所有负项的权重设置为{1.0},将表明正项与所有负项的距离非常远。如果我误解了,请纠正我。是的,我想你理解得很好。:)