WEKA-从Java中的特征向量列表创建实例_Java_Vector_Weka_Svm

WEKA-从Java中的特征向量列表创建实例

java vector

WEKA-从Java中的特征向量列表创建实例,java,vector,weka,svm,Java,Vector,Weka,Svm,我有一个固定长度的特征向量的大列表。列表长度为1000个向量，每个向量长度为10.000个双倍值。 100个向量代表一个类（每个类100个样本），因此稍后的模型训练将涉及以下逻辑：100个正样本与900个负样本，或者简言之，一个类与所有其他类相对如何从向量列表中创建Java实例来进行模型训练？这是我保存所有特征向量的列表： public static List <Vector<Double>> featuresList = new LinkedList<Vect

我有一个固定长度的特征向量的大列表。列表长度为1000个向量，每个向量长度为10.000个双倍值。 100个向量代表一个类（每个类100个样本），因此稍后的模型训练将涉及以下逻辑：100个正样本与900个负样本，或者简言之，一个类与所有其他类相对

如何从向量列表中创建Java实例来进行模型训练？

这是我保存所有特征向量的列表：

public static List <Vector<Double>> featuresList = new LinkedList<Vector<Double>>();

公共静态列表功能列表=新建LinkedList（）；

如果我遗漏了什么，请告诉我。

要训练你的模型，你必须创建一个

实例来减速你的属性。
实例是一组实例s。然后可以将实例添加到实例中。
从双矢量可以创建SparseInstance或DenseInstance：
public SparseInstance(double weight, double[] attValues)

public DenseInstance(double weight,  /*@non_null@*/ double[]attValues){

可以使用双数组代替向量
您可以在
上找到创建实例的有用信息，我已经查阅了Weka简介。我以前翻页过几次，但我没有看到那里使用的SparseInstance
s，只有DenseInstance
s和FastVector
s。据我所知，FastVectors已被弃用，因此信息。再也没有这么近的了。想分享更多关于SparseInstance的使用信息吗？实例权重描述了什么？我是Weka的新手，所以每一条信息。这会有很大帮助。我已经完成了对数组的向量解析（没有问题）。谢谢你。你也可以用双向量来创建一个DenseInstance。稀疏实例类似于密集实例（或密集双向量），但值为0的数据不会显式表示。e、 密集格式：0，X，0，Y，“class A”0，0，W，0，“class B”和稀疏格式：{1 X，3 Y，4“class A”}{2 W，4“class B”}您可以在ARFF文件中找到更多信息实例权重很好，例如，当您的训练集不平衡时，例如，负面实例（或尝试分类实例时的一个类）的代表性过高。在这种情况下，您可以增加积极实例（或稀有类）的权重，以帮助您的ML模型学习。但是，您主要只设置为1.0。再次感谢您的回答。如果我理解正确，我可以创建这两个实例中的任何一个（密集或稀疏），为实例设置权重实际上就像赋予它们“更负”或“更正”的属性一样。例如，将我的所有正项的权重设置为{5.0}，将所有负项的权重设置为{1.0}，将表明正项与所有负项的距离非常远。如果我误解了，请纠正我。是的，我想你理解得很好。：）