多ARFF文件的WEKA预测_R_Machine Learning_Weka_Arff

多ARFF文件的WEKA预测

r machine-learning

多ARFF文件的WEKA预测,r,machine-learning,weka,arff,R,Machine Learning,Weka,Arff,我对WEKA和ARFF文件相当陌生，目前正在使用它的GUI。我感到困惑的是，如何使用多个ARFF文件进行预测（分类）例如，文件A有3个属性，“ID”，“attribute_1”，“attribute_2”；而文件B有两个属性，“ID”，“Scores”（用于预测的主属性）问题是，文件A中的每一行数据都是唯一的，但是B中的数据是重复的。这两个文件都通过它们的“ID”进行关联。换句话说，文件B在文件a中为每个元素存储一组“分数” 对于如何将文件A和B连接在一起，有什么建议吗？或者有没有什么方法可

我对

WEKA

和

ARFF

文件相当陌生，目前正在使用它的

GUI

。我感到困惑的是，如何使用多个

ARFF

文件进行预测（分类）

例如，文件A有3个属性，

“ID”

，

“attribute_1”

，

“attribute_2”

；而文件B有两个属性，

“ID”

，

“Scores”

（用于预测的主属性）

问题是，

文件A

中的每一行数据都是唯一的，但是

中的数据是重复的。这两个文件都通过它们的

“ID”

进行关联。换句话说，

文件B

在

文件a

中为每个元素存储一组

“分数”

对于如何将

文件A

和

连接在一起，有什么建议吗？或者有没有什么方法可以让我绕过

WEKA

让它工作起来？

WEKA需要一个“扁平化”的表，即

arff

-文件。这个过程也称为非规范化。有一个weka包（反规范化），其中包含一个过滤器来执行此操作

这里有一个如何展平事务数据的示例：

在使用过滤器之前，您必须将两个文件合并在一起。如果您有

csv

-文件或类似文件，您可以通过Excel实现这一点，例如，请参见：