Machine learning 用Weka预测多个测试集

Machine learning 用Weka预测多个测试集,machine-learning,weka,Machine Learning,Weka,我有一个训练集和一个测试集,我想用Weka进行分类。因为我的属性是文本。。我知道我必须首先应用stringtoword过滤器。如上所述,我必须做以下工作: 1-加载列车和测试装置,并应用过滤器。 2-使用训练集训练分类器并保存模型。 3-加载模型以将其应用于测试集 在我的实验中,我必须使用经过训练的分类器来测试多个测试集。。那么,我必须重复1、2和3,还是我只能重复第三步 我是否必须用问号(?)替换测试集中的类,或者我可以离开类,分类器将尝试预测该类 您可以简单地重复第三步,假设所有测试集都已过

我有一个训练集和一个测试集,我想用Weka进行分类。因为我的属性是文本。。我知道我必须首先应用stringtoword过滤器。如上所述,我必须做以下工作: 1-加载列车和测试装置,并应用过滤器。 2-使用训练集训练分类器并保存模型。 3-加载模型以将其应用于测试集

在我的实验中,我必须使用经过训练的分类器来测试多个测试集。。那么,我必须重复1、2和3,还是我只能重复第三步


我是否必须用问号(?)替换测试集中的类,或者我可以离开类,分类器将尝试预测该类

您可以简单地重复第三步,假设所有测试集都已过滤并与过滤版本一起保存。如果选择“更多选项…”按钮并选中“输出预测”框,则不必用问号替换该类。

非常抱歉,但我仍然没有理解:(…当您说“假设所有测试集都已过滤并使用过滤版本保存”时)你的意思是,我必须在所有测试集上应用“第一步”上的过滤器,然后逐个进行分类吗?因为我有测试集,这些测试集是按年份分组的数据,我不想混合在一起,我想使用同一个经过训练的分类器对它们进行分类,我不知道如何进行分类!我必须重复整个实验吗对于每个测试集..或者我只需重复最后一步。这应该是最后一步。过滤数据并将过滤后的版本保存到.arff文件中,并在第3步中使用。但是我认为我无法对多个测试文件执行以下操作:test1、test2、test3…testn:(java-Xmx1024m weka.filters.unsupervised.attribute.StringToWordVector-b-i training.arff-o Output\u training.arff-r test1.arff test2.arff test3.arff-s Output\u test1.arff Output\u test2.arff Output\u test3.arff-r2-W 5000-C-T-i-n1-L-m2)因为我想转换多个测试文件,而不是将它们放在一个大的测试文件中。