Machine learning weka中看不见的标称值

Machine learning weka中看不见的标称值,machine-learning,weka,supervised-learning,Machine Learning,Weka,Supervised Learning,我有一个数据集,其中有一些标称值作为特征。我拥有的训练集有一组标称特征的值,这些特征在我的测试集中不存在。 例如,我在训练集中的特征对应于 @attributeh4{br,pl,com,ro,th,np} 并且测试集中的相同特性已被删除 @attributeh4{br,pl,abc,th,def,ghi,lmno} 我相信正因为如此,weka不允许我在测试集上重新评估我在训练集上构建的模型。有办法解决这个问题吗?我错过什么了吗 编辑:我使用的是随机森林分类器 感谢Weka寻求测试集中使用的所有标

我有一个数据集,其中有一些标称值作为特征。我拥有的训练集有一组标称特征的值,这些特征在我的测试集中不存在。 例如,我在训练集中的特征对应于

@attributeh4{br,pl,com,ro,th,np}

并且测试集中的相同特性已被删除

@attributeh4{br,pl,abc,th,def,ghi,lmno}

我相信正因为如此,weka不允许我在测试集上重新评估我在训练集上构建的模型。有办法解决这个问题吗?我错过什么了吗

编辑:我使用的是随机森林分类器


感谢

Weka寻求测试集中使用的所有标称值也存在于训练集中,因为分类器应该在进行预测之前进行学习

此外,Weka使用标称值及其指数;因此,重要的是对同一属性的标称值使用相同的顺序,以获得可靠的结果

在您的情况下,只需对训练集和测试集以相同的顺序使用相同的值(涵盖所有值)


您的组合值
{br、pl、com、ro、th、np、abc、th、def、ghi、lmno}
可用于训练集和测试集。

您应该能够在训练集和测试集中使用相同的属性声明。如果不是所有声明的值都出现在数据中,这不是问题。