Machine learning 如何识别Weka GUI中未正确分类实例的详细信息？_Machine Learning_Nlp_Classification_Weka_Data Mining

Machine learning 如何识别Weka GUI中未正确分类实例的详细信息？

machine-learning nlp

Machine learning 如何识别Weka GUI中未正确分类实例的详细信息？,machine-learning,nlp,classification,weka,data-mining,Machine Learning,Nlp,Classification,Weka,Data Mining,我想使用Weka GUI获取错误分类实例的详细信息（唯一id）。我正在跟踪你的答案。在这种情况下，他们要求使用预处理选项卡中的过滤器StringToNominal，转换唯一id，即字符串。然而，通过这样做，我怀疑分类器是否也将唯一id列视为分类过程中的一个特征请告诉我正确的方法如果需要，我很乐意提供示例。假设您希望（1）添加实例ID，（2）在模型中不使用该实例ID，以及（3）使用实例ID和其他一些属性查看单个预测我们将用一个较小的数据集来展示这一点。例如，打开iris.arff 使用“预处

我想使用Weka GUI获取错误分类实例的详细信息（唯一id）。我正在跟踪你的答案。在这种情况下，他们要求使用预处理选项卡中的过滤器

StringToNominal

，转换唯一id，即字符串。然而，通过这样做，我怀疑分类器是否也将唯一id列视为分类过程中的一个特征

请告诉我正确的方法

如果需要，我很乐意提供示例。

假设您希望（1）添加实例ID，（2）在模型中不使用该实例ID，以及（3）使用实例ID和其他一些属性查看单个预测

我们将用一个较小的数据集来展示这一点。例如，打开iris.arff

使用“预处理”选项卡中的“无监督属性过滤器”中的“添加的过滤器”。ID将是第一个属性

现在我们需要在建模过程中忽略它。将过滤后的分类器与移除过滤器一起使用。

我们需要用ID变量输出预测，这样我们就可以看到发生了什么。这里我们输出所有的属性，尽管我们不需要做所有的事情。

我们将在输出窗口中显示此详细信息：

=== Predictions on test split ===

inst#,actual,predicted,error,prediction,ID,sepallength,sepalwidth,petallength,petalwidth
1,2:Iris-versicolor,2:Iris-versicolor,,0.968,53,6.9,3.1,4.9,1.5
2,3:Iris-virginica,3:Iris-virginica,,0.968,131,7.4,2.8,6.1,1.9
3,2:Iris-versicolor,2:Iris-versicolor,,0.968,59,6.6,2.9,4.6,1.3
4,1:Iris-setosa,1:Iris-setosa,,1,36,5,3.2,1.2,0.2
5,3:Iris-virginica,3:Iris-virginica,,0.968,101,6.3,3.3,6,2.5
6,2:Iris-versicolor,2:Iris-versicolor,,0.968,88,6.3,2.3,4.4,1.3
7,1:Iris-setosa,1:Iris-setosa,,1,42,4.5,2.3,1.3,0.3
8,1:Iris-setosa,1:Iris-setosa,,1,8,5,3.4,1.5,0.2

等等。

我怀疑分类器是否也将唯一id列视为分类过程中的一个特征？我不明白为什么，你试过了吗？分类器输出应该显示模型中的属性。@nekomatic哦，我没有检查它。谢谢你的建议。你能告诉我有没有更好的方法吗？或者你也推荐这种方法？