Machine learning 如何识别Weka GUI中未正确分类实例的详细信息?

Machine learning 如何识别Weka GUI中未正确分类实例的详细信息?,machine-learning,nlp,classification,weka,data-mining,Machine Learning,Nlp,Classification,Weka,Data Mining,我想使用Weka GUI获取错误分类实例的详细信息(唯一id)。我正在跟踪你的答案。在这种情况下,他们要求使用预处理选项卡中的过滤器StringToNominal,转换唯一id,即字符串。然而,通过这样做,我怀疑分类器是否也将唯一id列视为分类过程中的一个特征 请告诉我正确的方法 如果需要,我很乐意提供示例。假设您希望(1)添加实例ID,(2)在模型中不使用该实例ID,以及(3)使用实例ID和其他一些属性查看单个预测 我们将用一个较小的数据集来展示这一点。例如,打开iris.arff 使用“预处

我想使用Weka GUI获取错误分类实例的详细信息(唯一id)。我正在跟踪你的答案。在这种情况下,他们要求使用预处理选项卡中的过滤器
StringToNominal
,转换唯一id,即字符串。然而,通过这样做,我怀疑分类器是否也将唯一id列视为分类过程中的一个特征

请告诉我正确的方法

如果需要,我很乐意提供示例。

假设您希望(1)添加实例ID,(2)在模型中不使用该实例ID,以及(3)使用实例ID和其他一些属性查看单个预测

我们将用一个较小的数据集来展示这一点。例如,打开iris.arff

使用“预处理”选项卡中的“无监督属性过滤器”中的“添加的过滤器”。ID将是第一个属性

现在我们需要在建模过程中忽略它。将过滤后的分类器与移除过滤器一起使用。

我们需要用ID变量输出预测,这样我们就可以看到发生了什么。这里我们输出所有的属性,尽管我们不需要做所有的事情。

我们将在输出窗口中显示此详细信息:

=== Predictions on test split ===

inst#,actual,predicted,error,prediction,ID,sepallength,sepalwidth,petallength,petalwidth
1,2:Iris-versicolor,2:Iris-versicolor,,0.968,53,6.9,3.1,4.9,1.5
2,3:Iris-virginica,3:Iris-virginica,,0.968,131,7.4,2.8,6.1,1.9
3,2:Iris-versicolor,2:Iris-versicolor,,0.968,59,6.6,2.9,4.6,1.3
4,1:Iris-setosa,1:Iris-setosa,,1,36,5,3.2,1.2,0.2
5,3:Iris-virginica,3:Iris-virginica,,0.968,101,6.3,3.3,6,2.5
6,2:Iris-versicolor,2:Iris-versicolor,,0.968,88,6.3,2.3,4.4,1.3
7,1:Iris-setosa,1:Iris-setosa,,1,42,4.5,2.3,1.3,0.3
8,1:Iris-setosa,1:Iris-setosa,,1,8,5,3.4,1.5,0.2

等等。

我怀疑分类器是否也将唯一id列视为分类过程中的一个特征?我不明白为什么,你试过了吗?分类器输出应该显示模型中的属性。@nekomatic哦,我没有检查它。谢谢你的建议。你能告诉我有没有更好的方法吗?或者你也推荐这种方法?