Testing Weka：为什么用我的测试集重新评估不'；在不抛出错误消息的情况下是否给出任何结果？_Testing_Machine Learning_Classification_Weka_Named Entity Recognition

Testing Weka：为什么用我的测试集重新评估不'；在不抛出错误消息的情况下是否给出任何结果？

testing machine-learning

Testing Weka：为什么用我的测试集重新评估不'；在不抛出错误消息的情况下是否给出任何结果？,testing,machine-learning,classification,weka,named-entity-recognition,Testing,Machine Learning,Classification,Weka,Named Entity Recognition,我正在写一篇关于德语文本命名实体识别的硕士论文，我想用Weka做机器学习部分。我是Weka的新手，所以我不明白为什么我没有得到结果，尽管训练过程很成功，我得到了一个模型我用J48训练了一个模型，另一个用NaiveBayes训练。首先，我得到了stackoverflow上已经讨论过的错误消息（train和test set不兼容），但我纠正了这一点。因此，当我重新评估时，我没有收到任何错误消息，Weka给出了结果，但这些结果只包含零： ==重新评估测试集=== 用户提供的测试集关系：train

我正在写一篇关于德语文本命名实体识别的硕士论文，我想用Weka做机器学习部分。我是Weka的新手，所以我不明白为什么我没有得到结果，尽管训练过程很成功，我得到了一个模型

我用J48训练了一个模型，另一个用NaiveBayes训练。首先，我得到了stackoverflow上已经讨论过的错误消息（train和test set不兼容），但我纠正了这一点。因此，当我重新评估时，我没有收到任何错误消息，Weka给出了结果，但这些结果只包含零：

==重新评估测试集===

用户提供的测试集关系：train weka.filters.unsupervised.attribute.StringToNominal-R1-10,12-last 实例：未知（尚未）。增量阅读属性：15

==摘要===

实例总数0
忽略类未知实例207484

==按类别划分的详细精度===

           TP Rate   FP Rate   Precision   Recall  F-Measure   ROC Area  Class
             0         0          0         0         0          ?        O
             0         0          0         0         0          ?        I-PER
             0         0          0         0         0          ?        I-LOC
             0         0          0         0         0          ?        I-MISC
             0         0          0         0         0          ?        I-ORG
             0         0          0         0         0          ?        B-MISC
             0         0          0         0         0          ?        B-LOC
             0         0          0         0         0          ?        B-ORG

加权平均值楠楠楠楠

==混淆矩阵===

在我看来，也许WEKA不知道数据中的class属性是什么？在“分类”选项卡下的Weka Explorer GUI中，有一个下拉列表用于选择类属性-确保选择了正确的类

如果这不是问题，您是否确保您的测试数据有效，并且可以在WEKA中处理？一个简单的测试是使用原始测试数据（例如，作为临时训练数据）使用WEKA训练模型

在我看来，也许WEKA不知道数据中的class属性是什么？在“分类”选项卡下的Weka Explorer GUI中，有一个下拉列表用于选择类属性-确保选择了正确的类

谢谢你的回复，你的建议似乎是对的。我现在指出要评估的班级，我得到了一个结果。现在剩下的问题是，重新评估没有考虑开发集中提供的所有实例，而是只评估了前4000个实例，而不是大约50000个实例。感谢您的回复，您的建议似乎是正确的。我现在指出要评估的班级，我得到了一个结果。现在剩下的问题是，重新评估并没有获取开发集中提供的所有实例，而是只评估前4000个实例，而不是大约50000个实例。