Testing Weka:为什么用我的测试集重新评估不';在不抛出错误消息的情况下是否给出任何结果?

Testing Weka:为什么用我的测试集重新评估不';在不抛出错误消息的情况下是否给出任何结果?,testing,machine-learning,classification,weka,named-entity-recognition,Testing,Machine Learning,Classification,Weka,Named Entity Recognition,我正在写一篇关于德语文本命名实体识别的硕士论文,我想用Weka做机器学习部分。我是Weka的新手,所以我不明白为什么我没有得到结果,尽管训练过程很成功,我得到了一个模型 我用J48训练了一个模型,另一个用NaiveBayes训练。首先,我得到了stackoverflow上已经讨论过的错误消息(train和test set不兼容),但我纠正了这一点。因此,当我重新评估时,我没有收到任何错误消息,Weka给出了结果,但这些结果只包含零: ==重新评估测试集=== 用户提供的测试集 关系:train

我正在写一篇关于德语文本命名实体识别的硕士论文,我想用Weka做机器学习部分。我是Weka的新手,所以我不明白为什么我没有得到结果,尽管训练过程很成功,我得到了一个模型

我用J48训练了一个模型,另一个用NaiveBayes训练。首先,我得到了stackoverflow上已经讨论过的错误消息(train和test set不兼容),但我纠正了这一点。因此,当我重新评估时,我没有收到任何错误消息,Weka给出了结果,但这些结果只包含零:

==重新评估测试集===

用户提供的测试集 关系:train weka.filters.unsupervised.attribute.StringToNominal-R1-10,12-last 实例:未知(尚未)。增量阅读 属性:15

==摘要===

实例总数0
忽略类未知实例207484

==按类别划分的详细精度===

           TP Rate   FP Rate   Precision   Recall  F-Measure   ROC Area  Class
             0         0          0         0         0          ?        O
             0         0          0         0         0          ?        I-PER
             0         0          0         0         0          ?        I-LOC
             0         0          0         0         0          ?        I-MISC
             0         0          0         0         0          ?        I-ORG
             0         0          0         0         0          ?        B-MISC
             0         0          0         0         0          ?        B-LOC
             0         0          0         0         0          ?        B-ORG
加权平均值楠楠楠楠

==混淆矩阵===


在我看来,也许WEKA不知道数据中的class属性是什么?在“分类”选项卡下的Weka Explorer GUI中,有一个下拉列表用于选择类属性-确保选择了正确的类


如果这不是问题,您是否确保您的测试数据有效,并且可以在WEKA中处理?一个简单的测试是使用原始测试数据(例如,作为临时训练数据)使用WEKA训练模型

在我看来,也许WEKA不知道数据中的class属性是什么?在“分类”选项卡下的Weka Explorer GUI中,有一个下拉列表用于选择类属性-确保选择了正确的类


如果这不是问题,您是否确保您的测试数据有效,并且可以在WEKA中处理?一个简单的测试是使用原始测试数据(例如,作为临时训练数据)使用WEKA训练模型

谢谢你的回复,你的建议似乎是对的。我现在指出要评估的班级,我得到了一个结果。现在剩下的问题是,重新评估没有考虑开发集中提供的所有实例,而是只评估了前4000个实例,而不是大约50000个实例。感谢您的回复,您的建议似乎是正确的。我现在指出要评估的班级,我得到了一个结果。现在剩下的问题是,重新评估并没有获取开发集中提供的所有实例,而是只评估前4000个实例,而不是大约50000个实例。