Attributes Weka中缺少标称属性的值

Attributes Weka中缺少标称属性的值,attributes,classification,weka,wordnet,Attributes,Classification,Weka,Wordnet,我有一个数据集,我正在使用朴素贝叶斯分类器进行分类。我有14个属性,其中一些是名词性的 仅在其中一个属性中,我缺少一些值。到目前为止,我所做的是将它们作为缺少的值保留下来,我知道Weka会自动替换这些值(有人就此提出问题) 我的意思是,这个属性的值在我的特征文件中是空的,当我创建ARFF文件时,我在两个逗号之间看到“?” 现在,我有两种可能性: 1) 让Weka自动填写。 2) 将它们替换为“NULL” 问题是在第一种情况下,分类器工作得更好。现在,我想知道是否允许用Weka替换它们?或者我应该

我有一个数据集,我正在使用朴素贝叶斯分类器进行分类。我有14个属性,其中一些是名词性的

仅在其中一个属性中,我缺少一些值。到目前为止,我所做的是将它们作为缺少的值保留下来,我知道Weka会自动替换这些值(有人就此提出问题)

我的意思是,这个属性的值在我的特征文件中是空的,当我创建ARFF文件时,我在两个逗号之间看到“?”

现在,我有两种可能性: 1) 让Weka自动填写。 2) 将它们替换为“NULL”

问题是在第一种情况下,分类器工作得更好。现在,我想知道是否允许用Weka替换它们?或者我应该使用第二种方法,即使我得到了更糟糕的结果

我的意思是,“什么时候”我们应该让Weka替换缺失的值?什么时候没有

同时,缺少值的特征表示单词的WordNet,当它为空时,意味着实例是一个介词或WH疑问句


提前感谢,

嗯,关于缺少的值,weka默认情况下不会替换它们,您必须使用过滤器(与您在问题中首先链接的帖子完全相同)。有些分类器可以处理缺失值,我认为朴素贝叶斯可以,只是在概率计算中不计算它们。所以基本上你有三个选择。使用ReplaceMissingValues筛选器将缺少的值替换为模式值,不要使用筛选器并使用缺少值的dataset(在这种情况下,我建议您看看NaiveBayes是如何工作的,以了解如何处理缺少的值,以及它是否对您有利),最后一个选项是,使用您自己的标签替换缺少的值,如“其他价值观”“大概吧。正确选择的关键可能在你的最后一段,这表明你缺少的值可能意味着什么。如果是这样,我将使用第三种方法-您的新标签。另一方面,如果缺少值并不意味着什么,只是数据收集中的一些错误导致的结果,我将考虑前两种方法。祝你好运