Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/vba/17.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Machine learning 韦卡:结果太乐观了_Machine Learning_Classification_Weka_Svm_Evaluation - Fatal编程技术网

Machine learning 韦卡:结果太乐观了

Machine learning 韦卡:结果太乐观了,machine-learning,classification,weka,svm,evaluation,Machine Learning,Classification,Weka,Svm,Evaluation,我正在使用Weka做一些分类任务。当我使用SVM时,假阳性率为0。这对我来说是非常乐观的分类任务。此外,在我以前的一些实验中,我看到了乐观的结果,比如精确性和回忆分数为100。我的问题是——如果你有如此乐观的结果,发生这种情况的可能性是什么?补救措施是什么?假阳性率为0可能意味着你总是或几乎总是预测阴性;假阴性率是多少?精度和召回率同时达到100意味着你的问题很容易解决,或者更可能是你的数据处理中存在缺陷;也许你的代码标签错了,或者别的什么。谢谢@Dougal。假阴性率相当高,但真阴性率为1。这

我正在使用Weka做一些分类任务。当我使用SVM时,假阳性率为0。这对我来说是非常乐观的分类任务。此外,在我以前的一些实验中,我看到了乐观的结果,比如精确性和回忆分数为100。我的问题是——如果你有如此乐观的结果,发生这种情况的可能性是什么?补救措施是什么?

假阳性率为0可能意味着你总是或几乎总是预测阴性;假阴性率是多少?精度和召回率同时达到100意味着你的问题很容易解决,或者更可能是你的数据处理中存在缺陷;也许你的代码标签错了,或者别的什么。谢谢@Dougal。假阴性率相当高,但真阴性率为1。这意味着SVM发现一切都是负面的。这个问题不太容易,因为我有大约3000个实例。然而,我只有3个变量,包括类特性。该问题是一个二进制分类问题,用于垃圾邮件检测。如果我添加了其他特性,那么这个乐观的结果就不存在了。可能,我们面临着同样的问题,但方式不同——如果你的SVM得到的都是否定的结果,这就解释了为什么你看到0个误报。如果还没有标准化功能,可以尝试设置分类率。在你的训练/测试中,阳性的实际比例是多少?你也可以尝试使用类权重来做出假阳性,而不是假阴性。这就是说,对于垃圾邮件检测这样的功能来说,这两个功能是非常少的,而且如果没有太多的信号可提取,您看到这一点也不奇怪,只要预测平均值即可。还可以尝试使用不同的内核,并确保您正在调整内核带宽和SVM余量惩罚项。