Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/cocoa/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Machine learning Weka预测(百分比置信度)-它是什么意思?_Machine Learning_Weka_Data Analysis - Fatal编程技术网

Machine learning Weka预测(百分比置信度)-它是什么意思?

Machine learning Weka预测(百分比置信度)-它是什么意思?,machine-learning,weka,data-analysis,Machine Learning,Weka,Data Analysis,我一直在自学Weka,并学会了如何构建模型并从中获得预测(使用CLI进行预测) 当我对来自先前构建的模型的数据集运行预测时,我会得到一个列,它是“预测”,也就是每个预测实例的预测置信度 我知道百分置信度意味着什么,但我所有的预测不都应该是我的Weka模型的准确性吗 如果我有一个准确率为90%的J48决策树分类器,那么使用该模型的每个分类实例不应该都有90%的预测置信度吗 任何人都知道这个百分比置信度是如何计算的,或者当我告诉别人我的模型时,我应该如何阅读错误预测和模型准确性?感谢基本上,当决策树

我一直在自学Weka,并学会了如何构建模型并从中获得预测(使用CLI进行预测)

当我对来自先前构建的模型的数据集运行预测时,我会得到一个列,它是“预测”,也就是每个预测实例的预测置信度

我知道百分置信度意味着什么,但我所有的预测不都应该是我的Weka模型的准确性吗

如果我有一个准确率为90%的J48决策树分类器,那么使用该模型的每个分类实例不应该都有90%的预测置信度吗


任何人都知道这个百分比置信度是如何计算的,或者当我告诉别人我的模型时,我应该如何阅读错误预测和模型准确性?感谢

基本上,当决策树在数据集上进行训练时,您通常希望(或由于缺少功能)在它超出每个训练实例之前停止它。当这种情况发生时,您将在树中的叶节点上拥有多个训练样本。通常情况下,培训标签在这一点上仍然是混合的(不是所有的正面课程,也不是所有的负面课程)

置信度是指当树在训练实例中长到一片叶子时,训练标签的一致性

编辑:注意,这也用于以干净、无偏见的方式处理缺少的特征(属性)

还可以看看昆兰在这方面关于决策树的一些工作。特别是他在C4.5上的工作

另外:“我知道百分置信度是什么意思,但我所有的预测不都应该是我的Weka模型的准确性吗?”


不,这不是真的,有些训练样本比其他样本更容易分类,这些分数反映了这一点。

谢谢,我感谢你的帮助。不幸的是,我无法阅读链接,直到我成为会员(刚刚申请)。虽然我对“一致性”这个词有点困惑。。我想我需要多读一点关于决策树的数学知识。是的,一定要读。试着在开始前阅读,你会记下大部分的概念。C4.5和J48大多只是添加了修剪的概念。作为旁注,我的经验是,信息获取树比基尼树工作得更好。