Machine learning Weka预测（百分比置信度）-它是什么意思？_Machine Learning_Weka_Data Analysis

Machine learning Weka预测（百分比置信度）-它是什么意思？

machine-learning

Machine learning Weka预测（百分比置信度）-它是什么意思？,machine-learning,weka,data-analysis,Machine Learning,Weka,Data Analysis,我一直在自学Weka，并学会了如何构建模型并从中获得预测（使用CLI进行预测）当我对来自先前构建的模型的数据集运行预测时，我会得到一个列，它是“预测”，也就是每个预测实例的预测置信度我知道百分置信度意味着什么，但我所有的预测不都应该是我的Weka模型的准确性吗如果我有一个准确率为90%的J48决策树分类器，那么使用该模型的每个分类实例不应该都有90%的预测置信度吗任何人都知道这个百分比置信度是如何计算的，或者当我告诉别人我的模型时，我应该如何阅读错误预测和模型准确性？感谢基本上，当决策树

我一直在自学Weka，并学会了如何构建模型并从中获得预测（使用CLI进行预测）

当我对来自先前构建的模型的数据集运行预测时，我会得到一个列，它是“预测”，也就是每个预测实例的预测置信度

我知道百分置信度意味着什么，但我所有的预测不都应该是我的Weka模型的准确性吗

如果我有一个准确率为90%的J48决策树分类器，那么使用该模型的每个分类实例不应该都有90%的预测置信度吗

任何人都知道这个百分比置信度是如何计算的，或者当我告诉别人我的模型时，我应该如何阅读错误预测和模型准确性？感谢

基本上，当决策树在数据集上进行训练时，您通常希望（或由于缺少功能）在它超出每个训练实例之前停止它。当这种情况发生时，您将在树中的叶节点上拥有多个训练样本。通常情况下，培训标签在这一点上仍然是混合的（不是所有的正面课程，也不是所有的负面课程）

置信度是指当树在训练实例中长到一片叶子时，训练标签的一致性

编辑：注意，这也用于以干净、无偏见的方式处理缺少的特征（属性）

还可以看看昆兰在这方面关于决策树的一些工作。特别是他在C4.5上的工作

另外：“我知道百分置信度是什么意思，但我所有的预测不都应该是我的Weka模型的准确性吗？”

不，这不是真的，有些训练样本比其他样本更容易分类，这些分数反映了这一点。

谢谢，我感谢你的帮助。不幸的是，我无法阅读链接，直到我成为会员（刚刚申请）。虽然我对“一致性”这个词有点困惑。。我想我需要多读一点关于决策树的数学知识。是的，一定要读。试着在开始前阅读，你会记下大部分的概念。C4.5和J48大多只是添加了修剪的概念。作为旁注，我的经验是，信息获取树比基尼树工作得更好。