Machine learning 确定模型的准确性,该模型估计其中一类的概率

Machine learning 确定模型的准确性,该模型估计其中一类的概率,machine-learning,regression,data-mining,random-forest,cross-validation,Machine Learning,Regression,Data Mining,Random Forest,Cross Validation,我正在为一个事件建模,它有两个结果:0(拒绝)和1(接受)。我创建了一个模型,用于估计1(接受)发生的概率(即,该模型将计算“1”发生的概率为80%,或者换句话说,接受概率为0.8) 现在,我有大量的试验结果记录和模型的估计值(例如:接受概率=0.8和实际等级(接受度=1))。我想量化或验证模型的准确性。这可能吗?如果可能,如何实现 注:我只是预测1类的概率。假设类1的预测值为0.8,实际类值为1。现在我想找到我的模型的性能 您只需将概率转换为具有阈值舍入的两个离散类之一,即,如果p(y=1 |

我正在为一个事件建模,它有两个结果:0(拒绝)和1(接受)。我创建了一个模型,用于估计1(接受)发生的概率(即,该模型将计算“1”发生的概率为80%,或者换句话说,接受概率为0.8)

现在,我有大量的试验结果记录和模型的估计值(例如:接受概率=0.8和实际等级(接受度=1))。我想量化或验证模型的准确性。这可能吗?如果可能,如何实现


注:我只是预测1类的概率。假设类1的预测值为0.8,实际类值为1。现在我想找到我的模型的性能

您只需将概率转换为具有阈值舍入的两个离散类之一,即,如果p(y=1 | x)>0.5:预测1,否则预测0。那么所有的指标都是适用的。阈值可以通过检查ROC曲线和/或精度回忆变化来选择,也可以简单地设置为0.5。

通过预测对对象进行排序


然后计算结果曲线的ROC AUC。

准确度、精密度、召回率、AUC、二进制交叉熵、MSE、MAE等都是您可以使用的指标,但AUC需要二进制输出,因此我们可以创建混淆矩阵,然后进行绘图。但在我的情况下,我无法创建混淆矩阵。我正在预测第1类(接受)的概率,我需要将其与第1类进行比较。有什么想法吗?AUC既不需要二进制输出,也不需要混淆矩阵。它需要每个对象的分数,用于对对象进行排序。您只需要一个二进制引用进行计算。