Machine learning 是否有任何度量来评估输出概率';分类模型的精度?

Machine learning 是否有任何度量来评估输出概率';分类模型的精度?,machine-learning,statistics,probability,Machine Learning,Statistics,Probability,我目前正在用Python和Keras为二进制分类任务(成功/失败)开发一个模型。我的目标是为每次观察生成成功概率,以便以后在另一项任务中使用它们 你知道有哪种度量标准可以量化这些概率的准确性(而不是模型的整体准确性) 提前谢谢。您是否尝试过使用类似的度量?谢谢您的回答。我在维基百科上查看了Brier分数,但它似乎只是一个简单的MSE,但却是公式的有趣分解()。这是每个预测组的biais_平方+方差分解,可以在我的例子中使用,但问题仍然在于选择足够大的组,使其不为空,但又不太大,使其具有接近的预测

我目前正在用Python和Keras为二进制分类任务(成功/失败)开发一个模型。我的目标是为每次观察生成成功概率,以便以后在另一项任务中使用它们

你知道有哪种度量标准可以量化这些概率的准确性(而不是模型的整体准确性)


提前谢谢。

您是否尝试过使用类似的度量?谢谢您的回答。我在维基百科上查看了Brier分数,但它似乎只是一个简单的MSE,但却是公式的有趣分解()。这是每个预测组的biais_平方+方差分解,可以在我的例子中使用,但问题仍然在于选择足够大的组,使其不为空,但又不太大,使其具有接近的预测概率。任何关于选择“正确”群体的建议都是欢迎的。