Statistics 分类时计算置信度

Statistics 分类时计算置信度,statistics,machine-learning,nlp,probability,Statistics,Machine Learning,Nlp,Probability,我正在使用朴素贝叶斯算法来预测电影的正面或负面收视率。我能够以81%的准确率给电影评分。然而,我也在尝试为每个评级分配一个“信心水平” 我试图确定如何告诉用户“我们认为审查是积极的,有80%的信心”。有人能帮我理解如何计算分类结果的置信度吗?你可以报告Naive Bayes计算的概率p(y |x)。(但请注意,Naive Bayes不是一个很好的概率模型,即使它不是一个很糟糕的分类器。)由于Naive Bayes实际上计算非常“小”的值,报告(对于结果为“正”的二元分类)p(正| x)/(p(正

我正在使用朴素贝叶斯算法来预测电影的正面或负面收视率。我能够以81%的准确率给电影评分。然而,我也在尝试为每个评级分配一个“信心水平”


我试图确定如何告诉用户“我们认为审查是积极的,有80%的信心”。有人能帮我理解如何计算分类结果的置信度吗?

你可以报告Naive Bayes计算的概率p(y |x)。(但请注意,Naive Bayes不是一个很好的概率模型,即使它不是一个很糟糕的分类器。)

由于Naive Bayes实际上计算非常“小”的值,报告(对于结果为“正”的二元分类)p(正| x)/(p(正| x)+p(负| x))作为用户的“分数”不是更好吗?@lejlot p(pos x)+p(负| x)=1,所以我看不出这有什么变化。这只适用于概率,而不适用于NB的典型实现所存储的值(通常是非规范化的,对吗?@lejlot:取决于OP的实现,但如果你调用NB P(y | x)中的值,那么这表明它们是概率:)P(正| x)是规范化的,类成员的后验概率。可能性p(x |正)是非常小的。Larsmans完全正确你能分享一下你的实现吗?很难说你是如何实现朴素贝叶斯的:作为一个概率分类器(它可以做你想做的事情)或者作为一个线性模型(它稍微快一点)。