Statistics 如何根据分数标准化评论

Statistics 如何根据分数标准化评论,statistics,normalize,Statistics,Normalize,让评论正常化的最佳方式是什么?也就是说,假设我们有用户可以从1-5颗星投票的产品 简单地计算平均值并不是一个好方法,因为它不考虑评论的数量 例如,如果一个产品只有一个5星级的评价,它不应该领先于一个有10000个评价的产品,仅仅因为唯一的评价给了它5星级 从本质上讲,我如何根据评论的数量将分数正常化?如果我的答案看起来很疯狂,我很抱歉。但是当我第一次看到你的问题时,我想到了下面的答案 计算排名靠前的250个标题的公式给出了一个真实的答案 贝叶斯估计: weighted rating (WR) =

让评论正常化的最佳方式是什么?也就是说,假设我们有用户可以从1-5颗星投票的产品

简单地计算平均值并不是一个好方法,因为它不考虑评论的数量

例如,如果一个产品只有一个5星级的评价,它不应该领先于一个有10000个评价的产品,仅仅因为唯一的评价给了它5星级


从本质上讲,我如何根据评论的数量将分数正常化?

如果我的答案看起来很疯狂,我很抱歉。但是当我第一次看到你的问题时,我想到了下面的答案

计算排名靠前的250个标题的公式给出了一个真实的答案 贝叶斯估计:

weighted rating (WR) = (v ÷ (v+m)) × R + (m ÷ (v+m)) × C 
其中:

R=电影的平均值(平均值)=(评级)

v=电影的票数=(票数)

m=需要列入前250名的最低票数(目前为 3000)

C=整个报告的平均投票数(目前为6.9)

(这是IMDB根据用户评论和投票对他们的顶级电影进行排名的方式。下面是我获得上述文章的页面链接:)