Statistics 如何根据分数标准化评论
让评论正常化的最佳方式是什么?也就是说,假设我们有用户可以从1-5颗星投票的产品 简单地计算平均值并不是一个好方法,因为它不考虑评论的数量 例如,如果一个产品只有一个5星级的评价,它不应该领先于一个有10000个评价的产品,仅仅因为唯一的评价给了它5星级Statistics 如何根据分数标准化评论,statistics,normalize,Statistics,Normalize,让评论正常化的最佳方式是什么?也就是说,假设我们有用户可以从1-5颗星投票的产品 简单地计算平均值并不是一个好方法,因为它不考虑评论的数量 例如,如果一个产品只有一个5星级的评价,它不应该领先于一个有10000个评价的产品,仅仅因为唯一的评价给了它5星级 从本质上讲,我如何根据评论的数量将分数正常化?如果我的答案看起来很疯狂,我很抱歉。但是当我第一次看到你的问题时,我想到了下面的答案 计算排名靠前的250个标题的公式给出了一个真实的答案 贝叶斯估计: weighted rating (WR) =
从本质上讲,我如何根据评论的数量将分数正常化?如果我的答案看起来很疯狂,我很抱歉。但是当我第一次看到你的问题时,我想到了下面的答案 计算排名靠前的250个标题的公式给出了一个真实的答案 贝叶斯估计:
weighted rating (WR) = (v ÷ (v+m)) × R + (m ÷ (v+m)) × C
其中:
R=电影的平均值(平均值)=(评级)
v=电影的票数=(票数)
m=需要列入前250名的最低票数(目前为
3000)
C=整个报告的平均投票数(目前为6.9)
(这是IMDB根据用户评论和投票对他们的顶级电影进行排名的方式。下面是我获得上述文章的页面链接:)