Math 如何计算内容的受欢迎程度?

Math 如何计算内容的受欢迎程度?,math,statistics,metrics,data-analysis,rating-system,Math,Statistics,Metrics,Data Analysis,Rating System,我正在开发一个网站,用户对内容进行评分(1-5颗星)。我需要衡量内容的受欢迎程度(也称为重要性/热度/兴趣)。我的第一个想法是为内容添加用户评分: 受欢迎程度=总和(评级-2.5) 如果两个用户给它5颗星,一个用户给它2颗星,那么它的受欢迎度为2.5+2.5-0.5=4.5。然后,该值将根据内容的年代而衰减。我希望它尽可能准确,所以我想知道这是否“足够好”,或者是否有更好的方法,例如分析评级分布,或者我是否必须引入更多指标(视图、评论、共享、内容花费的时间等)。这是一个经典问题。你的方法很好,但

我正在开发一个网站,用户对内容进行评分(1-5颗星)。我需要衡量内容的受欢迎程度(也称为重要性/热度/兴趣)。我的第一个想法是为内容添加用户评分:

受欢迎程度=总和(评级-2.5)


如果两个用户给它5颗星,一个用户给它2颗星,那么它的受欢迎度为2.5+2.5-0.5=4.5。然后,该值将根据内容的年代而衰减。我希望它尽可能准确,所以我想知道这是否“足够好”,或者是否有更好的方法,例如分析评级分布,或者我是否必须引入更多指标(视图、评论、共享、内容花费的时间等)。

这是一个经典问题。你的方法很好,但它是否考虑了分数的可靠性?你暗示那不是

一篇文章的收视率越高,收视率告诉你的价值就越可靠

另一方面,一个单一的坏评级是不值得信任的

能够通过计算数据集告诉我们的信息来说明数据集的可靠性,这就是统计中的Bayes。你需要一个贝叶斯平均值:看看这些文章和一个例子

由于这是一个堆栈溢出问题,这是许多关于如何计算平均值的规范SO问题之一


如果你想发现这一古老的金块的历史和哲学维度,这是一本好书。

这是一个经典问题。你的方法很好,但它是否考虑了分数的可靠性?你暗示那不是

一篇文章的收视率越高,收视率告诉你的价值就越可靠

另一方面,一个单一的坏评级是不值得信任的

能够通过计算数据集告诉我们的信息来说明数据集的可靠性,这就是统计中的Bayes。你需要一个贝叶斯平均值:看看这些文章和一个例子

由于这是一个堆栈溢出问题,这是许多关于如何计算平均值的规范SO问题之一


如果你想了解这座古老宝藏的历史和哲学维度,这本书是一本好书。

首先,流行不是一个定义明确的概念。有人可能会认为这与收视率成正比,但我也可以说“电影A很受欢迎,因为每个人都看了,但它的质量不如预期。”。这样的话,有很多收视率,但总的来说收视率不是很好

简单地说,你可以测量每部电影的平均收视率与全球平均收视率的偏差

以一种更复杂的方式,你还应该考虑有多少评级,这是很难确定的

通常,如果你正在构建一个推荐系统,你会使用项目相似性或用户相似性等,因为它们是相对的。默认情况下,受欢迎程度应该是有界的绝对规模,这是很难制定正确的建议

如果你想使用推荐系统,我建议你阅读以下文章:


首先,人气不是一个定义明确的概念。有人可能会认为这与收视率成正比,但我也可以说“电影A很受欢迎,因为每个人都看了,但它的质量不如预期。”。这样的话,有很多收视率,但总的来说收视率不是很好

简单地说,你可以测量每部电影的平均收视率与全球平均收视率的偏差

以一种更复杂的方式,你还应该考虑有多少评级,这是很难确定的

通常,如果你正在构建一个推荐系统,你会使用项目相似性或用户相似性等,因为它们是相对的。默认情况下,受欢迎程度应该是有界的绝对规模,这是很难制定正确的建议

如果你想使用推荐系统,我建议你阅读以下文章:


我使用贝叶斯估计来计算内容的平均评分(而不是我应该计算的受欢迎程度)。啊哈-听起来你可能只是把概念搞错了。我告诉你们——真正的“平均评级”本身并不是贝叶斯的,是吗?它应该只是平均值/期望值等。。。等视情况而定。然而,流行引入了一个主观维度,它只能用贝叶斯先验在公式中表示。你怎么认为?我是不是有意识形态?或者我们只是对受欢迎程度有不同的概念?这是一个困难的概念,我认为正式术语是“重要性”,它不同于“表现”(更类似于平均评级)。。问题是,评级可以是重要性和性能的指标,因为用户根据“我喜欢这个”或“我不喜欢这个”的感觉对事物进行评级,也就是说,一星级评级可以表示“我对此不感兴趣”和/或“此内容的质量很差”。为了澄清,贝叶斯估计是质量/性能的指标。我希望通过查看评级和评级数量来衡量受欢迎程度/重要性。它不需要衡量任何特定的事物-它是基于指标的指标,因此如果需要,让我们将同样的想法应用到其他指标上!你有什么?你认为什么是重要的?我使用贝叶斯估计来计算内容的平均评分(而不是我应该计算的受欢迎程度)。啊哈-听起来你可能只是把概念搞错了。我告诉你们——真正的“平均评级”本身并不是贝叶斯的,是吗?它应该只是平均值/期望值等。。。等视情况而定。然而,流行引入了一个主观维度,它只能用贝叶斯先验在公式中表示。你怎么认为?我是不是有意识形态?或者我们只是对受欢迎程度有不同的概念?这是一个困难的概念,我相信正式的术语是“重要性”,它不同于