Math 如何根据可变的比赛次数计算公平的总比赛分数?

Math 如何根据可变的比赛次数计算公平的总比赛分数?,math,statistics,Math,Statistics,我有一个游戏,你可以在每场比赛中得分从-40到+40。 用户可以玩任意数量的比赛。 我想计算一个总分数,它隐式地考虑了比赛的数量 只计算平均数是不公平的。 例如,如果彼得打了四场比赛,每场比赛得到40分,那么他的总得分是相同的 以Janne的身份得分,他只打了一场比赛,得了40分 把比赛分数加起来也不公平。 彼得打了两场比赛(每场比赛40分),总分80分。 詹恩打了8场比赛(每场比赛得10分),总分80分 是否有一种(简单)公平的方法来计算总分? 我读过关于国际象棋评分的Elo&Glicko系统

我有一个游戏,你可以在每场比赛中得分从-40到+40。 用户可以玩任意数量的比赛。 我想计算一个总分数,它隐式地考虑了比赛的数量

只计算平均数是不公平的。 例如,如果彼得打了四场比赛,每场比赛得到40分,那么他的总得分是相同的 以Janne的身份得分,他只打了一场比赛,得了40分

把比赛分数加起来也不公平。 彼得打了两场比赛(每场比赛40分),总分80分。 詹恩打了8场比赛(每场比赛得10分),总分80分

是否有一种(简单)公平的方法来计算总分? 我读过关于国际象棋评分的Elo&Glicko系统,但两者都是基于
一个球员的评级历史和对手的评级

使公式与游戏次数成非线性关系

设G为游戏数,S为所有游戏分数之和, 总分=G^2*S


玩游戏,直到你找到合乎逻辑的东西。

这取决于你想将玩过的游戏与分数进行比较。您可以定义一个返回游戏权重的函数:一场游戏只返回一个小分数,很多游戏返回一个小分数(例如,1-1/(2*#游戏)),并将其乘以累积分数。

您可以检查赢分情况,并为连续赢分(+5,+10,+15…),因此(-10,+10,+10,+10,+10)将给出分数(-10,+10,+15,+20,-10,+10)。你也可以在不考虑跑步的情况下完成,这将得到(-10,+10,+15,+20,-10,+25)


另一种可能是在开始时将奖金值设置为0,如果玩家输了,则将奖金值减少5,如果玩家赢了,则将奖金值增加5。

我认为没有好的方法在单个数字中创建这样的分数

我建议计算平均成功率,并包括游戏数量

  • 彼得得分40/2(两场比赛平均40分)
  • Janne得分10/8(8场比赛平均10分)
您可以快速查看第二个数字是否较大,第一个数字是否更准确


否则,请使用ELO,但仅当每位玩家至少打10场比赛时,它才是准确的。

您可以将分数设置为该玩家在过去30场比赛中最好的10场比赛的平均值(或者其他一些数字-可能只有最后10场才适合您)

还没有玩过10场比赛的玩家可以取他们玩过的比赛的平均值,然后将其加权到0,以补偿n<10的平均值比10的平均值有更高的标准偏差。不确定每n的比例因子应该是多少,但如果你有一些过去的数据要看,你可以计算出了解典型球员的得分有多大变化,并从中得出结论


或者计算出每场比赛的全球平均得分(可能为0),然后加上(10-n)当计算一个少于10场比赛的玩家的分数时,这个数字是假的。

你可以看看,几个月前我读到过关于它的文章,我真的忘记了大部分细节,所以我不确定它是否超级合适,但它可能是一个很好的灵感。

另一个起点可能是维基百科关于t国际象棋排名系统

另一种方法是使用贝叶斯统计。将每支队伍获胜的概率建模为贝塔分布,并计算一个分布的样本大于另一个分布的样本的概率。这种方法用于测试癌症药物。它不仅考虑了哪种药物具有比较两名球员或两支球队是完全相似的

这听起来可能比实际情况更复杂,但进行这些计算是有必要的,而且在某些情况下,手工计算很容易


请参阅和详细说明。

这取决于您想强调什么,但我认为这既简单又有效:

平均得分+玩过的游戏

您可以对变量进行一些加权(例如,如果您想产生更大的影响,可以玩2*个游戏),但基本关系似乎是合理的


在您的第一个示例中,Peter的分数为44,Jane的分数为40,但如果Peter开始失分,Jane可以迎头赶上。

我建议将游戏分数设置为95%置信区间的下限。在极限范围内,当您玩很多游戏时,您的游戏分数接近您的平均分数,但严格来说总是比较低。这就像使用平均得分,但对那些只打了几场比赛,可能只是运气好的人表示适当的怀疑

换句话说,这是一个悲观的估计,在玩了足够多的游戏后,真实平均值会是多少

如何计算95%置信区间而不存储整个分数列表:

或者,如果您记录所玩游戏的数量、玩家分数的总和以及他们分数的平方和,您可以按如下方式计算标准误差:

SE = sqrt((ss - s^2/n) / (n-1) / n)
与其为95%的CI烦恼,不如让游戏分数为:

s/n - SE
请注意,当只玩过一场游戏时,上述为负无穷大。这意味着您将给只玩过一场游戏的人尽可能低的分数作为他们的游戏分数

另一个想法是在给人们排名时明确显示置信区间(按低端排序)。然后人们会玩更多的游戏来缩小他们的CI,同时增加他们的平均值

最后,为最近的游戏增加权重可能是有意义的,这样一个孤立的坏游戏的重要性会更快地衰减。这样做的方法是选择一个大于1的贴现因子
d
,并给
i
th游戏一个
d^(i-1)
(尽管那时我不再确定如何应用这个参数)