Algorithm 标准化分数数据集的最佳方法是什么?

Algorithm 标准化分数数据集的最佳方法是什么?,algorithm,normalization,Algorithm,Normalization,我有很多elo分数(http://en.wikipedia.org/wiki/Elo_rating_system)大部分范围在800-1300之间(这是一个开放式刻度,因此没有特定的最小值或最大值)。某人的分数从1000开始,然后根据表现上下浮动。我希望将其正常化,以便我可以按照以下要求将分数显示为5.0-10.0: 它必须反映所有分数的相对等级。或者换句话说,由于所有分数都从1000开始,并从1000开始向上或向下移动,每个分数与1000之间的距离应该反映在标准化中。例如,如果分数为{950

我有很多elo分数(http://en.wikipedia.org/wiki/Elo_rating_system)大部分范围在800-1300之间(这是一个开放式刻度,因此没有特定的最小值或最大值)。某人的分数从1000开始,然后根据表现上下浮动。我希望将其正常化,以便我可以按照以下要求将分数显示为5.0-10.0:

  • 它必须反映所有分数的相对等级。或者换句话说,由于所有分数都从1000开始,并从1000开始向上或向下移动,每个分数与1000之间的距离应该反映在标准化中。例如,如果分数为{950、975、1000、1025},则应将其标准化为低于{1050、1075、1100、1125}的数字

  • 它必须保持分数之间的距离。例如,如果一些分数紧密地聚在一起,比如说{950,950,955,1100},那么它们应该标准化为接近的数字,比如{6,6,6.1,9}


问题在于,您不知道输入范围的实际最小值和最大值是多少(因为ELO是一个开放式刻度)

一旦你决定了你的最小值和最大值将是什么,剪辑和线性插值


如果你不知道怎么做(这是我怀疑的),请查看wiki上的公式,和/或参加小学代数复习课程。

问题是你不知道输入范围的实际最小值和最大值是多少(因为ELO是一个开放式量表)

一旦你决定了你的最小值和最大值将是什么,剪辑和线性插值


如果你不知道怎么做(这是我怀疑的),请查看维基上的公式,和/或参加小学代数复习课程。

在维基百科上快速搜索批评使用标准化分数作为排名较低玩家的倾斜数据。在问这个问题之前,我想先看一看是值得的,因为Elo分数似乎很普遍,我相信其他人也知道如何做到这一点,并发表了相关文章。Elo并不完美,但我认为批评与这个问题没有直接关系。这与每场比赛后如何计算分数更为相关,因为该公式使用的是正态分布。维基百科上的快速搜索批评了将标准化分数用作排名较低球员的倾斜数据的做法。在问这个问题之前,我想先看一看是值得的,因为Elo分数似乎很普遍,我相信其他人也知道如何做到这一点,并发表了相关文章。Elo并不完美,但我认为批评与这个问题没有直接关系。这与每场比赛后如何计算分数更为相关,因为该公式使用正态分布。是的,开放式量表使这成为一个难题。如果我有一个一致的最小值和最大值,那么将很容易正常化,但我没有。也许你应该重新考虑你的设计。如果分数是ELO,只需将其表示为已收到,而不是已解决的5-10个问题-数字就是它们。不幸的是,这不能满足我的用户需求。好吧,用有限范围表示无限范围,必须给出一些东西。剪辑或压缩-选择权在你。是的,开放式刻度使这成为一个难题。如果我有一个一致的最小值和最大值,那么将很容易正常化,但我没有。也许你应该重新考虑你的设计。如果分数是ELO,只需将其表示为已收到,而不是已解决的5-10个问题-数字就是它们。不幸的是,这不能满足我的用户需求。好吧,用有限范围表示无限范围,必须给出一些东西。剪辑或压缩-由您选择。