Algorithm 篮球比赛中罚球命中率的预测?

Algorithm 篮球比赛中罚球命中率的预测?,algorithm,statistics,probability,Algorithm,Statistics,Probability,我的实际问题比这更一般,但这里有一个具体的例子。在篮球比赛中,罚球命中率的计算公式为: 罚球命中率(FT%)=罚球命中率(FTM)/罚球未遂率(FTA) 我有两个团队,每个团队都有团队FTM和FTA的均值和方差,因此我可以将每个团队建模为随机正态变量(显然FTM和FTA是相关的)。例如,我可以很容易地计算出一支球队罚球次数比另一支球队多的概率 我的问题是。。。我怎样才能找到一支球队罚球命中率高于另一支球队的概率?为什么这么难计算?有什么想法吗 提前感谢!:-) 正态分布变量(如FTA和FTM)的

我的实际问题比这更一般,但这里有一个具体的例子。在篮球比赛中,罚球命中率的计算公式为:

罚球命中率(FT%)=罚球命中率(FTM)/罚球未遂率(FTA)

我有两个团队,每个团队都有团队FTM和FTA的均值和方差,因此我可以将每个团队建模为随机正态变量(显然FTM和FTA是相关的)。例如,我可以很容易地计算出一支球队罚球次数比另一支球队多的概率

我的问题是。。。我怎样才能找到一支球队罚球命中率高于另一支球队的概率?为什么这么难计算?有什么想法吗


提前感谢!:-)

正态分布变量(如FTA和FTM)的比率 在您的模型中),是以一种非常复杂的方式分布的!最简单的(或者可能是最不难处理的!)情况是当两个平均值都为0时,在这种情况下,比率遵循a。这种分布很难处理,因为表示均值和方差的积分没有很好的定义。但自由贸易协定 FTM有非零的平均值,所以这也是一个过于简单化的问题。所以我不认为你会找到任何简单的表达式来表示你试图计算的概率

另一种看待这个问题的方式可能是:谁在乎数学是否难解……只是 模拟一下!执行N次试验,为每个试验生成正确分布的值 每队的FTM和FTA,然后记录第1队有多少次FTM和FTA更好% 而不是第二队。N可能不需要太大,这取决于准确度 您的估算需要……可以看出,估算比例的误差变化为1/sqrt(N)

我还建议用非正态分布的东西来建模FTM。参数为n=平均值(FTA)和p=平均值(FTM)/平均值(FTA)的二项分布似乎更适合。对于两个正态分布,有一个非零概率,FTM>FTA
没有意义。

事实证明,正态分布变量(如FTA和FTM)的比率 在您的模型中),是以一种非常复杂的方式分布的!最简单的(或者可能是最不难处理的!)情况是当两个平均值都为0时,在这种情况下,比率遵循a。这种分布很难处理,因为表示均值和方差的积分没有很好的定义。但自由贸易协定 FTM有非零的平均值,所以这也是一个过于简单化的问题。所以我不认为你会找到任何简单的表达式来表示你试图计算的概率

另一种看待这个问题的方式可能是:谁在乎数学是否难解……只是 模拟一下!执行N次试验,为每个试验生成正确分布的值 每队的FTM和FTA,然后记录第1队有多少次FTM和FTA更好% 而不是第二队。N可能不需要太大,这取决于准确度 您的估算需要……可以看出,估算比例的误差变化为1/sqrt(N)

我还建议用非正态分布的东西来建模FTM。参数为n=平均值(FTA)和p=平均值(FTM)/平均值(FTA)的二项分布似乎更适合。对于两个正态分布,有一个非零概率,FTM>FTA
没有意义。

正态变量的平均值不需要为0才能使其比率遵循柯西分布吗?模拟的想法很有趣。。。虽然性能将是这里的一个考虑因素。另外,我认为你很清楚二项分布更适合FTM。谢谢你的意见@肯尼:你说得对,我错过了均值=0的条件!那样的话,数学就更糟了。我将试着改写一下我的答案。正态变量不需要平均值为0才能使它们的比率服从柯西分布吗?模拟的想法很有趣。。。虽然性能将是这里的一个考虑因素。另外,我认为你很清楚二项分布更适合FTM。谢谢你的意见@肯尼:你说得对,我错过了均值=0的条件!那样的话,数学就更糟了。我会试着改写我的答案。这个问题可能更适合新的这个问题可能更适合新的可怕公式!有什么方法可以将其应用于相关变量吗?如果允许任何形式的依赖关系,我怀疑答案是否定的。在这种情况下,我认为您可以尝试更密切地模拟情况,但结果很难分析。有一个参数为n,p(FTM)的二项式变量,其中n=FTA是一个随机变量,如你所说的正常值。我认为您不太可能找到此分发的封闭形式。我在这里找到了一篇非常简洁的文章,但我没有时间去尝试和理解它。在这种情况下,我会模拟上面的模型,然后使用bootstrap估计感兴趣的数量(如果我理解正确,两支球队的投篮平均数之差)。在R中,模块引导以及rnorm和rbinom对此非常有帮助。唯一的问题是,我不同意二项式中的p是均值(FTM)/均值(FTA),我认为p本身是一个随机变量,甚至依赖于FTA。所以模拟并不明显,也许你没有足够的信息来执行它。太棒了!有什么方法可以将其应用于相关变量吗?如果允许任何形式的依赖关系,我怀疑答案是否定的。在这种情况下,我认为您可以尝试更密切地模拟情况,但结果很难分析。有一个参数为n,p(FTM)的二项式变量,其中n=FTA是一个随机变量,如你所说的正常值。我认为您不太可能找到此分发的封闭形式。我在这里找到了一篇非常简洁的文章,但是我没有时间去尝试和理解它