Python 如何使用泊松分布计算列的期望值&;然后与实际值进行比较?

Python 如何使用泊松分布计算列的期望值&;然后与实际值进行比较?,python,dataframe,poisson,Python,Dataframe,Poisson,我有一个包含不同游戏结果的数据框。我需要用泊松分布计算预期结果(相同分数的游戏数),然后将实际结果与预期结果进行比较。因此,假设我有2个游戏的结果为2,4个游戏的结果为9,依此类推。我需要与实际值相对应的预期结果,即产生特定结果的游戏数 我计算了结果列的平均值,我读到的结果列也被称为期望值。绘制了实际结果的直方图 import pandas as pd import numpy as np # Game Results DataFrame game_results = pd.DataFrame

我有一个包含不同游戏结果的数据框。我需要用泊松分布计算预期结果(相同分数的游戏数),然后将实际结果与预期结果进行比较。因此,假设我有2个游戏的结果为2,4个游戏的结果为9,依此类推。我需要与实际值相对应的预期结果,即产生特定结果的游戏数

我计算了结果列的平均值,我读到的结果列也被称为期望值。绘制了实际结果的直方图

import pandas as pd
import numpy as np

# Game Results DataFrame
game_results = pd.DataFrame({"game_id":[56,57,58,59,60],"result":[0,9,4,6,8]})
print(game_results)

# Histogram for result column

result = game_results["result"]

plt.hist(result)
plt.xlabel("Result")
plt.ylabel("Number of Games")
plt.title("Result Histogram")

lamb = result.mean()

您可以使用
np.random.poisson
平均值和观察次数(即
len(游戏结果)
)绘制随机泊松分布:


这里的确切问题是什么?代码中没有问题。我需要找到如何找到与实际结果相对应的泊松分布的预期结果。泊松分布公式给出了我不需要的概率。(另外,我不知道应该用什么替换“k”此实例的值。谢谢,这很有帮助。我可以再问一件事吗?您建议我如何比较实际结果和预期结果。无需提供代码。只需想法即可。
errors=actual-expected
,反之亦然。取
错误
总和(平方(errors
)的平均值。您可以使用
RMSE
或熊猫套餐中包含的任何其他指标。如果答案有帮助,请进行投票
import numpy as np

game_results = pd.DataFrame({"game_id":[56,57,58,59,60],"result":[0,9,4,6,8]})
# Get the lambda
lamb = result.mean()
# Draw a random poisson distribution using the lambda
game_results["expected"] = np.random.poisson(lamb, len(game_results))