如何使用Python/Pandas转换正态分布?

如何使用Python/Pandas转换正态分布?,python,pandas,statistics,regression,Python,Pandas,Statistics,Regression,我正在寻找一种方便的方法来测试熊猫的正态分布 Stata有一个有用的梯形图/曲线图,可以计算或绘制多个变换 我知道R在“HH”包中包含了类似的功能 我想知道是否有一种方法可以通过Pandas/Python实现类似的功能 非常感谢 设置 np.random.seed(0) df = pd.DataFrame(np.random.normal(0, 1.5, (100, 1)), columns=['data']) 使用scipy.stats.normaltest功能: from scipy.st

我正在寻找一种方便的方法来测试熊猫的正态分布

Stata有一个有用的梯形图/曲线图,可以计算或绘制多个变换

我知道R在“HH”包中包含了类似的功能

我想知道是否有一种方法可以通过Pandas/Python实现类似的功能

非常感谢

设置

np.random.seed(0)
df = pd.DataFrame(np.random.normal(0, 1.5, (100, 1)), columns=['data'])
使用
scipy.stats.normaltest
功能:

from scipy.stats import normaltest
k2, p = normaltest(df.data)

p
0.796799418250495

该函数测试数据来自正态分布的无效假设。
p
的值越高,数据来自正态分布的概率越高。应用一个阈值(通常为0.05),超过该阈值,无效假设将无法被拒绝。

谢谢,这非常有用。“ladder/glader”函数自动运行normaltest本身以及一组可能的转换(log10、sqrt等)。我想知道熊猫身上是否有内置的东西,或者是否有人知道这样做的软件包?@col.slade啊,我不知道。正如他们在python中所说,显式优于隐式。您需要自己编写这些转换,但如果您使用
np.log10
np.sqrt
等,应该一点也不难。@col.slade如果您的问题得到了回答,请。您可以通过单击答案旁边的灰色复选框将其切换为绿色来完成此操作。