Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/295.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python Numpy 1自由度_Python_Numpy_Statistics - Fatal编程技术网

Python Numpy 1自由度

Python Numpy 1自由度,python,numpy,statistics,Python,Numpy,Statistics,在下面的代码中,我对第三行的含义感到困惑。ddof=1的作用是什么。我试着查了一下,但我还是不太明白这个概念或目的。如果有人能给我指出正确的方向,我将不胜感激 谢谢 data = stats.binom.rvs(n = 10, p = 0.3, size = 10000) print "Mean: %g" % np.mean(data) print "SD: %g" % np.std(data, **ddof=1**) 自由度是一个重要的概念,你可能想这样做,但是计算的差异实际上是直截了当的,

在下面的代码中,我对第三行的含义感到困惑。ddof=1的作用是什么。我试着查了一下,但我还是不太明白这个概念或目的。如果有人能给我指出正确的方向,我将不胜感激

谢谢

data = stats.binom.rvs(n = 10, p = 0.3, size = 10000)
print "Mean: %g" % np.mean(data)
print "SD: %g" % np.std(data, **ddof=1**)

自由度是一个重要的概念,你可能想这样做,但是计算的差异实际上是直截了当的,考虑这些:

In [20]:

x = np.array([6,5,4,6,6,7,2])
In [21]:

np.std(x)
Out[21]:
1.5518257844571737

#default is ddof=0, what this actually does:
In [22]:

np.sqrt((((x-x.mean())**2)/len(x)).sum())
Out[22]:
1.5518257844571737
In [23]:

np.std(x, ddof=1)
Out[23]:
1.6761634196950517

#what ddof=1 does:
In [24]:

np.sqrt((((x-x.mean())**2)/(len(x)-1)).sum())
Out[24]:
1.6761634196950517

在大多数语言中(
R
SAS
等),默认值是返回ddof=1的std
numpy
的默认值是ddof=0,这值得注意

它指的是分母自由度

在某些情况下(例如,使用人口级别数据),分母为N。在其他情况下(例如,样本级别数据),分母为N-1(或ddof值设置为的任何值)

所以这里的区别是你想除以N,还是除以N-ddof?何时何地除以每个是一个更特定于领域/上下文的问题

在numpy中,默认值为ddof=0(除以N),因此如果需要不同的分母值,则必须手动指定它

这是一个统计概念

总体的标准偏差公式:

但大多数时候,我们试图用样本标准差来估计总体的真实标准差。上面的公式是一个向下偏置的估计,使用N-1代替N给我们一个校正

查看维基:有关更多信息,请先阅读:

表示自由度的增量。计算中使用的除数 计算是
N-ddof
,其中
N
表示元素的数量。 默认情况下,
ddof
为零

搜索然后解释统计概念(重点):

统计参数的估计可以基于不同的 大量的信息或数据。独立数据块的数量 用于参数估计的信息称为 自由度。一般来说,估计的自由度 一个参数的值等于独立得分的个数 输入估计值减去用作中间值的参数数 估计参数本身的步骤(大多数情况下 样本方差有
N− 1
自由度,因为它是计算出来的 从N个随机分数减去估计为 中间步骤,即样本平均值


我认为ddof的意思是“自由度的增量”:减去多少度。