Python 如何使用scipy.stats expect函数?

Python 如何使用scipy.stats expect函数?,python,scipy,statistics,Python,Scipy,Statistics,我期待着 scipy.stats.norm.expect(loc = 55, scale = 1) 返回分布55的平均值,而不是返回3.9096876333292135e-108。 我用错了吗?谁能给我解释一下这个函数是如何工作的吗。谢谢我想这应该是个bug。您已经正确理解了手册,但事实证明,如果“loc”大于35.6,则会出现异常情况。否则,它将按预期工作。问题: import scipy.stats #expect(func, loc=0, scale=1, lb=None, ub=Non

我期待着

scipy.stats.norm.expect(loc = 55, scale = 1)
返回分布55的平均值,而不是返回3.9096876333292135e-108。
我用错了吗?谁能给我解释一下这个函数是如何工作的吗。谢谢

我想这应该是个bug。您已经正确理解了手册,但事实证明,如果
“loc”
大于35.6,则会出现异常情况。否则,它将按预期工作。

问题:

import scipy.stats
#expect(func, loc=0, scale=1, lb=None, ub=None, conditional=False, **kwds)

for i in range(26, 55):
    print scipy.stats.norm.expect(loc=i,scale=1),
输出:

26.0
27.0
28.0
29.0
30.0
31.0
32.0
33.0
34.0
35.0
3.36373206533e-10
1.24696133938e-13
1.7005527212e-17
8.53164410131e-22
1.57463854604e-26
1.06913991702e-31
2.670507049e-37
2.45390887262e-43
8.29523418554e-50
1.03158350625e-56
4.71938759035e-64
7.94277793838e-72
4.91773037097e-80
1.12011477121e-88
9.38568238273e-98
2.89317497775e-107
3.28087032536e-117
1.4932849185e-127
3.63870849201e-118
对于更大的
尺度
(标准偏差),行为的“截止线”会进一步向外移动,正如您所期望的那样

问题可以通过明确设置下限和上限来“修复”,如下所示:

import numpy as np

for i in np.arange(5,100,5):
    print i,scipy.stats.norm.expect(loc=55,lb=-i,ub=i,scale=1) 
输出:

5 0.0
10 0.0
15 0.0
20 2.01210143973e-267
25 1.05364770562e-196
30 7.87517644756e-137
35 8.61623210583e-88
40 1.40277331283e-49
45 3.46495136419e-22
50 1.42791169386e-05
55 27.1010577196
60 54.9999827474
65 55.0
70 55.0
75 55.0
80 55.0
85 55.0
90 55.0
95 55.0
但肯定有一个微妙的错误。如果查看类的方法(参见
rv_continue
),您会发现默认限制作为Numpy的“inf”导入。 如果以+/-np.inf的形式明确运行限制,则会得到与所述OP相同的行为:

for i in np.arange(5,60,5):
    print i,scipy.stats.norm.expect(loc=i,lb=-np.inf,ub=np.inf,scale=1) 
输出:

5 5.0
10 10.0
15 15.0
20 20.0
25 25.0000000007
30 30.0
35 35.0
40 1.57463854604e-26
45 1.03158350625e-56
50 9.38568238273e-98
55 3.90968763333e-108
还请注意,在中的
expect
定义中,集成警告被静音:

    # Silence floating point warnings from integration.
    olderr = np.seterr(all='ignore')
    vals = integrate.quad(fun, lb, ub, **kwds)[0] / invfac

问题的根源很可能是
integrate.quad
如何处理给定为+/-
np.inf的限制。中给出了无限区间(映射到有限范围,就像Riemann球体的情况一样)数值积分的实际但粗略的描述。

是的,但“截止点”取决于比例,对于更大的比例值,则更为重要。如果你给某人下一票,请帮助他们评论如何做得更好。我认为问题中的“loc=55”将分布中心移动到55,pdf应该是np.exp(-(x-55)**2/2)/np.sqrt(2*np.pi),在55左右更大。