Python 如何从经验分布函数中提取样本

Python 如何从经验分布函数中提取样本,python,scipy,statistics,statistics-bootstrap,Python,Scipy,Statistics,Statistics Bootstrap,我试图在Python上实现非参数引导。它需要获取一个样本,从中构建一个经验分布函数,然后从这个edf生成一组样本。我怎么做? 在scipy中,我只找到了如何制作自己的分布函数,如果您知道描述它的确切公式,但我只有一个edf。通过对样本进行排序得到的edf: N = samples.size ss = np.sort(samples) # these are the x-values of the edf # the y-values are 1/(2N

我试图在Python上实现非参数引导。它需要获取一个样本,从中构建一个经验分布函数,然后从这个edf生成一组样本。我怎么做?
在scipy中,我只找到了如何制作自己的分布函数,如果您知道描述它的确切公式,但我只有一个edf。

通过对样本进行排序得到的edf:

N = samples.size
ss = np.sort(samples) # these are the x-values of the edf
                      # the y-values are 1/(2N), 3/(2N), 5/(2N) etc.
edf = lambda x: np.searchsorted(ss, x) / N
然而,如果你只想重新取样,那么你只需以相同的概率和替换率从样本中抽取


如果这对你来说太“steppy”,你可以使用某种插值来获得平滑分布。

根据定义,EDF是steppy@是的,我知道。但通常人们对edf本身并不感兴趣,而是将其作为一种估计“真实”分布的设备。人们可能有充分的理由认为真实的分布是平滑的。此外,根据您使用新样本的目的,从真实分布平滑的离散分布进行采样可能会导致伪影。这很有趣。。。“你经常整理你的引导吗?”maxymoo幸运的是,我的日常生活不需要太多统计数据。为什么,你有什么原则性的反对意见吗?我总是很乐意倾听卓越的知识。lol“幸运的”不,我绝对没有卓越的知识或任何原则性的反对意见,我在这里学到了一些东西,如果我在引导中观察到人工制品,我会记住平滑技巧。你为什么需要EDF?您只需从数据中采样(替换),这些将是您的引导样本