R 我应该如何指定参数;问题;使用sample()进行重采样时? 简言之
我试图更好地理解参数R 我应该如何指定参数;问题;使用sample()进行重采样时? 简言之,r,statistics,sampling,resampling,R,Statistics,Sampling,Resampling,我试图更好地理解参数prob作为函数sample在R中的一部分。在下面的内容中,我提出了一个问题,并提供了一段与我的问题相关的R代码 问题: 假设我已经生成了10000随机标准rnorms。然后,我想从这位母亲10000standardrnorms中抽取一个size5样本 我应该如何在样本中设置prob参数,以便从母rnorm绘制这些5数字的概率考虑母rnorm的中间区域更密集,但尾部区域更薄(因此,在绘制这5个数字时,它会比尾部区域更频繁地从密集区域绘制) 过度思考是魔鬼 您希望按照原始分布或
prob
作为函数sample
在R中的一部分。在下面的内容中,我提出了一个问题,并提供了一段与我的问题相关的R代码
问题:
假设我已经生成了10000
随机标准rnorm
s。然后,我想从这位母亲10000
standardrnorm
s中抽取一个size
5
样本
我应该如何在样本中设置prob
参数,以便从母rnorm
绘制这些5
数字的概率考虑母rnorm
的中间区域更密集,但尾部区域更薄(因此,在绘制这5个数字时,它会比尾部区域更频繁地从密集区域绘制)
过度思考是魔鬼
您希望按照原始分布或经验分布对这些样本进行重采样。请考虑如何获得经验CDF:
plot(sort(x), 1:length(x)/length(x))
换句话说,经验PDF只是
plot(sort(x), rep(1/length(x), length(x)))
所以,我们想要prob=rep(1/length(x),length(x))
或者简单地说,prob=rep(1,length(x))
assample
在内部对prob
进行规范化。或者,由于默认情况下概率相等,所以不指定它。因为您是从正态分布中提取的,所以在原始分布的中心已经有了更多的观察值。因此sample()
它更有可能返回这些。您在这里试图模拟什么情况?您希望生成的分发结果是什么?@MrFlick,您是对的。我想得太多了。
plot(sort(x), rep(1/length(x), length(x)))