Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/77.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 我应该如何指定参数;问题;使用sample()进行重采样时? 简言之_R_Statistics_Sampling_Resampling - Fatal编程技术网

R 我应该如何指定参数;问题;使用sample()进行重采样时? 简言之

R 我应该如何指定参数;问题;使用sample()进行重采样时? 简言之,r,statistics,sampling,resampling,R,Statistics,Sampling,Resampling,我试图更好地理解参数prob作为函数sample在R中的一部分。在下面的内容中,我提出了一个问题,并提供了一段与我的问题相关的R代码 问题: 假设我已经生成了10000随机标准rnorms。然后,我想从这位母亲10000standardrnorms中抽取一个size5样本 我应该如何在样本中设置prob参数,以便从母rnorm绘制这些5数字的概率考虑母rnorm的中间区域更密集,但尾部区域更薄(因此,在绘制这5个数字时,它会比尾部区域更频繁地从密集区域绘制) 过度思考是魔鬼 您希望按照原始分布或

我试图更好地理解参数
prob
作为函数
sample
在R中的一部分。在下面的内容中,我提出了一个问题,并提供了一段与我的问题相关的R代码

问题: 假设我已经生成了
10000
随机标准
rnorm
s。然后,我想从这位母亲
10000
standard
rnorm
s中抽取一个
size
5
样本

我应该如何在
样本中设置
prob
参数,以便从母
rnorm
绘制这些
5
数字的概率考虑母
rnorm
的中间区域更密集,但尾部区域更薄(因此,在绘制这5个数字时,它会比尾部区域更频繁地从密集区域绘制)

过度思考是魔鬼

您希望按照原始分布或经验分布对这些样本进行重采样。请考虑如何获得经验CDF:

plot(sort(x), 1:length(x)/length(x))
换句话说,经验PDF只是

plot(sort(x), rep(1/length(x), length(x)))

所以,我们想要
prob=rep(1/length(x),length(x))
或者简单地说,
prob=rep(1,length(x))
as
sample
在内部对
prob
进行规范化。或者,由于默认情况下概率相等,所以不指定它。

因为您是从正态分布中提取的,所以在原始分布的中心已经有了更多的观察值。因此
sample()
它更有可能返回这些。您在这里试图模拟什么情况?您希望生成的分发结果是什么?@MrFlick,您是对的。我想得太多了。
plot(sort(x), rep(1/length(x), length(x)))