从R中正态分布的特定部分取样

从R中正态分布的特定部分取样,r,random,sampling,resampling,R,Random,Sampling,Resampling,我试图首先提取所有值,我想您正在寻找这样的值: mother <- rnorm(1e6) p1 <- mother[mother <= -4] 您可以使用函数sample参数prob。引用帮助(“示例”): 概率权重向量,用于获取 正在采样的向量 在详细信息部分: 可选的prob参数可用于为 获取被采样向量的元素。它们不需要求和 对1,但它们应该是非负的,而不是全部为零 所以你必须小心,离平均值越远,概率越小,正态分布很快下降到概率的小值 set.seed(1315)

我试图首先提取所有值
,我想您正在寻找这样的值:

mother <- rnorm(1e6)
p1 <- mother[mother <= -4]

您可以使用函数
sample
参数
prob
。引用
帮助(“示例”)

概率权重向量,用于获取 正在采样的向量

详细信息部分

可选的prob参数可用于为 获取被采样向量的元素。它们不需要求和 对1,但它们应该是非负的,而不是全部为零

所以你必须小心,离平均值越远,概率越小,正态分布很快下降到概率的小值

set.seed(1315)    # Make the results reproducible

mother <- rnorm(1e6)
p1 <- mother[mother <= -4]

p2 <- sample(p1, 50, replace = T, prob = pnorm(p1))

从截短的正态分布开始取样不是更容易吗

truncnorm::rtruncnorm(50, a = -Inf, b = -4)

@rnorouzian矿山假设正态分布,TUSHAr使用均匀分布。@rnorouzian我得到一个错误,
样本中的错误.int(长度(x),大小,替换,概率):概率数不正确
@rnorouzian是,对于示例数据集,
平均值(p1)
返回
[1]-4.208714
平均值(p2)
返回
[1]-4.125671
@rnorouzian是的,它会。
sd越大
的影响就越大。我认为这种方法不能正确地从正态分布中采样(以x为条件)
set.seed(1315)    # Make the results reproducible

mother <- rnorm(1e6)
p1 <- mother[mother <= -4]

p2 <- sample(p1, 50, replace = T, prob = pnorm(p1))
hist(p2)
truncnorm::rtruncnorm(50, a = -Inf, b = -4)