R中的平衡抽样

R中的平衡抽样,r,sampling,large-data,R,Sampling,Large Data,目前,我在R中使用“立方体”函数进行平衡采样。它在中等数量的数据上运行良好。但是,如果使用10000000+的全部人口,R将挂起。是否有任何适用于“大数据”的替代方案?首先,您应该重新安装软件包BalancedSampling,以确保您拥有最新版本1.4。对我来说,对于N=10000000(选择一个样本大约需要30秒)来说,它似乎工作得很好 你能供应吗? library(BalancedSampling) N = 10000000 # population size n = 100 # samp

目前,我在R中使用“立方体”函数进行平衡采样。它在中等数量的数据上运行良好。但是,如果使用10000000+的全部人口,R将挂起。是否有任何适用于“大数据”的替代方案?

首先,您应该重新安装软件包
BalancedSampling
,以确保您拥有最新版本1.4。对我来说,对于
N=10000000
(选择一个样本大约需要30秒)来说,它似乎工作得很好

你能供应吗?
library(BalancedSampling)
N = 10000000 # population size
n = 100 # sample size
p = rep(n/N,N) # inclusion probabilities
X = cbind(p,runif(N),runif(N),runif(N)) # matrix of 3 auxiliary variables
system.time(cube(p,X))
 user  system elapsed
 31.31    0.02   31.42