R

R,r,sampling,subsampling,R,Sampling,Subsampling,在R中,有30个类别的数据集(N簇=30),在每个簇中有不相等数量的单元(在第i簇中,可以有24、25、26、27或28个单元)。我想采取两个阶段的抽样,首先从n中抽取n个簇,然后在这些n个簇中,随机抽取每个选定簇中50%的单元 例如: ls=list(4,c(1,1,1,1)) mstage(b,stage=list("cluster","cluster"),varnames=list("REGION","AREA"), size=ls, method=c("systematic"

在R中,有30个类别的数据集(N簇=30),在每个簇中有不相等数量的单元(在第i簇中,可以有24、25、26、27或28个单元)。我想采取两个阶段的抽样,首先从n中抽取n个簇,然后在这些n个簇中,随机抽取每个选定簇中50%的单元

例如:

ls=list(4,c(1,1,1,1))
mstage(b,stage=list("cluster","cluster"),varnames=list("REGION","AREA"),
      size=ls, method=c("systematic","systematic"),pik=prob)
我的情况是:

mstage(cs.bb2,stage=list("cluster",""), varnames=list("Team","Team"),
     size=list(12,c(?)),pik=list(rep(0.5,797)), method=list("srswor","srswor"))
我上面的代码不起作用。我不知道如何使用“size=”的第二个参数? 对我的代码的任何修改或这两个阶段采样的替代解决方案都将不胜感激

例如:

如果不知道数据的结构,甚至不知道mstage来自哪个包,就很难提供有意义的建议。也许这可以提供一些指导。在这里的回答中,我创建了一个函数,用于从数据帧执行分层采样。这应该可以用来帮助解决你的问题。谢谢,我更新了你的代码以适应我的情况。