R 使用启动包按组启动

R 使用启动包按组启动,r,statistics-bootstrap,R,Statistics Bootstrap,我有这样一个“my.dataset”: ID Species SEX Category V1 V2 V3 87790 Caniceps F F_Caniceps -0.34 -0.55 0.61 199486 Caniceps F F_Caniceps -0.34 -0.56 0.63 199490 Caniceps F F_Caniceps -0.37 -0.54 0.57 19

我有这样一个“my.dataset”:

   ID    Species  SEX     Category     V1      V2     V3
87790   Caniceps    F   F_Caniceps  -0.34   -0.55   0.61
199486  Caniceps    F   F_Caniceps  -0.34   -0.56   0.63
199490  Caniceps    F   F_Caniceps  -0.37   -0.54   0.57
199493  Caniceps    F   F_Caniceps  -0.35   -0.54   0.58
200139  Caniceps    F   F_Caniceps  -0.39   -0.51   0.51
393151  Caniceps    M   M_Caniceps  -0.36   -0.56   0.55
393154  Caniceps    M   M_Caniceps  -0.36   -0.55   0.55
486210  Caniceps    M   M_Caniceps  -0.41   -0.50   0.45
811945  Hyemalis    F   F_Hyemalis  -0.35   -0.54   0.55
811947  Hyemalis    F   F_Hyemalis  -0.35   -0.59   0.62
 15661  Hyemalis    M   M_Hyemalis  -0.34   -0.56   0.62
 15662  Hyemalis    M   M_Hyemalis  -0.35   -0.53   0.53
 15663  Hyemalis    M   M_Hyemalis  -0.33   -0.58   0.68
 15664  Vulcani     F   F_Vulcani   -0.29   -0.57   0.71
 15665  Vulcani     F   F_Vulcani   -0.29   -0.56   0.67
 15666  Vulcani     F   F_Vulcani   -0.28   -0.55   0.70
486218  Vulcani     F   F_Vulcani   -0.36   -0.55   0.56
486224  Vulcani     F   F_Vulcani   -0.36   -0.54   0.56
486212  Vulcani     M   M_Vulcani   -0.37   -0.53   0.53
486213  Vulcani     M   M_Vulcani   -0.37   -0.53   0.54
199479  Vulcani     M   M_Vulcani   -0.33   -0.57   0.61
199483  Vulcani     M   M_Vulcani   -0.33   -0.62   0.69
199484  Vulcani     M   M_Vulcani   -0.33   -0.60   0.65
我正在尝试使用
boot()
执行引导,以计算变量“V1”、“V2”和“V3”的统计信息,类似于:

boot(my.dataset, statistic=lda (formula=lda(SEX~V1+V2+V3, data=my.dataset), R=3, sim = "ordinary")
   statfun = function(d, i) {lda(formula=SEX~V1+V2+V3, data=d[i, ])}
res <- boot(my.dataset, statfun, R=100, strata=factor(my.dataset$Species))
但我需要重新采样,以根据“my.dataset”的“Category”变量获取相同数量的个体。你知道怎么做吗

您正在寻找引导的“分层”参数。这称为分层引导。备注:我不确定您的启动代码是否正确,我建议如下:

boot(my.dataset, statistic=lda (formula=lda(SEX~V1+V2+V3, data=my.dataset), R=3, sim = "ordinary")
   statfun = function(d, i) {lda(formula=SEX~V1+V2+V3, data=d[i, ])}
res <- boot(my.dataset, statfun, R=100, strata=factor(my.dataset$Species))
statfun=function(d,i){lda(formula=SEX~V1+V2+V3,data=d[i,])

res你的
公式
参数似乎有问题…@guillermo fris嗨,如果有任何答案解决了你的问题,你能点击“接受它”让其他人看到吗?非常感谢,我会照你的建议去做@吉勒莫弗里斯,不客气。如果它解决了你的问题,请考虑接受答案,这样别人就可以从中受益。