stepcAIC-评估中出错(预变量、数据、环境):未找到对象“Color1”

stepcAIC-评估中出错(预变量、数据、环境):未找到对象“Color1”,r,lme4,R,Lme4,我想为我的混合效应模型选择最佳的随机结构,该模型安装了lme4中的lmer。我从cAIC4软件包中找到了函数stepcAIC,它应该比较模型并逐步选择AIC最小的模型。尽管实现看起来非常简单,但我还是遇到了一个错误 安装模型后,我运行了以下功能: stepcAIC(model_full, direction="backward") 因此,首先,它需要永远运行。第二,我收到一条错误消息。我尝试显式指定数据集: stepcAIC(model_full, direction="backward",

我想为我的混合效应模型选择最佳的随机结构,该模型安装了lme4中的lmer。我从cAIC4软件包中找到了函数stepcAIC,它应该比较模型并逐步选择AIC最小的模型。尽管实现看起来非常简单,但我还是遇到了一个错误

安装模型后,我运行了以下功能:

stepcAIC(model_full, direction="backward")
因此,首先,它需要永远运行。第二,我收到一条错误消息。我尝试显式指定数据集:

stepcAIC(model_full, direction="backward", data=data_correct)
我还尝试将R更新到最新版本,然后再次运行,但没有任何帮助

有没有人对这个函数有过积极的经验,可以告诉我我做错了什么

我得到的错误是:

evalpredvars、数据、环境中出错:未找到对象“Color1”

我有一个名为Color的变量,但不是Color1。也许Color1是一个取自效果表的名称,但是为什么它要使用摘要表中的名称并在数据框中搜索它呢

我还收到警告:

如果!hasIntresForThisGroup res[[i]]1,并且仅使用第一个元素

这里有一个[链接] 要下载正确的数据和完整的型号:

以下是我创建模型_full的方式:


只是一种回答;如果合适,将稍后删除

我无法复制您的问题,因为您的数据集对于我目前正在使用的机器来说太大了;当我尝试完全运行stepcAICmodel_时,方向=向后,我得到:

无法计算初始模型的cAIC

cAICmodel_full的消息对此进行了解释:

错误:无法分配大小为2.9 Gb的向量

这也许并不奇怪,因为该模型是中等规模的~20K观测值,28个参数。深入研究代码,我们可以看到该模型正试图构造一个维度等于观察数的密集单位矩阵——在这种情况下,n*n*8字节接近3 Gb

只有当你想根据个人水平预测选择模型时,计算cAIC才是真正必要的;如果你想在人口水平预测的基础上进行选择,AIC应该是可以接受的,并且在计算上要便宜得多。最简单的选择过程是基于p值的,我不喜欢它,因为我认为建模决策不应该基于显著性测试,但很多人都使用它

lmerTest中的step函数将执行基于p值的反向选择:

system.time(ss <- step(model_full,reduce.fixed=FALSE))
?步骤1.lmerModLmerTest

。。。“已消除”列表示从模型中消除术语的顺序,零“0”表示未从模型中消除术语


在这种情况下,阶跃函数尝试删除所有最高阶项双向交互+真值的主效应,这不涉及交互,并且发现它不想删除任何项。在这种情况下,所有术语的p值标准都有pwe,可能需要a来解决这个问题。至少,我们能得到Summary model_full的结果吗?这里有一个链接,可以分享我的数据,以及model_full:最好把数据放在问题本身中。要求人们从远程站点下载数据会增加帮助您所需的工作量。还显示了用于生成model_full的代码。我添加了另一个编辑,其中包括如何创建model_full以及model_full的摘要。我不知道如何生成类似于我的数据的内容,也不知道如何将其放入问题中。当我试图计算cAICfull_模型时,我得到一个错误:无法分配大小为2.9 Gb的向量。正在尝试使用lmerTest::step.lmerModLmerTest。你有强烈的需要做基于cAIC的减少而不是基于p值的减少吗?我不知道AIC和cAIC有那么大的不同。谢谢所以它并不是因为计算太繁重才运行的?我对step的问题是它选择的模型不收敛,这意味着它测试的所有其他模型都不收敛。我不确定我能指望两个模型之间的模型比较,这两个模型不收敛更不用说,我仍然必须以某种方式减少所选模型。
Linear mixed model fit by maximum likelihood . t-tests use Satterthwaite's method [
lmerModLmerTest]
Formula: log_RT ~ Polarity + Delay + Truth_value + Type + Color + Order +  
    Polarity:Delay + Polarity:Truth_value + Polarity:Order +  
    Polarity:Type + Polarity:Color + Delay:Truth_value + Truth_value:Delay:Polarity +  
    (1 + Polarity * Color + Delay + Delay:Polarity + Truth_value |          Subject)
   Data: data_correct
Control: lmerControl(optimizer = "bobyqa")

     AIC      BIC   logLik deviance df.resid 
 16556.6  16896.2  -8235.3  16470.6    19838 

Scaled residuals: 
    Min      1Q  Median      3Q     Max 
-3.9078 -0.6585 -0.1065  0.5654  6.5045 

Random effects:
 Groups   Name             Variance  Std.Dev. Corr                               
 Subject  (Intercept)      0.0652479 0.25544                                     
          Polarity1        0.0045472 0.06743   0.51                              
          Color1           0.0030415 0.05515   0.15  0.13                        
          Delay1           0.0005240 0.02289   0.22 -0.05 -0.02                  
          Truth_value1     0.0022027 0.04693   0.00  0.48  0.23  0.00            
          Polarity1:Color1 0.0003927 0.01982   0.04 -0.33  0.57 -0.50 -0.12      
          Polarity1:Delay1 0.0001981 0.01408   0.61  0.07  0.06  0.55  0.06 -0.04
 Residual                  0.1304137 0.36113                                     
Number of obs: 19881, groups:  Subject, 38

Fixed effects:
                                Estimate Std. Error         df t value Pr(>|t|)    
(Intercept)                    6.572e+00  4.152e-02  3.800e+01 158.301  < 2e-16 ***
Polarity1                      1.234e-01  1.124e-02  3.797e+01  10.985 2.38e-13 ***
Delay1                        -6.476e-02  4.512e-03  3.817e+01 -14.352  < 2e-16 ***
Truth_value1                   5.266e-02  8.034e-03  3.805e+01   6.556 9.83e-08 ***
Type1                          7.531e-03  2.562e-03  1.962e+04   2.939 0.003292 ** 
Color1                         2.512e-02  9.308e-03  3.756e+01   2.698 0.010379 *  
Order1                        -3.524e-02  8.981e-03  3.794e+01  -3.924 0.000354 ***
Polarity1:Delay1              -2.244e-02  3.433e-03  3.834e+01  -6.538 1.00e-07 ***
Polarity1:Truth_value1        -5.728e-02  2.563e-03  1.963e+04 -22.347  < 2e-16 ***
Polarity1:Order1              -1.250e-02  3.547e-03  3.823e+01  -3.525 0.001119 ** 
Polarity1:Type1               -7.107e-03  2.562e-03  1.962e+04  -2.774 0.005544 ** 
Polarity1:Color1               4.012e-03  4.114e-03  3.790e+01   0.975 0.335639    
Delay1:Truth_value1            5.301e-03  2.563e-03  1.963e+04   2.068 0.038629 *  
Polarity1:Delay1:Truth_value1  9.625e-03  2.563e-03  1.963e+04   3.755 0.000174 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
system.time(ss <- step(model_full,reduce.fixed=FALSE))
Backward reduced random-effect table:

                     Eliminated npar  logLik   AIC     LRT Df Pr(>Chisq)    
<none>                            43 -8235.3 16557                          
T_i(1+P*C+D+D:P+T_|S          0   36 -8366.3 16804 261.915  7  < 2.2e-16 ***
P:Ci(1+P*C+D+D:P+T|S          0   36 -8257.1 16586  43.693  7  2.451e-07 ***
P:Di(1+P*C+D+D:P+T|S          0   36 -8245.0 16562  19.507  7   0.006739 ** 
---