R 如何训练多元线性回归模型以找到变量的最佳组合?

R 如何训练多元线性回归模型以找到变量的最佳组合?,r,lm,R,Lm,我想要运行一个包含大量变量的线性回归模型,我想要一个R函数来迭代这些变量的良好组合,并给出最佳组合 有许多不同的方法来描述最佳模型,但AIC是一种常见的方法,base R提供step,package MASS提供stepAIC 政府将相当有效地做到这一点: 自动模型选择和模型平均。为glm和其他函数提供包装,根据用户设定的约束条件,使用指定的响应和解释变量自动生成所有可能的模型,并根据某些信息标准AIC、AICc或BIC查找最佳模型。可以处理大量的候选模型。特征是当候选人的彻底筛选不可行时,采用

我想要运行一个包含大量变量的线性回归模型,我想要一个R函数来迭代这些变量的良好组合,并给出最佳组合

有许多不同的方法来描述最佳模型,但AIC是一种常见的方法,base R提供step,package MASS提供stepAIC

政府将相当有效地做到这一点:

自动模型选择和模型平均。为glm和其他函数提供包装,根据用户设定的约束条件,使用指定的响应和解释变量自动生成所有可能的模型,并根据某些信息标准AIC、AICc或BIC查找最佳模型。可以处理大量的候选模型。特征是当候选人的彻底筛选不可行时,采用遗传算法寻找最佳模型

未经请求的建议如下:

不过。请注意,虽然这种方法可以找到使样本内误差和实际数据拟合优度最小化的模型,但它有两个主要问题,应该让您在使用它时三思而后行

这种类型的数据驱动模型选择几乎总是会破坏您做出可靠推断、计算p值、置信区间等的能力。。看见 虽然使用软件包说明中列出的信息标准将有助于解决此问题,但它可能会超出您的数据
summary(lm1 <- lm(Fertility ~ ., data = swiss))
slm1 <- step(lm1)
summary(slm1)
slm1$anova