如何识别R中自变量的组合冗余

如何识别R中自变量的组合冗余,r,R,我有一个数据集,有15个线性回归的自变量。单独测试时,一个变量与因变量有很强的相关性。相关矩阵还表明,它与任何其他自变量都没有完全(甚至非常密切)的相关性。然而,当我创建一个包含所有变量的线性模型时,这个变量并没有增加预测能力。我假设这意味着它与模型中其他变量的某些组合是冗余的。除了手动检查包括该变量在内的每个独立变量组合之外,是否有一些自动方法来确定哪些其他变量共同导致该变量冗余?似乎最直接的解决方案是将新变量与其他预测值进行回归?这很有趣。如果我对假设的冗余变量的其他预测因子进行了详尽的测试

我有一个数据集,有15个线性回归的自变量。单独测试时,一个变量与因变量有很强的相关性。相关矩阵还表明,它与任何其他自变量都没有完全(甚至非常密切)的相关性。然而,当我创建一个包含所有变量的线性模型时,这个变量并没有增加预测能力。我假设这意味着它与模型中其他变量的某些组合是冗余的。除了手动检查包括该变量在内的每个独立变量组合之外,是否有一些自动方法来确定哪些其他变量共同导致该变量冗余?

似乎最直接的解决方案是将新变量与其他预测值进行回归?这很有趣。如果我对假设的冗余变量的其他预测因子进行了详尽的测试,我认为这将确定完全预测它所需的最少量,如果确实存在一些其他变量的组合,如果完全预测的话。我试试看。谢谢