提取R中多个列之间的最佳线性回归模型

提取R中多个列之间的最佳线性回归模型,r,regression,R,Regression,这可能需要一点时间来解释,但现在开始 在本例中,假设我有两列与真实世界观测数据RealX相关,还有四列与来自真实世界数据的模型输出的预测ModX相关。为了使事情复杂化,数据被分类变量分组 我想做的是确定每个分类变量的观测值和预测值之间的最佳线性回归模型lmRealX~ModX。我并不太在意哪列给出了最好的模型,只是每个类别的最佳模型的R平方和P值 下面是一些示例数据来说明数据结构: RealA <- c(3,2,2,6,7,9,3,1,4,6) RealB <- c(3,2,1,5,

这可能需要一点时间来解释,但现在开始

在本例中,假设我有两列与真实世界观测数据RealX相关,还有四列与来自真实世界数据的模型输出的预测ModX相关。为了使事情复杂化,数据被分类变量分组

我想做的是确定每个分类变量的观测值和预测值之间的最佳线性回归模型lmRealX~ModX。我并不太在意哪列给出了最好的模型,只是每个类别的最佳模型的R平方和P值

下面是一些示例数据来说明数据结构:

RealA <- c(3,2,2,6,7,9,3,1,4,6)
RealB <- c(3,2,1,5,8,8,4,2,5,5)
Mod1 <- c(2,2,3,4,6,7,4,1,5,6)
Mod2 <- c(1,4,2,4,7,8,4,2,6,5)
Mod3 <- c(3,2,2,5,8,7,5,3,4,5)
Mod4 <- c(3,1,1,3,8,7,3,2,5,6)
Cat <- c("A", "A", "A", "A", "A", "B", "B", "B", "B", "B")
DF <- data.frame(Cat, RealA, RealB, Mod1, Mod2, Mod3, Mod4)
对于上面的例子,我想找出A类和B类最佳线性回归模型的R平方和p值


谢谢

您是否在寻找最佳简单线性回归,其中只有一个预测变量在截距之外?是的,找到它的最佳简单线性回归,即lmRealX~ModXUse步骤。