R 用虚拟变量预测线性边缘

R 用虚拟变量预测线性边缘,r,regression,prediction,dummy-data,R,Regression,Prediction,Dummy Data,我正在尝试使用下面的代码和库中的GenCont数据进行岭回归ridge library(ridge) data(GenCont) GenCont_df <- as.data.frame(GenCont) GenCont_df$SNP1 <- as.factor(GenCont_df$SNP1) mod2 <- linearRidge(Phenotypes ~ SNP1+SNP2, data = GenCont_df) predict(mod2, GenCont_df, na.a

我正在尝试使用下面的代码和库中的GenCont数据进行岭回归
ridge

library(ridge)
data(GenCont)
GenCont_df <- as.data.frame(GenCont)
GenCont_df$SNP1 <- as.factor(GenCont_df$SNP1)
mod2 <- linearRidge(Phenotypes ~ SNP1+SNP2, data = GenCont_df)
predict(mod2, GenCont_df, na.action = na.pass, all.coef = FALSE,scaling ="scale")

有没有一种方法可以预测R中岭回归中的虚拟变量?

岭回归似乎在某一点上使用了PCA,对于这一点,分类变量很难转化为可以用有意义的距离表示的度量。在这种情况下,R中有一条捷径,我可以重新编码虚拟变量。假设我有A类、B类和C类,我想为它们创建一个列,包含1和0Nevermind,
model。矩阵
似乎有效。你能解释一下你是如何修复错误@jbest的吗?岭回归似乎在某个时候使用PCA,对于那些分类变量很难转化为可以在有意义的距离内表达的度量。在这种情况下,在R中有一条捷径,我可以重新编码我的虚拟变量。假设我有类别A、B和C,我想为它们创建一个列,包含1和0Nevermind,
model.matrix
似乎有效。你能解释一下你是如何修复@jbest错误的吗?
Error in X[, ll] : subscript out of bounds