R 使用多因子预测器从GLM中删除截距_R_Glm_Intercept_Binomial Coefficients

R 使用多因子预测器从GLM中删除截距

R 使用多因子预测器从GLM中删除截距,r,glm,intercept,binomial-coefficients,R,Glm,Intercept,Binomial Coefficients,我正在用R中的logit链接函数进行二项逻辑回归。我的回答是阶乘[0/1]，我有两个多级阶乘预测因子-我们称它们为a和b，其中a有4个因子水平（a1、a2、a3、a4），b有9个因子水平（b1、b2…b9）。因此： mod <- glm(y~a+b, family=binomial(logit),data=pretend) summary(mod) mod有趣的是给出了a1。人们期望一个因子水平作为“参考”，因此在输出中没有任何或（因为它是1.0）我认为b1是您的参考，因此是隐藏的，因

我正在用R中的logit链接函数进行二项逻辑回归。我的回答是阶乘[0/1]，我有两个多级阶乘预测因子-我们称它们为a和b，其中a有4个因子水平（a1、a2、a3、a4），b有9个因子水平（b1、b2…b9）。因此：

mod <- glm(y~a+b, family=binomial(logit),data=pretend) summary(mod)

mod有趣的是给出了a1
。人们期望一个因子水平作为“参考”，因此在输出中没有任何或（因为它是1.0）
我认为b1
是您的参考，因此是隐藏的，因此是1.0。
您可以尝试调整对比度。我最喜欢的是
options(contrasts = c('contr.sum','contr.poly'))

这里的假设是，a_i的和=0，b_i的和=0（尽管我刚刚想到，这可能不是GLM的情况）与这些对比，它通常省略最后的a和b，因为它们可以通过分别取其他a或b的和的相反值来恢复（因为它们的和都为0）
查看此问题或更多参考资料。
为什么要删除截距项并获取a1
的系数
以第一因子水平为参考，拟合了一个带因子变量的logistic回归模型。该因子水平的对数优势（系数）设置为1.0
在比较因素（或组）之间的对数优势时，得出的因素水平的所有对数优势均指基础优势。因此，您可以计算不同组之间的优势比，并预测事件发生的可能性（与基本因子水平相比）
如果a
中不再有参考级别，我不知道a
的任何级别的参考级别是什么。如果a
的参考是b1
，您如何解释？是否有任何证据表明删除截距是有意义的？（非常好奇，还没有听说过这种方法）
顺便说一句，你不需要截距来计算因子水平之间的优势比。下面是一个计算随机二项式glm的优势比的小示例：
library(oddsratio)
fit.glm <- glm(admit ~ gre + gpa + rank, data = data.glm, family = "binomial") # fit model

# Calculate OR for specific increment step of continuous variable
calc.oddsratio.glm(data = data.glm, model = fit.glm, incr = list(gre = 380, gpa = 5))

predictor oddsratio CI.low (2.5 %) CI.high (97.5 %)          increment
1     gre     2.364          1.054            5.396                380
2     gpa    55.712          2.229         1511.282                  5
3   rank2     0.509          0.272            0.945 Indicator variable
4   rank3     0.262          0.132            0.512 Indicator variable
5   rank4     0.212          0.091            0.471 Indicator variable

库（oddsratio）
glm我刚刚重新运行了模型，并交换了a和b，这样：“mod2消失项的coef为零。在mod中，“a”的coef为“a”—“a1”，而“b”的coef为“b”—“b1”，因此a1和b1的coef为零（因为glm使用“控制处理”）。在mod2中，b1的coef实际上是零，因为你没有给出截距。我认为这不是一个编程主题。
library(oddsratio)
fit.glm <- glm(admit ~ gre + gpa + rank, data = data.glm, family = "binomial") # fit model

# Calculate OR for specific increment step of continuous variable
calc.oddsratio.glm(data = data.glm, model = fit.glm, incr = list(gre = 380, gpa = 5))

predictor oddsratio CI.low (2.5 %) CI.high (97.5 %)          increment
1     gre     2.364          1.054            5.396                380
2     gpa    55.712          2.229         1511.282                  5
3   rank2     0.509          0.272            0.945 Indicator variable
4   rank3     0.262          0.132            0.512 Indicator variable
5   rank4     0.212          0.091            0.471 Indicator variable