R 如何防止glm模型的摘要输出显示所有级别的分类变量_R_Logistic Regression_Categorical Data

R 如何防止glm模型的摘要输出显示所有级别的分类变量

R 如何防止glm模型的摘要输出显示所有级别的分类变量,r,logistic-regression,categorical-data,R,Logistic Regression,Categorical Data,我正在进行逻辑回归，以性别作为预测因素。我的问题是，当将A-X级别的“学校”包含到模型中时，我会在摘要输出中获得： > glm.1=glm(Gender~Math.Scaled.Scores.2011+Math.Scaled.Scores.2012+Math.Scaled.Scores.2013+School, data= Ed, family=binomial) > summary(glm.1) Call: glm(formula = Gender ~ Math.Scaled.S

我正在进行逻辑回归，以性别作为预测因素。我的问题是，当将A-X级别的“学校”包含到模型中时，我会在摘要输出中获得：

> glm.1=glm(Gender~Math.Scaled.Scores.2011+Math.Scaled.Scores.2012+Math.Scaled.Scores.2013+School, data= Ed, family=binomial)
> summary(glm.1)

Call:
glm(formula = Gender ~ Math.Scaled.Scores.2011 + Math.Scaled.Scores.2012 + 
    Math.Scaled.Scores.2013 + School, family = binomial, data = Ed)

Deviance Residuals: 
   Min      1Q  Median      3Q     Max  
-1.389  -1.212   1.058   1.138   1.376  

Coefficients:
                          Estimate Std. Error z value Pr(>|z|)  
(Intercept)              3.331e-02  2.223e-01   0.150   0.8809  
Math.Scaled.Scores.2011 -7.837e-04  5.401e-04  -1.451   0.1468  
Math.Scaled.Scores.2012  5.279e-05  6.298e-04   0.084   0.9332  
Math.Scaled.Scores.2013  9.878e-04  6.258e-04   1.579   0.1144  
SchoolB                  5.198e-03  2.091e-01   0.025   0.9802  
SchoolC                 -3.341e-02  2.120e-01  -0.158   0.8748  
SchoolD                 -6.354e-02  2.348e-01  -0.271   0.7867  
SchoolE                  9.032e-03  2.159e-01   0.042   0.9666  
SchoolF                 -3.553e-01  2.322e-01  -1.530   0.1260  
SchoolG                 -1.845e-01  2.325e-01  -0.794   0.4274  
SchoolH                 -2.358e-01  2.308e-01  -1.022   0.3069  
SchoolI                  1.351e-02  2.162e-01   0.062   0.9502  
SchoolJ                  1.220e-01  2.395e-01   0.509   0.6105  
SchoolK                 -3.845e-02  2.388e-01  -0.161   0.8721  
SchoolL                 -1.637e-02  2.018e-01  -0.081   0.9354  
SchoolML                 1.051e-01  2.304e-01   0.456   0.6483  
SchoolN                  4.214e-02  2.310e-01   0.182   0.8552  
SchoolO                 -1.764e-02  2.248e-01  -0.078   0.9374  
SchoolP                  3.455e-02  2.258e-01   0.153   0.8784  
SchoolQ                 -2.496e-01  2.066e-01  -1.208   0.2270  
SchoolR                 -4.046e-01  2.187e-01  -1.851   0.0642 .
SchoolS                  1.483e-02  2.139e-01   0.069   0.9447  
SchoolT                 -2.566e-01  2.334e-01  -1.100   0.2714  
SchoolU                 -4.166e-02  2.088e-01  -0.199   0.8419  
SchoolV                 -4.073e-01  2.246e-01  -1.813   0.0698 .
SchoolW                  1.074e-03  2.203e-01   0.005   0.9961  
SchoolX                 -1.056e-01  2.190e-01  -0.482   0.6298  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 5997.2  on 4327  degrees of freedom
Residual deviance: 5971.4  on 4301  degrees of freedom
AIC: 6025.4

Number of Fisher Scoring iterations: 3

它给出了每个学校的所有系数，但我希望它总体上是“学校”，而不是“学校”。所以看起来我有24个学校预测因子，而我实际上只想要1个。

好吧，你永远不会得到一个学校系数，所以lm的输出不会改变。但是你只是想测试一下这个变量的显著性吗？可能是LRT测试，比较有变量和没有变量的模型？除了“只有一个值”之外，期望的输出是什么？这个值应该是什么。如果你提供一个示例输入数据，它总是更容易帮助。考虑<代码> CA:：ANOVA（）/代码>作为获得紧凑输出的一种方式，你想做一个测试，看看是否有意义，看看May.SCORE，2011年，2012, 2013，或者学校是有意义的。什么是LRT？这是一个似然比测试。请参见以下问答：