R-返回所有级别的因素的模型矩阵_R_Logistic Regression_Predict_Model.matrix

R-返回所有级别的因素的模型矩阵

R-返回所有级别的因素的模型矩阵,r,logistic-regression,predict,model.matrix,R,Logistic Regression,Predict,Model.matrix,我需要手动预测概率。我在用电脑工作。我想从模型中删除一个变量，并保留原始系数以预测另一个周期。我的公式是： > lr$formula target ~ grupoAntig + nu_seguros_1TRUNC + cd_sexo + grupoEdad + vl_limite_aeQU + vl_ltd_6QU + Revolv3 + nu_servicios_1TRUNC + fl_cliente_hit + nu_resumen_6 + fl_rv 我想删

我需要手动预测概率。我在用电脑工作。我想从模型中删除一个变量，并保留原始系数以预测另一个周期。我的公式是：

> lr$formula
target ~ grupoAntig + nu_seguros_1TRUNC + cd_sexo + grupoEdad + 
    vl_limite_aeQU + vl_ltd_6QU + Revolv3 + nu_servicios_1TRUNC + 
    fl_cliente_hit + nu_resumen_6 + fl_rv

我想删除fl_客户。所以我使用model.matrix并排除它：

mm<-model.matrix(~ grupoAntig + nu_seguros_1TRUNC + cd_sexo + grupoEdad + 
    vl_limite_aeQU + vl_ltd_6QU + Revolv3 + nu_servicios_1TRUNC + 
     nu_resumen_6 + fl_rv, train)[,]

我想这应该保持变量的（级别数-1）级别。例如：

> ddply(train, .(grupoEdad  ), summarize, cant=length(target))
  grupoEdad  cant
1     25a40  7864
2       h25    60
3       m40 11684

矩阵只包括这3个级别中的2个，如mm[1，]

但问题在于cd_sexo：

> ddply(train, .(cd_sexo), summarize, cant=length(target))
  cd_sexo  cant
1       F  8962
2       M 10646

它只有两个级别，而且两个级别都包含在内

我的问题是，因为我想预测概率，所以我将使用系数（lr），与mm矩阵相比，我将有不同数量的变量。

表（train$cd_sexto，useNA='always'）看起来像什么？或者

with（train，table（cd_sexto，target，useNA='always'））

不确定目标是什么为什么需要手动预测概率而不是使用内置方法？基本方法是通过某种匹配（例如名称）在模型矩阵上进行列子集设置同样地，在系数向量上做索引子集。。。。但我不清楚为什么不使用内置方法。例如，下面是一个相关的问题/答案：

> ddply(train, .(cd_sexo), summarize, cant=length(target))
  cd_sexo  cant
1       F  8962
2       M 10646