在逻辑回归中，如何设置我的'；参考水平'；用于python中的虚拟变量_Python_Scikit Learn_Regression_Logistic Regression_Statsmodels

在逻辑回归中，如何设置我的'；参考水平'；用于python中的虚拟变量

python scikit-learn

在逻辑回归中，如何设置我的'；参考水平'；用于python中的虚拟变量,python,scikit-learn,regression,logistic-regression,statsmodels,Python,Scikit Learn,Regression,Logistic Regression,Statsmodels,我正在用python使用statsmodel做一个逻辑回归模型。因为我的很多专栏都是分类的，所以我用“get_dummies”对它们进行了热编码。我的新dataframe现在有了更多的1和0列。（即性别1、性别2、状态1、状态2、状态3等）有了这个新的数据框架，我如何为我的逻辑回归设置“参考水平”？默认情况下，我如何知道我的参考级别设置为多少？我不是100%了解您的问题，但在scikit learn中存在一个概念如果您有一个数据帧df，它的工作原理如下： from sklearn.dummy

我正在用python使用statsmodel做一个逻辑回归模型。因为我的很多专栏都是分类的，所以我用“get_dummies”对它们进行了热编码。我的新dataframe现在有了更多的1和0列。（即性别1、性别2、状态1、状态2、状态3等）

有了这个新的数据框架，我如何为我的逻辑回归设置“参考水平”？默认情况下，我如何知道我的参考级别设置为多少？

我不是100%了解您的问题，但在

scikit learn

中存在一个概念

如果您有一个数据帧df，它的工作原理如下：

from sklearn.dummy import DummyRegressor
clf = DummyRegressor(strategy='mean', random_state=0)
clf = clf.fit(X, y)

还有带有

导入DummyClassifier

的DummyClassifier。查看文档，我们的想法始终是预测平均值或最常见类别的基线。

什么是参考水平？你能举个例子吗？就像你做逻辑回归一样，系数表示参考水平的大小。比如，如果你有两个变量（“男性”、“女性”、“未知”），如果你的参考水平是“男性”，那么分配给“女性”的系数就是你预测的男性变量的可能性。我肯定我没有完全正确地解释它，但我知道确实存在参考类别的概念。