在逻辑回归中,如何设置我的';参考水平';用于python中的虚拟变量
我正在用python使用statsmodel做一个逻辑回归模型。因为我的很多专栏都是分类的,所以我用“get_dummies”对它们进行了热编码。我的新dataframe现在有了更多的1和0列。(即性别1、性别2、状态1、状态2、状态3等)在逻辑回归中,如何设置我的';参考水平';用于python中的虚拟变量,python,scikit-learn,regression,logistic-regression,statsmodels,Python,Scikit Learn,Regression,Logistic Regression,Statsmodels,我正在用python使用statsmodel做一个逻辑回归模型。因为我的很多专栏都是分类的,所以我用“get_dummies”对它们进行了热编码。我的新dataframe现在有了更多的1和0列。(即性别1、性别2、状态1、状态2、状态3等) 有了这个新的数据框架,我如何为我的逻辑回归设置“参考水平”?默认情况下,我如何知道我的参考级别设置为多少?我不是100%了解您的问题,但在scikit learn中存在一个概念 如果您有一个数据帧df,它的工作原理如下: from sklearn.dummy
有了这个新的数据框架,我如何为我的逻辑回归设置“参考水平”?默认情况下,我如何知道我的参考级别设置为多少?我不是100%了解您的问题,但在
scikit learn
中存在一个概念
如果您有一个数据帧df,它的工作原理如下:
from sklearn.dummy import DummyRegressor
clf = DummyRegressor(strategy='mean', random_state=0)
clf = clf.fit(X, y)
还有带有
导入DummyClassifier
的DummyClassifier。查看文档,我们的想法始终是预测平均值或最常见类别的基线。什么是参考水平?你能举个例子吗?就像你做逻辑回归一样,系数表示参考水平的大小。比如,如果你有两个变量(“男性”、“女性”、“未知”),如果你的参考水平是“男性”,那么分配给“女性”的系数就是你预测的男性变量的可能性。我肯定我没有完全正确地解释它,但我知道确实存在参考类别的概念。