是否可以将输入设置为“0”;套索“;python中是否包含分类变量?
我想用lasso在python中执行多元线性回归。我不确定输入观察矩阵X是否可以包含分类变量。我在这里阅读了说明: 但它很简单,并没有指明允许的类型。例如,我的代码包括:是否可以将输入设置为“0”;套索“;python中是否包含分类变量?,python,scikit-learn,lasso-regression,Python,Scikit Learn,Lasso Regression,我想用lasso在python中执行多元线性回归。我不确定输入观察矩阵X是否可以包含分类变量。我在这里阅读了说明: 但它很简单,并没有指明允许的类型。例如,我的代码包括: model = Lasso(fit_intercept=False, alpha=0.01) model.fit(X, y) 在上面的代码中,X是一个大小为n-X-p的观察矩阵,其中一个p变量可以是分类类型吗?您需要使用1和0表示分类变量。如果您的分类变量是二进制的,这意味着每个变量都属于两个类别中的一个,那么您可以将所有类
model = Lasso(fit_intercept=False, alpha=0.01)
model.fit(X, y)
在上面的代码中,
X
是一个大小为n-X-p的观察矩阵,其中一个p变量可以是分类类型吗?您需要使用1和0表示分类变量。如果您的分类变量是二进制的,这意味着每个变量都属于两个类别中的一个,那么您可以将所有类别A和B变量分别替换为0和1。如果某些类别有两个以上,则需要使用
我通常将数据放在Pandas数据框中,在这种情况下,我使用
houses=pd.get_dummies(houses)
,这将创建虚拟变量 您需要使用1和0表示分类变量。如果您的分类变量是二进制的,这意味着每个变量都属于两个类别中的一个,那么您可以将所有类别A和B变量分别替换为0和1。如果某些类别有两个以上,则需要使用
我通常将数据放在Pandas数据框中,在这种情况下,我使用
houses=pd.get_dummies(houses)
,这将创建虚拟变量 前面的海报对此给出了很好的答案,您需要对分类变量进行编码。标准方法是一种热编码(或虚拟编码),但有很多方法可以实现这一点
这是一个很好的库,它有许多不同的方法可以对分类变量进行编码。这些工具也用于Sci工具包学习
前面的海报对此给出了很好的答案,您需要对分类变量进行编码。标准方法是一种热编码(或虚拟编码),但有很多方法可以实现这一点 这是一个很好的库,它有许多不同的方法可以对分类变量进行编码。这些工具也用于Sci工具包学习
不,不仅仅是套索,整个sklearn不支持fit()中的分类变量,predict()函数如果要使用分类功能,请尝试使用
sklearn
模块的OneHotEncoder
将它们编码为数值,不,不仅仅是套索,整个sklearn不支持fit()中的分类变量,predict()功能如果要使用分类功能,请尝试使用sklearn
的onehotcoder
模块将其编码为数值,