Scikit learn 使用sklearn同时使用数字和分类变量拟合决策树
在SKL中对分类变量使用onehotencoding时,了解如何使用稀疏矩阵生成以及其他数值变量来拟合决策树? 如果我使用OneHotEncoding将分类变量转换为稀疏矩阵,那么如何将该稀疏矩阵与原始数据集中的数值变量组合起来?使用:Scikit learn 使用sklearn同时使用数字和分类变量拟合决策树,scikit-learn,decision-tree,categorical-data,one-hot-encoding,Scikit Learn,Decision Tree,Categorical Data,One Hot Encoding,在SKL中对分类变量使用onehotencoding时,了解如何使用稀疏矩阵生成以及其他数值变量来拟合决策树? 如果我使用OneHotEncoding将分类变量转换为稀疏矩阵,那么如何将该稀疏矩阵与原始数据集中的数值变量组合起来?使用: 使用参数categorical_features为要编码的功能编制索引(自动组合所有功能) 如果未更改sparse=True 或者:仅在变量子集上使用OneHotEncoder时,将这些值叠加到原始值上: scipy.sparse.hstack((one
- 使用参数
为要编码的功能编制索引(自动组合所有功能)categorical_features
- 如果未更改
sparse=True
- 如果未更改
- 或者:仅在变量子集上使用OneHotEncoder时,将这些值叠加到原始值上:
scipy.sparse.hstack((onehot,original))
- 其中,
将是形状onehot
(取决于您的特长),而(n个样本,
将是形状原始的
(n个样本,