Scikit learn 使用sklearn同时使用数字和分类变量拟合决策树

Scikit learn 使用sklearn同时使用数字和分类变量拟合决策树,scikit-learn,decision-tree,categorical-data,one-hot-encoding,Scikit Learn,Decision Tree,Categorical Data,One Hot Encoding,在SKL中对分类变量使用onehotencoding时,了解如何使用稀疏矩阵生成以及其他数值变量来拟合决策树? 如果我使用OneHotEncoding将分类变量转换为稀疏矩阵,那么如何将该稀疏矩阵与原始数据集中的数值变量组合起来?使用: 使用参数categorical_features为要编码的功能编制索引(自动组合所有功能) 如果未更改sparse=True 或者:仅在变量子集上使用OneHotEncoder时,将这些值叠加到原始值上: scipy.sparse.hstack((one

在SKL中对分类变量使用onehotencoding时,了解如何使用稀疏矩阵生成以及其他数值变量来拟合决策树? 如果我使用OneHotEncoding将分类变量转换为稀疏矩阵,那么如何将该稀疏矩阵与原始数据集中的数值变量组合起来?

使用:

  • 使用参数
    categorical_features
    为要编码的功能编制索引(自动组合所有功能)
    • 如果未更改
      sparse=True
  • 或者:仅在变量子集上使用OneHotEncoder时,将这些值叠加到原始值上:
    • scipy.sparse.hstack((onehot,original))
    • 其中,
      onehot
      将是形状
      (n个样本,
      (取决于您的特长),而
      原始的
      将是形状
      (n个样本,