Python Sklearn:理解分类变量的d树输出

Python Sklearn:理解分类变量的d树输出,python,python-3.x,pandas,machine-learning,scikit-learn,Python,Python 3.x,Pandas,Machine Learning,Scikit Learn,我正在学习Python 我最近在一个习题集上实现了d-tree。数据集具有所有分类特性,与R不同,Python需要对分类变量进行虚拟编码 我使用以下代码对所有分类变量进行虚拟编码: col_names =['city_name','signup_os','signup_channel'] df_with_dummies = pd.get_dummies(df2, columns = col_names) 虚拟编码基于每列具有的因子数创建新列,然后用0和1替换值: 我在这个新的数据帧上创建了一

我正在学习Python

我最近在一个习题集上实现了
d-tree
。数据集具有所有分类特性,与R不同,Python需要对分类变量进行虚拟编码

我使用以下代码对所有分类变量进行虚拟编码:

col_names =['city_name','signup_os','signup_channel']
df_with_dummies = pd.get_dummies(df2, columns = col_names)
虚拟编码基于每列具有的因子数创建新列,然后用0和1替换值:

我在这个新的数据帧上创建了一个
d-tree
算法,但让我困惑的是输出

d-tree
方法已经能够为虚拟编码列计算出.5的节点值:

如何解释输出?value
sign\u os\u windows
  • DT
    分类器将二进制分类变量表示为浮点0.5,这不是问题。条件
    signup\u os\u ios\u web

    • DT
      分类器将二进制分类变量表示为浮点0.5,这不是问题。条件
      signup\u os\u ios\u web谢谢!!这很有帮助。谢谢!!这很有帮助。
      
      Indexer          (0)  (1)    (2)      (3)
      PassengerID    Pclass Sex    Age      Fare
      1                 3    1    22.00    7.2500
      2                 1    0    38.00   71.2833
      3                 3    0    26.00    7.9250
      4                 1    0    35.00   53.1000
      5                 3    1    35.00    8.0500