Python Sklearn:理解分类变量的d树输出
我正在学习Python 我最近在一个习题集上实现了Python Sklearn:理解分类变量的d树输出,python,python-3.x,pandas,machine-learning,scikit-learn,Python,Python 3.x,Pandas,Machine Learning,Scikit Learn,我正在学习Python 我最近在一个习题集上实现了d-tree。数据集具有所有分类特性,与R不同,Python需要对分类变量进行虚拟编码 我使用以下代码对所有分类变量进行虚拟编码: col_names =['city_name','signup_os','signup_channel'] df_with_dummies = pd.get_dummies(df2, columns = col_names) 虚拟编码基于每列具有的因子数创建新列,然后用0和1替换值: 我在这个新的数据帧上创建了一
d-tree
。数据集具有所有分类特性,与R不同,Python需要对分类变量进行虚拟编码
我使用以下代码对所有分类变量进行虚拟编码:
col_names =['city_name','signup_os','signup_channel']
df_with_dummies = pd.get_dummies(df2, columns = col_names)
虚拟编码基于每列具有的因子数创建新列,然后用0和1替换值:
我在这个新的数据帧上创建了一个d-tree
算法,但让我困惑的是输出
d-tree
方法已经能够为虚拟编码列计算出.5的节点值:
如何解释输出?valuesign\u os\u windows
DT
分类器将二进制分类变量表示为浮点0.5,这不是问题。条件signup\u os\u ios\u web
DT
分类器将二进制分类变量表示为浮点0.5,这不是问题。条件signup\u os\u ios\u web谢谢!!这很有帮助。谢谢!!这很有帮助。
Indexer (0) (1) (2) (3)
PassengerID Pclass Sex Age Fare
1 3 1 22.00 7.2500
2 1 0 38.00 71.2833
3 3 0 26.00 7.9250
4 1 0 35.00 53.1000
5 3 1 35.00 8.0500