Python Scikit使用随机林学习分类数据

Python Scikit使用随机林学习分类数据,python,scikit-learn,random-forest,Python,Scikit Learn,Random Forest,我正在卡格尔参加泰坦尼克号生存挑战赛 我没有R方面的经验,所以我使用Python和Scikit学习随机林分类器 我看到许多人使用scikit学习将他们的多层次分类转换为虚拟变量 我不明白这样做的意义,为什么我们不能把等级映射成一个数值,然后用它来完成呢 我还看到有人做了以下事情: 有一个分类特征Pclass有三个级别,他为此创建了三个虚拟变量,并删除了生存率最低的变量。我也不明白这一点,我认为决策树并不关心相关的特性。如果您只是将级别映射到数值,python会将您的值视为数值。也就是说,数值1如

我正在卡格尔参加泰坦尼克号生存挑战赛

我没有R方面的经验,所以我使用Python和Scikit学习随机林分类器

我看到许多人使用scikit学习将他们的多层次分类转换为虚拟变量

我不明白这样做的意义,为什么我们不能把等级映射成一个数值,然后用它来完成呢

我还看到有人做了以下事情:
有一个分类特征Pclass有三个级别,他为此创建了三个虚拟变量,并删除了生存率最低的变量。我也不明白这一点,我认为决策树并不关心相关的特性。

如果您只是将级别映射到数值,python会将您的值视为数值。也就是说,数值
1如果您只是将级别映射到数值,python将把您的值视为数值。也就是说,数值
1