Python 使用ColumnTransformer学习一个热编码

Python 使用ColumnTransformer学习一个热编码,python,scikit-learn,Python,Scikit Learn,我的数据集第8列有分类数据。我想对这些数据进行编码,我正在使用ColumnTransformer。我第一次尝试使用这种方法时,我使用了以下代码: from sklearn.preprocessing import OneHotEncoder from sklearn.preprocessing import LabelEncoder from sklearn.compose import ColumnTransformer #encoding categorical data for dept

我的数据集第8列有分类数据。我想对这些数据进行编码,我正在使用ColumnTransformer。我第一次尝试使用这种方法时,我使用了以下代码:

from sklearn.preprocessing import OneHotEncoder
from sklearn.preprocessing import LabelEncoder
from sklearn.compose import ColumnTransformer

#encoding categorical data for dept column(independent variables)
ct = ColumnTransformer(transformers=[('one_hot_encoder',OneHotEncoder(categories='auto'), [0])],
                       remainder='passthrough')
X = np.array(ct.fit_transform(X), dtype=np.float)
请注意,我正在使用LabelEncoder编码我的因变量,这是完美的工作。现在的问题是,当我第一次执行这段代码时,没有出现错误,但是在我的例子中,当我将列索引改为[8]时,我得到了一个与索引[0]有关的错误。 ValueError:无法将字符串转换为浮点:“Emp ID” 我认为这引发了两个问题,第一,我的专栏标题没有被这样解读,第二,索引没有被改为8


我添加了:
drop='first'
,希望删除[0]列,但是没有用

为什么不使用Keras来进行分类呢

from keras.utils.np_utils import to_categorical

X = to_categorical(X)

为什么不使用Keras来进行分类呢

from keras.utils.np_utils import to_categorical

X = to_categorical(X)

请包括一些表格的样本/结构
X
请包括一些表格的样本/结构
X