Python 使用ColumnTransformer学习一个热编码
我的数据集第8列有分类数据。我想对这些数据进行编码,我正在使用ColumnTransformer。我第一次尝试使用这种方法时,我使用了以下代码:Python 使用ColumnTransformer学习一个热编码,python,scikit-learn,Python,Scikit Learn,我的数据集第8列有分类数据。我想对这些数据进行编码,我正在使用ColumnTransformer。我第一次尝试使用这种方法时,我使用了以下代码: from sklearn.preprocessing import OneHotEncoder from sklearn.preprocessing import LabelEncoder from sklearn.compose import ColumnTransformer #encoding categorical data for dept
from sklearn.preprocessing import OneHotEncoder
from sklearn.preprocessing import LabelEncoder
from sklearn.compose import ColumnTransformer
#encoding categorical data for dept column(independent variables)
ct = ColumnTransformer(transformers=[('one_hot_encoder',OneHotEncoder(categories='auto'), [0])],
remainder='passthrough')
X = np.array(ct.fit_transform(X), dtype=np.float)
请注意,我正在使用LabelEncoder编码我的因变量,这是完美的工作。现在的问题是,当我第一次执行这段代码时,没有出现错误,但是在我的例子中,当我将列索引改为[8]时,我得到了一个与索引[0]有关的错误。
ValueError:无法将字符串转换为浮点:“Emp ID”
我认为这引发了两个问题,第一,我的专栏标题没有被这样解读,第二,索引没有被改为8
我添加了:
drop='first'
,希望删除[0]列,但是没有用为什么不使用Keras来进行分类呢
from keras.utils.np_utils import to_categorical
X = to_categorical(X)
为什么不使用Keras来进行分类呢
from keras.utils.np_utils import to_categorical
X = to_categorical(X)
请包括一些表格的样本/结构
X
请包括一些表格的样本/结构X