Python 从每个单元格中提取类别并对其进行编码
我需要对column1的值进行编码。我知道何时数据类型是分类的,或者如果它只有一个值。但是对于这种情况,我应该怎么做Python 从每个单元格中提取类别并对其进行编码,python,pandas,scikit-learn,Python,Pandas,Scikit Learn,我需要对column1的值进行编码。我知道何时数据类型是分类的,或者如果它只有一个值。但是对于这种情况,我应该怎么做 Column1 x_val y_val z_val x; y 1 1 0 y;z;x 1 1 1 x 1 0 0 z;x 1 0 1 x 1 0 0 NaN ? ? ? 注意:x_val、y_
Column1 x_val y_val z_val
x; y 1 1 0
y;z;x 1 1 1
x 1 0 0
z;x 1 0 1
x 1 0 0
NaN ? ? ?
注意:x_val、y_val、z_val是所需的列使用
pandas.Str.get_dummies
:
new_df = df["Column1"].str.get_dummies(";").add_suffix("_val")
new_df.loc[~new_df.any(1)] = '?'
print(new_df)
输出:
x_val y_val z_val
0 1 1 0
1 1 1 1
2 1 0 0
3 1 0 1
4 1 0 0
5 ? ? ?
你想要的结果是什么?x_val,y_val,z_val是你想要的吗?你所说的编码到底是什么意思?