Python 从每个单元格中提取类别并对其进行编码

Python 从每个单元格中提取类别并对其进行编码,python,pandas,scikit-learn,Python,Pandas,Scikit Learn,我需要对column1的值进行编码。我知道何时数据类型是分类的,或者如果它只有一个值。但是对于这种情况,我应该怎么做 Column1 x_val y_val z_val x; y 1 1 0 y;z;x 1 1 1 x 1 0 0 z;x 1 0 1 x 1 0 0 NaN ? ? ? 注意:x_val、y_

我需要对column1的值进行编码。我知道何时数据类型是分类的,或者如果它只有一个值。但是对于这种情况,我应该怎么做

Column1  x_val y_val z_val 
   x; y    1     1     0
   y;z;x   1     1     1 
   x       1     0     0
   z;x     1     0     1
   x       1     0     0
   NaN     ?     ?     ?

注意:x_val、y_val、z_val是所需的列

使用
pandas.Str.get_dummies

new_df = df["Column1"].str.get_dummies(";").add_suffix("_val")
new_df.loc[~new_df.any(1)] = '?'
print(new_df)
输出:

  x_val y_val z_val
0     1     1     0
1     1     1     1
2     1     0     0
3     1     0     1
4     1     0     0
5     ?     ?     ?

你想要的结果是什么?x_val,y_val,z_val是你想要的吗?你所说的编码到底是什么意思?