Python 如何用多个字符串对数据帧列进行热编码?

Python 如何用多个字符串对数据帧列进行热编码?,python,string,pandas,dataframe,Python,String,Pandas,Dataframe,我目前正在建立一个回归模型来预测食物的运送时间 这是一个有一些观察的数据帧 如果你观察美食专栏,你会发现它有很多弦。使用代码 pd.get_dummies(data.Cuisines.str.split(',',expand=True),prefix='c') 这有助于我分割字符串和热编码,然而,有一个新问题需要处理 合并了数据帧和假人。快餐出现在第一排和第三排。预期的输出是第一行和第三行的值为1的单个快餐列,但是,创建了两个快餐列。第一行创建快餐(第4列),第三行创建快餐(第15列) 有

我目前正在建立一个回归模型来预测食物的运送时间

这是一个有一些观察的数据帧

如果你观察美食专栏,你会发现它有很多弦。使用代码

pd.get_dummies(data.Cuisines.str.split(',',expand=True),prefix='c')
这有助于我分割字符串和热编码,然而,有一个新问题需要处理

合并了数据帧和假人。快餐出现在第一排和第三排。预期的输出是第一行和第三行的值为1的单个快餐列,但是,创建了两个快餐列。第一行创建快餐(第4列),第三行创建快餐(第15列)


有人能帮我解决这个问题吗?有人能帮我在第一行和第三行得到一个值为1的快餐栏,其他菜系也是如此。

这两个
快餐的尾随空格不同。您可能想试试:

data.Cuisines.str.get_dummies(',\s*')

还是一样。这段代码再次创建了两个不同的快餐栏。