Python 如何使用列中给定的多个标签创建列表

Python 如何使用列中给定的多个标签创建列表,python,pandas,csv,Python,Pandas,Csv,我有一个csv文件,有两列…图像名称和相应的多个标签。我想把它转换成一个多二进制向量。但是我犯了一个错误 我在标签的第二列上直接试用了sklearn的倍增器 df[“标签”][0]给出: ['label1', 'label2', 'label3'] df.head() 我想为此获得二进制代码。我尝试了下面的代码,它对我有效。我相信还有其他方法,但希望这能有所帮助。 我的输入文件如下所示 将熊猫作为pd导入 将numpy作为np导入 从sklearn.preprocessing导入多Label

我有一个csv文件,有两列…图像名称和相应的多个标签。我想把它转换成一个多二进制向量。但是我犯了一个错误

我在标签的第二列上直接试用了sklearn的
倍增器

df[“标签”][0]
给出:

['label1', 'label2', 'label3']
df.head()


我想为此获得二进制代码。

我尝试了下面的代码,它对我有效。我相信还有其他方法,但希望这能有所帮助。
我的输入文件如下所示

将熊猫作为pd导入
将numpy作为np导入
从sklearn.preprocessing导入多LabelBinarizer
file=pd.read\u csv('file.csv',sep='\t')
y=file['label'].apply(lambda f:f.split(','))
binarizer=MultiLabelBinarizer()
one_hot=二值化器.fit_变换(y.values)
打印(一个热的二进制程序类)

我尝试了下面的代码,它对我有效。我相信还有其他方法,但希望这能有所帮助。
我的输入文件如下所示

将熊猫作为pd导入
将numpy作为np导入
从sklearn.preprocessing导入多LabelBinarizer
file=pd.read\u csv('file.csv',sep='\t')
y=file['label'].apply(lambda f:f.split(','))
binarizer=MultiLabelBinarizer()
one_hot=二值化器.fit_变换(y.values)
打印(一个热的二进制程序类)

欢迎来到StackOverflow。请花点时间阅读这篇文章,以及如何提供答案,并相应地修改你的问题。这些提示可能也很有用。欢迎使用StackOverflow。请花点时间阅读这篇文章,以及如何提供答案,并相应地修改你的问题。这些提示可能也很有用。从你的问题来看,我只能猜测这是因为你的标签在一个数组中。在调用fit_transform之前,我们需要拆分值。根据您的问题,我只能猜测这是因为您的标签位于一个数组中。我们需要在调用fit_transform之前拆分值。