Python 如何使用列中给定的多个标签创建列表_Python_Pandas_Csv

Python 如何使用列中给定的多个标签创建列表

python pandas csv

Python 如何使用列中给定的多个标签创建列表,python,pandas,csv,Python,Pandas,Csv,我有一个csv文件，有两列…图像名称和相应的多个标签。我想把它转换成一个多二进制向量。但是我犯了一个错误我在标签的第二列上直接试用了sklearn的倍增器 df[“标签”][0]给出： ['label1', 'label2', 'label3'] df.head（）我想为此获得二进制代码。我尝试了下面的代码，它对我有效。我相信还有其他方法，但希望这能有所帮助。我的输入文件如下所示将熊猫作为pd导入将numpy作为np导入从sklearn.preprocessing导入多Label

我有一个csv文件，有两列…图像名称和相应的多个标签。我想把它转换成一个多二进制向量。但是我犯了一个错误

我在标签的第二列上直接试用了sklearn的

倍增器
df[“标签”][0]
给出：
['label1', 'label2', 'label3']

df.head（）
我想为此获得二进制代码。
我尝试了下面的代码，它对我有效。我相信还有其他方法，但希望这能有所帮助。

我的输入文件如下所示


将熊猫作为pd导入
将numpy作为np导入
从sklearn.preprocessing导入多LabelBinarizer
file=pd.read\u csv（'file.csv'，sep='\t'）
y=file['label'].apply（lambda f:f.split（'，'））
binarizer=MultiLabelBinarizer（）
one_hot=二值化器.fit_变换（y.values）
打印（一个热的二进制程序类）
我尝试了下面的代码，它对我有效。我相信还有其他方法，但希望这能有所帮助。

我的输入文件如下所示


将熊猫作为pd导入
将numpy作为np导入
从sklearn.preprocessing导入多LabelBinarizer
file=pd.read\u csv（'file.csv'，sep='\t'）
y=file['label'].apply（lambda f:f.split（'，'））
binarizer=MultiLabelBinarizer（）
one_hot=二值化器.fit_变换（y.values）
打印（一个热的二进制程序类）
欢迎来到StackOverflow。请花点时间阅读这篇文章，以及如何提供答案，并相应地修改你的问题。这些提示可能也很有用。欢迎使用StackOverflow。请花点时间阅读这篇文章，以及如何提供答案，并相应地修改你的问题。这些提示可能也很有用。从你的问题来看，我只能猜测这是因为你的标签在一个数组中。在调用fit_transform之前，我们需要拆分值。根据您的问题，我只能猜测这是因为您的标签位于一个数组中。我们需要在调用fit_transform之前拆分值。