如何在Python中使用值列表作为标签';机器学习

如何在Python中使用值列表作为标签';机器学习,python,machine-learning,multilabel-classification,Python,Machine Learning,Multilabel Classification,我遇到了一个问题,我不知道如何在ML模型中使用列表作为标签。基本上,我有一个数据框架,如下所示: 我的功能集是一个数字列表,我的标签也是一个数字列表。我如何将两者联系起来?我已经使用过二进制标签,但是我不能用非二进制标签来管理它 ps:我知道我的数据缺乏预处理,出于处理速度的原因,我只加载了整个数据的一小部分 编辑-抱歉不够清晰:每个数字都是一个单词。我的功能集是文本,我的标签是标题。我正在尝试构建一个模型,在给定文本的情况下,它会根据经过训练的模型生成一个标题您应该使用多标签方法来解决您的问

我遇到了一个问题,我不知道如何在ML模型中使用列表作为标签。基本上,我有一个数据框架,如下所示:

我的功能集是一个数字列表,我的标签也是一个数字列表。我如何将两者联系起来?我已经使用过二进制标签,但是我不能用非二进制标签来管理它

ps:我知道我的数据缺乏预处理,出于处理速度的原因,我只加载了整个数据的一小部分


编辑-抱歉不够清晰:每个数字都是一个单词。我的功能集是文本,我的标签是标题。我正在尝试构建一个模型,在给定文本的情况下,它会根据经过训练的模型生成一个标题

您应该使用多标签方法来解决您的问题

您可能需要尝试sklearn的
多标签编辑器()
。看一看

我想你可以试试熊猫“get_dummies”内置的OneHotEncoding

根据我的理解,您的数据如下(此处以“y”为例):

其中y列中的每个数字表示每个类别

因此,您可以做的是:

new\u y=pd.get\u dummies(df['y'],drop\u first=True)

如果您在此处发布一些示例数据以及您希望实现的具体目标,将非常有帮助。


PS:除此之外,你还必须使用分类交叉熵作为损失计算。

你能举一个“相互关联”的例子吗?每个数字都是一个单词。我的功能集是文本,我的标签是标题。我试图构建一个模型,在给定文本的情况下,它会根据经过训练的模型生成一个标题。我已经看到了这种方法,但它不适合我的问题。我没有多个标签,我有一个标签可以有多个值,即不是二进制。Thank’s anyways^^最近我有一个类似的项目->每个标签都包含多个值(每个标签的值不是二进制的)。而
multi-labelbinarizer()
将标签的那些
非二进制
值转换为
二进制表示
。我建议你急切地阅读这篇文章:)不要犹豫,问问你是否需要进一步的帮助,如果答案有用,请投上一票。有趣的是,根据这篇文章,我的怀疑正是算法中最关键的一点。谢谢,伙计,真的帮了大忙
df
 
   a  b  y
0  1  2  1
1  4  5  2
2  7  1  3
3  4  7  1
4  6  0  3
5  7  9  2
6  8  1  1