Python 每列车数据类标签非均匀分布的多标签文本分类
我有一个多标签分类问题,我想用六个标签对文本进行分类,每个文本可以有一到六个标签,但这个标签分布是不相等的。例如,10个人对句子1的注释如下: 这些标签是该类别的投票数。我可以将它们正常化,如悲伤0.7,愤怒0.2,恐惧0.1,快乐0.0,Python 每列车数据类标签非均匀分布的多标签文本分类,python,classification,sentiment-analysis,text-classification,multilabel-classification,Python,Classification,Sentiment Analysis,Text Classification,Multilabel Classification,我有一个多标签分类问题,我想用六个标签对文本进行分类,每个文本可以有一到六个标签,但这个标签分布是不相等的。例如,10个人对句子1的注释如下: 这些标签是该类别的投票数。我可以将它们正常化,如悲伤0.7,愤怒0.2,恐惧0.1,快乐0.0, 对于这个问题,什么是最好的分类器?标签的最佳类型是什么?我的意思是我是否应该规范化它们? 对于这种标签概率不相等的多标签分类问题,我应该搜索哪些关键字?首先,我想澄清一下,我是否正确理解了您的问题。你有句子=[sent1,sent2,…sentn],你想把
对于这个问题,什么是最好的分类器?标签的最佳类型是什么?我的意思是我是否应该规范化它们?
对于这种标签概率不相等的多标签分类问题,我应该搜索哪些关键字?首先,我想澄清一下,我是否正确理解了您的问题。你有句子=[sent1,sent2,…sentn],你想把它们分成这六个标签标签=[l1,l2,…,l6]。您的数据不是标签本身,而是文本中存在该标签的可能性。你还提到六个标签来自人类注释(我不知道你说的10个人评论是什么意思,我猜是注释) 如果是这种情况,您可以使用多标签分类或多目标回归透视图来处理该问题。在这两种情况下,我将探讨如何处理数据: