带频率的多标签分类-NLP（BERT）_Nlp_Bert Language Model

带频率的多标签分类-NLP（BERT）

nlp

带频率的多标签分类-NLP（BERT）,nlp,bert-language-model,Nlp,Bert Language Model,我的数据集如下所示： entence emotions bla bla bla {'kind':105, 'sad':32, 'angry':5} ..... {'surprised': 65, 'kind': 10} 这里的数字表示人们在阅读文章时有多少次这种情绪基本上，对105人来说，发布“布拉布拉布拉布拉”似乎“友善”，而32人对此感到“悲伤” 基本上，我的目标是预测一个帖子最有可能的情绪类型我要用一个伯特变压器问题：如何处理

我的数据集如下所示：

entence          emotions
bla bla bla       {'kind':105, 'sad':32, 'angry':5}
.....             {'surprised': 65, 'kind': 10}

这里的数字表示人们在阅读文章时有多少次这种情绪

基本上，对105人来说，发布“布拉布拉布拉布拉”似乎“友善”，而32人对此感到“悲伤”

基本上，我的目标是预测一个帖子最有可能的情绪类型

我要用一个伯特变压器

问题：如何处理每种情绪的频率？我知道频率很重要，特别是当一个帖子有105个人微笑，而另外5个人感到愤怒时，如果我删除频率，那么这将是一起微笑和愤怒，这可能会引起误解。我应该如何设计我的模型？我应该去掉频率吗？或者我应该删除除频率最高的情感类型之外的所有其他情感类型吗？

在我看来，如果你的目的是只预测频率最高的情感，我不知道所有的频率都能为你做些什么。所以我会告诉你，只删除并保留值最高的一个。你可以规范化频率，并训练你的模型进行多标签回归。