带频率的多标签分类-NLP(BERT)

带频率的多标签分类-NLP(BERT),nlp,bert-language-model,Nlp,Bert Language Model,我的数据集如下所示: entence emotions bla bla bla {'kind':105, 'sad':32, 'angry':5} ..... {'surprised': 65, 'kind': 10} 这里的数字表示人们在阅读文章时有多少次这种情绪 基本上,对105人来说,发布“布拉布拉布拉布拉”似乎“友善”,而32人对此感到“悲伤” 基本上,我的目标是预测一个帖子最有可能的情绪类型 我要用一个伯特变压器 问题:如何处理

我的数据集如下所示:

entence          emotions
bla bla bla       {'kind':105, 'sad':32, 'angry':5}
.....             {'surprised': 65, 'kind': 10} 
这里的数字表示人们在阅读文章时有多少次这种情绪

基本上,对105人来说,发布“布拉布拉布拉布拉”似乎“友善”,而32人对此感到“悲伤”

基本上,我的目标是预测一个帖子最有可能的情绪类型

我要用一个伯特变压器


问题:如何处理每种情绪的频率?我知道频率很重要,特别是当一个帖子有105个人微笑,而另外5个人感到愤怒时,如果我删除频率,那么这将是一起微笑和愤怒,这可能会引起误解。我应该如何设计我的模型?我应该去掉频率吗?或者我应该删除除频率最高的情感类型之外的所有其他情感类型吗?

在我看来,如果你的目的是只预测频率最高的情感,我不知道所有的频率都能为你做些什么。所以我会告诉你,只删除并保留值最高的一个。你可以规范化频率,并训练你的模型进行多标签回归。