Nlp 使用诸如BERT之类的预训练模型进行文档分类
我正在寻找分类文件的方法。例如,我有一堆带文本的文档,我想给文档贴上标签,标明它是否属于体育、食品、政治等。Nlp 使用诸如BERT之类的预训练模型进行文档分类,nlp,bert-language-model,huggingface-transformers,document-classification,Nlp,Bert Language Model,Huggingface Transformers,Document Classification,我正在寻找分类文件的方法。例如,我有一堆带文本的文档,我想给文档贴上标签,标明它是否属于体育、食品、政治等。 我可以使用BERT(对于单词>500的文档)来完成此任务吗?或者是否有其他模型可以有效地完成此任务?BERT的最大序列长度为512个标记(注意,这通常远小于500个单词),因此您不能一次将整个文档输入到BERT。如果您仍然想使用该模型完成此任务,我建议您 将每个文档拆分为可由BERT处理的块(例如512个令牌或更少) 分别对所有文档块进行分类 根据最常预测的区块标签对整个文档进行分类,即
我可以使用BERT(对于单词>500的文档)来完成此任务吗?或者是否有其他模型可以有效地完成此任务?BERT的最大序列长度为512个标记(注意,这通常远小于500个单词),因此您不能一次将整个文档输入到BERT。如果您仍然想使用该模型完成此任务,我建议您