Nlp 把几个句子传给伯特?

Nlp 把几个句子传给伯特?,nlp,text-classification,bert-language-model,huggingface-transformers,Nlp,Text Classification,Bert Language Model,Huggingface Transformers,我有一个包含段落的数据集,我需要将其分为两类。这些段落通常有3-5句长。其中绝大多数长度不到500字。我想利用伯特来解决这个问题 我想知道我应该如何使用BERT来生成这些段落的向量表示,尤其是,是否可以将整个段落传递给BERT 对相关问题和问题进行了有益的讨论。这些讨论集中于如何使用BERT表示整个文档。在我的例子中,段落没有那么长,实际上可以传递给BERT而不超过其最大长度512。然而,伯特接受了句子训练。句子是相对独立的意义单位。我想知道,在BERT中输入多个句子是否与模型的设计目的根本不冲

我有一个包含段落的数据集,我需要将其分为两类。这些段落通常有3-5句长。其中绝大多数长度不到500字。我想利用伯特来解决这个问题

我想知道我应该如何使用BERT来生成这些段落的向量表示,尤其是,是否可以将整个段落传递给BERT


对相关问题和问题进行了有益的讨论。这些讨论集中于如何使用BERT表示整个文档。在我的例子中,段落没有那么长,实际上可以传递给BERT而不超过其最大长度512。然而,伯特接受了句子训练。句子是相对独立的意义单位。我想知道,在BERT中输入多个句子是否与模型的设计目的根本不冲突(尽管这似乎是经常进行的)。

我认为你的问题是基于一种误解。尽管该词经常使用
句子
,但它并不是指语言句子。本文将句子定义为

连续文本的任意跨度,而不是实际的语言句子

因此,将整个段落传递给BERT以及他们能够处理这些段落的原因是完全正确的