Machine learning 通过PV-DBOW学习的文档向量是否等于文档中包含的单词向量的平均值/总和?

Machine learning 通过PV-DBOW学习的文档向量是否等于文档中包含的单词向量的平均值/总和?,machine-learning,nlp,gensim,word2vec,doc2vec,Machine Learning,Nlp,Gensim,Word2vec,Doc2vec,我看到一些帖子说,单词向量的平均值在某些任务中比通过PV_DBOW学习的文档向量表现得更好。文档向量与其单词向量的平均值/总和之间的关系是什么?我们能说向量d吗 大约等于其字向量的平均值或总和? 谢谢 否。PV-DBOW向量是通过一个不同的过程来计算的,该过程基于PV-DBOW向量可以通过同时训练的浅层神经网络以增量的方式依次预测文本中的每个单词 但是,单词向量的简单平均值通常可以相当好地作为文本的摘要向量 假设PV-DBOW向量和简单平均向量的维数相同。由于它们是从完全相同的输入(相同的单词列

我看到一些帖子说,单词向量的平均值在某些任务中比通过PV_DBOW学习的文档向量表现得更好。文档向量与其单词向量的平均值/总和之间的关系是什么?我们能说向量d吗 大约等于其字向量的平均值或总和?
谢谢

否。PV-DBOW向量是通过一个不同的过程来计算的,该过程基于PV-DBOW向量可以通过同时训练的浅层神经网络以增量的方式依次预测文本中的每个单词

但是,单词向量的简单平均值通常可以相当好地作为文本的摘要向量

假设PV-DBOW向量和简单平均向量的维数相同。由于它们是从完全相同的输入(相同的单词列表)引导而来的,并且神经网络(在其内部状态下)并不比一组好的单词向量复杂得多,因此向量在下游评估中的性能可能不会有很大的不同

例如,如果PV-DBOW模型的训练数据很少,或者元参数没有得到很好的优化,但是用于平均向量的词向量非常适合您的域,那么简单的平均向量可能更适合某些下游任务。另一方面,在足够的域文本上训练的PV-DBOW模型可以提供优于基于另一个域的词向量的简单平均值的向量


请注意,FastText的分类模式(以及Facebook的StarSpace中的类似模式)实际上优化了单词向量,使其成为用于预测已知文本类的简单平均向量的一部分。因此,如果您的最终目标是有一个用于分类的文本向量,并且您有一个具有已知标签的良好训练数据集,那么这些技术也值得考虑

否。PV-DBOW向量是通过一个不同的过程来计算的,该过程基于PV-DBOW向量可以通过同时训练的浅层神经网络以增量的方式依次预测文本中的每个单词

但是,单词向量的简单平均值通常可以相当好地作为文本的摘要向量

假设PV-DBOW向量和简单平均向量的维数相同。由于它们是从完全相同的输入(相同的单词列表)引导而来的,并且神经网络(在其内部状态下)并不比一组好的单词向量复杂得多,因此向量在下游评估中的性能可能不会有很大的不同

例如,如果PV-DBOW模型的训练数据很少,或者元参数没有得到很好的优化,但是用于平均向量的词向量非常适合您的域,那么简单的平均向量可能更适合某些下游任务。另一方面,在足够的域文本上训练的PV-DBOW模型可以提供优于基于另一个域的词向量的简单平均值的向量

请注意,FastText的分类模式(以及Facebook的StarSpace中的类似模式)实际上优化了单词向量,使其成为用于预测已知文本类的简单平均向量的一部分。因此,如果您的最终目标是有一个用于分类的文本向量,并且您有一个具有已知标签的良好训练数据集,那么这些技术也值得考虑