Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/python-3.x/15.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 3.x doc2vec中的矢量是如何计算的?尺寸参数描述了什么?_Python 3.x_Nlp_Doc2vec - Fatal编程技术网

Python 3.x doc2vec中的矢量是如何计算的?尺寸参数描述了什么?

Python 3.x doc2vec中的矢量是如何计算的?尺寸参数描述了什么?,python-3.x,nlp,doc2vec,Python 3.x,Nlp,Doc2vec,如果我将一个包含5个单词的句子传递给Doc2Vec模型,如果大小为100,则有100个向量。我不明白那些向量是什么。如果我把大小增加到200,一个简单的句子就有200个向量。请告诉我这些向量是如何计算的。当使用size=100时,每个文本示例中没有“100个向量”–有一个向量,其中包括100个标量维度(每个向量都是浮点值,如0.513或-1.301) 请注意,这些值表示100维空间中的点,并且各个维度/轴没有容易解释的含义。相反,只有单个向量之间的相对距离和相对方向对于基于文本的应用程序(如辅助

如果我将一个包含5个单词的句子传递给Doc2Vec模型,如果大小为100,则有100个向量。我不明白那些向量是什么。如果我把大小增加到200,一个简单的句子就有200个向量。请告诉我这些向量是如何计算的。

当使用
size=100
时,每个文本示例中没有“100个向量”–有一个向量,其中包括100个标量维度(每个向量都是浮点值,如
0.513
-1.301

请注意,这些值表示100维空间中的点,并且各个维度/轴没有容易解释的含义。相反,只有单个向量之间的相对距离和相对方向对于基于文本的应用程序(如辅助信息检索或自动分类)具有有用的意义


本文介绍了矢量的计算方法。但是,它与“word2vec”算法密切相关,因此了解1st可能会有所帮助,例如通过its和论文。如果这种风格的纸张不是你的风格,那么像
[word2vec教程]
[word2vec如何工作]
[doc2vec简介]
这样的查询应该会找到更随意的开头描述

好的,有一点很清楚,它只是一个向量,而不是100个向量。我也会看一些教程,看看这些标量维度是如何计算的。简短的版本是:它们开始时是随机的、低量级的值,但随后神经网络的迭代训练会促使它们在训练附近单词的预测方面越来越好。因此,最终的值没有很强的意义,除了:“这些对预测非常有效,与所有其他试图擅长预测的词向量相平衡”。结果表明,该过程的最终结果是以有用的相对距离/方向排列向量。