Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/67.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
计算R中word2vec模型的余弦相似性_R_Word2vec_Word Embedding_Cosine Similarity - Fatal编程技术网

计算R中word2vec模型的余弦相似性

计算R中word2vec模型的余弦相似性,r,word2vec,word-embedding,cosine-similarity,R,Word2vec,Word Embedding,Cosine Similarity,我正在使用R中的包“word2vec”模型,遇到了一个巨大的问题。我想找出哪些词是“不确定性”和“经济”最接近的同义词,如Azqueta Gavaldon(2020)的论文:“欧元区的经济政策不确定性:一种无监督的机器学习方法”。因此,我使用word2vec包中的word2vec函数创建了我自己的word2vec模型。使用函数predict(object,…)我可以创建一个表,其中显示与我考虑的单词最接近的单词。问题是该函数的相似性定义为(sqrt(sum(x.y)/ncol(x)),而不是余弦

我正在使用R中的包“word2vec”模型,遇到了一个巨大的问题。我想找出哪些词是“不确定性”和“经济”最接近的同义词,如Azqueta Gavaldon(2020)的论文:“欧元区的经济政策不确定性:一种无监督的机器学习方法”。因此,我使用word2vec包中的word2vec函数创建了我自己的word2vec模型。使用函数predict(object,…)我可以创建一个表,其中显示与我考虑的单词最接近的单词。问题是该函数的相似性定义为(sqrt(sum(x.y)/ncol(x)),而不是余弦相似性。 我知道我可以用余弦函数(x,y)。这个函数只是用来计算两个向量之间的余弦相似性,不能像我上面描述的预测函数那样输出

是否有人知道如何确定Word2Vec模型中每个单词与另一个单词的余弦相似性,并根据这些值为我输出与给定单词最相似的单词

这真的会帮我很大的忙,我已经很感激你的回答了

亲切问候,,
Tom

以下github代码解释了如何在R中使用Word2Vec模型中的余弦相似性:

您可以在R中的每个矩阵上使用此函数,因此也可以在R中构建的每个Word2Vec模型上使用此函数

亲切问候,, 汤姆