计算R中word2vec模型的余弦相似性_R_Word2vec_Word Embedding_Cosine Similarity

计算R中word2vec模型的余弦相似性

计算R中word2vec模型的余弦相似性,r,word2vec,word-embedding,cosine-similarity,R,Word2vec,Word Embedding,Cosine Similarity,我正在使用R中的包“word2vec”模型，遇到了一个巨大的问题。我想找出哪些词是“不确定性”和“经济”最接近的同义词，如Azqueta Gavaldon（2020）的论文：“欧元区的经济政策不确定性：一种无监督的机器学习方法”。因此，我使用word2vec包中的word2vec函数创建了我自己的word2vec模型。使用函数predict（object，…）我可以创建一个表，其中显示与我考虑的单词最接近的单词。问题是该函数的相似性定义为（sqrt（sum（x.y）/ncol（x）），而不是余弦

我正在使用R中的包“word2vec”模型，遇到了一个巨大的问题。我想找出哪些词是“不确定性”和“经济”最接近的同义词，如Azqueta Gavaldon（2020）的论文：“欧元区的经济政策不确定性：一种无监督的机器学习方法”。因此，我使用word2vec包中的word2vec函数创建了我自己的word2vec模型。使用函数predict（object，…）我可以创建一个表，其中显示与我考虑的单词最接近的单词。问题是该函数的相似性定义为（sqrt（sum（x.y）/ncol（x）），而不是余弦相似性。我知道我可以用余弦函数（x，y）。这个函数只是用来计算两个向量之间的余弦相似性，不能像我上面描述的预测函数那样输出

是否有人知道如何确定Word2Vec模型中每个单词与另一个单词的余弦相似性，并根据这些值为我输出与给定单词最相似的单词

这真的会帮我很大的忙，我已经很感激你的回答了

亲切问候,，

Tom

以下github代码解释了如何在R中使用Word2Vec模型中的余弦相似性：

您可以在R中的每个矩阵上使用此函数，因此也可以在R中构建的每个Word2Vec模型上使用此函数

亲切问候,，汤姆