计算R中word2vec模型的余弦相似性
我正在使用R中的包“word2vec”模型,遇到了一个巨大的问题。我想找出哪些词是“不确定性”和“经济”最接近的同义词,如Azqueta Gavaldon(2020)的论文:“欧元区的经济政策不确定性:一种无监督的机器学习方法”。因此,我使用word2vec包中的word2vec函数创建了我自己的word2vec模型。使用函数predict(object,…)我可以创建一个表,其中显示与我考虑的单词最接近的单词。问题是该函数的相似性定义为(sqrt(sum(x.y)/ncol(x)),而不是余弦相似性。 我知道我可以用余弦函数(x,y)。这个函数只是用来计算两个向量之间的余弦相似性,不能像我上面描述的预测函数那样输出 是否有人知道如何确定Word2Vec模型中每个单词与另一个单词的余弦相似性,并根据这些值为我输出与给定单词最相似的单词 这真的会帮我很大的忙,我已经很感激你的回答了 亲切问候,,计算R中word2vec模型的余弦相似性,r,word2vec,word-embedding,cosine-similarity,R,Word2vec,Word Embedding,Cosine Similarity,我正在使用R中的包“word2vec”模型,遇到了一个巨大的问题。我想找出哪些词是“不确定性”和“经济”最接近的同义词,如Azqueta Gavaldon(2020)的论文:“欧元区的经济政策不确定性:一种无监督的机器学习方法”。因此,我使用word2vec包中的word2vec函数创建了我自己的word2vec模型。使用函数predict(object,…)我可以创建一个表,其中显示与我考虑的单词最接近的单词。问题是该函数的相似性定义为(sqrt(sum(x.y)/ncol(x)),而不是余弦
Tom以下github代码解释了如何在R中使用Word2Vec模型中的余弦相似性: 您可以在R中的每个矩阵上使用此函数,因此也可以在R中构建的每个Word2Vec模型上使用此函数 亲切问候,, 汤姆