使用周围词的python word2vec上下文相似性

使用周围词的python word2vec上下文相似性,python,gensim,word2vec,word-embedding,Python,Gensim,Word2vec,Word Embedding,我想使用w2v所做的嵌入,以获得给定上下文的最有可能的替代词(周围的词),而不是提供单个词 例如: 句子='我想明天放学后去公园' 如果我想找到类似于“park”的候选对象,通常我会利用Gensim模型中的相似性函数 model.most_similar('park') 并获得语义相似的单词。然而,这可能会给我类似于动词“park”的单词,而不是我所追求的名词“park” 有没有办法查询模型并将其周围的单词作为上下文提供更好的候选词?Word2vec主要不是一种单词预测算法。在内部,它尝试进行

我想使用w2v所做的嵌入,以获得给定上下文的最有可能的替代词(周围的词),而不是提供单个词

例如: 句子='我想明天放学后去公园'

如果我想找到类似于“park”的候选对象,通常我会利用Gensim模型中的相似性函数

model.most_similar('park')
并获得语义相似的单词。然而,这可能会给我类似于动词“park”的单词,而不是我所追求的名词“park”


有没有办法查询模型并将其周围的单词作为上下文提供更好的候选词?

Word2vec主要不是一种单词预测算法。在内部,它尝试进行半预测,以训练其词向量,但通常这些训练预测并不是需要词向量的最终用途

也就是说,gensim的最新版本添加了一个
predict\u output\u word()
方法,该方法(对于某些模型模式)近似于训练期间所做的预测。它可能对您的目的有用

或者,检查与初始目标词有无与上下文词相似的单词
最相似()
,可能会有所帮助

有一些关于在词向量训练中消除多个词义歧义的方法的研究论文(比如“to/park/a car”和“walk in a/park/”),但我还没有看到它们在开源库中实现