Nlp 如何使用预先训练的词向量创建gensim word2vec模型?

Nlp 如何使用预先训练的词向量创建gensim word2vec模型?,nlp,gensim,word2vec,text-analysis,word-embedding,Nlp,Gensim,Word2vec,Text Analysis,Word Embedding,我使用分布式word2vec算法创建了单词向量。现在我有了单词和它们对应的向量。如何使用这些单词和向量构建gensim word2vec模型 我不确定您是否使用gensim或其他工具创建了word2vec模型,但如果您正确理解了您的问题,您只想使用gensim加载word2vec模型。这是通过以下方式完成的: import gensim w2v_file = codecs.open(WORD2VEC_PATH, encoding='utf-8') model = gensim.models.Ke

我使用分布式word2vec算法创建了单词向量。现在我有了单词和它们对应的向量。如何使用这些单词和向量构建gensim word2vec模型

我不确定您是否使用
gensim
或其他工具创建了word2vec模型,但如果您正确理解了您的问题,您只想使用gensim加载word2vec模型。这是通过以下方式完成的:

import gensim
w2v_file = codecs.open(WORD2VEC_PATH, encoding='utf-8')
model = gensim.models.KeyedVectors.load_word2vec_format(w2v_file, binary=True)  # or binary=False if the model is not compressed

但是,如果您想使用纯
gensim
从零开始(即从原始文本)训练word2vec模型,这里有一个。

谢谢,这正是我想要的。您能提供示例w2v_文件或帮助我生成该格式吗?我把单词和它的向量用空格隔开,单词用线隔开。多谢各位@你有没有尝试过以下方法
从gensim.models导入word2vec model=word2vec.word2vec.load_word2vec_格式('path/to/GoogleNews-vectors-negative300.bin',binary=False)
重要的部分是
binary=False
。它确实帮助了我,谢谢。我用微软multiverso训练了我的语料库。现在我可以使用load_word2vec_格式创建我的模型。