Nlp 如何使用预先训练的词向量创建gensim word2vec模型？_Nlp_Gensim_Word2vec_Text Analysis_Word Embedding

Nlp 如何使用预先训练的词向量创建gensim word2vec模型？

nlp

Nlp 如何使用预先训练的词向量创建gensim word2vec模型？,nlp,gensim,word2vec,text-analysis,word-embedding,Nlp,Gensim,Word2vec,Text Analysis,Word Embedding,我使用分布式word2vec算法创建了单词向量。现在我有了单词和它们对应的向量。如何使用这些单词和向量构建gensim word2vec模型我不确定您是否使用gensim或其他工具创建了word2vec模型，但如果您正确理解了您的问题，您只想使用gensim加载word2vec模型。这是通过以下方式完成的： import gensim w2v_file = codecs.open(WORD2VEC_PATH, encoding='utf-8') model = gensim.models.Ke

我使用分布式word2vec算法创建了单词向量。现在我有了单词和它们对应的向量。如何使用这些单词和向量构建gensim word2vec模型

我不确定您是否使用

gensim

或其他工具创建了word2vec模型，但如果您正确理解了您的问题，您只想使用gensim加载word2vec模型。这是通过以下方式完成的：

import gensim
w2v_file = codecs.open(WORD2VEC_PATH, encoding='utf-8')
model = gensim.models.KeyedVectors.load_word2vec_format(w2v_file, binary=True)  # or binary=False if the model is not compressed

但是，如果您想使用纯

gensim

从零开始（即从原始文本）训练word2vec模型，这里有一个。

谢谢，这正是我想要的。您能提供示例w2v_文件或帮助我生成该格式吗？我把单词和它的向量用空格隔开，单词用线隔开。多谢各位@你有没有尝试过以下方法

从gensim.models导入word2vec model=word2vec.word2vec.load_word2vec_格式（'path/to/GoogleNews-vectors-negative300.bin'，binary=False）

重要的部分是

binary=False

。它确实帮助了我，谢谢。我用微软multiverso训练了我的语料库。现在我可以使用load_word2vec_格式创建我的模型。