Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/305.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 设置word2vec-KeyError:“0”;单词';单词';“不在词汇表中”;_Python_Character Encoding_Gensim_Word2vec - Fatal编程技术网

Python 设置word2vec-KeyError:“0”;单词';单词';“不在词汇表中”;

Python 设置word2vec-KeyError:“0”;单词';单词';“不在词汇表中”;,python,character-encoding,gensim,word2vec,Python,Character Encoding,Gensim,Word2vec,我尝试使用word2vec,但在尝试对任何单词执行任何操作时都会出现错误。这似乎是一个编码问题,以下是我所做的: 初始化word2vec: 稍微测试一下: 错误: 我还尝试加载带有binary=False的模型,但这会在加载时出错 您的word2vec使用没有问题。文件格式为二进制(可以使用转换为文本) 您已经下载了一个预先训练过的“实体”矢量文件。我建议您使用来自的单词或短语向量(也可在word2vec网站上获得) 我知道你没有接受这个答案?你有什么问题吗? import gensim, lo

我尝试使用word2vec,但在尝试对任何单词执行任何操作时都会出现错误。这似乎是一个编码问题,以下是我所做的:

初始化word2vec: 稍微测试一下: 错误:
我还尝试加载带有
binary=False
的模型,但这会在加载时出错

您的word2vec使用没有问题。文件格式为二进制(可以使用转换为文本)

您已经下载了一个预先训练过的“实体”矢量文件。我建议您使用来自的单词或短语向量(也可在word2vec网站上获得)


我知道你没有接受这个答案?你有什么问题吗?
import gensim, logging
logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)

model = gensim.models.Word2Vec.load_word2vec_format('freebase-vectors-skipgram1000/knowledge-vectors-skipgram1000.bin', binary=True)
model.init_sims(replace=True)
print(model)  
# prints: Word2Vec(vocab=1422903, size=1000, alpha=0.025)

print(model.index2word[0])  
# prints: u'/m/0dgps15'
# I would expect a readable word, how to fix that?
print(model.similarity('word', 'sound'))
# An error happen: KeyError: 'word'
[1] import gensim
[2] model = gensim.models.Word2Vec.load_word2vec_format('GoogleNews-vectors-negative300.bin', binary=True)
[3] print(model.similarity('word', 'sound'))
0.152615140536