Python Word2Vec词汇表未定义错误

Python Word2Vec词汇表未定义错误,python,word2vec,Python,Word2vec,我是python和word2vec的新手,经常会遇到“在训练模型之前必须先构建词汇表”的错误。我的代码有什么问题 这是我的密码: file_object=open("SupremeCourt.txt","w") from gensim.models import word2vec data = word2vec.Text8Corpus('SupremeCourt.txt') model = word2vec.Word2Vec(data, size=200) out=model.most_si

我是python和word2vec的新手,经常会遇到“在训练模型之前必须先构建词汇表”的错误。我的代码有什么问题

这是我的密码:

file_object=open("SupremeCourt.txt","w")
from gensim.models import word2vec

data = word2vec.Text8Corpus('SupremeCourt.txt')
model = word2vec.Word2Vec(data, size=200)

out=model.most_similar()

print(out[1])
print(out[2])

您正在以写模式打开该文件,行为:

file_object = open("SupremeCourt.txt", "w")
通过这样做,您正在擦除文件的内容,这样当您试图将文件传递给模型进行训练时,就没有数据可读取了。这就是抛出错误的原因


删除该行(同时恢复文件内容),它将正常工作。

您正在以写模式使用以下行打开该文件:

file_object = open("SupremeCourt.txt", "w")
通过这样做,您正在擦除文件的内容,这样当您试图将文件传递给模型进行训练时,就没有数据可读取了。这就是抛出错误的原因


删除该行(并恢复文件内容),它就会工作。

我可能会在代码中看到一些错误的东西,例如文件是在写模式下打开的,并且加载的模型不包含您希望找到最相似单词的单词。 我建议您使用预定义的模型,比如加载到gensim中,或者构建您自己的word2vec,这样您就不会出现错误。 gensim中最相似的用法是
out=model。最相似的(“单词名”)


我可能在你的代码中看到一些错误的东西,比如文件是在写模式下打开的,并且你加载的模型不包含你想要找到最相似单词的单词。 我建议您使用预定义的模型,比如加载到gensim中,或者构建您自己的word2vec,这样您就不会出现错误。 gensim中最相似的用法是
out=model。最相似的(“单词名”)


确保在将更改写入磁盘之前已重新下载该文件。确保在将更改写入磁盘之前已重新下载该文件。