Python Word2Vec词汇表未定义错误_Python_Word2vec

Python Word2Vec词汇表未定义错误

python

Python Word2Vec词汇表未定义错误,python,word2vec,Python,Word2vec,我是python和word2vec的新手，经常会遇到“在训练模型之前必须先构建词汇表”的错误。我的代码有什么问题这是我的密码： file_object=open("SupremeCourt.txt","w") from gensim.models import word2vec data = word2vec.Text8Corpus('SupremeCourt.txt') model = word2vec.Word2Vec(data, size=200) out=model.most_si

我是python和word2vec的新手，经常会遇到“在训练模型之前必须先构建词汇表”的错误。我的代码有什么问题

这是我的密码：

file_object=open("SupremeCourt.txt","w")
from gensim.models import word2vec

data = word2vec.Text8Corpus('SupremeCourt.txt')
model = word2vec.Word2Vec(data, size=200)

out=model.most_similar()

print(out[1])
print(out[2])

您正在以写模式打开该文件，行为：

file_object = open("SupremeCourt.txt", "w")

通过这样做，您正在擦除文件的内容，这样当您试图将文件传递给模型进行训练时，就没有数据可读取了。这就是抛出错误的原因

删除该行（同时恢复文件内容），它将正常工作。

您正在以写模式使用以下行打开该文件：

file_object = open("SupremeCourt.txt", "w")

通过这样做，您正在擦除文件的内容，这样当您试图将文件传递给模型进行训练时，就没有数据可读取了。这就是抛出错误的原因

删除该行（并恢复文件内容），它就会工作。

我可能会在代码中看到一些错误的东西，例如文件是在写模式下打开的，并且加载的模型不包含您希望找到最相似单词的单词。我建议您使用预定义的模型，比如加载到gensim中，或者构建您自己的word2vec，这样您就不会出现错误。 gensim中最相似的用法是

out=model。最相似的（“单词名”）

我可能在你的代码中看到一些错误的东西，比如文件是在写模式下打开的，并且你加载的模型不包含你想要找到最相似单词的单词。我建议您使用预定义的模型，比如加载到gensim中，或者构建您自己的word2vec，这样您就不会出现错误。 gensim中最相似的用法是

out=model。最相似的（“单词名”）

确保在将更改写入磁盘之前已重新下载该文件。确保在将更改写入磁盘之前已重新下载该文件。