Python word2vec模型的计算复杂性
我对Gensim W2V模型进行了500K个句子(约60K个单词)的训练,我想计算困惑度Python word2vec模型的计算复杂性,python,nlp,gensim,word2vec,language-model,Python,Nlp,Gensim,Word2vec,Language Model,我对Gensim W2V模型进行了500K个句子(约60K个单词)的训练,我想计算困惑度 这样做的最佳方式是什么 对于60K字,我如何检查适当数量的数据 谢谢如果你想计算困惑,你必须先找回损失。 在gensim.models.word2vec.word2vec构造函数上,传递compute\u loss=True参数-这样,gensim将在训练时为您存储损失。 经过培训后,您可以调用该方法来检索损失 由于skip-gram模型的交叉熵损失中的损失,损失的2次方将给出预弯曲度。(2**损失)我损失
谢谢如果你想计算困惑,你必须先找回损失。 在
gensim.models.word2vec.word2vec
构造函数上,传递compute\u loss=True
参数-这样,gensim
将在训练时为您存储损失。
经过培训后,您可以调用该方法来检索损失
由于skip-gram模型的交叉熵损失中的损失,损失的2次方将给出预弯曲度。(2**损失)我损失了36672808.0这有意义吗?你进行过培训吗?告诉我你的词汇表中的困惑和单词总数,这样就更容易确定它是否有意义了