Python word2vec模型的计算复杂性_Python_Nlp_Gensim_Word2vec_Language Model

Python word2vec模型的计算复杂性

python nlp

Python word2vec模型的计算复杂性,python,nlp,gensim,word2vec,language-model,Python,Nlp,Gensim,Word2vec,Language Model,我对Gensim W2V模型进行了500K个句子（约60K个单词）的训练，我想计算困惑度这样做的最佳方式是什么对于60K字，我如何检查适当数量的数据谢谢如果你想计算困惑，你必须先找回损失。在gensim.models.word2vec.word2vec构造函数上，传递compute\u loss=True参数-这样，gensim将在训练时为您存储损失。经过培训后，您可以调用该方法来检索损失由于skip-gram模型的交叉熵损失中的损失，损失的2次方将给出预弯曲度。（2**损失）我损失

我对Gensim W2V模型进行了500K个句子（约60K个单词）的训练，我想计算困惑度

这样做的最佳方式是什么

对于60K字，我如何检查适当数量的数据

谢谢

如果你想计算困惑，你必须先找回损失。在

gensim.models.word2vec.word2vec

构造函数上，传递

compute\u loss=True

参数-这样，

gensim

将在训练时为您存储损失。经过培训后，您可以调用该方法来检索损失

由于skip-gram模型的交叉熵损失中的损失，损失的2次方将给出预弯曲度。（2**损失）

我损失了36672808.0这有意义吗？你进行过培训吗？告诉我你的词汇表中的困惑和单词总数，这样就更容易确定它是否有意义了