Python word2vec模型的计算复杂性

Python word2vec模型的计算复杂性,python,nlp,gensim,word2vec,language-model,Python,Nlp,Gensim,Word2vec,Language Model,我对Gensim W2V模型进行了500K个句子(约60K个单词)的训练,我想计算困惑度 这样做的最佳方式是什么 对于60K字,我如何检查适当数量的数据 谢谢如果你想计算困惑,你必须先找回损失。 在gensim.models.word2vec.word2vec构造函数上,传递compute\u loss=True参数-这样,gensim将在训练时为您存储损失。 经过培训后,您可以调用该方法来检索损失 由于skip-gram模型的交叉熵损失中的损失,损失的2次方将给出预弯曲度。(2**损失)我损失

我对Gensim W2V模型进行了500K个句子(约60K个单词)的训练,我想计算困惑度

  • 这样做的最佳方式是什么
  • 对于60K字,我如何检查适当数量的数据

  • 谢谢

    如果你想计算困惑,你必须先找回损失。 在
    gensim.models.word2vec.word2vec
    构造函数上,传递
    compute\u loss=True
    参数-这样,
    gensim
    将在训练时为您存储损失。 经过培训后,您可以调用该方法来检索损失


    由于skip-gram模型的交叉熵损失中的损失,损失的2次方将给出预弯曲度。(2**损失)

    我损失了36672808.0这有意义吗?你进行过培训吗?告诉我你的词汇表中的困惑和单词总数,这样就更容易确定它是否有意义了