gensim生成LSI模型原因“;Python已停止工作;

gensim生成LSI模型原因“;Python已停止工作;,python,python-3.x,gensim,latent-semantic-indexing,latent-semantic-analysis,Python,Python 3.x,Gensim,Latent Semantic Indexing,Latent Semantic Analysis,因此,我尝试使用gensim生成LSI模型,并在接下来的教程中使用corpus_LSI 我从我自己生成的语料库和词典开始。 文档列表太小(9行=9个文档),这是教程中提供的示例列表 然而,pythos只是在到达生成LSI_模型的线路时崩溃。 您可以在下面看到我的代码以及生成的输出 代码 #!/usr/bin/env python import os from gensim import corpora, models, similarities import logging #logging.

因此,我尝试使用gensim生成LSI模型,并在接下来的教程中使用corpus_LSI

我从我自己生成的语料库和词典开始。 文档列表太小(9行=9个文档),这是教程中提供的示例列表

然而,pythos只是在到达生成LSI_模型的线路时崩溃。 您可以在下面看到我的代码以及生成的输出

代码

#!/usr/bin/env python
import os
from gensim import corpora, models, similarities
import logging

#logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)

if __name__ == '__main__':
    if (os.path.exists("tmp\dictionary.dict")):
        dictionary = corpora.Dictionary.load('tmp\dictionary.dict')
        corpus = corpora.MmCorpus('tmp\corpus.mm')
        print("Used files generated Dataset Generator")
    else:
        print("Please run dataset generator")

print ("generating tf-idf model ...")
tfidf = models.TfidfModel(corpus)   # Generate tfidf matrix (tf-idf model)
print ("generating corpus_tf-idf model ...")
corpus_tfidf = tfidf[corpus]    #use the model to transform vectors

print ("generating LSI model ...")
lsi = models.LsiModel(corpus_tfidf, id2word=dictionary, num_topics=2) # initialize an LSI transformation
print ("generating corpus_lsi model ...")
corpus_lsi = lsi[corpus_tfidf] # create a double wrapper over the original corpus: bow->tfidf->fold-in-lsi

lsi.print_topics(2)
输出

Used files generated Dataset Generator
generating tf-idf model ...
generating corpus_tf-idf model ...
generating LSI model ...
打印“生成LSI模型”后,它崩溃

有什么建议吗

我尝试过的其他事情

  • 将python版本更改为python 2.6
  • 从github(而不是conda)卸下gensim并重新安装

问题似乎出在教程中使用的功能上(可能是降级或其他原因)

所以我改变了路线

lsi = models.LsiModel(corpus_tfidf, id2word=dictionary, num_topics=2) # initialize an LSI transformation


而且它实际上工作得很好

谢谢-删除“id2word=dictionary”不会有任何影响吗?
lsi = LsiModel(corpus_tfidf,num_topics=2)