Python 如何保存列车组';gensim训练的LDA模型上的s分布?

Python 如何保存列车组';gensim训练的LDA模型上的s分布?,python,lda,gensim,Python,Lda,Gensim,守则的最后部分: lda = models.LdaModel(corpus_tfidf, id2word = dic, num_topics = 64) corpus_lda = lda[corpus_tfidf] 我想知道如何保存语料库以供进一步使用?Gensim具有将语料库写入磁盘的功能: from Gensim import corpora corpora.MmCorpus.serialize('pathandfilename.mm', corpus_lda) 要加载保存的语料库,请

守则的最后部分:

lda = models.LdaModel(corpus_tfidf, id2word = dic, num_topics = 64)
corpus_lda = lda[corpus_tfidf]

我想知道如何保存语料库以供进一步使用?

Gensim具有将语料库写入磁盘的功能:

from Gensim import corpora
corpora.MmCorpus.serialize('pathandfilename.mm', corpus_lda) 
要加载保存的语料库,请使用:

corpus_lda = corpora.MmCorpus('pathandfilename.mm')
保存模型也有类似的功能(请查看教程或)。
有不同的语料库格式可用,我相信matrix market曾经是Gensim使用的标准格式,但最近添加了indexedcorpus格式,它具有一些额外的功能(如您可能猜到的,索引)

您的意思是要保存
lda
模型吗?我这样问是因为你的代码使得
corpus\u lda
包含每个培训文档的主题分布。我知道corpus\u lda包含主题分布,这就是我想要保存的,我想要将分布保存为2173*64(2173是我的培训文档编号,64是主题)矩阵,但不知道如何保存。一个快速的解决方案是使用该模块并将主题分布矩阵转储到一个文件中,然后在需要时使用同一模块加载矩阵。非常感谢@亨利·沃顿勋爵