Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/327.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python Gensim获取文档主题(参见文档)_Python_Lda_Gensim - Fatal编程技术网

Python Gensim获取文档主题(参见文档)

Python Gensim获取文档主题(参见文档),python,lda,gensim,Python,Lda,Gensim,我知道,在为gensim培训lda模型后,我们可以通过以下方式获得一个看不见的文档的主题: lda = LdaModel(corpus, num_topics=10) doc_lda = lda[doc_bow] 但是那些已经用于培训的文档呢?我的意思是,有没有一种方法可以在培训中使用的语料库中获取文档主题,而不将其视为新文档?没有 单个文档中的信息被提取到模型中,然后被遗忘。 不保留每个文档的信息(更一般地说,不保留需要O(#docs)内存的信息)。但是如果我想获得经过培训的文档的主题分布,

我知道,在为gensim培训lda模型后,我们可以通过以下方式获得一个看不见的文档的主题:

lda = LdaModel(corpus, num_topics=10)
doc_lda = lda[doc_bow]
但是那些已经用于培训的文档呢?我的意思是,有没有一种方法可以在培训中使用的语料库中获取文档主题,而不将其视为新文档?

没有

单个文档中的信息被提取到模型中,然后被遗忘。
不保留每个文档的信息(更一般地说,不保留需要
O(#docs)
内存的信息)。

但是如果我想获得经过培训的文档的主题分布,这样我就可以进行某种聚类操作,那么我能做什么呢?