Python 如何使用Gensim打印前十大主题?

Python 如何使用Gensim打印前十大主题?,python,lda,gensim,topic-modeling,Python,Lda,Gensim,Topic Modeling,在官方解释中,LDA中的主题之间没有自然的顺序 至于show_topics()方法,如果它像文档中所说的那样返回num_topics,那么在LDA中主题之间没有自然的顺序。如果您有自己的主题排序标准,如出现频率,则始终可以从模型中检索整个主题列表并自行排序 然而,即使是“十大最频繁的话题”的概念也是模棱两可的,人们可以合理地提出几种不同的频率定义。您是指分配给最多单词标记的主题吗?你是指所有文档中平均比例最高的主题吗?这种模糊性是gensim没有内置的主题排序方法的原因。如文档所述,LDA中的主

在官方解释中,LDA中的主题之间没有自然的顺序


至于show_topics()方法,如果它像文档中所说的那样返回num_topics,那么在LDA中主题之间没有自然的顺序。如果您有自己的主题排序标准,如出现频率,则始终可以从模型中检索整个主题列表并自行排序


然而,即使是“十大最频繁的话题”的概念也是模棱两可的,人们可以合理地提出几种不同的频率定义。您是指分配给最多单词标记的主题吗?你是指所有文档中平均比例最高的主题吗?这种模糊性是gensim没有内置的主题排序方法的原因。

如文档所述,LDA中的主题之间没有自然排序。如果您有自己的主题排序标准,如出现频率,则始终可以从模型中检索整个主题列表并自行排序

然而,即使是“十大最频繁的话题”的概念也是模棱两可的,人们可以合理地提出几种不同的频率定义。您是指分配给最多单词标记的主题吗?你是指所有文档中平均比例最高的主题吗?这种模糊性是gensim没有内置的主题排序方法的原因。

在LDA文档中,以下方法已登记:

热门主题(语料库=None,文本=None,词典=None,窗口大小=None,连贯性=u\u mass',topn=20,过程=1)

这可能会有帮助。

在LDA文档中,以下方法已登记:

热门主题(语料库=None,文本=None,词典=None,窗口大小=None,连贯性=u\u mass',topn=20,过程=1)


这可能会有帮助。

无论使用
gensim
等,是否有好的经验法则来排序/排列LDA主题?无论使用
gensim
等,是否有好的经验法则来排序/排列LDA主题?