Machine learning 关于Blei'的推理结果;s lda-c-dist

Machine learning 关于Blei'的推理结果;s lda-c-dist,machine-learning,lda,topic-modeling,Machine Learning,Lda,Topic Modeling,我对lda-c-dist包的推断结果有一个问题。查看推理结果时应显示多少单词?例如,如果我将单词的数量设置为一个非常大的数字N(假设所有术语的数量都是N),那么似乎存在一些单词组。在每组中,单词的索引范围为1到N 我得到的是, 假设术语数为10,我将显示的单词数指定为10 Topic 0xx: 001 008 009 002 003 007 000 004 005 006 看来,可能是我应该设置文字显示3,而不是10 那么,对于一个主题,当通过调用topics.py查看主题时,应该指定多少个单

我对lda-c-dist包的推断结果有一个问题。查看推理结果时应显示多少单词?例如,如果我将单词的数量设置为一个非常大的数字N(假设所有术语的数量都是N),那么似乎存在一些单词组。在每组中,单词的索引范围为1到N

我得到的是, 假设术语数为10,我将显示的单词数指定为10

Topic 0xx:
001
008
009
002
003
007
000
004
005
006
看来,可能是我应该设置文字显示3,而不是10

那么,对于一个主题,当通过调用topics.py查看主题时,应该指定多少个单词


此外,我将使用这个输出来计算两个主题的相似性。所以…

实际上,词汇表中的项目可以有多少就有多少。这里显示的只是有限数量的概率降序