Python 如何在gensim LdaModel中调整alpha参数
我在lda分布中使用对称alpha训练了一个主题模型:Python 如何在gensim LdaModel中调整alpha参数,python,alpha,gensim,topic-modeling,Python,Alpha,Gensim,Topic Modeling,我在lda分布中使用对称alpha训练了一个主题模型: model = gensim.models.ldamodel.LdaModel(bows, num_topics = 20, id2word = dictionary, passes = 100) 我可以看到: model.alpha array([ 0.05, 0.05, 0.05, 0.05, 0.05, 0.05, 0.05, 0.05, 0.05, 0.05, 0.05, 0.05, 0.05, 0
model = gensim.models.ldamodel.LdaModel(bows, num_topics = 20, id2word = dictionary, passes = 100)
我可以看到:
model.alpha
array([ 0.05, 0.05, 0.05, 0.05, 0.05, 0.05, 0.05, 0.05, 0.05,
0.05, 0.05, 0.05, 0.05, 0.05, 0.05, 0.05, 0.05, 0.05,
0.05, 0.05])
在哪里
numpy.sum(model.alpha)
1.0000000000000002
我不太明白gensim如何降低alpha参数,使每个文档成为较少主题的混合体?看起来像
似乎gensim.models.ldamodel.ldamodel
采用默认为对称的alpha
参数。您可以显式地为它提供一个alpha数组,或者将它设置为'auto'
,它将从您的数据中学习优先级
我建议用alpha='auto'
试试它,让它了解优先级。我认为,像你提到的那样,显式地将它设置为数组是我要做的。@r2d2oid很酷。我绝对建议尝试一下'auto'
,让算法学习不对称的先验知识在过去给了我很好的结果!