Nlp 使用LDA完成主题建模后,如何将主题映射到文档?

Nlp 使用LDA完成主题建模后,如何将主题映射到文档?,nlp,gensim,lda,Nlp,Gensim,Lda,是否有任何方法可以将生成的主题从LDA映射到文档列表,并确定它属于哪个主题?我感兴趣的是使用无监督学习对文档进行聚类,并将其分为适当的聚类 例如,在使用最佳超参数运行LDA模型后,我有10个主题。所以,它应该返回一些已经用预先训练好的LDA模型定义的主题,以及用户输入的新句子或文档 我在等你们好办法。:) 另外,我正在使用Gensim进行NLP。使用Quanteda,您可以通过以下方式实现这一点 dtm <- convert(dfmat_news, to = "topicmodels")

是否有任何方法可以将生成的主题从LDA映射到文档列表,并确定它属于哪个主题?我感兴趣的是使用无监督学习对文档进行聚类,并将其分为适当的聚类

例如,在使用最佳超参数运行LDA模型后,我有10个主题。所以,它应该返回一些已经用预先训练好的LDA模型定义的主题,以及用户输入的新句子或文档

我在等你们好办法。:)


另外,我正在使用Gensim进行NLP。

使用Quanteda,您可以通过以下方式实现这一点

dtm <- convert(dfmat_news, to = "topicmodels")
lda <- LDA(dtm, k = 10). #10 topics in this case

dtm这个包是由R编写的。您知道其他使用Python的包吗?谢谢看第18章
docvars(dfmat_news, 'topic') <- topics(lda)
head(topics(lda), 20)