Scikit learn 如何使用sklearn获取在LDA中生成每个主题的文档

Scikit learn 如何使用sklearn获取在LDA中生成每个主题的文档,scikit-learn,lda,topic-modeling,dirichlet,Scikit Learn,Lda,Topic Modeling,Dirichlet,嗨,我需要检索哪些文档(文档id)使用sklearn在潜在Dirichlet分配中生成了每个主题 我正在使用数据库来存储语料库 例如,我有表格语料库: 语料库=(文档id,文本) 我在语料库上运行LDA 我需要检索: 专题1 由doc_id=(ID3、ID9、ID12等)生成 专题2 由doc_id=(ID2、ID9、ID66等)生成 主题K 由文档id(d1,d2,…)生成 我可以这样做吗?一旦LDA获取语料库并将其放入弓中,文档id丢失,我只能检索文档的序列号,而不是数据库中的文档id 我能

嗨,我需要检索哪些文档(文档id)使用sklearn在潜在Dirichlet分配中生成了每个主题

我正在使用数据库来存储语料库

例如,我有表格语料库:

语料库=(文档id,文本)

我在语料库上运行LDA

我需要检索:

专题1

由doc_id=(ID3、ID9、ID12等)生成

专题2

由doc_id=(ID2、ID9、ID66等)生成

主题K

由文档id(d1,d2,…)生成

我可以这样做吗?一旦LDA获取语料库并将其放入弓中,文档id丢失,我只能检索文档的序列号,而不是数据库中的文档id

我能做这个吗


谢谢。

您好,您能提供一个最小的可复制代码示例吗?