Python 使用维基百科转储从文本生成主题的方法是什么

Python 使用维基百科转储从文本生成主题的方法是什么,python,nlp,text-processing,topic-modeling,Python,Nlp,Text Processing,Topic Modeling,我是NLP/文本处理新手 构建一个应用程序,需要从大约2行输入文本生成主题(音乐、游戏、浪漫、历史等) 我决定使用维基百科的文章库来帮助我完成这个过程 “训练”我的程序从输入文本中识别和分类这些主题的步骤是什么?这是一个广泛的问题。对于自动主题建模(不必训练模型),您可能希望查看潜在的Dirichlet分配。在python中,gensim是一种很好的LDA方法。我在Java中使用了分类任务,这可能更符合您的要求。并为文本挖掘任务提供了GUI。维基百科从何而来?要训练任何东西,你需要的输入已经根据

我是NLP/文本处理新手

构建一个应用程序,需要从大约2行输入文本生成主题(音乐、游戏、浪漫、历史等)

我决定使用维基百科的文章库来帮助我完成这个过程


“训练”我的程序从输入文本中识别和分类这些主题的步骤是什么?

这是一个广泛的问题。对于自动主题建模(不必训练模型),您可能希望查看潜在的Dirichlet分配。在python中,gensim是一种很好的LDA方法。我在Java中使用了分类任务,这可能更符合您的要求。并为文本挖掘任务提供了GUI。

维基百科从何而来?要训练任何东西,你需要的输入已经根据你的标准进行分类,而维基百科的原始文本就不是这样了。但是这太宽泛了,不能用一本介绍性的教科书来回答。提名结束。