Nlp 在Mallet中使用预定义的主题

Nlp 在Mallet中使用预定义的主题,nlp,topic-modeling,mallet,Nlp,Topic Modeling,Mallet,我希望使用Mallet根据我定义的主题对不同的文档进行分类。我知道Mallet将首先确定主题,然后对文档进行分类,但我想跳过第一步,因为我已经有一个主题列表,其中包含与它们相关的单词。有没有办法使用我创建的预定义主题列表来使用Mallet对文档进行分类 感谢您的指导。谢谢 如果您正在进行无监督学习(没有培训示例,即每个主题的文档),您不能简单地设置主题。关键是,训练算法事先对文档一无所知。它只是试图根据您提供的功能来分离/分发它们 如果你在进行有监督的学习,那么主题实际上是课程,你有每个课程的文

我希望使用Mallet根据我定义的主题对不同的文档进行分类。我知道Mallet将首先确定主题,然后对文档进行分类,但我想跳过第一步,因为我已经有一个主题列表,其中包含与它们相关的单词。有没有办法使用我创建的预定义主题列表来使用Mallet对文档进行分类


感谢您的指导。谢谢

如果您正在进行无监督学习(没有培训示例,即每个主题的文档),您不能简单地设置主题。关键是,训练算法事先对文档一无所知。它只是试图根据您提供的功能来分离/分发它们

如果你在进行有监督的学习,那么主题实际上是课程,你有每个课程的文档。然后,该算法尝试了解哪些特征对于每个类都是重要的。在mallet中,您应该使用分类模块

可能有一些奇特的主题建模思想,根据特定的关键字合并/扭曲主题分布,但我认为这在Mallet中是不可能的