Java Mallet主题建模API-如何确定优化所需或最佳的间隔数?

Java Mallet主题建模API-如何确定优化所需或最佳的间隔数?,java,nlp,intervals,topic-modeling,mallet,Java,Nlp,Intervals,Topic Modeling,Mallet,很抱歉,我是NLP领域的初学者,正如标题所说,malletAPI中优化的最佳间隔是什么?我还想知道它是否与迭代次数/主题/语料库等相关。优化间隔是超参数更新之间的迭代次数。20到50之间的值似乎很有效,但我还没有做过任何系统测试。需要注意的一种可能的失败模式是,过多的优化循环可能会导致不稳定,alpha hyperparameters将为零。这里有一篇有趣的博文,其中对 TL;博士: 这完全取决于项目的目标。但重要的是我们 意识到巨大的影响,马勒特的不显眼的参数 超参数优化可能会对结果模型产生

很抱歉,我是NLP领域的初学者,正如标题所说,malletAPI中优化的最佳间隔是什么?我还想知道它是否与迭代次数/主题/语料库等相关。

优化间隔是超参数更新之间的迭代次数。20到50之间的值似乎很有效,但我还没有做过任何系统测试。需要注意的一种可能的失败模式是,过多的优化循环可能会导致不稳定,alpha hyperparameters将为零。

这里有一篇有趣的博文,其中对

TL;博士:

这完全取决于项目的目标。但重要的是我们 意识到巨大的影响,马勒特的不显眼的参数 超参数优化可能会对结果模型产生影响


编辑:作者没有修复随机种子。因此,结果可以用MALLET的随机初始化来解释。

这是针对培训主题模型中的
--optimize interval
选项的吗?@davidimno是的,对于API,这是针对.setOptimizeInterval(num)的代码;