Nlp 为什么使用gensim计算LDA的一致性分数时速度如此缓慢

Nlp 为什么使用gensim计算LDA的一致性分数时速度如此缓慢,nlp,gensim,lda,Nlp,Gensim,Lda,我是LDA新手,当我使用gensim CoherenceModel计算LDA模型的一致性分数时,运行该模型需要非常长的时间。然而,训练部分相对较快,而且时间合理。我想知道这是否是因为我的数据量(大约250000长的文本)的缘故,有没有办法加快这个过程?谢谢 这是我的代码,与教程完全相同 from gensim.models import CoherenceModel coherence_model_lda = CoherenceModel(model=lda_model_tfidf, texts

我是LDA新手,当我使用gensim CoherenceModel计算LDA模型的一致性分数时,运行该模型需要非常长的时间。然而,训练部分相对较快,而且时间合理。我想知道这是否是因为我的数据量(大约250000长的文本)的缘故,有没有办法加快这个过程?谢谢

这是我的代码,与教程完全相同

from gensim.models import CoherenceModel
coherence_model_lda = CoherenceModel(model=lda_model_tfidf, texts=LDA_, dictionary=dictionary, coherence='c_v')
coherence_lda = coherence_model_lda.get_coherence()
print('\nCoherence Score: ', coherence_lda)

众所周知,
'c_v'
相干度量是最慢的方法,但得到的结果最好。您可以尝试
'u_mass'
以获得最快的性能

请注意,您只需要
'u_mass'
的模型、语料库和连贯性参数


您可以在此处阅读更多关于这两种方法之间差异的信息:

众所周知,一致性度量是最慢的方法,但得到的结果最好。您可以尝试
'u_mass'
以获得最快的性能

请注意,您只需要
'u_mass'
的模型、语料库和连贯性参数


您可以在此处阅读有关这两种方法之间差异的更多信息:

Hi,欢迎使用堆栈溢出。显示您的问题的最小(代码)示例。您好,欢迎使用堆栈溢出。谢谢你的回答,我还想知道如何在一个模型的可解释性和分数之间做出选择,我应该先考虑哪一个呢?谢谢你的回答,我也想知道如何在一个模型的可解释性和分数之间进行选择,我应该先考虑哪一个?