Nlp 为什么使用gensim计算LDA的一致性分数时速度如此缓慢_Nlp_Gensim_Lda

Nlp 为什么使用gensim计算LDA的一致性分数时速度如此缓慢

nlp

Nlp 为什么使用gensim计算LDA的一致性分数时速度如此缓慢,nlp,gensim,lda,Nlp,Gensim,Lda,我是LDA新手，当我使用gensim CoherenceModel计算LDA模型的一致性分数时，运行该模型需要非常长的时间。然而，训练部分相对较快，而且时间合理。我想知道这是否是因为我的数据量（大约250000长的文本）的缘故，有没有办法加快这个过程？谢谢这是我的代码，与教程完全相同 from gensim.models import CoherenceModel coherence_model_lda = CoherenceModel(model=lda_model_tfidf, texts

我是LDA新手，当我使用gensim CoherenceModel计算LDA模型的一致性分数时，运行该模型需要非常长的时间。然而，训练部分相对较快，而且时间合理。我想知道这是否是因为我的数据量（大约250000长的文本）的缘故，有没有办法加快这个过程？谢谢

这是我的代码，与教程完全相同

from gensim.models import CoherenceModel
coherence_model_lda = CoherenceModel(model=lda_model_tfidf, texts=LDA_, dictionary=dictionary, coherence='c_v')
coherence_lda = coherence_model_lda.get_coherence()
print('\nCoherence Score: ', coherence_lda)

众所周知，

'c_v'

相干度量是最慢的方法，但得到的结果最好。您可以尝试

'u_mass'

以获得最快的性能

请注意，您只需要

'u_mass'

的模型、语料库和连贯性参数

您可以在此处阅读更多关于这两种方法之间差异的信息：

众所周知，一致性度量是最慢的方法，但得到的结果最好。您可以尝试

'u_mass'

以获得最快的性能

请注意，您只需要

'u_mass'

的模型、语料库和连贯性参数

您可以在此处阅读有关这两种方法之间差异的更多信息：

Hi，欢迎使用堆栈溢出。显示您的问题的最小（代码）示例。您好，欢迎使用堆栈溢出。谢谢你的回答，我还想知道如何在一个模型的可解释性和分数之间做出选择，我应该先考虑哪一个呢？谢谢你的回答，我也想知道如何在一个模型的可解释性和分数之间进行选择，我应该先考虑哪一个？