Nlp ldaseqmodel runtimewarning双_标量中的值无效

Nlp ldaseqmodel runtimewarning双_标量中的值无效,nlp,gensim,lda,Nlp,Gensim,Lda,我目前正在尝试对一些从web上抓取的新闻使用动态主题建模。 不幸的是,我在日志中收到一条警告: 信息:在此节点上使用串行LDA版本 path/to/gensim/models/ldaseqmodel.py:1472: RuntimeWarning: invalid value encountered in double_scalars converged = np.fabs((lhood_old - lhood) / (lhood_old * total)) 在使用google了解更多关于这个

我目前正在尝试对一些从web上抓取的新闻使用动态主题建模。 不幸的是,我在日志中收到一条警告:

信息:在此节点上使用串行LDA版本

path/to/gensim/models/ldaseqmodel.py:1472: RuntimeWarning: invalid value encountered in double_scalars converged = np.fabs((lhood_old - lhood) / (lhood_old * total))

在使用google了解更多关于这个问题的信息后,我了解到这个numpy错误通常是由NAN或null值产生的。那么关于动态主题建模,这可能指的是一个空文档?但是我的数据框中没有任何空文档

因为缺乏声誉,我无法发表评论,这就是我在这里写建议的原因。因此,在运行
gensim
ldaseqmodel
之前,您可能已经做了一些预处理。首先,检查完成所有预处理后,语料库中是否有空文档。要检查是否在列表格式中(通常在列表格式中),可以执行以下操作:

for i in range(len(bow_corpus)): #bow_corpus is the corpus
    if len(bow_corpus[i])==0: #check for empty document
        print(i) #if there is any empty document then print the index of that document
通过运行上述命令,您将获得空文档的所有索引。然后,您可以简单地删除相应的文档