Python gensim转换语料库数据到数组的高效转换

Python gensim转换语料库数据到数组的高效转换,python,numpy,gensim,lda,Python,Numpy,Gensim,Lda,有没有比下面的按行方法更直接或有效的方法将gensim.interfaces.TransformedCorpus对象中的主题概率数据获取到numpy数组(或者熊猫数据帧) from gensim import models import numpy as np num_topics = 5 model = models.LdaMulticore(corpus, num_topics=num_topics, minimum_probability=0.0) all_topics = model

有没有比下面的按行方法更直接或有效的方法将gensim.interfaces.TransformedCorpus对象中的主题概率数据获取到numpy数组(或者熊猫数据帧)

from gensim import models
import numpy as np

num_topics = 5
model = models.LdaMulticore(corpus, num_topics=num_topics, minimum_probability=0.0)

all_topics = model.get_document_topics(corpus)
num_docs = len(all_topics)

lda_scores = np.empty([num_docs, num_topics])

for i in range(0, num_docs):
    lda_scores[i] = np.array(all_topics[i]).transpose()[1]

可能已经太晚了,但是gensim有一个助手函数用于在numpy/scipy数组之间进行转换

你在寻找什么:

然后可以根据需要将输出转换为numpy数组或df

import gensim
import numpy as np

all_topics_csr = gensim.matutils.corpus2csc(all_topics)
all_topics_numpy = all_topics_csr.T.toarray()

可能已经太晚了,但是gensim有一个助手函数用于在numpy/scipy数组之间进行转换

你在寻找什么:

然后可以根据需要将输出转换为numpy数组或df

import gensim
import numpy as np

all_topics_csr = gensim.matutils.corpus2csc(all_topics)
all_topics_numpy = all_topics_csr.T.toarray()