Python 使用Gensim获得TF-IDF单词分数_Python_Tf Idf_Gensim

Python 使用Gensim获得TF-IDF单词分数

python

Python 使用Gensim获得TF-IDF单词分数,python,tf-idf,gensim,Python,Tf Idf,Gensim,我试图根据他们的TF-IDF分数在语料库中找到最重要的单词我们一直在学习这个例子。基于 >>> for doc in corpus_tfidf: ... print(doc) TF-IDF分数在每次迭代中都会得到更新。比如说, Word 0（“基于计算机”）的TF-IDF得分为0.5773（Doc#1），0.4442（Doc#2）单词10（“图表”）的TF-IDF得分为0.7071（文件7）、0.5080（文件8）、0.4588（文件9）下面是我目前如何获得

我试图根据他们的TF-IDF分数在语料库中找到最重要的单词

我们一直在学习这个例子。基于

>>> for doc in corpus_tfidf:
...     print(doc)

TF-IDF分数在每次迭代中都会得到更新。比如说,

Word 0（“基于计算机”）的TF-IDF得分为0.5773（Doc#1），0.4442（Doc#2）
单词10（“图表”）的TF-IDF得分为0.7071（文件7）、0.5080（文件8）、0.4588（文件9）

下面是我目前如何获得每个单词的最终TF-IDF分数

tfidf = gensim.models.tfidfmodel.TfidfModel(corpus)
corpus_tfidf = tfidf[corpus]
d = {}
for doc in corpus_tfidf:
    for id, value in doc:
        word = dictionary.get(id)
        d[word] = value

有更好的办法吗

提前谢谢。

使用字典理解怎么样

d = {dictionary.get(id): value for doc in corpus_tfidf for id, value in doc}