Python 使用Gensim获得TF-IDF单词分数
我试图根据他们的TF-IDF分数在语料库中找到最重要的单词 我们一直在学习这个例子。基于Python 使用Gensim获得TF-IDF单词分数,python,tf-idf,gensim,Python,Tf Idf,Gensim,我试图根据他们的TF-IDF分数在语料库中找到最重要的单词 我们一直在学习这个例子。基于 >>> for doc in corpus_tfidf: ... print(doc) TF-IDF分数在每次迭代中都会得到更新。比如说, Word 0(“基于计算机”)的TF-IDF得分为0.5773(Doc#1),0.4442(Doc#2) 单词10(“图表”)的TF-IDF得分为0.7071(文件7)、0.5080(文件8)、0.4588(文件9) 下面是我目前如何获得
>>> for doc in corpus_tfidf:
... print(doc)
TF-IDF分数在每次迭代中都会得到更新。比如说,
- Word 0(“基于计算机”)的TF-IDF得分为0.5773(Doc#1),0.4442(Doc#2)
- 单词10(“图表”)的TF-IDF得分为0.7071(文件7)、0.5080(文件8)、0.4588(文件9)
tfidf = gensim.models.tfidfmodel.TfidfModel(corpus)
corpus_tfidf = tfidf[corpus]
d = {}
for doc in corpus_tfidf:
for id, value in doc:
word = dictionary.get(id)
d[word] = value
有更好的办法吗
提前谢谢。使用字典理解怎么样
d = {dictionary.get(id): value for doc in corpus_tfidf for id, value in doc}