Python 如何使用TF-IDF或LSA与gensim计算单词相似度?

Python 如何使用TF-IDF或LSA与gensim计算单词相似度?,python,nlp,tf-idf,gensim,lsa,Python,Nlp,Tf Idf,Gensim,Lsa,我知道gensim中的word2vec可以计算单词之间的相似性。但现在我想使用TF-IDF或LSA与gensim计算单词相似度。怎么做 注意:使用LSA和gensim计算文档相似性很容易:TF-IDF是一种加权方案,因此它不是LSA的替代方案。 把你的问题想象成一个由“n”个文档组成的“m”个术语的矩阵。矩阵的每个条目Aij表示文档“j”中术语“i”的权重。这就是你使用TF-IDF的地方。知道在矩阵的每个单元格中放置什么 然后,如果它适合您的应用程序,您可以使用LSA减少矩阵的维数 我希望这能澄

我知道gensim中的word2vec可以计算单词之间的相似性。但现在我想使用TF-IDF或LSA与gensim计算单词相似度。怎么做


注意:使用LSA和gensim计算文档相似性很容易:

TF-IDF是一种加权方案,因此
它不是LSA的替代方案。

把你的问题想象成一个由“n”个文档组成的“m”个术语的矩阵。矩阵的每个条目Aij表示文档“j”中术语“i”的权重。这就是你使用TF-IDF的地方。知道在矩阵的每个单元格中放置什么

然后,如果它适合您的应用程序,您可以使用LSA减少矩阵的维数


我希望这能澄清一点问题。

我想使用gensim,怎么做?嗨@hankaixyz,但在你最初的问题中你没有提到?