Python 如何使用TF-IDF或LSA与gensim计算单词相似度？_Python_Nlp_Tf Idf_Gensim_Lsa

Python 如何使用TF-IDF或LSA与gensim计算单词相似度？

python nlp

Python 如何使用TF-IDF或LSA与gensim计算单词相似度？,python,nlp,tf-idf,gensim,lsa,Python,Nlp,Tf Idf,Gensim,Lsa,我知道gensim中的word2vec可以计算单词之间的相似性。但现在我想使用TF-IDF或LSA与gensim计算单词相似度。怎么做注意：使用LSA和gensim计算文档相似性很容易：TF-IDF是一种加权方案，因此它不是LSA的替代方案。把你的问题想象成一个由“n”个文档组成的“m”个术语的矩阵。矩阵的每个条目Aij表示文档“j”中术语“i”的权重。这就是你使用TF-IDF的地方。知道在矩阵的每个单元格中放置什么然后，如果它适合您的应用程序，您可以使用LSA减少矩阵的维数我希望这能澄

我知道gensim中的word2vec可以计算单词之间的相似性。但现在我想使用TF-IDF或LSA与gensim计算单词相似度。怎么做

注意：使用LSA和gensim计算文档相似性很容易：

TF-IDF是一种加权方案，因此

它不是LSA的替代方案。

把你的问题想象成一个由“n”个文档组成的“m”个术语的矩阵。矩阵的每个条目Aij表示文档“j”中术语“i”的权重。这就是你使用TF-IDF的地方。知道在矩阵的每个单元格中放置什么

然后，如果它适合您的应用程序，您可以使用LSA减少矩阵的维数

我希望这能澄清一点问题。

我想使用gensim，怎么做？嗨@hankaixyz，但在你最初的问题中你没有提到？