Python文本匹配-同义词

Python文本匹配-同义词,python,pandas,nltk,synonym,textmatching,Python,Pandas,Nltk,Synonym,Textmatching,我在Pandas中有两列:A和B,每个列都包含术语字符串。我的目标是找到B列中与A列最相似的条目。我已经在使用TF-IDF来实现这一点,但有时有些同义词并不明显匹配,例如货币和货币 如何找到还包含同义词的匹配项?如果您使用单个词对,我不确定TF-IDF在这里有何用处 无论如何,有两个明显的解决方案 使用传统的知识库,我会推荐这个用例,它被广泛认为是业界的标准 第二种选择是使用机器学习算法Word2Vec(或类似手套的变体)。我想说,如果你使用一个已经像这样训练过的模型,这是最简单的解决方案。查看

我在Pandas中有两列:A和B,每个列都包含术语字符串。我的目标是找到B列中与A列最相似的条目。我已经在使用TF-IDF来实现这一点,但有时有些同义词并不明显匹配,例如货币和货币


如何找到还包含同义词的匹配项?

如果您使用单个词对,我不确定TF-IDF在这里有何用处

无论如何,有两个明显的解决方案

使用传统的知识库,我会推荐这个用例,它被广泛认为是业界的标准


第二种选择是使用机器学习算法Word2Vec(或类似手套的变体)。我想说,如果你使用一个已经像这样训练过的模型,这是最简单的解决方案。查看以加载模型并计算相似度。

如果您使用单个词对,我不确定TF-IDF在这里有何用处

无论如何,有两个明显的解决方案

使用传统的知识库,我会推荐这个用例,它被广泛认为是业界的标准

第二种选择是使用机器学习算法Word2Vec(或类似手套的变体)。我想说,如果你使用一个已经像这样训练过的模型,这是最简单的解决方案。查看以加载模型并计算相似性