如何计算Python中两个单词的意义距离_Python_Nlp_Nltk

如何计算Python中两个单词的意义距离

python nlp

如何计算Python中两个单词的意义距离,python,nlp,nltk,Python,Nlp,Nltk,我想知道是否有可能计算Python中两个相关单词之间的距离/相似性（如“欺诈”和“偷窃”）。这两个词本身并不是同义词，但它们显然是相关的。NLP中是否有任何概念/算法可以用数字表示这种关系？也许通过NLTK 我不是在寻找Levenshtein距离，因为它与组成一个单词的单个字符有关。我在寻找意义之间的联系非常感谢您的帮助。我的建议如下：将每个单词放在同一个同义词词典中，以获得同义词列表获取这两个单词的相似同义词集的大小这是词语之间相似性的度量如果您想进行更彻底的分析：同时也要得

我想知道是否有可能计算Python中两个相关单词之间的距离/相似性（如“欺诈”和“偷窃”）。这两个词本身并不是同义词，但它们显然是相关的。NLP中是否有任何概念/算法可以用数字表示这种关系？也许通过NLTK

我不是在寻找Levenshtein距离，因为它与组成一个单词的单个字符有关。我在寻找意义之间的联系

非常感谢您的帮助。

我的建议如下：

将每个单词放在同一个同义词词典中，以获得同义词列表
获取这两个单词的相似同义词集的大小
这是词语之间相似性的度量

如果您想进行更彻底的分析：

同时也要得到两个单词的反义词
获取两个单词的反义词集的交集大小

如果你想走得更远

将每个单词放在同一个同义词词典中，以获得同义词列表
使用查询结果中最前面的n（=5）个词来启动新查询
重复这个步骤，直到你觉得足够的深度
从重复的同义词查询中收集同义词
从两个同义词集合中获取两个单词的相似同义词集的大小
这是词语之间相似性的度量

synonymSet = wordnet.synsets(word)

similarity = synonym1.res_similarity(synonym2,semcor_ic)

import nltk    
from nltk.corpus import wordnet
from nltk.corpus import wordnet_ic
semcor_ic = wordnet_ic.ic('ic-semcor.dat')