Nlp 一对词的词义消歧

Nlp 一对词的词义消歧,nlp,artificial-intelligence,word-sense-disambiguation,Nlp,Artificial Intelligence,Word Sense Disambiguation,假设我有一个词a和一个词B,其中我使用B作为暗示,暗示a的含义。例如,a=低音,B=音乐,给定这个词对,作为人类,我们可以立即知道a是什么意思 我知道有很多算法适用于句子。我想知道是否已经开发了只针对一对单词进行WSD的算法 词义消歧(WSD)是在给定上下文句子/文档的情况下消除单词歧义的任务。在这种情况下,两个标记短语的上下文基本上是另一个标记 您可以试用不同的WSD软件,下面是一个列表: 我将使用pywsd()为您提供一个示例: (免责声明:我在NLTK中编写了pywsd和lesk模块)词义

假设我有一个词a和一个词B,其中我使用B作为暗示,暗示a的含义。例如,a=低音,B=音乐,给定这个词对,作为人类,我们可以立即知道a是什么意思

我知道有很多算法适用于句子。我想知道是否已经开发了只针对一对单词进行WSD的算法

词义消歧(WSD)是在给定上下文句子/文档的情况下消除单词歧义的任务。在这种情况下,两个标记短语的上下文基本上是另一个标记

您可以试用不同的WSD软件,下面是一个列表:

我将使用
pywsd
()为您提供一个示例:

(免责声明:我在
NLTK
中编写了
pywsd
lesk
模块)

词义消歧(WSD)是在上下文句子/文档中消除单词歧义的任务。在这种情况下,两个标记短语的上下文基本上是另一个标记

您可以试用不同的WSD软件,下面是一个列表:

我将使用
pywsd
()为您提供一个示例:


(免责声明:我在
NLTK
中编写了
pywsd
lesk
模块)

谢谢!我在列表中看到了很多算法!你认为哪种算法最适合我的任务?我的意思是,最合适的可能是更高的精度和更低的算法/空间复杂度。我没有太多。我只有两个主要算法,即lesk和最大化相似度。其余的都在进行中。我建议您使用任何lesk算法作为基线。当我有空的时候,我会尝试完成剩下的代码。我建议adapted_lesk作为lesk变体和相似性的“最强”版本(需要更长的时间),但路径相似性效果很好。这是一篇你可能会感兴趣的研究论文。谢谢!我在列表中看到了很多算法!你认为哪种算法最适合我的任务?我的意思是,最合适的可能是更高的精度和更低的算法/空间复杂度。我没有太多。我只有两个主要算法,即lesk和最大化相似度。其余的都在进行中。我建议您使用任何lesk算法作为基线。当我有空的时候,我会尝试完成剩下的代码。我建议adapted_lesk作为lesk变体和相似性的“最强”版本(需要更长的时间),但路径相似性效果很好。这是一篇你可能会感兴趣的研究论文。
$ wget https://github.com/alvations/pywsd/archive/master.zip
$ unzip master.zip
$ cd pywsd-master
$ python
Python 2.7.5+ (default, Feb 27 2014, 19:37:08) 
[GCC 4.8.1] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> from lesk import simple_lesk
# disambiguating the word 'bass' given the context 'bass music'
>>> simple_lesk('bass music', 'bass') 
Synset('bass.n.07')
>>> disambiguated = simple_lesk('bass music', 'bass')
>>> disambiguated.definition
<bound method Synset.definition of Synset('bass.n.07')>
>>> disambiguated.definition()
u'the member with the lowest range of a family of musical instruments
from nltk.wsd import lesk
disambiguated = lesk(context_sentence="bass music", ambiguous_word="bass")
print disambiguated.definition()