Nlp 一对词的词义消歧_Nlp_Artificial Intelligence_Word Sense Disambiguation

Nlp 一对词的词义消歧

nlp artificial-intelligence

Nlp 一对词的词义消歧,nlp,artificial-intelligence,word-sense-disambiguation,Nlp,Artificial Intelligence,Word Sense Disambiguation,假设我有一个词a和一个词B，其中我使用B作为暗示，暗示a的含义。例如，a=低音，B=音乐，给定这个词对，作为人类，我们可以立即知道a是什么意思我知道有很多算法适用于句子。我想知道是否已经开发了只针对一对单词进行WSD的算法词义消歧（WSD）是在给定上下文句子/文档的情况下消除单词歧义的任务。在这种情况下，两个标记短语的上下文基本上是另一个标记您可以试用不同的WSD软件，下面是一个列表：我将使用pywsd（）为您提供一个示例：（免责声明：我在NLTK中编写了pywsd和lesk模块）词义

假设我有一个词a和一个词B，其中我使用B作为暗示，暗示a的含义。例如，a=低音，B=音乐，给定这个词对，作为人类，我们可以立即知道a是什么意思

我知道有很多算法适用于句子。我想知道是否已经开发了只针对一对单词进行WSD的算法

词义消歧（WSD）是在给定上下文句子/文档的情况下消除单词歧义的任务。在这种情况下，两个标记短语的上下文基本上是另一个标记

您可以试用不同的WSD软件，下面是一个列表：

我将使用

pywsd

（）为您提供一个示例：

（免责声明：我在

NLTK

中编写了

pywsd

和

lesk

模块）

词义消歧（WSD）是在上下文句子/文档中消除单词歧义的任务。在这种情况下，两个标记短语的上下文基本上是另一个标记

您可以试用不同的WSD软件，下面是一个列表：

我将使用

pywsd

（）为您提供一个示例：

（免责声明：我在

NLTK

中编写了

pywsd

和

lesk

模块）

谢谢！我在列表中看到了很多算法！你认为哪种算法最适合我的任务？我的意思是，最合适的可能是更高的精度和更低的算法/空间复杂度。我没有太多。我只有两个主要算法，即lesk和最大化相似度。其余的都在进行中。我建议您使用任何lesk算法作为基线。当我有空的时候，我会尝试完成剩下的代码。我建议adapted_lesk作为lesk变体和相似性的“最强”版本（需要更长的时间），但路径相似性效果很好。这是一篇你可能会感兴趣的研究论文。谢谢！我在列表中看到了很多算法！你认为哪种算法最适合我的任务？我的意思是，最合适的可能是更高的精度和更低的算法/空间复杂度。我没有太多。我只有两个主要算法，即lesk和最大化相似度。其余的都在进行中。我建议您使用任何lesk算法作为基线。当我有空的时候，我会尝试完成剩下的代码。我建议adapted_lesk作为lesk变体和相似性的“最强”版本（需要更长的时间），但路径相似性效果很好。这是一篇你可能会感兴趣的研究论文。

$ wget https://github.com/alvations/pywsd/archive/master.zip
$ unzip master.zip
$ cd pywsd-master
$ python
Python 2.7.5+ (default, Feb 27 2014, 19:37:08) 
[GCC 4.8.1] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> from lesk import simple_lesk
# disambiguating the word 'bass' given the context 'bass music'
>>> simple_lesk('bass music', 'bass') 
Synset('bass.n.07')
>>> disambiguated = simple_lesk('bass music', 'bass')
>>> disambiguated.definition
<bound method Synset.definition of Synset('bass.n.07')>
>>> disambiguated.definition()
u'the member with the lowest range of a family of musical instruments

from nltk.wsd import lesk
disambiguated = lesk(context_sentence="bass music", ambiguous_word="bass")
print disambiguated.definition()