NLTK跳转语法集名称-python
从NLTK WordNet API:NLTK跳转语法集名称-python,python,nlp,nltk,wordnet,Python,Nlp,Nltk,Wordnet,从NLTK WordNet API: >>> from nltk.corpus import wordnet as wn >>> for i in wn.synsets('discover'): ... print i, i.offset ... Synset('detect.v.01') 2154508 Synset('learn.v.02') 598954 Synset('discover.v.03') 1637982 Synset('disco
>>> from nltk.corpus import wordnet as wn
>>> for i in wn.synsets('discover'):
... print i, i.offset
...
Synset('detect.v.01') 2154508
Synset('learn.v.02') 598954
Synset('discover.v.03') 1637982
Synset('discover.v.04') 721437
Synset('fall_upon.v.01') 2286687
Synset('unwrap.v.02') 933821
Synset('discover.v.07') 2128066
Synset('identify.v.05') 652346
>>> wn.synset('discover.v.8')
Synset('identify.v.05')
从WN3.0的index.verb
文件中,我们有:
discover v 8 6 @ ~ * > $ + 8 7 02154508 00598954 01637982 00721437 02286687 00933821 02128066 00652346
我已经检查了WordNet API(),但是没有太多说明如何从discover.v.8
映射到identify.v.5
有人能解释映射是如何发生的吗?
如何提取这些映射的列表?我不确定您的问题的真正意图。似乎您不明白为什么“发现”与“识别”相关联,对吗?WordNet语法集是一个“同义词集”,因此为单个语法集列出了许多单词 如果您通过浏览器(WNB)或通过检查wordnet,您将看到用于“discover”的语法集列表只是wordnet中包含单词discover的所有语法集的列表。出于某种原因,NLTk在内部描述的语法集只有第一个单词出现在相关单词的语法集列表上 换句话说,
Synset('discover.v.8')
与Synset('identify.v.05')
是同一个Synset,只是从不同的角度来看。作为动词的发现的第八个意义也是作为动词的识别的第五个意义。在内部,两者都使用相同的S-ID,这就是它们之间的关系
这些映射的列表只是与单词相关的Synset ID的列表。类似于discover.v.8到identification.v.5的确切路径?是的,但是如何提取这些Synset的列表?我理解Synset的概念以及一个ID中的多个引理的概念,但似乎有一个没有文档的引理主列表。ID 652346在NLTK API中将始终显示
identify.v.5
而不是discover.v.8
,因此如何提取这些映射?