Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/345.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python NLTK词类的缩写参考_Python_Nlp_Nltk - Fatal编程技术网

Python NLTK词类的缩写参考

Python NLTK词类的缩写参考,python,nlp,nltk,Python,Nlp,Nltk,我正在使用nltk查找句子中每个单词的词性。它返回的缩写,我既不能完全凭直觉,也找不到好的文档 运行: import nltk sample = "There is no spoon." tokenized_words = nltk.word_tokenize(sample) tagged_words = nltk.pos_tag(tokenized_words) print tagged_words 返回: [('There', 'EX'), ('is', 'VBZ'), ('no', 'D

我正在使用nltk查找句子中每个单词的词性。它返回的缩写,我既不能完全凭直觉,也找不到好的文档

运行:

import nltk
sample = "There is no spoon."
tokenized_words = nltk.word_tokenize(sample)
tagged_words = nltk.pos_tag(tokenized_words)
print tagged_words
返回:

[('There', 'EX'), ('is', 'VBZ'), ('no', 'DT'), ('spoon', 'NN'), ('.', '.')]
在上面的例子中,我在寻找什么是
DT
EX
,以及其他的意思

到目前为止,我所能做的最好的事情就是在文章中搜索有关缩写词的提及,但必须有更好的内容。我也找到了一些基于文献的资源,但我不知道如何判断nltk使用的是哪种语言。

您已经提到的有两种不同的标记集

有关标记集文档,请参见
nltk.help.upenn\u标记集()
nltk.help.brown\u标记集()

在此特定示例中,这些标记来自

您还可以通过以下方式了解这些标记:

nltk.help.upenn_tagset('DT')
nltk.help.upenn_tagset('EX')

佩恩·特雷班克:是的!谢谢你有没有可能把它写在答案里,这样我就可以把它记下来?可能是重复的。重复:虽然在另一个答案中给出的函数确实提供了我需要的信息,但我现在没有,因为它只提到列出缩写而没有定义它们。如中所示,默认标记集可以通过
nltk.tag.\u POS\u TAGGER