Python NLTK词类的缩写参考_Python_Nlp_Nltk

Python NLTK词类的缩写参考

python nlp

Python NLTK词类的缩写参考,python,nlp,nltk,Python,Nlp,Nltk,我正在使用nltk查找句子中每个单词的词性。它返回的缩写，我既不能完全凭直觉，也找不到好的文档运行： import nltk sample = "There is no spoon." tokenized_words = nltk.word_tokenize(sample) tagged_words = nltk.pos_tag(tokenized_words) print tagged_words 返回： [('There', 'EX'), ('is', 'VBZ'), ('no', 'D

我正在使用nltk查找句子中每个单词的词性。它返回的缩写，我既不能完全凭直觉，也找不到好的文档

运行：

import nltk
sample = "There is no spoon."
tokenized_words = nltk.word_tokenize(sample)
tagged_words = nltk.pos_tag(tokenized_words)
print tagged_words

[('There', 'EX'), ('is', 'VBZ'), ('no', 'DT'), ('spoon', 'NN'), ('.', '.')]

在上面的例子中，我在寻找什么是

DT

，

EX

，以及其他的意思

到目前为止，我所能做的最好的事情就是在文章中搜索有关缩写词的提及，但必须有更好的内容。我也找到了一些基于文献的资源，但我不知道如何判断nltk使用的是哪种语言。

您已经提到的有两种不同的标记集

有关标记集文档，请参见

nltk.help.upenn\u标记集（）

和

nltk.help.brown\u标记集（）

在此特定示例中，这些标记来自

您还可以通过以下方式了解这些标记：

nltk.help.upenn_tagset('DT')
nltk.help.upenn_tagset('EX')

佩恩·特雷班克：是的！谢谢你有没有可能把它写在答案里，这样我就可以把它记下来？可能是重复的。重复：虽然在另一个答案中给出的函数确实提供了我需要的信息，但我现在没有，因为它只提到列出缩写而没有定义它们。如中所示，默认标记集可以通过

nltk.tag.\u POS\u TAGGER