Python NLTK词类的缩写参考
我正在使用nltk查找句子中每个单词的词性。它返回的缩写,我既不能完全凭直觉,也找不到好的文档 运行:Python NLTK词类的缩写参考,python,nlp,nltk,Python,Nlp,Nltk,我正在使用nltk查找句子中每个单词的词性。它返回的缩写,我既不能完全凭直觉,也找不到好的文档 运行: import nltk sample = "There is no spoon." tokenized_words = nltk.word_tokenize(sample) tagged_words = nltk.pos_tag(tokenized_words) print tagged_words 返回: [('There', 'EX'), ('is', 'VBZ'), ('no', 'D
import nltk
sample = "There is no spoon."
tokenized_words = nltk.word_tokenize(sample)
tagged_words = nltk.pos_tag(tokenized_words)
print tagged_words
返回:
[('There', 'EX'), ('is', 'VBZ'), ('no', 'DT'), ('spoon', 'NN'), ('.', '.')]
在上面的例子中,我在寻找什么是DT
,EX
,以及其他的意思
到目前为止,我所能做的最好的事情就是在文章中搜索有关缩写词的提及,但必须有更好的内容。我也找到了一些基于文献的资源,但我不知道如何判断nltk使用的是哪种语言。您已经提到的有两种不同的标记集
有关标记集文档,请参见nltk.help.upenn\u标记集()
和nltk.help.brown\u标记集()
在此特定示例中,这些标记来自
您还可以通过以下方式了解这些标记:
nltk.help.upenn_tagset('DT')
nltk.help.upenn_tagset('EX')
佩恩·特雷班克:是的!谢谢你有没有可能把它写在答案里,这样我就可以把它记下来?可能是重复的。重复:虽然在另一个答案中给出的函数确实提供了我需要的信息,但我现在没有,因为它只提到列出缩写而没有定义它们。如中所示,默认标记集可以通过
nltk.tag.\u POS\u TAGGER