Python 如何使用NLTK pos标记获得更好的结果

Python 如何使用NLTK pos标记获得更好的结果,python,nltk,pos-tagger,Python,Nltk,Pos Tagger,我正在学习使用Python的nltk。我试着在不同的句子上做pos_标记。但所得结果并不准确。我如何即兴创作结果 broke = NN flimsy = NN crap = NN 我也得到了很多额外的单词被归类为NN。我怎样才能筛选出这些结果来获得更好的结果呢?请给出上下文,您就在这里获得了这些结果。举个例子,我在上下文短语“他们打破了陈词滥调”上用pos_标记获得了其他结果: [(“他们”、“PRP”)、(“破产”、“VBP”)、(“脆弱”、“JJ”)、(“垃圾”、“NN”)] 无论如何,如

我正在学习使用Python的nltk。我试着在不同的句子上做pos_标记。但所得结果并不准确。我如何即兴创作结果

broke = NN
flimsy = NN
crap = NN

我也得到了很多额外的单词被归类为NN。我怎样才能筛选出这些结果来获得更好的结果呢?

请给出上下文,您就在这里获得了这些结果。举个例子,我在上下文短语“他们打破了陈词滥调”上用pos_标记获得了其他结果:

[(“他们”、“PRP”)、(“破产”、“VBP”)、(“脆弱”、“JJ”)、(“垃圾”、“NN”)]

无论如何,如果你发现在你看来,很多单词被错误地阴极化为“NN”,你可以应用一些其他技术,特别是在那些标记为“NN”的单词上。 例如,您可以获取一些适当的标记语料库,并使用trigram tagger对其进行分类。 (事实上,与作者在使用bigrams时使用的方法相同)

大概是这样的:

pos_tag_results=nltk.pos_tag(your_text) #tagged sentences with pos_tag
trigram_tagger=nltk.TrigramTagger(tagged_corpora) #build trigram tagger based on your tagged_corpora
trigram_tag_results=trigram_tagger(your_text) #tagged sentences with trigram tagger
for i in range(0,len(pos_tag_results)):
    if pos_tag_results[i][1]=='NN':
        pos_tag_results[i][1]=trigram_tag_results[i][1]#for 'NN' take trigram_tagger instead
如果它能改善您的成绩,请告诉我。

请参阅
pos_tag_results=nltk.pos_tag(your_text) #tagged sentences with pos_tag
trigram_tagger=nltk.TrigramTagger(tagged_corpora) #build trigram tagger based on your tagged_corpora
trigram_tag_results=trigram_tagger(your_text) #tagged sentences with trigram tagger
for i in range(0,len(pos_tag_results)):
    if pos_tag_results[i][1]=='NN':
        pos_tag_results[i][1]=trigram_tag_results[i][1]#for 'NN' take trigram_tagger instead