Python 如何使用NLTK pos标记获得更好的结果_Python_Nltk_Pos Tagger

Python 如何使用NLTK pos标记获得更好的结果

python

Python 如何使用NLTK pos标记获得更好的结果,python,nltk,pos-tagger,Python,Nltk,Pos Tagger,我正在学习使用Python的nltk。我试着在不同的句子上做pos_标记。但所得结果并不准确。我如何即兴创作结果 broke = NN flimsy = NN crap = NN 我也得到了很多额外的单词被归类为NN。我怎样才能筛选出这些结果来获得更好的结果呢？请给出上下文，您就在这里获得了这些结果。举个例子，我在上下文短语“他们打破了陈词滥调”上用pos_标记获得了其他结果： [（“他们”、“PRP”）、（“破产”、“VBP”）、（“脆弱”、“JJ”）、（“垃圾”、“NN”）] 无论如何，如

我正在学习使用Python的nltk。我试着在不同的句子上做pos_标记。但所得结果并不准确。我如何即兴创作结果

broke = NN
flimsy = NN
crap = NN

我也得到了很多额外的单词被归类为NN。我怎样才能筛选出这些结果来获得更好的结果呢？

请给出上下文，您就在这里获得了这些结果。举个例子，我在上下文短语“他们打破了陈词滥调”上用pos_标记获得了其他结果：

[（“他们”、“PRP”）、（“破产”、“VBP”）、（“脆弱”、“JJ”）、（“垃圾”、“NN”）]

无论如何，如果你发现在你看来，很多单词被错误地阴极化为“NN”，你可以应用一些其他技术，特别是在那些标记为“NN”的单词上。例如，您可以获取一些适当的标记语料库，并使用trigram tagger对其进行分类。（事实上，与作者在使用bigrams时使用的方法相同）

大概是这样的：

pos_tag_results=nltk.pos_tag(your_text) #tagged sentences with pos_tag
trigram_tagger=nltk.TrigramTagger(tagged_corpora) #build trigram tagger based on your tagged_corpora
trigram_tag_results=trigram_tagger(your_text) #tagged sentences with trigram tagger
for i in range(0,len(pos_tag_results)):
    if pos_tag_results[i][1]=='NN':
        pos_tag_results[i][1]=trigram_tag_results[i][1]#for 'NN' take trigram_tagger instead

如果它能改善您的成绩，请告诉我。

请参阅

pos_tag_results=nltk.pos_tag(your_text) #tagged sentences with pos_tag
trigram_tagger=nltk.TrigramTagger(tagged_corpora) #build trigram tagger based on your tagged_corpora
trigram_tag_results=trigram_tagger(your_text) #tagged sentences with trigram tagger
for i in range(0,len(pos_tag_results)):
    if pos_tag_results[i][1]=='NN':
        pos_tag_results[i][1]=trigram_tag_results[i][1]#for 'NN' take trigram_tagger instead