Python 编写一个函数,通过考虑词性标记将句子中的所有单词进行柠檬化

Python 编写一个函数,通过考虑词性标记将句子中的所有单词进行柠檬化,python,nltk,wordnet,lemmatization,Python,Nltk,Wordnet,Lemmatization,我试图在python中使用wordnet lemmatizer,我注意到默认的pos标记是NOUN,它不会为动词输出正确的引理,除非pos标记被显式指定为verb 如何创建函数 proper_lemmatize_sentence(raw1, True) 因此,如果它的“True”,它根据它的pos标签给出引理,或者如果它的“False”,它给出pos=n的默认引理 我试过以下方法 import nltk from nltk.corpus import wordnet raw1 = 'Corpu

我试图在python中使用wordnet lemmatizer,我注意到默认的pos标记是NOUN,它不会为动词输出正确的引理,除非pos标记被显式指定为verb

如何创建函数

proper_lemmatize_sentence(raw1, True)
因此,如果它的“True”,它根据它的pos标签给出引理,或者如果它的“False”,它给出pos=n的默认引理

我试过以下方法

import nltk
from nltk.corpus import wordnet
raw1 = 'Corpus linguistics proposes that reliable language analysis is more feasible with corpora collected in the field, in their natural contexts, and with minimal experimental-interference.'
tokens = nltk.word_tokenize(raw1)
wnl = nltk.WordNetLemmatizer()
lemmatized_tokens = [wnl.lemmatize(tk) for tk in tokens]
print(lemmatized_tokens)

我不明白;听起来wordnet lemmatizer就像你想要的那样工作。或者你想把pos标签存储在某个地方吗?试试这个:从