如何获得一个单词';将其柠檬化后的后缀是什么(Python)?

如何获得一个单词';将其柠檬化后的后缀是什么(Python)?,python,lemmatization,suffix,Python,Lemmatization,Suffix,我需要得到一个单词的后缀在柠檬化之后。我想知道是否有一种方法可以从一个单词中“减去”一个引理,从而得到后缀? 我尝试过re.sub,但它当然只在某些情况下有效,即在单词中找到引理的情况下(因此它不适用于“跳舞”、“女士”等)。我不知道是否有更好的方法 word = "produced" lemma = lemmatizer_.lemmatize(word, "v") suffix = re.sub(lemma, "", word) su

我需要得到一个单词的后缀在柠檬化之后。我想知道是否有一种方法可以从一个单词中“减去”一个引理,从而得到后缀? 我尝试过re.sub,但它当然只在某些情况下有效,即在单词中找到引理的情况下(因此它不适用于“跳舞”、“女士”等)。我不知道是否有更好的方法

word = "produced"
lemma = lemmatizer_.lemmatize(word, "v")
suffix = re.sub(lemma, "", word)
suffix
那么

def get_suffix(word, lemma):
    cnt = sum(w==l for w, l in zip(word, lemma))
    return word[cnt:]
print('suffix:', get_suffix('dancing', 'dance'))
print('suffix:', get_suffix('ladies',  'lady'))

>> suffix: ing
>> suffix: ies

显然,这对不规则的表单不起作用,可能还有其他一些特殊情况,但对于基本的结尾,它似乎会起作用。

不幸的是,您可能需要查看nltk.stem.porter的
源代码
问题是,我不想去掉后缀,而是要去掉引理。所有这些方法似乎都只是把这个词的后缀去掉了。