为什么在使用python nltk进行柠檬化之后,“shining”变成了“shin”?
有几个词用-ing来表示持续的,就像闪亮一样。但当我尝试使用nltk将shining柠檬化时,它会变成shin。代码如下:为什么在使用python nltk进行柠檬化之后,“shining”变成了“shin”?,python,nltk,stem,Python,Nltk,Stem,有几个词用-ing来表示持续的,就像闪亮一样。但当我尝试使用nltk将shining柠檬化时,它会变成shin。代码如下: from nltk.stem import WordNetLemmatizer wordnet_lemmatizer = WordNetLemmatizer() word = "shining" newlemma = wordnet_lemmatizer.lemmatize(word,'v') print newlemma 即使不使用“v”,它仍然保持相同的亮度,不会
from nltk.stem import WordNetLemmatizer
wordnet_lemmatizer = WordNetLemmatizer()
word = "shining"
newlemma = wordnet_lemmatizer.lemmatize(word,'v')
print newlemma
即使不使用“v”,它仍然保持相同的亮度,不会改变。
我期待着输出的光芒。
有人能帮忙吗?感谢WordNet在搜索根表单时应用规则和异常列表的方式 它有一个规则列表,特别是删除词尾的规则,例如:
"ing" -> ""
"ing" -> "e"
它应用规则并查看结果单词形式是否存在于WordNet中。例如,使用挖掘,它会尝试min,但什么也找不到。然后它会尝试我的第二条规则,发现我的是有效的单词并返回它。但是使用shining,它可能会尝试shin,在有效单词列表中找到shin,并认为这是正确的词根,所以它会返回它 我不明白,你期望的输出是什么?我期望的输出是像柠檬色不是完美的。您是否发现了更多此类错误?