Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/314.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
为什么在使用python nltk进行柠檬化之后,“shining”变成了“shin”?_Python_Nltk_Stem - Fatal编程技术网

为什么在使用python nltk进行柠檬化之后,“shining”变成了“shin”?

为什么在使用python nltk进行柠檬化之后,“shining”变成了“shin”?,python,nltk,stem,Python,Nltk,Stem,有几个词用-ing来表示持续的,就像闪亮一样。但当我尝试使用nltk将shining柠檬化时,它会变成shin。代码如下: from nltk.stem import WordNetLemmatizer wordnet_lemmatizer = WordNetLemmatizer() word = "shining" newlemma = wordnet_lemmatizer.lemmatize(word,'v') print newlemma 即使不使用“v”,它仍然保持相同的亮度,不会

有几个词用-ing来表示持续的,就像闪亮一样。但当我尝试使用nltk将shining柠檬化时,它会变成shin。代码如下:

from nltk.stem import WordNetLemmatizer

wordnet_lemmatizer = WordNetLemmatizer()
word = "shining"

newlemma = wordnet_lemmatizer.lemmatize(word,'v')
print newlemma
即使不使用“v”,它仍然保持相同的亮度,不会改变。 我期待着输出的光芒。
有人能帮忙吗?感谢WordNet在搜索根表单时应用规则和异常列表的方式

它有一个规则列表,特别是删除词尾的规则,例如:

"ing" -> ""
"ing" -> "e"

它应用规则并查看结果单词形式是否存在于WordNet中。例如,使用挖掘,它会尝试min,但什么也找不到。然后它会尝试我的第二条规则,发现我的是有效的单词并返回它。但是使用shining,它可能会尝试shin,在有效单词列表中找到shin,并认为这是正确的词根,所以它会返回它

我不明白,你期望的输出是什么?我期望的输出是像柠檬色不是完美的。您是否发现了更多此类错误?