Stemming 词干生成算法

Stemming 词干生成算法,stemming,porter-stemmer,Stemming,Porter Stemmer,我有一个关于波特·斯泰默算法的问题,我在互联网上研究过 但我找不到表达不足和表达过度之间的区别 波特算法是不足还是过度 你有什么想法吗 提前感谢当截止后缀太长时,会出现过度修饰,这会导致不相关单词的虚假匹配 欠temming是相反的,例如,不切断任何固有欠tem的词干分析器 我怀疑波特·斯泰默(Porter Stemmer)会时不时地为英语犯这两种错误。请注意,其他语言的实现可能表现得非常不同(谈到Snowball,它为一组语言提供了用户提供的算法)。他们甚至可能在词干的语言学定义上有所不同。谢

我有一个关于波特·斯泰默算法的问题,我在互联网上研究过

但我找不到表达不足和表达过度之间的区别

波特算法是不足还是过度

你有什么想法吗


提前感谢

当截止后缀太长时,会出现过度修饰,这会导致不相关单词的虚假匹配

欠temming是相反的,例如,不切断任何固有欠tem的词干分析器


我怀疑波特·斯泰默(Porter Stemmer)会时不时地为英语犯这两种错误。请注意,其他语言的实现可能表现得非常不同(谈到Snowball,它为一组语言提供了用户提供的算法)。他们甚至可能在词干的语言学定义上有所不同。

谢谢,这非常有帮助