Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/solr/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Solr Snowball PorterFilterFactory和葡萄牙SestemFilterFactory之间的差异_Solr_Stemming - Fatal编程技术网

Solr Snowball PorterFilterFactory和葡萄牙SestemFilterFactory之间的差异

Solr Snowball PorterFilterFactory和葡萄牙SestemFilterFactory之间的差异,solr,stemming,Solr,Stemming,Solr有一个SnowballPorterFilterFactory,可以与语言参数一起使用 <filter class="solr.SnowballPorterFilterFactory" language="Portuguese" /> Solr也有一些特定于语言的词干分析器,比如葡萄牙语sestemfilterfactory。我已阅读了,但无法找出它们之间的区别。来源: 葡萄牙词干分析器实现RSLP(Removedor de Sufixos da Lingua葡萄牙语

Solr有一个SnowballPorterFilterFactory,可以与语言参数一起使用

  <filter class="solr.SnowballPorterFilterFactory" language="Portuguese" />

Solr也有一些特定于语言的词干分析器,比如葡萄牙语sestemfilterfactory。我已阅读了,但无法找出它们之间的区别。

来源:

葡萄牙词干分析器实现RSLP(Removedor de Sufixos da Lingua葡萄牙语)算法。这有时也称为Orengo词干分析器

所使用的算法是专门针对葡萄牙语的需要而定制的,并且了解不同的词类以及葡萄牙语中的词干

然而,Snowball词干分析器是一个通用的词干分析器引擎,您可以给它一个字典来处理-即,应该词干的后缀,等等。这些不允许关于如何分类和词干特定词类的相同知识


我看不出有什么理由在有葡萄牙语RSLP的情况下想要使用Snowball版本,但我没有用葡萄牙语做任何工作(不过我不得不手动更新挪威版本,以适应Snowball默认情况下无法捕捉的某些边缘情况).

我知道特定语言的词干分析器比特定语言的Snowball更好,但我找不到任何官方链接。您可以在挪威语的Solr指南()中看到该语言所遵循的一些额外步骤。我在某处读到了关于CJK过滤器的相同内容,但同样没有官方文档。