Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/357.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
我想要一个Java阿拉伯语词干分析器_Java_Arabic_Stemming_Porter Stemmer - Fatal编程技术网

我想要一个Java阿拉伯语词干分析器

我想要一个Java阿拉伯语词干分析器,java,arabic,stemming,porter-stemmer,Java,Arabic,Stemming,Porter Stemmer,我在找一个阿拉伯语的Java词干分析器。 我发现了一个名为“AraMorph”的lib,但它的输出是无法控制的,它会生成不需要的单词 还有其他阿拉伯语词干分析器吗?您可以在这里找到Kohja词干分析器: 直接下载: 挖掘之后,我发现最好的解决方案是使用波特算法实现我自己的词干分析器,这样我就可以调整我的词干分析器了 试试这个,它是基于Shereen Khoja算法的 您可以使用Elkhoja词干分析器或Lucene的这是一个新的阿拉伯语词干分析器:使用Snowball框架编码,并生成多种语言,

我在找一个阿拉伯语的Java词干分析器。 我发现了一个名为“AraMorph”的lib,但它的输出是无法控制的,它会生成不需要的单词


还有其他阿拉伯语词干分析器吗?

您可以在这里找到Kohja词干分析器:

直接下载:


挖掘之后,我发现最好的解决方案是使用波特算法实现我自己的词干分析器,这样我就可以调整我的词干分析器了


试试这个,它是基于Shereen Khoja算法的

您可以使用Elkhoja词干分析器或Lucene的

这是一个新的阿拉伯语词干分析器:使用Snowball框架编码,并生成多种语言,包括Java。您可以通过下载libstemmer for Java来使用它

谢谢你的回答,@paradigmatic。我问了我的问题,因为我不知道词干是什么。根据你的回答,我读了一点。我想要API或Lib,这样我就可以在我的项目中使用了。谢谢:)@Kareem:这是一个API或Lib。。。检查我发布的第二个链接。尽管代码在GPL许可下。对于词干库来说,这是非常严格的。不能用于商业产品。我甚至不能将其包装在令牌过滤器中并将其提交给Lucene,因为Apache许可证和GPL不兼容。它可以用于基于web的商业产品,例如SaaS,这样就不涉及可再发行文件,所以GPL对此没有问题!什么?这行不通!阿拉伯语是用非拉丁字母输入的,更重要的是,它采用的算法方法与其他拉丁语言截然不同。。。。但我很想知道它是否对你有用?