我想要一个Java阿拉伯语词干分析器
我在找一个阿拉伯语的Java词干分析器。 我发现了一个名为“AraMorph”的lib,但它的输出是无法控制的,它会生成不需要的单词我想要一个Java阿拉伯语词干分析器,java,arabic,stemming,porter-stemmer,Java,Arabic,Stemming,Porter Stemmer,我在找一个阿拉伯语的Java词干分析器。 我发现了一个名为“AraMorph”的lib,但它的输出是无法控制的,它会生成不需要的单词 还有其他阿拉伯语词干分析器吗?您可以在这里找到Kohja词干分析器: 直接下载: 挖掘之后,我发现最好的解决方案是使用波特算法实现我自己的词干分析器,这样我就可以调整我的词干分析器了 试试这个,它是基于Shereen Khoja算法的 您可以使用Elkhoja词干分析器或Lucene的这是一个新的阿拉伯语词干分析器:使用Snowball框架编码,并生成多种语言,
还有其他阿拉伯语词干分析器吗?您可以在这里找到Kohja词干分析器: 直接下载:
挖掘之后,我发现最好的解决方案是使用波特算法实现我自己的词干分析器,这样我就可以调整我的词干分析器了
试试这个,它是基于Shereen Khoja算法的 您可以使用Elkhoja词干分析器或Lucene的这是一个新的阿拉伯语词干分析器:使用Snowball框架编码,并生成多种语言,包括Java。您可以通过下载libstemmer for Java来使用它 谢谢你的回答,@paradigmatic。我问了我的问题,因为我不知道词干是什么。根据你的回答,我读了一点。我想要API或Lib,这样我就可以在我的项目中使用了。谢谢:)@Kareem:这是一个API或Lib。。。检查我发布的第二个链接。尽管代码在GPL许可下。对于词干库来说,这是非常严格的。不能用于商业产品。我甚至不能将其包装在令牌过滤器中并将其提交给Lucene,因为Apache许可证和GPL不兼容。它可以用于基于web的商业产品,例如SaaS,这样就不涉及可再发行文件,所以GPL对此没有问题!什么?这行不通!阿拉伯语是用非拉丁字母输入的,更重要的是,它采用的算法方法与其他拉丁语言截然不同。。。。但我很想知道它是否对你有用?