Lucene分析仪

Lucene分析仪,lucene,analyzer,Lucene,Analyzer,我曾与Lucene合作编制文档索引并提供其中的搜索,然而,我的工作是用英语,但现在,我有一个项目是库尔德语,库尔德语使用一些阿拉伯文unicode字符和其他几个字符,下面是 我的问题是如何为这种语言创建Analyzer,或者我可以为此使用阿拉伯语Analyzer吗?Lucene有一个分析器,包括阿拉伯语。恐怕没有人专门针对库尔德人,但也许您可以扩展阿拉伯语分析器以满足您的需要 请记住,所有这些分析器都来自主要的Lucene发行版。要回答您关于如何为新语言创建自定义分析器的问题,“《Lucene

我曾与Lucene合作编制文档索引并提供其中的搜索,然而,我的工作是用英语,但现在,我有一个项目是库尔德语,库尔德语使用一些阿拉伯文unicode字符和其他几个字符,下面是

我的问题是如何为这种语言创建Analyzer,或者我可以为此使用阿拉伯语Analyzer吗?

Lucene有一个分析器,包括阿拉伯语。恐怕没有人专门针对库尔德人,但也许您可以扩展阿拉伯语分析器以满足您的需要


请记住,所有这些分析器都来自主要的Lucene发行版。

要回答您关于如何为新语言创建自定义分析器的问题,“《Lucene in Action》一书介绍了自定义分析器的创建,内容非常详细。您可以“利用”在其他分析器中找到的大量代码,只需更改所需内容。Lucene是开源的,非常可扩展,因此分析这些更改非常容易。

我已经为此定制了一个PersianAnalyzer,提供了新的stopwords列表和更改规范化类,但是,词干分析是另一个问题。有什么建议吗?我已经定制了一个波斯语分析器,通过提供新的停止词列表和更改规范化类,它与库尔德语比阿拉伯语更相关,但是词干分析是另一个问题。有什么建议吗?