拉丁语文本的Lucene/Solr过滤器
是否有Solr/Lucene过滤器用于分析拉丁语文本(语言,而不是脚本类型)?它们存在于许多其他语言(意大利语、捷克语等)中,但默认情况下,Solr分布中不包括拉丁语拉丁语文本的Lucene/Solr过滤器,solr,lucene,latin,Solr,Lucene,Latin,是否有Solr/Lucene过滤器用于分析拉丁语文本(语言,而不是脚本类型)?它们存在于许多其他语言(意大利语、捷克语等)中,但默认情况下,Solr分布中不包括拉丁语 这是有道理的,当然(没有人会说拉丁语了…),但我希望能找到一个。也许在我能看到的地方有一个插件列表。搜索很困难,因为所有结果都只针对拉丁语编码块。除非您需要词干分析功能,StandardAnalyzer至少应该是一个合理的起点,尽管默认的停止词集不会特别有用 如果您正在寻找词干分析器,那么也有一个LatinStemFilter。你
这是有道理的,当然(没有人会说拉丁语了…),但我希望能找到一个。也许在我能看到的地方有一个插件列表。搜索很困难,因为所有结果都只针对拉丁语编码块。除非您需要词干分析功能,
StandardAnalyzer
至少应该是一个合理的起点,尽管默认的停止词集不会特别有用
如果您正在寻找词干分析器,那么也有一个
LatinStemFilter
。你可以在。不过,目前我真的不知道它有多有效。有一个外部项目可以做到这一点