Solr中同一核心中的多种语言

Solr中同一核心中的多种语言,solr,lucene,Solr,Lucene,我正在电子商务网站上实现Solr。现在,由于电子商务站点支持多种语言,我只想知道如何在单个solr核心中管理多种语言?我对一个领域中的多种语言有兴趣。有谁能建议我如何在一个领域中对多种语言进行索引和查询?有什么例子吗 谢谢大家! 在一个字段中可以有多种语言。当然,这会“损害”您的频率向量和术语频率,但如果您使用特定于语言的过滤查询进行查询,例如fq:en,则术语频率将仅校准为该值 无论如何,我建议您对任何与语言无关的内容(id、类别、数量等)使用公共字段,但可以将描述和标题保存在自己的字段中,如

我正在电子商务网站上实现Solr。现在,由于电子商务站点支持多种语言,我只想知道如何在单个solr核心中管理多种语言?我对一个领域中的多种语言有兴趣。有谁能建议我如何在一个领域中对多种语言进行索引和查询?有什么例子吗


谢谢大家!

在一个字段中可以有多种语言。当然,这会“损害”您的频率向量和术语频率,但如果您使用特定于语言的过滤查询进行查询,例如fq:en,则术语频率将仅校准为该值

无论如何,我建议您对任何与语言无关的内容(id、类别、数量等)使用公共字段,但可以将描述和标题保存在自己的字段中,如“描述”、“标题”

对于可以定义特定语言分析器以优化搜索和索引效率的特定语言方法,请参阅


然后,要访问这些字段,您可以根据用户语言或门店所在国定义要索引/查询的字段

这个问题已经在SolrUser邮件列表中详细讨论了好几次。没有简单的解决方案,这完全取决于权衡。邮件列表在谷歌上的可视性不如它应有的那么高,但你可以

但另一种选择是,也可以单独为语言编制索引,然后使用eDiscoveryMax搜索所有变体。我(从我的书中)在GitHub上找到了。

可能的副本