规范化unicode

规范化unicode,unicode,solr,Unicode,Solr,假设我使用Apache Solr编制了文档索引,其中包含以下字符串: Klüft skräms inför 我希望能够使用这个关键字通过搜索找到它(注意“u”-“u”): 克鲁夫特 有什么方法可以做到这一点吗?对索引和查询分析器都使用。值得注意的是,还有一些流行的Solr客户端使用的。我不确定它是否比ASCIIFoldingFilterFactory有什么特别的优势,后者当然更全面。我们发现自己偶尔不得不更新位于的标准mapping-ISOLatin1Accent.txt文件,以适应使用Mapp

假设我使用Apache Solr编制了文档索引,其中包含以下字符串:

Klüft skräms inför

我希望能够使用这个关键字通过搜索找到它(注意“u”-“u”):

克鲁夫特


有什么方法可以做到这一点吗?

对索引和查询分析器都使用。

值得注意的是,还有一些流行的Solr客户端使用的。我不确定它是否比
ASCIIFoldingFilterFactory
有什么特别的优势,后者当然更全面。我们发现自己偶尔不得不更新位于的标准
mapping-ISOLatin1Accent.txt
文件,以适应使用
MappingCharFilterFactory
的客户。