Php Zend Lucene没有';t索引特殊字符(尽管使用了不区分大小写的通用字符)

Php Zend Lucene没有';t索引特殊字符(尽管使用了不区分大小写的通用字符),php,zend-framework,lucene,Php,Zend Framework,Lucene,虽然我使用了一个UTF8分析仪,但Lucene并不能很好地处理特殊字符(如ë,这是荷兰语中的常见字符)。 在安装了本地Xampp的Windows上进行测试时,我了解到ë由lucene存储为ë 在我的live站点(linux服务器)上,情况更糟:Lucene在遇到像ë这样的字符时会完全停止索引字符串 我只是不明白我做错了什么。 希望有人能提供一些信息…为了让Zend Lucene正确地编码荷兰语,需要将语言环境设置为荷兰语: setlocale(LC_CTYPE, 'nl_NL.utf8')

虽然我使用了一个UTF8分析仪,但Lucene并不能很好地处理特殊字符(如ë,这是荷兰语中的常见字符)。 在安装了本地Xampp的Windows上进行测试时,我了解到ë由lucene存储为ë

在我的live站点(linux服务器)上,情况更糟:Lucene在遇到像ë这样的字符时会完全停止索引字符串

我只是不明白我做错了什么。
希望有人能提供一些信息…

为了让Zend Lucene正确地编码荷兰语,需要将语言环境设置为荷兰语:

setlocale(LC_CTYPE, 'nl_NL.utf8')

我已经这样做了,但事实证明,我的网站所在的服务器上没有安装此区域设置


您可以通过检查
setlocale(LC\u CTYPE,'nl\u nl.utf8')
的返回值来检查这一点。如果返回false,则不安装区域设置。

其他示例存储为,使用或不使用html_entity_decode()
setlocale(LC_ALL, 'nl_NL.utf8')