solr core中未知的土耳其字符
我有一个包含许多数据的solr核心。我意识到一些数据在我的solr core中有土耳其语字符问题。以下是此solr查询中发布的数据solr core中未知的土耳其字符,solr,Solr,我有一个包含许多数据的solr核心。我意识到一些数据在我的solr core中有土耳其语字符问题。以下是此solr查询中发布的数据 { "responseHeader":{ "status":0, "QTime":0, "params":{ "q":"ID:406768", "fl":"DocNa
{
"responseHeader":{
"status":0,
"QTime":0,
"params":{
"q":"ID:406768",
"fl":"DocName"}},
"response":{"numFound":1,"start":0,"docs":[
{
"DocName":"Motor Teslim D�k�manlar� Listesi"}]
}}
我在schema.xml中定义我的solr字段DocName
<field name="DocName" type="string" indexed="true" stored="true"/>
似乎内容没有被索引为UTF-8,或者没有显示为UTF-8?@MatsLindh如何将内容索引为UTF-8管理面板,或者如何更新索引数据?有什么建议吗?你现在怎么索引你的数据?如何将数据插入Solr?你索引的原始术语是什么?你检查过你插入的数据是否正确吗?当向Solr发送具有相同id的文档时,文档将被更新;旧的会被新的覆盖。@MatsLindh首先我用simpleposttool索引数据,但现在我使用Solr的管理面板,以XML的形式插入数据。我的数据是正确的,但在solr的管理面板中没有可以设置UTF-8的选项。在这种情况下,请尝试添加
-Dfile.encoding=UTF8
,将UTF8
替换为文件中使用的实际编码。您可以尝试iso-8859-9
,这是用于土耳其字符的“旧”字符集。另一个选项是Windows-1254
/cp1254
,它是土耳其语常用的窗口字符集。
java -Dtype=text/csv -Durl=http://localhost:8983/solr/archiveCore/update -jar post.jar TableArchive.csv