如何尊重solr中的空格和换行符,或如何删除solr中的\n和\t代码
我使用的是sol 8.4版本,对于索引,我使用DHL(数据导入处理程序),因为我的数据的主要来源是postgresql。 我有一个名为desc_croquis的字段,它是一个字符串,格式已经从数据库中建立,例如:如何尊重solr中的空格和换行符,或如何删除solr中的\n和\t代码,solr,nosql,solrj,Solr,Nosql,Solrj,我使用的是sol 8.4版本,对于索引,我使用DHL(数据导入处理程序),因为我的数据的主要来源是postgresql。 我有一个名为desc_croquis的字段,它是一个字符串,格式已经从数据库中建立,例如: DESCRIPCION: A PARTIR DEL SEGUNDO ANILLO DE LA CIUDAD DE AGUASCALIENTES Y LA CARRETERA A SAN LUIS PO-
DESCRIPCION:
A PARTIR DEL SEGUNDO ANILLO DE LA CIUDAD DE AGUASCALIENTES Y LA CARRETERA A SAN LUIS PO-
TOSI RECORRER 7.4 KM PARA TOMAR LA DESVIACION A CALVILLITO, CONTINUAR 2.5 KM HASTA EL JAR-
DIN DE NINOS DE CALVILLITO, SEGUIR POR 1.2 KM SOBRE LA TERRACERIA A LA TINAJA PARA LLEGAR
A LA DESVIACION A LA IZQUIERDA QUE LLEVA AL RETONO. AVANZAR 1.1 KM HASTA UNA DESVIACION DE
BRECHA, DONDE HAY UN ALAMBRADO (AL ESTE). CONTINUAR POR 300 M PARA ENCONTRAR UNA FINCA,
SEGUIR 100 M POR BRECHA HASTA DONDE TERMINA EL ALAMBRADO. CRUZAR POR PARCELA AL ESTE UNOS
200 M HASTA DONDE COMIENZA OTRA PARCELA ALAMBRADA. TOMAR AL SUR POR 500 M JUNTO AL ALAM-
BRADO HASTA LLEGAR AL VERTICE 01001004.
LA MARCA CONSISTE EN UNA PLACA DE ALUMINIO DE 9 CM DE DIAMETRO CON LA INSCRIPCION "INEGI
01001004 22-06-93". LA PLACA SE ENCUENTRA EMPOTRADA EN UN MONUMENTO DE CONCRETO NO VISIBLE
DE 40x40x60 CM.
因为它的空格和换行符是我的系统使用它的方式,所以我需要在solr中使用它。
但情况并非如此,当json返回时,我得到以下结果:
"desc_croquis":"DESCRIPCION:\nA PARTIR DEL TERCER ANILLO (AV. SIGLO XXI) DE LA CIUDAD DE AGUASCALIENTES Y SOBRE LA CA-\nRRETERA FEDERAL No. 45 RECORRER 12.7 KM HASTA EL ENTRONQUE A SAN BARTOLO EN DIRECCION ESTE\nCONTINUAR SOBRE EL ENTRONQUE POR 1.2 KM, PASAR LA LOCALIDAD COTORINA Y A LA ALTURA DE LOS\nULTIMOS TOPES TOMAR CON RUMBO SUR POR CAMINO DE BRECHA. SEGUIR POR 800 M Y JUNTO A UNA\nCERCA DE ALAMBRE SE UBICA EL VERTICE 01001002.\nLA MARCA CONSISTE EN UNA PLACA DE ALUMINIO DE 9 CM DE DIAMETRO CON LA INSCRIPCION \"INEGI\n01001002 12/01/93\". LA MARCA SE ENCUENTRA EMPOTRADA EN MONUMENTO DE CONCRETO NO VISIBLE\nDE 40X40X60 CM.\n\n"
如图所示,每次有换行符时,它都返回“\n”,每次有空格时,它都返回“\t”
我想取消这些“\n”和“\t”
奇怪的是,当我更改输出wt=xml时,如果它尊重数据库中的空格,这里的输出是xml:
<result name="response" numFound="85126" start="0">
<doc>
<str name="descripcion">Estación Geodésica Horizontal</str>
<str name="tipo">100</str>
<int name="gid">100004</int>
<str name="desc_croquis">DESCRIPCION:
A PARTIR DEL TERCER ANILLO (AV. SIGLO XXI) DE LA CIUDAD DE AGUASCALIENTES Y SOBRE LA CA-
RRETERA FEDERAL No. 45 RECORRER 12.7 KM HASTA EL ENTRONQUE A SAN BARTOLO EN DIRECCION ESTE
CONTINUAR SOBRE EL ENTRONQUE POR 1.2 KM, PASAR LA LOCALIDAD COTORINA Y A LA ALTURA DE LOS
ULTIMOS TOPES TOMAR CON RUMBO SUR POR CAMINO DE BRECHA. SEGUIR POR 800 M Y JUNTO A UNA
CERCA DE ALAMBRE SE UBICA EL VERTICE 01001002.
LA MARCA CONSISTE EN UNA PLACA DE ALUMINIO DE 9 CM DE DIAMETRO CON LA INSCRIPCION "INEGI
01001002 12/01/93". LA MARCA SE ENCUENTRA EMPOTRADA EN MONUMENTO DE CONCRETO NO VISIBLE
DE 40X40X60 CM.
</str>
<str name="lugar">COTORINA</str>
Estación Geodésica Horizontal
100
100004
描述:
阿瓜斯卡连特斯和索布雷市的阿尼略党(第二十一届)-
第45号联邦公路,全长12.7公里,位于圣巴托洛市
1.2公里长的入口连续墙,位于科托里纳和阿尔图拉地区
最后一个问题是在布雷查河沿岸的拉姆博。SEGUIR POR 800米Y JUNTO A UNA
CERCA DE ALAMBRE SE UBICA EL VERTICE 01002。
在“INEGI”的9厘米直径的铝合金板上,有一块金属砖
01001002 12/01/93". 不可见混凝土纪念碑上的主教堂
DE 40X40X60厘米。
科托里纳
你能帮帮我吗?这就是用JSON编码的方式。当您解码应用程序中的JSON内容时,它将被解码为实际的换行符和制表符。您应该在索引时处理这些事情。