SOLR根据标点符号生成短语查询

SOLR根据标点符号生成短语查询,solr,lucene,Solr,Lucene,我的SOLR 3.5实例中有以下analyzer链(尽管我们没有设置luceneMatch版本): 请注意我们是如何使用autogenerateFlaseQueries=“false”的 显然,这将防止查询解析器在查找标点符号时生成短语查询。然而,这并没有发生 查看&debugQuery的输出: <str name="querystring">title_search_pt:(looking,for peugeot)</str> <str name="parse

我的SOLR 3.5实例中有以下analyzer链(尽管我们没有设置luceneMatch版本):


请注意我们是如何使用autogenerateFlaseQueries=“false”的
显然,这将防止查询解析器在查找标点符号时生成短语查询。然而,这并没有发生

查看&debugQuery的输出:

<str name="querystring">title_search_pt:(looking,for peugeot)</str>
<str name="parsedquery">+PhraseQuery(title_search_pt:"looking for") +title_search_pt:peugeot</str>
title\u search\u pt:(查找,用于标致)
+短语查询(标题搜索部分:“查找”)+标题搜索部分:标致
正如您所看到的,逗号虽然被正确地标记,但现在作为短语查询结束。很多人复制粘贴文本进行搜索(使用标点符号),在我的逻辑中,标点符号不应该表示“用它进行短语查询”

如何禁用/防止这种情况发生?

StandardTokenizer完全理解点和逗号,并且只在必要时分割(保留主机名、数字等),因此在查询SOLR之前替换客户端上的所有标点符号不是一个选项,因为我会丢失一些重要信息

谢谢

<str name="querystring">title_search_pt:(looking,for peugeot)</str>
<str name="parsedquery">+PhraseQuery(title_search_pt:"looking for") +title_search_pt:peugeot</str>