Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/solr/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Lucene 标准分析器,不要将一个字符视为标点符号_Lucene_Solr - Fatal编程技术网

Lucene 标准分析器,不要将一个字符视为标点符号

Lucene 标准分析器,不要将一个字符视为标点符号,lucene,solr,Lucene,Solr,我正在为一些数据编制索引,其中“@”字符应按原样处理。 我还需要标准分析器提供的所有功能(消除标点符号、尾随s等),但这也会删除@。 是否有任何地方可以指定将字符视为非标点符号?或者任何可以与whitespaceTokenizer一起使用以获得此类结果的过滤器? 我知道我应该为这样的需求编写自己的分析器,但我不想错过一些非常明显的东西 谢谢, 卡卡找到了帖子。感谢作者。将PatternTokenizerFactory与适当的过滤器一起使用。我认为,解决办法是编写自己的分析工具。标准分析仪是内置的

我正在为一些数据编制索引,其中“@”字符应按原样处理。 我还需要标准分析器提供的所有功能(消除标点符号、尾随s等),但这也会删除@。 是否有任何地方可以指定将字符视为非标点符号?或者任何可以与whitespaceTokenizer一起使用以获得此类结果的过滤器? 我知道我应该为这样的需求编写自己的分析器,但我不想错过一些非常明显的东西

谢谢,
卡卡找到了帖子。感谢作者。将PatternTokenizerFactory与适当的过滤器一起使用。

我认为,解决办法是编写自己的分析工具。标准分析仪是内置的