Lucene 标准分析器,不要将一个字符视为标点符号
我正在为一些数据编制索引,其中“@”字符应按原样处理。 我还需要标准分析器提供的所有功能(消除标点符号、尾随s等),但这也会删除@。 是否有任何地方可以指定将字符视为非标点符号?或者任何可以与whitespaceTokenizer一起使用以获得此类结果的过滤器? 我知道我应该为这样的需求编写自己的分析器,但我不想错过一些非常明显的东西 谢谢,Lucene 标准分析器,不要将一个字符视为标点符号,lucene,solr,Lucene,Solr,我正在为一些数据编制索引,其中“@”字符应按原样处理。 我还需要标准分析器提供的所有功能(消除标点符号、尾随s等),但这也会删除@。 是否有任何地方可以指定将字符视为非标点符号?或者任何可以与whitespaceTokenizer一起使用以获得此类结果的过滤器? 我知道我应该为这样的需求编写自己的分析器,但我不想错过一些非常明显的东西 谢谢, 卡卡找到了帖子。感谢作者。将PatternTokenizerFactory与适当的过滤器一起使用。我认为,解决办法是编写自己的分析工具。标准分析仪是内置的
卡卡找到了帖子。感谢作者。将PatternTokenizerFactory与适当的过滤器一起使用。我认为,解决办法是编写自己的分析工具。标准分析仪是内置的