仅当令牌长度大于X个字符时应用Solr筛选器

仅当令牌长度大于X个字符时应用Solr筛选器,solr,Solr,我是一个孤独的乞丐,被扔进了深渊:) 我正在处理一个自定义字段类型,其过滤器定义如下: <charFilter class="solr.HTMLStripCharFilterFactory"/> <tokenizer class="solr.WhitespaceTokenizerFactory"/> <filter class="solr.LowerCaseFilterFactory"/> <filter class="solr.StandardFilt

我是一个孤独的乞丐,被扔进了深渊:) 我正在处理一个自定义字段类型,其过滤器定义如下:

<charFilter class="solr.HTMLStripCharFilterFactory"/>
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.StandardFilterFactory"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true"/>
<filter class="solr.ASCIIFoldingFilterFactory"/>

之后,定义了一个阀杆过滤器

我只想在标记长度超过X个字符时应用词干分析,这在Solr中可能吗

我知道有一个
可用,但它只会删除不符合其标准的单词,而不是让它们绕过词干

有没有办法解决这个问题?
提前感谢:)

词干分析器通常会忽略标记为关键字的单词

因此,您希望在词干分析器之前向链中添加一个

要标记至少X个字符的单词,可以使用参数pattern,该参数采用Java正则表达式。因此,即使是像“{13,}”(匹配任何13个字符或更长的字符)这样的基本功能也应该可以工作