Solr ShingleFilter\n-GramTokenizer的优点?

Solr ShingleFilter\n-GramTokenizer的优点?,solr,lucene,Solr,Lucene,我一直在使用标准分析器在Lucene中进行索引和搜索。我最近遇到了带状疱疹(2个单词的带状疱疹\bigrams),到目前为止,我在研究中发现的唯一优势是短语搜索会更快。 不利的一面是,我的指数增加了。 我不太确定我的应用程序使用木瓦的真正优势\功能是什么。 如果我使用Shingles/NGramTokenizer对文档进行标记,这将如何影响我的其他现有搜索(Stem\Fuzzy等搜索) 有人能解释一下这个主题吗?它不会影响您的其他搜索,但是与使用标准Analyzer的索引相比,索引的大小将非常大

我一直在使用标准分析器在Lucene中进行索引和搜索。我最近遇到了带状疱疹(2个单词的带状疱疹\bigrams),到目前为止,我在研究中发现的唯一优势是短语搜索会更快。 不利的一面是,我的指数增加了。 我不太确定我的应用程序使用木瓦的真正优势\功能是什么。 如果我使用Shingles/NGramTokenizer对文档进行标记,这将如何影响我的其他现有搜索(Stem\Fuzzy等搜索)


有人能解释一下这个主题吗?

它不会影响您的其他搜索,但是与使用标准Analyzer的索引相比,索引的大小将非常大