短语的Lucene模糊匹配
我试图使用ApacheLucene对短语“GrandPrarie”(故意拼错)进行模糊匹配。我的问题的一部分是短语的Lucene模糊匹配,lucene,solr,fuzzy-search,Lucene,Solr,Fuzzy Search,我试图使用ApacheLucene对短语“GrandPrarie”(故意拼错)进行模糊匹配。我的问题的一部分是~操作符只对单个单词进行模糊匹配,并表现为短语的近似匹配 有没有办法用lucene对短语进行模糊匹配?对模糊短语没有直接的支持,但您可以通过显式地模拟它,然后将它们添加到列表中。生成的查询如下所示: <MultiPhraseQuery: "grand (prarie prairie)"> Lucene 3.0拥有支持模糊短语查询的功能。这是contrib软件包中的内容。通过
~
操作符只对单个单词进行模糊匹配,并表现为短语的近似匹配
有没有办法用lucene对短语进行模糊匹配?对模糊短语没有直接的支持,但您可以通过显式地模拟它,然后将它们添加到列表中。生成的查询如下所示:
<MultiPhraseQuery: "grand (prarie prairie)">
Lucene 3.0拥有支持模糊短语查询的功能。这是contrib软件包中的内容。通过谷歌发现了这一点,并感觉到解决方案不是我想要的。 在我的例子中,解决方案是简单地针对SolrAPI重复搜索序列。 例如,如果我正在寻找:title\t以包含“dog~”和“cat~”的匹配项,我添加了一些手动代码以生成查询,如下所示:
((title_t:dog~) and (title_t:cat~))
这可能正是上述查询所涉及的内容,但链接似乎已经失效。您能详细说明一下吗?我不是直接使用Lucene,而是通过Solr。我很可能不得不去读《lucene的行动》。我不介意更好地理解这两者是如何协同工作的,并在更基本的层面上适应它。现在,在Solr中,我正在使用Solr.拼音过滤器工厂分析器实现一些对我来说足够有效的功能。