Java 如何突出显示Lucene-boost中的布尔模糊查询必须是正浮点？_Java_Lucene_Highlight_Fuzzy Search_Booleanquery

Java 如何突出显示Lucene-boost中的布尔模糊查询必须是正浮点？

java lucene

Java 如何突出显示Lucene-boost中的布尔模糊查询必须是正浮点？,java,lucene,highlight,fuzzy-search,booleanquery,Java,Lucene,Highlight,Fuzzy Search,Booleanquery,我正试图对那些有很多打字错误的用户（比如我自己）友好一些我尝试为一些数据创建一个简单的搜索页面。我在BooleanQuery中构建FuzzyQuerys，因为我希望用户输入错误，例如： BooleanQuery.Builder builder = new BooleanQuery.Builder(); builder.add(new FuzzyQuery(new Term("body", "pzza")), BooleanClause.Occur.SHOULD); b

我正试图对那些有很多打字错误的用户（比如我自己）友好一些

我尝试为一些数据创建一个简单的搜索页面。我在

BooleanQuery

中构建

FuzzyQuery

s，因为我希望用户输入错误，例如：

    BooleanQuery.Builder builder = new BooleanQuery.Builder();

    builder.add(new FuzzyQuery(new Term("body", "pzza")), BooleanClause.Occur.SHOULD);
    builder.add(new FuzzyQuery(new Term("body", "tcyoon")), BooleanClause.Occur.SHOULD);

    BooleanQuery query = builder.build();

搜索按预期工作，但我从Lucene 8.5 API文档中获取的用于构建突出显示的代码失败：

    SimpleHTMLFormatter htmlFormatter = new SimpleHTMLFormatter();
    Highlighter highlighter = new Highlighter(htmlFormatter, new QueryScorer(query));
    for (int i = 0; i < hits.length; i++) {
        int id = hits[i].doc;
        Document doc = searcher.doc(id);
        System.out.println("HIT:" +  doc.get("url"));
        String text = doc.get("body");
        TokenStream tokenStream = TokenSources.getAnyTokenStream(searcher.getIndexReader(), id, "body", analyzer);
        TextFragment[] frag = highlighter.getBestTextFragments(tokenStream, text, false, 10);//highlighter.getBestFragments(tokenStream, text, 3, "...");
        for (int j = 0; j < frag.length; j++) {
            if ((frag[j] != null) && (frag[j].getScore() > 0)) {
                System.out.println((frag[j].toString()));
            }
        }
    }

SimpleHTMLFormatter htmlFormatter=新的SimpleHTMLFormatter（）；
Highlighter Highlighter=新的Highlighter（htmlFormatter，新的QueryScorer（query））；
for（int i=0；i0））{
System.out.println（（frag[j].toString（））；
}
}
}

有误：

java.lang.IllegalArgumentException: boost must be a positive float, got -1.0
    at org.apache.lucene.search.BoostQuery.<init>(BoostQuery.java:44)
    at org.apache.lucene.search.ScoringRewrite$1.addClause(ScoringRewrite.java:69)
    at org.apache.lucene.search.ScoringRewrite$1.addClause(ScoringRewrite.java:54)
    at org.apache.lucene.search.ScoringRewrite.rewrite(ScoringRewrite.java:117)
    at org.apache.lucene.search.highlight.WeightedSpanTermExtractor.extract(WeightedSpanTermExtractor.java:246)
    at org.apache.lucene.search.highlight.WeightedSpanTermExtractor.extract(WeightedSpanTermExtractor.java:135)
    at org.apache.lucene.search.highlight.WeightedSpanTermExtractor.getWeightedSpanTerms(WeightedSpanTermExtractor.java:530)
    at org.apache.lucene.search.highlight.QueryScorer.initExtractor(QueryScorer.java:218)
    at org.apache.lucene.search.highlight.QueryScorer.init(QueryScorer.java:186)
    at org.apache.lucene.search.highlight.Highlighter.getBestTextFragments(Highlighter.java:201)

java.lang.IllegalArgumentException:boost必须是正浮点，got-1.0
位于org.apache.lucene.search.BoostQuery（BoostQuery.java:44）
位于org.apache.lucene.search.ScoringRewrite$1.addClause（ScoringRewrite.java:69）
位于org.apache.lucene.search.ScoringRewrite$1.addClause（ScoringRewrite.java:54）
位于org.apache.lucene.search.ScoringRewrite.rewrite（ScoringRewrite.java:117）
位于org.apache.lucene.search.highlight.weightedSpanterExtractor.extract（weightedSpanterExtractor.java:246）
在org.apache.lucene.search.highlight.weightedspantermrextractor.extract（weightedspantermrextractor.java:135）上
在org.apache.lucene.search.highlight.weightedspantermrextractor.getWeightedSpanTerms（weightedspantermrextractor.java:530）上
位于org.apache.lucene.search.highlight.QueryScorer.initExtractor（QueryScorer.java:218）
位于org.apache.lucene.search.highlight.QueryScorer.init（QueryScorer.java:186）
位于org.apache.lucene.search.highlight.Highlighter.getBestTextFragments（Highlighter.java:201）

代码使用了一个不推荐使用的方法，但我直接从文档中获取了它

有人能解释我为什么会犯这个错误吗？如何创建与此查询构造一起工作的高亮显示？或者我需要不同的

查询

以下突出显示方法使用Lucene v8.5.0和问题的模糊布尔示例

在我的精简演示中，结果如下所示（当然，您可以优化高亮显示片段的显示方式）：

突出显示代码如下所示：

import java.io.IOException;
import org.apache.lucene.document.Document;
import org.apache.lucene.analysis.TokenStream;
import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.highlight.SimpleHTMLFormatter;
import org.apache.lucene.search.highlight.Highlighter;
import org.apache.lucene.search.highlight.QueryScorer;
import org.apache.lucene.search.highlight.TokenSources;
import org.apache.lucene.search.highlight.TextFragment;
import org.apache.lucene.search.highlight.InvalidTokenOffsetsException;

public class CustomHighlighter {

    private static final String PRE_TAG = "<span class=\"hilite\">";
    private static final String POST_TAG = "</span>";

    public static String[] highlight(Query query, IndexSearcher searcher,
            Analyzer analyzer, ScoreDoc hit, String fieldName)
            throws IOException, InvalidTokenOffsetsException {
        SimpleHTMLFormatter htmlFormatter = new SimpleHTMLFormatter(PRE_TAG, POST_TAG);
        Highlighter highlighter = new Highlighter(htmlFormatter, new QueryScorer(query));
        int id = hit.doc;
        Document doc = searcher.doc(id);

        String text = doc.get(fieldName);

        TokenStream tokenStream = TokenSources.getTokenStream(fieldName,
                searcher.getIndexReader().getTermVectors(id), text, analyzer, -1);
        int maxNumFragments = 10;

        boolean mergeContiguousFragments = Boolean.TRUE;
        TextFragment[] frags = highlighter.getBestTextFragments(tokenStream,
                text, mergeContiguousFragments, maxNumFragments);

        String[] highlightedText = new String[frags.length];
        for (int i = 0; i < frags.length; i++) {
            highlightedText[i] = frags[i].toString();
        }
        // control how you handle each fragment for display...
        //for (TextFragment frag : frags) {
        //    if ((frag != null) && (frag.getScore() > 0)) {
        //        highlightedText = frag.toString();
        //    }
        //}
        return highlightedText;
    }

}

模糊查询是这样的：

private static Query useFuzzyBooleanQuery() {
    BooleanQuery.Builder builder = new BooleanQuery.Builder();
    builder.add(new FuzzyQuery(new Term("contents", "pzza")), BooleanClause.Occur.SHOULD);
    builder.add(new FuzzyQuery(new Term("contents", "tcyoon")), BooleanClause.Occur.SHOULD);
    return builder.build();
}

上面的代码没有给我任何弃用警告

我无法解释为什么会出现那个特定的“boost”错误——我自己没有看到过，我也无法重现它。但我承认，我并没有太努力

private static Query useFuzzyBooleanQuery() {
    BooleanQuery.Builder builder = new BooleanQuery.Builder();
    builder.add(new FuzzyQuery(new Term("contents", "pzza")), BooleanClause.Occur.SHOULD);
    builder.add(new FuzzyQuery(new Term("contents", "tcyoon")), BooleanClause.Occur.SHOULD);
    return builder.build();
}