Lucene有效载荷计分
我想弄清楚有效负载评分在lucene中是如何工作的。因为我不明白PayloadFunction在哪里,我想我真的不明白它是如何工作的。我试着在谷歌上搜索,但除了建议之外,找不到更多的信息。嗯,如果有人能在这里解释一下就好了,否则源代码就是:)它有三个部分。首先,您应该在分析期间生成有效负载。这可以使用Lucene有效载荷计分,lucene,payload,Lucene,Payload,我想弄清楚有效负载评分在lucene中是如何工作的。因为我不明白PayloadFunction在哪里,我想我真的不明白它是如何工作的。我试着在谷歌上搜索,但除了建议之外,找不到更多的信息。嗯,如果有人能在这里解释一下就好了,否则源代码就是:)它有三个部分。首先,您应该在分析期间生成有效负载。这可以使用PayloadAttribute完成。您只需要在分析期间将此属性添加到所需的术语中 class MyFilter extends TokenFilter { private PayloadAt
PayloadAttribute
完成。您只需要在分析期间将此属性添加到所需的术语中
class MyFilter extends TokenFilter {
private PayloadAttribute attr;
public MyFilter() {
attr = addAttribute(PayloadAttribute.class);
}
public final boolean incrementToken() throws IOException {
if (input.incrementToken()) {
Payload p = new Payload(PayloadHelper.encodeFloat(42));
attr.setPayload(p);
} else {
attr.setPayload(null);
}
}
然后在搜索过程中,您应该使用特殊的查询类PayloadTermQuery
。此类的行为类似于SpanTermQuery
,但不跟踪索引中的有效负载。使用自定义相似性
实现,您可以对文档中出现的每个有效负载进行评分
public class MySimilarity extends DefaultSimilarity {
public float scorePayload(int docID, String fieldName,
int start, int end, byte[] payload,
int offset, int length) {
if (payload != null) {
return PayloadHelper.decodeFloat(payload, offset);
} else {
return 1.0f;
}
}
}
最后,使用PayloadFunction
可以对文档的有效负载分数进行聚合,以生成最终的文档分数