elasticsearch BM25是否使用查询协调器?,elasticsearch,solr,lucene,information-retrieval,tf-idf,elasticsearch,Solr,Lucene,Information Retrieval,Tf Idf" /> elasticsearch BM25是否使用查询协调器?,elasticsearch,solr,lucene,information-retrieval,tf-idf,elasticsearch,Solr,Lucene,Information Retrieval,Tf Idf" />

elasticsearch BM25是否使用查询协调器?

elasticsearch BM25是否使用查询协调器?,elasticsearch,solr,lucene,information-retrieval,tf-idf,elasticsearch,Solr,Lucene,Information Retrieval,Tf Idf,在Lucene的实用评分函数中,有一个查询协调器,用于惩罚未能匹配所有查询条件的文档。Okapi BM25是否使用相同的技巧 我对此感到好奇的原因是我正在使用Elasticsearch和BM25相似性模块,有时我觉得这种算法不适合匹配更多的文档。有些情况下,一个文档大量包含一个或两个术语,比包含所有查询术语的文档更核心。是和否 不,它没有使用旧的Lucene默认相似性所描述的coord因子(注意:Lucene core现在默认也使用BM25) 是的,它确实比同一个查询词上的一堆点击更重地衡量了更

在Lucene的实用评分函数中,有一个查询协调器,用于惩罚未能匹配所有查询条件的文档。Okapi BM25是否使用相同的技巧

我对此感到好奇的原因是我正在使用Elasticsearch和BM25相似性模块,有时我觉得这种算法不适合匹配更多的文档。有些情况下,一个文档大量包含一个或两个术语,比包含所有查询术语的文档更核心。

是和否

不,它没有使用旧的Lucene默认相似性所描述的coord因子(注意:Lucene core现在默认也使用BM25)

是的,它确实比同一个查询词上的一堆点击更重地衡量了更多查询词上的点击。它通过更好的术语饱和来实现这一点,使得旧的协调因子实际上已经过时


然而,使用这两种算法,在较少术语上的多次点击总是可能超过在较多术语上的少量点击。

您是否测试了
\u explain
参数来解释该行为?请给出一些此类文档的示例,并附上适当的解释信息。