Search Lucene评分结果

Search Lucene评分结果,search,lucene,Search,Lucene,在Lucene中,如果有多个索引,每个索引只覆盖一个分区。为什么对不同索引进行相同的搜索会返回不同分数的结果?来自不同服务器的结果完全匹配 i、 e.如果我搜索: 姓名-约翰·史密斯 日期:1934年11月11日 分区0将返回0.345的分数 分区1将返回0.337分 两者在名称和DOB上完全匹配。包含反向文档频率(IDF)。如果术语“John Smith”在一个分区中,则为0,100次,在分区1中为一次。搜索John Smith的分数会更高,因为在分区1中搜索的术语更稀少 要解决这个问题,

在Lucene中,如果有多个索引,每个索引只覆盖一个分区。为什么对不同索引进行相同的搜索会返回不同分数的结果?来自不同服务器的结果完全匹配

i、 e.如果我搜索:

  • 姓名-约翰·史密斯
  • 日期:1934年11月11日
分区0将返回0.345的分数

分区1将返回0.337分

两者在名称和DOB上完全匹配。

包含反向文档频率(IDF)。如果术语“John Smith”在一个分区中,则为0,100次,在分区1中为一次。搜索John Smith的分数会更高,因为在分区1中搜索的术语更稀少


要解决这个问题,您必须让索引覆盖所有分区,否则您需要覆盖IDF。

因为如果我没有完全弄错的话,分数是在索引上确定的

如果您有不同的索引(更多/更少或不同的索引数据),分数将不同:


(警告:包含数学:-)

您可能还对的输出及其结果感兴趣,这将让您了解事物的评分方式。

或者您可以从所有索引构建多搜索器。