Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/solr/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
包含在结果中的最小Solr分数?_Solr - Fatal编程技术网

包含在结果中的最小Solr分数?

包含在结果中的最小Solr分数?,solr,Solr,我使用所有默认的Solr(7.5)设置创建了一组医学术语。文档来自CSV文件,我使用默认设置的bin/post 当我提交一个愚蠢的查询时,我可能无法获得我请求的行数 http://host/solr/collection/select?fl=anyLabel,score&q=anyLabel:(宇航员%20%20football%20felafel)&rows=9999&wt=csv 有评分标准吗?在这种情况下,最低分数为~8分。我还运行过其他一些不那么愚蠢的查询,这些查询返回的结果合理到2分或

我使用所有默认的Solr(7.5)设置创建了一组医学术语。文档来自CSV文件,我使用默认设置的
bin/post

当我提交一个愚蠢的查询时,我可能无法获得我请求的行数

http://host/solr/collection/select?fl=anyLabel,score&q=anyLabel:(宇航员%20%20football%20felafel)&rows=9999&wt=csv

有评分标准吗?在这种情况下,最低分数为~8分。我还运行过其他一些不那么愚蠢的查询,这些查询返回的结果合理到2分或3分

为什么该结果在得分为8的结果之后被截断?我能控制吗?

anyLabel、score
足球,16.0328
宇航员溶血性贫血,15.470738
宇航员溶血性贫血,15.470738
加拿大足球队,14.440538
美式足球,14.440538
足球场,14.440538
宇航员骨脱矿综合征,14.188901
室内足球场,13.135968
澳大利亚足球规则,13.135968
加拿大足球-体育,13.135968
美式足球-体育,13.135968
澳大利亚人统治足球,13.135968
室内足球场,13.135968
宇航员骨脱矿综合征(紊乱),13.103226
澳大利亚规则足球场,12.04758
室内足球场(环境),12.04758
室内美式足球场,12.04758
美国或加拿大足球,12.04758
美国或加拿大足球场,11.12575
在足球比赛中意外被踢,11.12575
澳大利亚规则足球场(环境),11.12575
加拿大足球-体育(资格赛价值),11.12575
美国或加拿大足球-体育,11.12575
美式足球-运动(资格赛价值),11.12575
澳大利亚规则足球(资格赛价值),11.12575
“美国或加拿大足球\,设备”,11.12575
在足球比赛中意外踩到,10.334962
美国或加拿大足球场(环境),10.334962
在足球比赛(活动)期间意外踢出,10.334962
美国或加拿大足球-体育(资格赛价值),9.649129
“美国或加拿大足球\,设备(物理对象)”,9.649129
在足球比赛(活动)期间意外踩到,9.649129
“事故或中毒发生地点”,足球场,8.518538
“事故或中毒发生地点\,足球场(环境)”,8.047099

没有最低分数-高于
0
的任何内容在某种程度上都被视为匹配项,只要
开始
参数与响应中的
numFound
值相比有意义,就将其包括在内

一般来说,请求之间的分数是不可比较的,将分数外推到“一个文档的分数只有另一个文档的一半,则只有50%是相关的”也没有意义


分数还将取决于所使用的相似性算法,这在Solr版本之间可能有所不同。对于7.5,这是一个BM25相似性。

没有最低分数-任何高于
0
的内容在某种程度上都被视为匹配,只要
开始
参数与响应中的
numFound
值相比有意义,就包括在内

一般来说,请求之间的分数是不可比较的,将分数外推到“一个文档的分数只有另一个文档的一半,则只有50%是相关的”也没有意义

分数还将取决于所使用的相似性算法,这在Solr版本之间可能有所不同。对于7.5,它与BM25相似