Solr 索尔:numFound和docfreq有什么区别

Solr 索尔:numFound和docfreq有什么区别,solr,Solr,docfreq函数按照文档中的说明“返回字段中包含术语的文档数”,每次搜索返回的值numFound应产生与搜索匹配的文档数 但是我还没有找到两者之间的区别 例如,我有一个查询生成“response”:{“numFound”:9693,当我使用docfreq函数时,我在同一个查询中得到“docfreq”:9705,(只有一个单词) 但是为什么它们不同呢?我看到一篇帖子说它是“已删除的文档”,但根据Solr管理界面,其中有0个文档。正如@MatsLindh在评论中所建议的,一个优化对齐的numFou

docfreq
函数按照文档中的说明“返回字段中包含术语的文档数”,每次搜索返回的值
numFound
应产生与搜索匹配的文档数

但是我还没有找到两者之间的区别

例如,我有一个查询生成
“response”:{“numFound”:9693,
当我使用
docfreq
函数时,我在同一个查询中得到
“docfreq”:9705,
(只有一个单词)


但是为什么它们不同呢?我看到一篇帖子说它是“已删除的文档”,但根据Solr管理界面,其中有0个文档。

正如@MatsLindh在评论中所建议的,一个优化对齐的
numFound
docfreq
来显示相同的数字! 非常感谢@MatsLindh


因此,它们似乎确实显示了相同的数字(即与搜索/术语匹配的文档数量),但
docfreq
似乎包含已删除的文档(通过优化清除),而
numFound
则不包含此数据。

尝试发布优化-该优化应永久删除索引中的所有已删除文档(管理界面中显示的计数可能已关闭)。您还可以使用
debugQuery
显示分数计算中使用的
docFreq
。感谢@MatsLindh!优化成功了!因此,为了理解两者之间的区别,docFreq在计数时似乎包括所有已删除的文档(直到发布优化)而numFound没有。