使用Solr时如何限制搜索结果中来自同一域的页面数

使用Solr时如何限制搜索结果中来自同一域的页面数,solr,lucene,Solr,Lucene,我已将我的爬网数据索引到solr中。当我搜索一些单词时,例如“工程师”。在前十名结果中,有一半来自同一领域。我想知道是否有办法限制搜索结果中来自同一个域的页面数量。e、 g.如果来自雅虎的页面已经提前显示,是否有办法降低来自雅虎的其他页面的排名?您可以使用分组或折叠和展开来限制每个组(即域)返回的文档数量。在现实中,你会想考虑你实际上想要实现的——如果搜索结果之间的相关性的差异对于这样的查询来说非常低,那么添加一个小的随机拆分器来获得更多不同的搜索结果。危险在于你会开始隐藏高度相关的搜索点击,仅

我已将我的爬网数据索引到solr中。当我搜索一些单词时,例如“工程师”。在前十名结果中,有一半来自同一领域。我想知道是否有办法限制搜索结果中来自同一个域的页面数量。e、 g.如果来自雅虎的页面已经提前显示,是否有办法降低来自雅虎的其他页面的排名?

您可以使用分组或折叠和展开来限制每个组(即域)返回的文档数量。在现实中,你会想考虑你实际上想要实现的——如果搜索结果之间的相关性的差异对于这样的查询来说非常低,那么添加一个小的随机拆分器来获得更多不同的搜索结果。危险在于你会开始隐藏高度相关的搜索点击,仅仅因为它们来自已经显示的域。非常感谢。这真的很有帮助!