在Solr中的查询搜索期间使用group.ngroups

在Solr中的查询搜索期间使用group.ngroups,solr,Solr,我想检查一下,在搜索中使用带有group.ngroups的结果分组(其中包括匹配查询的组数)是否会影响Solr的性能?我发现在添加group.ngroups参数后,搜索速度明显减慢 我需要匹配查询的组数的值。除此之外,还有其他方法可以检索该值吗 我有1000多万个文档,索引大小超过500GB,我使用的是Solr 5.4.0 问候, Edwin是的,它会影响性能。需要对结果集执行的所有操作(例如分组)都会以某种方式影响性能。多少取决于太多的因素,无法确切说出多少(但你们已经观察到了) 您可以通过多

我想检查一下,在搜索中使用带有group.ngroups的结果分组(其中包括匹配查询的组数)是否会影响Solr的性能?我发现在添加group.ngroups参数后,搜索速度明显减慢

我需要匹配查询的组数的值。除此之外,还有其他方法可以检索该值吗

我有1000多万个文档,索引大小超过500GB,我使用的是Solr 5.4.0

问候,

Edwin是的,它会影响性能。需要对结果集执行的所有操作(例如分组)都会以某种方式影响性能。多少取决于太多的因素,无法确切说出多少(但你们已经观察到了)

您可以通过多种方式获得字段的唯一值的数量(这应该与该字段的分组和计算组的数量相同),Yonik在博客文章中显示了这一点

unique facet函数是Solr计算不同值数量的最快实现


是的,它会影响性能。需要对结果集执行的所有操作(例如分组)都会以某种方式影响性能。多少取决于太多的因素,无法确切说出多少(但你们已经观察到了)

您可以通过多种方式获得字段的唯一值的数量(这应该与该字段的分组和计算组的数量相同),Yonik在博客文章中显示了这一点

unique facet函数是Solr计算不同值数量的最快实现


谢谢你的回答。是否可以使用HTTP URL而不是curl来执行此独特的facet函数命令?@EdwinYeo当然可以-您应该能够将其包装在具有相同参数的URL中。当它作为一篇文章来写的时候,通常可读性更高,所以这就是为什么示例会使用它。谢谢@MatsLindh。是的,它是有效的,通过使用JSON方面,搜索唯一值所需的时间已从2分钟减少到不到2秒,索引中有我的1000万个文档。这应该是Solr文档中group.ngroupsThanks旁边的建议响应。是否可以使用HTTP URL而不是curl来执行此独特的facet函数命令?@EdwinYeo当然可以-您应该能够将其包装在具有相同参数的URL中。当它作为一篇文章来写的时候,通常可读性更高,所以这就是为什么示例会使用它。谢谢@MatsLindh。是的,它是有效的,通过使用JSON方面,搜索唯一值所需的时间已从2分钟减少到不到2秒,索引中有我的1000万个文档。这应该是group.ngroups旁边的Solr文档中建议的响应
$ curl http://localhost:8983/solr/techproducts/query -d '
q=*:*&
json.facet={
  x : "unique(manu_exact)"    // manu_exact is the manufacturer indexed as a single string
}'