如何避免分组SOLR搜索中的重复结果

如何避免分组SOLR搜索中的重复结果,solr,duplicate-removal,Solr,Duplicate Removal,我有一个问题 group.field=USER_TYPE&group.limit=3&group.format=grouped 因此,这是基于用户类型的完美分组。但是,组内的结果包含重复项。也就是说,每个用户都有一个唯一的用户标识和用户组。每个用户可以有多个用户组。因此,结果包含具有不同用户组和相同用户id的重复用户。我希望分组结果不应包含重复的用户id值 {"groupValue":"A","doclist":{"numFound":849956,"start":0,"max

我有一个问题

group.field=USER_TYPE&group.limit=3&group.format=grouped
因此,这是基于用户类型的完美分组。但是,组内的结果包含重复项。也就是说,每个用户都有一个唯一的用户标识和用户组。每个用户可以有多个用户组。因此,结果包含具有不同用户组和相同用户id的重复用户。我希望分组结果不应包含重复的用户id值

{"groupValue":"A","doclist":{"numFound":849956,"start":0,"maxScore":9.992027,\
    "docs":[
        {"user_group":"GPA","user_id":"4443510",.....},
        {"user_group":"GPB","user_id":"4443510",.....},
        {"user_group":"GPC","user_id":"4443510",.....},
        ....
        ]
在这种情况下,请任何人帮助避免重复

编辑: 我期待着结果会是

{"groupValue":"A","doclist":{"numFound":849956,"start":0,"maxScore":9.992027,       
    "docs":[
        {"groupValue":"4443510"
            "docs":[            
                {"user_group":"GPA","user_id":"4443510",.....},
                {"user_group":"GPB","user_id":"4443510",.....},
                {"user_group":"GPC","user_id":"4443510",.....},
                ....
                ]
        ....
        ]

我认为在一个小组内进行分组是不可能的

但另一方面,我认为可以通过修改索引方式来解决这个问题

现在,每个用户id都有多个文档:

 "docs":[            
                {"user_group":"GPA","user_id":"4443510",.....},
                {"user_group":"GPB","user_id":"4443510",.....},
                {"user_group":"GPC","user_id":"4443510",.....},
                ....
                ]
您可以按如下方式对其进行修改以解决此问题:

 "docs":[            
                {"user_group":["GPA","GPB","GPC"],"user_id":"4443510",.....},
                {"user_group":["GPB"],"user_id":"4443511",.....},
                {"user_group":["GPA","GPC"],"user_id":"4443512",.....},
                ....
                ]

我的意思是,您可以将用户组修改为多值,这样每个用户只有一个文档

,我认为这是不可能的。您希望用户_id出现在其中一个组中,对吗?但是索尔怎么知道是哪一个呢。我相信这必须在客户身上完成?我更新了问题中的预期结果。我可以在SolrConfig.xml中的RequestHandler中找到什么吗?非常感谢您的回答。但是,我不能改变索引,因为其他系统也在使用它。所以影响会很大。