返回Lucene文档中字段的Top-k命中率

返回Lucene文档中字段的Top-k命中率,lucene,Lucene,我有一个Lucene索引,由文档组成,每个文档都有两个字段F1和F2。我在F1上执行搜索,并收集排名前k的文档的F2。我使用IndexSearcher接口。 在我的结果中,有很多重复的F2值,我可以要求top-k超过唯一的F2值吗?在哈希集中添加F2值,然后在重复检查(使用链接)中,在结果对象中添加字段值对…这样您的结果对象就不会有重复值 @myahya您无法避免lucene索引中的重复项…因此您必须在添加到结果对象之前过滤每个文档

我有一个Lucene索引,由文档组成,每个文档都有两个字段F1和F2。我在F1上执行搜索,并收集排名前k的文档的F2。我使用IndexSearcher接口。
在我的结果中,有很多重复的F2值,我可以要求top-k超过唯一的F2值吗?

在哈希集中添加F2值,然后在重复检查(使用链接)中,在结果对象中添加字段值对…这样您的结果对象就不会有重复值


@myahya您无法避免lucene索引中的重复项…因此您必须在添加到结果对象之前过滤每个文档