Elasticsearch:惩罚具有相似邻域的文档以取消聚类
我有一个Elasticsearch实例,其中充满了工作列表,当用户搜索时,它的目标是返回相关结果。然而,我们有很多份工作的副本,但在不同的位置,因为这些都与搜索非常相关,它们出现在列表的顶部,结果杂乱无章 以下是一个例子:Elasticsearch:惩罚具有相似邻域的文档以取消聚类,search,
elasticsearch,Search,
elasticsearch,我有一个Elasticsearch实例,其中充满了工作列表,当用户搜索时,它的目标是返回相关结果。然而,我们有很多份工作的副本,但在不同的位置,因为这些都与搜索非常相关,它们出现在列表的顶部,结果杂乱无章 以下是一个例子: Search: facebook Results: - Facebook Engineering Internship Atlanta, Georgia - Facebook Engineering Internship Madison, Wisconsin
Search: facebook
Results:
- Facebook Engineering Internship
Atlanta, Georgia
- Facebook Engineering Internship
Madison, Wisconsin
- Facebook Engineering Internship
Palo Alto, California
我想在这里做的是对过于相似的结果进行去聚类,根据返回的文档对特定文档结果进行有效惩罚。这将使顶级结果具有更多的多样性,看起来更像这样:
Search: facebook
Results:
- Facebook Engineering Internship
Atlanta, Georgia
- Facebook Marketing Trainee
Palo Alto, California
- Social Media Expert: Facebook (Verizon)
Chicago, Illinois
- Facebook Engineering Internship
Madison, Wisconsin
我该怎么做?如果我以错误的方式对基于邻居的文档进行处罚,请让我知道这一点。这可能有用: