Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/search/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Elasticsearch:惩罚具有相似邻域的文档以取消聚类_Search_<img Src="//i.stack.imgur.com/RUiNP.png" Height="16" Width="18" Alt="" Class="sponsor Tag Img">elasticsearch - Fatal编程技术网 elasticsearch,Search,elasticsearch" /> elasticsearch,Search,elasticsearch" />

Elasticsearch:惩罚具有相似邻域的文档以取消聚类

Elasticsearch:惩罚具有相似邻域的文档以取消聚类,search,elasticsearch,Search,elasticsearch,我有一个Elasticsearch实例,其中充满了工作列表,当用户搜索时,它的目标是返回相关结果。然而,我们有很多份工作的副本,但在不同的位置,因为这些都与搜索非常相关,它们出现在列表的顶部,结果杂乱无章 以下是一个例子: Search: facebook Results: - Facebook Engineering Internship Atlanta, Georgia - Facebook Engineering Internship Madison, Wisconsin

我有一个Elasticsearch实例,其中充满了工作列表,当用户搜索时,它的目标是返回相关结果。然而,我们有很多份工作的副本,但在不同的位置,因为这些都与搜索非常相关,它们出现在列表的顶部,结果杂乱无章

以下是一个例子:

Search: facebook

Results:
 - Facebook Engineering Internship
   Atlanta, Georgia
 - Facebook Engineering Internship
   Madison, Wisconsin
 - Facebook Engineering Internship
   Palo Alto, California
我想在这里做的是对过于相似的结果进行去聚类,根据返回的文档对特定文档结果进行有效惩罚。这将使顶级结果具有更多的多样性,看起来更像这样:

Search: facebook

Results:
 - Facebook Engineering Internship
   Atlanta, Georgia
 - Facebook Marketing Trainee
   Palo Alto, California
 - Social Media Expert: Facebook (Verizon)
   Chicago, Illinois
 - Facebook Engineering Internship
   Madison, Wisconsin
我该怎么做?如果我以错误的方式对基于邻居的文档进行处罚,请让我知道这一点。

这可能有用: