Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/390.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/python-2.7/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 弹性搜索中的频率上限和_Java_<img Src="//i.stack.imgur.com/RUiNP.png" Height="16" Width="18" Alt="" Class="sponsor Tag Img">elasticsearch_Groovy - Fatal编程技术网 elasticsearch,groovy,Java,elasticsearch,Groovy" /> elasticsearch,groovy,Java,elasticsearch,Groovy" />

Java 弹性搜索中的频率上限和

Java 弹性搜索中的频率上限和,java,elasticsearch,groovy,Java,elasticsearch,Groovy,在Elasticsearch中,我为以下形式的文档编制了索引: { "device_id": "abc", "views": 123, + other criteria } 我可以计算: 使用on设备id的唯一设备的计数 使用on视图的视图总数 如何计算视图的总和,以使给定设备最多只能计算n视图? 例如,如果我的文档是: {"device_id": "a", "views": 3, ...} {"device_id": "a", "views": 4, ...} {"devic

在Elasticsearch中,我为以下形式的文档编制了索引:

{
  "device_id": "abc",
  "views": 123,
  + other criteria
}
我可以计算:

  • 使用on
    设备id的唯一设备的计数
  • 使用on
    视图的视图总数
如何计算视图的总和,以使给定设备最多只能计算
n
视图?

例如,如果我的文档是:

{"device_id": "a", "views": 3, ...}
{"device_id": "a", "views": 4, ...}
{"device_id": "a", "views": 1, ...}
{"device_id": "b", "views": 2, ...}
{"device_id": "c", "views": 6, ...}
我的
n
5
,那么结果应该是
12
=(对于
a
来说是5,即使对于
b
+5对于
c
,它的总数是8+2)

我的索引包含约500000个不同的设备

结果不需要精确,可以在合理范围内近似

我不介意使用我自己的脚本,使用多种技术组合(HLL、Count Min Sketch、Bloomfilters、Min Hash等)