Java 弹性搜索中的频率上限和
在Elasticsearch中,我为以下形式的文档编制了索引:Java 弹性搜索中的频率上限和,java,elasticsearch,groovy,Java,elasticsearch,Groovy,在Elasticsearch中,我为以下形式的文档编制了索引: { "device_id": "abc", "views": 123, + other criteria } 我可以计算: 使用on设备id的唯一设备的计数 使用on视图的视图总数 如何计算视图的总和,以使给定设备最多只能计算n视图? 例如,如果我的文档是: {"device_id": "a", "views": 3, ...} {"device_id": "a", "views": 4, ...} {"devic
{
"device_id": "abc",
"views": 123,
+ other criteria
}
我可以计算:
- 使用on
设备id的唯一设备的计数
- 使用on
视图的视图总数
n
视图?
例如,如果我的文档是:
{"device_id": "a", "views": 3, ...}
{"device_id": "a", "views": 4, ...}
{"device_id": "a", "views": 1, ...}
{"device_id": "b", "views": 2, ...}
{"device_id": "c", "views": 6, ...}
我的n
是5
,那么结果应该是12
=(对于a
来说是5,即使对于b
+5对于c
,它的总数是8+2)
我的索引包含约500000个不同的设备
结果不需要精确,可以在合理范围内近似
我不介意使用我自己的脚本,使用多种技术组合(HLL、Count Min Sketch、Bloomfilters、Min Hash等)