elasticsearch 在Elasticsearch中创建无重复参数的文档
我试图防止elasticsearch中出现重复条目,但基于数据中的一个参数。例如,如果我有一个如下所示的对象,我希望阻止另一个具有相同事件ID数组的条目。有什么办法吗 我正在使用ElasticSearchJavaScript API编写代码,如果它有什么不同的话
elasticsearch 在Elasticsearch中创建无重复参数的文档,
elasticsearch,
elasticsearch,我试图防止elasticsearch中出现重复条目,但基于数据中的一个参数。例如,如果我有一个如下所示的对象,我希望阻止另一个具有相同事件ID数组的条目。有什么办法吗 我正在使用ElasticSearchJavaScript API编写代码,如果它有什么不同的话 { start_date: '2015-11-19T08:46:14-05:00', end_date: '2015-11-19T08:46:38-05:00', length_seconds: 24, number_events: 5
{ start_date: '2015-11-19T08:46:14-05:00',
end_date: '2015-11-19T08:46:38-05:00',
length_seconds: 24,
number_events: 5,
event_ids: [ 5589253, 5589254, 5589255, 5589256, 5510380 ] },
您可以创建一个包含所有串联事件id的字符串,对其进行哈希运算,然后将其用作文档的id。 您还应该对重复项进行排序和删除 例如:
sha1(“5510380 | 5589253 | 5589254 | 5589255 | 5589256”)
这样,具有相同事件的文档将获得相同的
\u id
。然后,您可以检查该文档是否存在。是否有比SHA哈希使用更少计算资源的想法?任何哈希都可以,它只用于缩短字符串。例如,一个快速的是。如果列表不是很长,那么原始字符串也可以工作。