如何在ElasticSearch上检查重复数据?
在存储某些文档时,它应该存储不存在的文档,而忽略其余的文档(是否应该在应用程序级别执行此操作,或者检查文档的id是否已经存在,等等?)以下是文档中说明的内容: 操作类型 索引操作还接受一个op_类型,该类型可用于强制创建操作,允许“不存在时放置”行为。使用create时,如果索引中已存在具有该id的文档,则索引操作将失败 以下是使用op_类型参数的示例:如何在ElasticSearch上检查重复数据?,search,elasticsearch,deduplication,Search,elasticsearch,Deduplication,在存储某些文档时,它应该存储不存在的文档,而忽略其余的文档(是否应该在应用程序级别执行此操作,或者检查文档的id是否已经存在,等等?)以下是文档中说明的内容: 操作类型 索引操作还接受一个op_类型,该类型可用于强制创建操作,允许“不存在时放置”行为。使用create时,如果索引中已存在具有该id的文档,则索引操作将失败 以下是使用op_类型参数的示例: $ curl -XPUT 'http://localhost:9200/twitter/tweet/1?op_type=create' -d
$ curl -XPUT 'http://localhost:9200/twitter/tweet/1?op_type=create' -d '{
"user" : "kimchy",
"post_date" : "2009-11-15T14:12:12",
"message" : "trying out Elastic Search"
}'
指定创建的另一个选项是使用以下uri:
$ curl -XPUT 'http://localhost:9200/twitter/tweet/1/_create' -d '{
"user" : "kimchy",
"post_date" : "2009-11-15T14:12:12",
"message" : "trying out Elastic Search"
}'