如何使用python CouchDB和map reduce从CouchDB中删除重复文档？_Couchdb

如何使用python CouchDB和map reduce从CouchDB中删除重复文档？

couchdb

如何使用python CouchDB和map reduce从CouchDB中删除重复文档？,couchdb,Couchdb,我正在用python编程来处理couchDB中存储的数据，但是数据库中的数据有一些重复。例如，数据库中的两个文档代表tweet： { "_id": "0245d6a270ff7f2c9459544185adfc50", "_rev": "1-4a6ccb26cfde2da4b70188ba05d29c46", "twitter_id": "0d8e7f60615584747d869770b0033e55", "coordinates": null, "text": "Jim

我正在用python编程来处理couchDB中存储的数据，但是数据库中的数据有一些重复。例如，数据库中的两个文档代表tweet：

{
  "_id": "0245d6a270ff7f2c9459544185adfc50",
  "_rev": "1-4a6ccb26cfde2da4b70188ba05d29c46",
  "twitter_id": "0d8e7f60615584747d869770b0033e55",
  "coordinates": null,
  "text": "Jimins playlist is sexy af"
}


{
  "_id": "0245d6a270ff7f2c9459544185ae03e5",
  "_rev": "1-4a6ccb26cfde2da4b70188ba05d29c46",
  "twitter_id": "0d8e7f60615584747d869770b0033e55",
  "coordinates": null,
  "text": "Jimins playlist is sexy af"
}

这些文档表示相同的tweet，但是数据库中有数千个文档。我可以使用map reduce删除相同的推文吗

我使用python作为编程语言。

是否要删除重复的文档？map/reduce无法做到这一点——它不会修改您的数据。还是在执行查询时只想忽略重复的文档？map/reduce可以做到这一点。@Flimzy您能给我举一个如何忽略它的例子吗，谢谢。您最好的选择可能是首先不要创建重复的文档。考虑使用Twitter ID作为DOC ID的一部分，使之变得简单。