如何使用python CouchDB和map reduce从CouchDB中删除重复文档?

如何使用python CouchDB和map reduce从CouchDB中删除重复文档?,couchdb,Couchdb,我正在用python编程来处理couchDB中存储的数据,但是数据库中的数据有一些重复。 例如,数据库中的两个文档代表tweet: { "_id": "0245d6a270ff7f2c9459544185adfc50", "_rev": "1-4a6ccb26cfde2da4b70188ba05d29c46", "twitter_id": "0d8e7f60615584747d869770b0033e55", "coordinates": null, "text": "Jim

我正在用python编程来处理couchDB中存储的数据,但是数据库中的数据有一些重复。 例如,数据库中的两个文档代表tweet:

{
  "_id": "0245d6a270ff7f2c9459544185adfc50",
  "_rev": "1-4a6ccb26cfde2da4b70188ba05d29c46",
  "twitter_id": "0d8e7f60615584747d869770b0033e55",
  "coordinates": null,
  "text": "Jimins playlist is sexy af"
}


{
  "_id": "0245d6a270ff7f2c9459544185ae03e5",
  "_rev": "1-4a6ccb26cfde2da4b70188ba05d29c46",
  "twitter_id": "0d8e7f60615584747d869770b0033e55",
  "coordinates": null,
  "text": "Jimins playlist is sexy af"
}
这些文档表示相同的tweet,但是数据库中有数千个文档。我可以使用map reduce删除相同的推文吗


我使用python作为编程语言。

是否要删除重复的文档?map/reduce无法做到这一点——它不会修改您的数据。还是在执行查询时只想忽略重复的文档?map/reduce可以做到这一点。@Flimzy您能给我举一个如何忽略它的例子吗,谢谢。您最好的选择可能是首先不要创建重复的文档。考虑使用Twitter ID作为DOC ID的一部分,使之变得简单。