如何使用python CouchDB和map reduce从CouchDB中删除重复文档?
我正在用python编程来处理couchDB中存储的数据,但是数据库中的数据有一些重复。 例如,数据库中的两个文档代表tweet:如何使用python CouchDB和map reduce从CouchDB中删除重复文档?,couchdb,Couchdb,我正在用python编程来处理couchDB中存储的数据,但是数据库中的数据有一些重复。 例如,数据库中的两个文档代表tweet: { "_id": "0245d6a270ff7f2c9459544185adfc50", "_rev": "1-4a6ccb26cfde2da4b70188ba05d29c46", "twitter_id": "0d8e7f60615584747d869770b0033e55", "coordinates": null, "text": "Jim
{
"_id": "0245d6a270ff7f2c9459544185adfc50",
"_rev": "1-4a6ccb26cfde2da4b70188ba05d29c46",
"twitter_id": "0d8e7f60615584747d869770b0033e55",
"coordinates": null,
"text": "Jimins playlist is sexy af"
}
{
"_id": "0245d6a270ff7f2c9459544185ae03e5",
"_rev": "1-4a6ccb26cfde2da4b70188ba05d29c46",
"twitter_id": "0d8e7f60615584747d869770b0033e55",
"coordinates": null,
"text": "Jimins playlist is sexy af"
}
这些文档表示相同的tweet,但是数据库中有数千个文档。我可以使用map reduce删除相同的推文吗
我使用python作为编程语言。是否要删除重复的文档?map/reduce无法做到这一点——它不会修改您的数据。还是在执行查询时只想忽略重复的文档?map/reduce可以做到这一点。@Flimzy您能给我举一个如何忽略它的例子吗,谢谢。您最好的选择可能是首先不要创建重复的文档。考虑使用Twitter ID作为DOC ID的一部分,使之变得简单。