MongoDB:计算重复字段、mapReduce与python循环
我有一个集合,希望在其中查找给定字段的所有副本。从Mongo文档和这里的其他答案来看,大多数人似乎都建议使用mapReduce。我想知道从python迭代游标而不是使用map reduce的缺点是什么 看起来mapreduce也必须遍历对象 在这里添加解决方案,这样可能会对某人有所帮助 我运行了下面的查询以获得一个列表,其中列出了多次出现的所有条形码MongoDB:计算重复字段、mapReduce与python循环,mongodb,mapreduce,pymongo,Mongodb,Mapreduce,Pymongo,我有一个集合,希望在其中查找给定字段的所有副本。从Mongo文档和这里的其他答案来看,大多数人似乎都建议使用mapReduce。我想知道从python迭代游标而不是使用map reduce的缺点是什么 看起来mapreduce也必须遍历对象 在这里添加解决方案,这样可能会对某人有所帮助 我运行了下面的查询以获得一个列表,其中列出了多次出现的所有条形码$group管道统计出现的次数,$match过滤计数大于1的出现次数 db.sandbox.aggregate([
$group
管道统计出现的次数,$match
过滤计数大于1
的出现次数
db.sandbox.aggregate([
{$group: {_id: '$barcode',
count: {$sum: 1}
}
},
{$match: {count: {$gt:1} } }
])
将帮助您查找重复项。这比获取记录和循环要好。将帮助您查找重复项。这比获取记录和循环要好。你可以为此进行聚合。你可以为此进行聚合。你甚至不知道聚合是什么。但效果很好。Thx.我甚至不知道聚合是什么。但效果很好。谢谢。