Mongodb 如何使用php计算mongo集合中的文档元素?
我拥有mongo文档的以下结构:Mongodb 如何使用php计算mongo集合中的文档元素?,mongodb,mongodb-query,nosql,Mongodb,Mongodb Query,Nosql,我拥有mongo文档的以下结构: { "_id": ObjectId("4fba2558a0787e53320027eb"), "replies": { "0": { "email": ObjectId("4fb89a181b3129fe2d000000"), "sentDate": "2012-05-21T11: 22: 01.418Z" } "1": { "email": ObjectId("4fb89a181b3129fe2
{
"_id": ObjectId("4fba2558a0787e53320027eb"),
"replies": {
"0": {
"email": ObjectId("4fb89a181b3129fe2d000000"),
"sentDate": "2012-05-21T11: 22: 01.418Z"
}
"1": {
"email": ObjectId("4fb89a181b3129fe2d000000"),
"sentDate": "2012-05-21T11: 22: 01.418Z"
}
"2" ....
}
}
如何统计集合中所有文档的所有回复?
谢谢大家! 在下面的回答中,我使用的是一个简单的数据集,在整个集合中有五个回复:
> db.foo.find()
{ "_id" : ObjectId("4fba6b0c7c32e336fc6fd7d2"), "replies" : [ 1, 2, 3 ] }
{ "_id" : ObjectId("4fba6b157c32e336fc6fd7d3"), "replies" : [ 1, 2 ] }
因为我们不仅仅是清点文件,在这方面对我们没有帮助。我们需要扫描每个文档并聚合回复数组长度。考虑以下事项:
db.foo.mapReduce(
function() { emit('totalReplies', { count: this.replies.length }); },
function(key, values) {
var result = { count: 0 };
values.forEach(function(value) {
result.count += value.count;
});
return result;
},
{ out: { inline: 1 }}
);
map函数(第一个参数)在整个集合中运行,并以常量键发出每个文档中的回复数。然后,Mongo将考虑所有发出的值,并运行Read函数(第二个参数)多次以合并(字面上减少)结果。希望这里的代码很简单。如果您是map/reduce新手,一个警告是reduce方法必须能够处理自己的输出。上面链接的MapReduce文档对此进行了详细解释
注意:如果您的收集量很大,您可能必须使用另一种输出模式(例如收集输出);然而,inline
对于小数据集很有效
最后,如果您使用的是MongoDB 2.1+,我们可以利用避免编写JS函数,从而使编写变得更加简单:
db.foo.aggregate(
{ $project: { replies: 1 }},
{ $unwind: "$replies" },
{ $group: {
_id: "result",
totalReplies: { $sum: 1 }
}}
);
这里发生了三件事。首先,我们告诉Mongo我们对回复
字段感兴趣。第二,我们想要解开数组,这样我们就可以在投影中的所有字段上迭代所有元素。最后,我们将在一个“结果”桶下汇总结果(任何常数都可以),为每个迭代向totalReplies
结果添加1
。执行此查询将产生以下结果:
{
"result" : [{
"_id" : "result",
"totalReplies" : 5
}],
"ok" : 1
}
尽管我就Mongo客户机编写了上述答案,但将它们翻译成PHP应该没有问题。您需要使用来运行MapReduce或聚合查询,因为PHP驱动程序目前没有这两种查询的帮助器方法。PHP文档中目前有一个MapReduce示例,您可以通过相同的方法参考执行聚合查询。我没有检查您的代码,可能也可以。我已经做了以下几点,而且效果很好:
$replies = $db->command(
array(
"distinct" => "foo",
"key" => "replies"
)
);
$all = count($replies['values']);
我使用PHP Mongo驱动程序的group命令再次完成了这项工作。它类似于MapReduce命令
$keys = array("replies.type" => 1); //keys for group by
$initial = array("count" => 0); //initial value of the counter
$reduce = "function (obj, prev) { prev.count += obj.replies.length; }";
$condition = array('replies' => array('$exists' => true), 'replies.type' => 'follow');
$g = $db->foo->group($keys, $initial, $reduce, $condition);
echo $g['count'];
感谢jmikola提供Mongo的链接。JSON应该是
{
"_id": ObjectId("4fba2558a0787e53320027eb"),
"replies":[
{
0: {
"email": ObjectId("4fb89a181b3129fe2d000000"),
"sentDate": "2012-05-21T11: 22: 01.418Z"
},
1: {
"email": ObjectId("4fb89a181b3129fe2d000000"),
"sentDate": "2012-05-21T11: 22: 01.418Z"
},
2: {....}
]
}
只要每个reply元素都是唯一的值,
distinct()
就会产生预期的答案。我认为这可能效率较低(特别是对于较大的值和数据集),因为区别比求和数组长度更复杂。我将尝试您的解决方案,您对性能的看法是正确的。。。您知道如何从php检查mongo的性能吗?请查看我链接的要点,以获得一个简单的计时示例。对于实际的MongoDB查询评测,您可能想看看:您好,我只是想知道如何将此应用于统计集合中单个文档的所有回复。您可以使用类似于我的示例的聚合管道,从开始将内容缩小到单个文档;但是,我认为最简单的方法是简单地选择文档并计算应用程序中的数组长度。如果您关心数据大小,可以从嵌入文档数组(例如,{repress.author}
)中投影单个字段,甚至可以投影一个缺少的字段以获取返回的空对象数组(仍然可以计数)。