mongodb中数组内的$sum值
我们有一个Mongo系列,其形式如下:mongodb中数组内的$sum值,mongodb,mongodb-query,aggregation-framework,Mongodb,Mongodb Query,Aggregation Framework,我们有一个Mongo系列,其形式如下: [ { "_id" : "34210db0-6g91-83e8-ae8c-659f064f503f", "dateReceived" : ISODate("2018-01-01T00:00:00.000Z"), "group" : null, "clientShortName" : "My Client Name", "sourceShortName" : "Datas
[
{
"_id" : "34210db0-6g91-83e8-ae8c-659f064f503f",
"dateReceived" : ISODate("2018-01-01T00:00:00.000Z"),
"group" : null,
"clientShortName" : "My Client Name",
"sourceShortName" : "Datasource Name",
"files" : [
{
"_id" : "807061f0-2d77-87e8-8610-9ff3cbc9c774"
"status" : 1,
"fileName" : "filename1.csv",
"numRows" : 15,
},
{
"_id" : "587036f0-2n65-55e8-8610-3ee3cbc9c814"
"status" : 8,
"fileName" : "filename2.csv",
"numRows" : 30,
}
]
}
]
我们有一个Mongo查询,使用“find”和“map”来生成转换后的输出。“查找/映射”命令如下所示:
db.getCollection('batches')
.find({_id: "34210db0-6g91-83e8-ae8c-659f064f503f"}, {"__v": false, "files.diffHistory": false})
.map( doc =>
{
doc.id = doc._id;
doc.clientName = doc.clientShortName;
doc.dataSourceName = doc.sourceShortName;
delete doc._id;
delete doc.clientShortName;
delete doc.sourceShortName;
doc.numFiles = NumberInt(doc.files.length);
doc.files = doc.files.map( file =>
{
file.id = file._id;
delete file._id;
delete file.__v;
delete file.edits;
return file;
}
);
// broken....how should this be formatted?
doc.totalNumRows = {$sum: doc.files.numRows};
return doc;
}
)
此查找/映射工作并生成除“totalNumRows”总和之外的预期输出。我们试图完成的是将所有“files.numRows”字段相加,以便在返回数据集的顶层获得一个汇总条目。Ie我们将看到一个结果集,如下所示:
[
{
"id" : "34210db0-6g91-83e8-ae8c-659f064f503f",
"dateReceived" : ISODate("2018-01-01T00:00:00.000Z"),
"group" : null,
"clientName" : "My Client Name",
"dataSourceName" : "Datasource Name",
"files" : [
{
"id" : "807061f0-2d77-87e8-8610-9ff3cbc9c774"
"status" : 1,
"fileName" : "filename1.csv",
"numRows" : 15,
},
{
"id" : "587036f0-2n65-55e8-8610-3ee3cbc9c814"
"status" : 8,
"fileName" : "filename2.csv",
"numRows" : 30,
}
],
"totalNumRows": 45
}
]
到目前为止尝试的所有方法都会产生一个中断的查询。有人知道对“文件”子文档的“numRows”字段进行汇总的正确命令/格式吗?您可以做一些更好更快的方法,然后。。。尝试重命名实际字段名,然后获取
numRows的总数
db.collection.aggregate([
{ "$match": { _id: "34210db0-6g91-83e8-ae8c-659f064f503f" }},
{ "$project": {
"totalNumRows": {
"$sum": "$files.numRows"
},
"clientName": "$clientShortName",
"dataSourceName": "$sourceShortName",
"files": "$files"
}}
])
它将给出以下输出
[
{
"_id": 1111,
"clientName": "My Client Name",
"dataSourceName": "Datasource Name",
"files": [
{
"fileName": "filename1.csv",
"id": 2222,
"numRows": 15,
"status": 1
},
{
"fileName": "filename2.csv",
"id": 3333,
"numRows": 30,
"status": 8
}
],
"totalNumRows": 45
}
]
明亮的工作完美,在初始负载测试下似乎更快。万分感谢@加特曼多只是一个提示。。。不要在查询后执行映射或循环之类的操作,因为这总是一项耗时的任务。。。始终使用mongodb聚合运算符来执行此操作。。。他们闪电般地快。。。