mongodb中数组内的$sum值_Mongodb_Mongodb Query_Aggregation Framework

mongodb中数组内的$sum值

mongodb

mongodb中数组内的$sum值,mongodb,mongodb-query,aggregation-framework,Mongodb,Mongodb Query,Aggregation Framework,我们有一个Mongo系列，其形式如下： [ { "_id" : "34210db0-6g91-83e8-ae8c-659f064f503f", "dateReceived" : ISODate("2018-01-01T00:00:00.000Z"), "group" : null, "clientShortName" : "My Client Name", "sourceShortName" : "Datas

我们有一个Mongo系列，其形式如下：

[
    {
        "_id" : "34210db0-6g91-83e8-ae8c-659f064f503f",
        "dateReceived" : ISODate("2018-01-01T00:00:00.000Z"),
        "group" : null,
        "clientShortName" : "My Client Name",
        "sourceShortName" : "Datasource Name",
        "files" : [ 
            {
                "_id" : "807061f0-2d77-87e8-8610-9ff3cbc9c774"
                "status" : 1,
                "fileName" : "filename1.csv",
                "numRows" : 15,

            }, 
            {
                "_id" : "587036f0-2n65-55e8-8610-3ee3cbc9c814"
                "status" : 8,
                "fileName" : "filename2.csv",
                "numRows" : 30,
            }
        ]
    }
]

我们有一个Mongo查询，使用“find”和“map”来生成转换后的输出。“查找/映射”命令如下所示：

db.getCollection('batches')
.find({_id: "34210db0-6g91-83e8-ae8c-659f064f503f"}, {"__v": false, "files.diffHistory": false})
.map( doc =>
    {
        doc.id = doc._id;
        doc.clientName = doc.clientShortName;
        doc.dataSourceName = doc.sourceShortName;
        delete doc._id;
        delete doc.clientShortName;
        delete doc.sourceShortName;

        doc.numFiles = NumberInt(doc.files.length);

        doc.files = doc.files.map( file =>
            {
                file.id = file._id;
                delete file._id;
                delete file.__v;
                delete file.edits;

                return file;
            }
        );

        // broken....how should this be formatted?    
        doc.totalNumRows = {$sum: doc.files.numRows};

        return doc;
    }
)

此查找/映射工作并生成除“totalNumRows”总和之外的预期输出。我们试图完成的是将所有“files.numRows”字段相加，以便在返回数据集的顶层获得一个汇总条目。Ie我们将看到一个结果集，如下所示：

[
        {
            "id" : "34210db0-6g91-83e8-ae8c-659f064f503f",
            "dateReceived" : ISODate("2018-01-01T00:00:00.000Z"),
            "group" : null,
            "clientName" : "My Client Name",
            "dataSourceName" : "Datasource Name",
            "files" : [ 
                {
                    "id" : "807061f0-2d77-87e8-8610-9ff3cbc9c774"
                    "status" : 1,
                    "fileName" : "filename1.csv",
                    "numRows" : 15,

                }, 
                {
                    "id" : "587036f0-2n65-55e8-8610-3ee3cbc9c814"
                    "status" : 8,
                    "fileName" : "filename2.csv",
                    "numRows" : 30,
                }
            ],

            "totalNumRows": 45

        }
    ]

到目前为止尝试的所有方法都会产生一个中断的查询。有人知道对“文件”子文档的“numRows”字段进行汇总的正确命令/格式吗？

您可以做一些更好更快的方法，然后。。。尝试重命名实际字段名，然后获取

numRows的总数
db.collection.aggregate([
  { "$match": { _id: "34210db0-6g91-83e8-ae8c-659f064f503f" }},
  { "$project": {
    "totalNumRows": {
      "$sum": "$files.numRows"
    },
    "clientName": "$clientShortName",
    "dataSourceName": "$sourceShortName",
    "files": "$files"
  }}
])

它将给出以下输出
[
  {
    "_id": 1111,
    "clientName": "My Client Name",
    "dataSourceName": "Datasource Name",
    "files": [
      {
        "fileName": "filename1.csv",
        "id": 2222,
        "numRows": 15,
        "status": 1
      },
      {
        "fileName": "filename2.csv",
        "id": 3333,
        "numRows": 30,
        "status": 8
      }
    ],
    "totalNumRows": 45
  }
]

明亮的工作完美，在初始负载测试下似乎更快。万分感谢@加特曼多只是一个提示。。。不要在查询后执行映射或循环之类的操作，因为这总是一项耗时的任务。。。始终使用mongodb聚合运算符来执行此操作。。。他们闪电般地快。。。