MongoDB聚合:多组+;元素数组
文档的结构如下所示:MongoDB聚合:多组+;元素数组,mongodb,mongodb-query,aggregation-framework,robo3t,Mongodb,Mongodb Query,Aggregation Framework,Robo3t,文档的结构如下所示: "_id" : ObjectId("581496e8564627c098e41755"), "startdate": somedate, "enddate": somedate, "userId" : 1, "activity" : "activity1", "measures" : [ { "M1" : 99, "M2" : 103, "M3" : 118, "M4" : 4 },
"_id" : ObjectId("581496e8564627c098e41755"),
"startdate": somedate,
"enddate": somedate,
"userId" : 1,
"activity" : "activity1",
"measures" : [
{
"M1" : 99,
"M2" : 103,
"M3" : 118,
"M4" : 4
},
{
"M1" : 136,
"M2" : 89,
"M3" : 108,
"M4" : 6
},
。。。等等
有50个用户,8种类型的活动,每个活动大约有100个度量值。用户可以在另一个日期使用其他措施进行相同的活动。
我在db中有大约3000个文档:每个用户每个活动有1个文档,其中包含度量
我想得到每个用户,每个活动的所有措施
我有以下代码:
`db.armband.aggregate([
{$match: { "measures.M1": { $gt: 1 } } },
{$project: { _id: 0, userId: 1, activity:1, measures:1 } },
{$sort: {userId:1, activity:1} },
{$out: "actPerUser"}
])
`
这里的问题是,我每个活动都有一个按顺序排列的文档。但我得到:
- 1个用户ID为1、活动1、度量值为100的文档
- 1个用户ID为1、活动1、度量值为100的文档
- 1个用户ID为2、活动1、度量值为100的文档
`db.armband.aggregate(
[
{
$group:
{
_id: { userId: "$userId" },
actMes: { $push: { activity:"$activity", measures: "$measures" } }
}
},
{$project: { _id: 0, userId: "$_id.userId", actMes:1 } },
{$sort: { userId:1}},
]
)
这为每个用户提供了一个文档,其中包含不同的活动+度量(但仍然是双重活动)
然后我尝试放松措施:
`db.armband.aggregate(
[
{$unwind: '$measures'},
{$group: {
_id: { userId: "$userId" },
activity: { $addToSet: "$activity" },
measures: {$addToSet: "$measures"}
}
},
{ $sort: {userId:1}}
])
`
这给了我每个用户一个文档,包含8个活动,大约5900个
所以我有点不知所措,我怎样才能实现我想要的?是否可能,一个用户一份文档,一项活动,该活动的所有措施?您可以使用:
- 1
删除阵列$unwind
- 1
按活动/用户ID分组,并且$group
测量到新创建的数组中$push
db.armband.aggregate([{
"$unwind": "$measures"
}, {
$group: {
_id: {
userId: "$userId",
activity: "$activity"
},
measures: { $push: "$measures" }
}
}])
这会产生如下结果:
{ "_id" : { "userId" : 2, "activity" : "activity1" }, "measures" : [ { "M1" : 99, "M2" : 103, "M3" : 118, "M4" : 4 }, { "M1" : 136, "M2" : 89, "M3" : 108, "M4" : 6 } ] }
{ "_id" : { "userId" : 2, "activity" : "activity2" }, "measures" : [ { "M1" : 99, "M2" : 103, "M3" : 118, "M4" : 4 }, { "M1" : 136, "M2" : 89, "M3" : 108, "M4" : 6 } ] }
{ "_id" : { "userId" : 1, "activity" : "activity1" }, "measures" : [ { "M1" : 99, "M2" : 103, "M3" : 118, "M4" : 4 }, { "M1" : 136, "M2" : 89, "M3" : 108, "M4" : 6 }, { "M1" : 99, "M2" : 103, "M3" : 118, "M4" : 4 }, { "M1" : 136, "M2" : 89, "M3" : 108, "M4" : 6 } ] }
谢谢,就这样。我首先想到的是,在执行代码时,对于一个活动,每个用户只能得到50个文档。但这是机器人世界的一个问题。当我将它写入一个新集合($out)时,我实际上得到了所有文档,每个用户一个,每个活动一个,以及该活动的所有度量。再次感谢!