MongoDB 2.1聚合框架与名称匹配的数组元素之和
这是一个关于在数组中添加一系列数据的最佳方法的问题,其中我必须匹配另一个元素。我正在尝试使用2.2聚合框架,我可以通过一个简单的组来实现这一点 所以对于一组给定的文档,我试图得到这样的输出MongoDB 2.1聚合框架与名称匹配的数组元素之和,mongodb,Mongodb,这是一个关于在数组中添加一系列数据的最佳方法的问题,其中我必须匹配另一个元素。我正在尝试使用2.2聚合框架,我可以通过一个简单的组来实现这一点 所以对于一组给定的文档,我试图得到这样的输出 { "result" : [ { "_id" : null, "numberOf": 2, "Sales" : 468000, "profit" :
{
"result" : [
{
"_id" : null,
"numberOf": 2,
"Sales" : 468000,
"profit" : 246246,
}
],
"ok" : 1
}
[
{
_id : 1,
finance: [
{
"k": "sales",
"v": {
"description":"sales over the year",
v: 234000,
}
},
{
"k": "profit",
"v": {
"description":"money made from sales",
v: 123123,
}
}
]
}
,
{
_id : 2,
finance: [
{
"k": "sales",
"v": {
"description":"sales over the year",
v: 234000,
}
},
{
"k": "profit",
"v": {
"description": "money made from sales",
v: 123123,
}
}
]
}
]
现在,我最初有一个文档列表,包含指定给命名属性的值,例如
[
{
_id : 1,
finance: {
sales: 234000,
profit: 123123,
}
}
,
{
_id : 2,
finance: {
sales: 234000,
profit: 123123,
}
}
]
这很容易加起来,但由于其他原因,该结构不起作用。例如,可能还有其他类似“finance”的列,我希望能够在不创建数千个索引的情况下对它们进行索引,因此我需要转换为这样的结构
{
"result" : [
{
"_id" : null,
"numberOf": 2,
"Sales" : 468000,
"profit" : 246246,
}
],
"ok" : 1
}
[
{
_id : 1,
finance: [
{
"k": "sales",
"v": {
"description":"sales over the year",
v: 234000,
}
},
{
"k": "profit",
"v": {
"description":"money made from sales",
v: 123123,
}
}
]
}
,
{
_id : 2,
finance: [
{
"k": "sales",
"v": {
"description":"sales over the year",
v: 234000,
}
},
{
"k": "profit",
"v": {
"description": "money made from sales",
v: 123123,
}
}
]
}
]
如果我愿意,我可以为finance.k编制索引,但是我很难构建一个聚合查询来将与特定键匹配的所有数字相加。这就是我最初选择命名属性的原因,但这确实需要在有数千个“k”标签的情况下工作
有人知道如何使用新框架为此构建聚合查询吗?我试过这个
db.projects.aggregate([
{
$match: {
// QUERY
$and: [
// main query
{},
]
}
},
{
$group: {
_id: null,
"numberOf": { $sum: 1 },
"sales": { $sum: "$finance.v.v" },
"profit": { $sum: "$finance.v.v" },
}
},
])
但是我得到了
{
"errmsg" : "exception: can't convert from BSON type Array to double",
"code" : 16005,
"ok" : 0
}
**为了获得额外的荣誉,我还需要能够在MapReduce查询中执行此操作。您必须使用“$unwind”来分解数组中的值,这意味着您无法在单个聚合命令中获得销售额和利润之和。鉴于此,查询本身很简单:
var pipeline = [
{"$unwind": "$finance" } ,
{"$match": {"finance.k": "sales"} },
{ $group:
{ _id: null,
numberOf: { "$sum": 1 },
sales: {"$sum": "$finance.v.v" }
}
}
];
R = db.tb.aggregate( pipeline );
printjson(R);
{
"result" : [
{
"_id" : null,
"numberOf" : 2,
"sales" : 236340
}
],
"ok" : 1
}
您可以运行类似的利润查询,只需在“$match”操作符中将“利润”替换为“销售”
哦,下面是map/reduce示例:
map = function() {
var ret = { sales: 0.0 , profit: 0.0, count: 1 };
// iterate over 'finance[]' array
this.finance.forEach( function (i) {
if ( i.k == "sales" ) ret.sales = i.v.v ;
if ( i.k == "profit" ) ret.profit = i.v.v ;
} );
emit( 1, ret );
}
reduce = function(key, values) {
var ret = { sales: 0.0 , profit: 0.0, count: 0 };
values.forEach(function(v) {
ret.sales += v.sales;
ret.profit += v.profit;
ret.count += v.count;
});
return ret;
};
//
// run map/reduce
//
res = SOURCE.mapReduce( map, reduce );
您可以使用聚合框架获取销售和利润,以及存储在密钥/值对表示中的任何其他值 对于您的示例数据:
var pipeline = [
{
"$unwind" : "$finance"
},
{
"$group" : {
"_id" : "$finance.k",
"numberOf" : {
"$sum" : 1
},
"total" : {
"$sum" : "$finance.v.v"
}
}
}
]
R = db.tb.aggregate( pipeline );
printjson(R);
{
"result" : [
{
"_id" : "profit",
"numberOf" : 2,
"total" : 246246
},
{
"_id" : "sales",
"numberOf" : 2,
"total" : 468000
}
],
"ok" : 1
}
如果您有额外的k/v对,则可以添加一个仅通过[“销售”、“利润”]中的k值的匹配项.为什么需要在MapReduce中执行此操作?聚合框架将比M/R更快,并且通常更易于阅读。除了agg fx尚未投入生产之外,在大多数情况下,MR将更快,因为我可以预缓存输出。agg fx解决方案将适用于没有MR缓存版本的情况。2.2 ha是的,但实际上只是在我最后一次评论和你的评论之间:)它作为标准产品出现在MongoLab和MongoHQ等地还需要一段时间,但是能够预先计算和存储MR结果仍然是一项要求,除非e$out功能正在运行。顺便说一句,答案很好!可惜我不能将两个答案都标记为正确。我想这正是我所需要的-如果我想过滤掉可能存在的其他字段,并只返回“sales”和“profit”?$match语法与find()的第一个参数相同-因此{$match:{“finance.k”:{$in:[“sales”,“利润“]}}}你可以把它放在放松之后(实际上你可以把它放在前后:)回答得很好,谢谢!地图还原效果很好。可惜我不能把两个答案都标对。