Mapreduce Pig累加器,输入元组是否保证订购?

Mapreduce Pig累加器,输入元组是否保证订购?,mapreduce,apache-pig,Mapreduce,Apache Pig,我编写了一个UDF,它实现了累加器接口。但是,要使我的UDF工作,需要对传入的关系进行排序。我用第二种方法来处理这个问题: out = FOREACH (GROUP test BY key) { sorted = ORDER test BY sub_key; GENERATE MyUDF(sorted); } 根据累加器文档,我的UDF需要一系列增量行李。我的UDF接收元组的总顺序是否保持不变?即,每个增量行李是否在内部订购,以及我看到的增量行李的订购顺序 当我测试它时,一切似

我编写了一个UDF,它实现了
累加器
接口。但是,要使我的UDF工作,需要对传入的关系进行排序。我用第二种方法来处理这个问题:

out = FOREACH (GROUP test BY key) {
    sorted = ORDER test BY sub_key;
    GENERATE MyUDF(sorted);
}
根据
累加器
文档,我的UDF需要一系列增量行李。我的UDF接收元组的总顺序是否保持不变?即,每个增量行李是否在内部订购,以及我看到的增量行李的订购顺序


当我测试它时,一切似乎都是有序的,但我想确定的是,因为Pig文档将包描述为“无序的”。

因为您使用了ORDER操作符对包中的元组进行排序,您的UDF肯定会收到“已排序”包中的元组