Apache pig 应用于每个组属性的Pig拉丁限制运算符
根据各州的人口,我试图只返回五个最大的地方。我还试图按州名对结果进行排序,每个州的地方都按人口递减顺序排列。目前,我只得到了各州的前五名,而不是每个州的前五名Apache pig 应用于每个组属性的Pig拉丁限制运算符,apache-pig,Apache Pig,根据各州的人口,我试图只返回五个最大的地方。我还试图按州名对结果进行排序,每个州的地方都按人口递减顺序排列。目前,我只得到了各州的前五名,而不是每个州的前五名 下面的代码片段可能会有所帮助 inp_data = load 'input_data.csv' using PigStorage(',') AS (state:chararray,place:chararray,population:long); req_stats = FOREACH(GROUP inp_data BY state)
下面的代码片段可能会有所帮助
inp_data = load 'input_data.csv' using PigStorage(',') AS (state:chararray,place:chararray,population:long);
req_stats = FOREACH(GROUP inp_data BY state) {
ordered = ORDER inp_data BY population DESC;
required = LIMIT ordered 5;
GENERATE FLATTEN(required);
};
req_stats_ordered = ORDER req_stats BY state, population DESC;
DUMP req_stats_ordered;
下面的代码片段可能会有所帮助
inp_data = load 'input_data.csv' using PigStorage(',') AS (state:chararray,place:chararray,population:long);
req_stats = FOREACH(GROUP inp_data BY state) {
ordered = ORDER inp_data BY population DESC;
required = LIMIT ordered 5;
GENERATE FLATTEN(required);
};
req_stats_ordered = ORDER req_stats BY state, population DESC;
DUMP req_stats_ordered;
您可以添加示例输入和预期输出吗?您可以添加示例输入和预期输出吗?