使用mapreduce查找数据集的平均/最小/最大值

使用mapreduce查找数据集的平均/最小/最大值,mapreduce,Mapreduce,我正试图编写一个mapreduce示例实践程序,其中在我的数据集中是这样的 place year avg min max america 2014 625000 600000 650000 france 2010 400000 400000 400000 这是关于一个国家/城市/州每年人们的工资 place year salary($) america 2014 60,000 france 2010

我正试图编写一个mapreduce示例实践程序,其中在我的数据集中是这样的

place   year    avg      min        max
america 2014   625000   600000    650000 
france  2010   400000    400000    400000
这是关于一个国家/城市/州每年人们的工资

place      year  salary($)
america    2014  60,000
france     2010  40,000
india      2012  20,000
australia  2001  50,000
america    2014  65,000
我想要这样的输出

place   year    avg      min        max
america 2014   625000   600000    650000 
france  2010   400000    400000    400000
请指导我如何编写mapreduce程序/任何已处理此类情况的示例程序。 提前感谢:)

我试过mapper部分 公共静态类映射扩展映射器{

    public void map(LongWritable key, Text value,
            Context context)
            throws IOException,InterruptedException {
        String year=null;
        String country =null;
        String amount=null;

          // this will work even if we receive more than 1 line
        Scanner scanner = new Scanner(value.toString());
        String line;
        String[] tokens;
        while (scanner.hasNext()) {
            line = scanner.nextLine();
            tokens = line.split("\\s+");
            country = tokens[0];
            year = tokens[1];
            amount = (tokens[2]);

            context.write(new Text(country), new Text(year));
            context.write(new Text(year), new Text(amount));
        }



    }

}

你的代码在哪里?你已经尝试过什么?嗨,问题是在每个mapreduce程序中,我看到mapper都有一个键和一个值,在reducer中,它求和并显示它…在我的例子中,每个国家都有一个值列表,作为年份,每年都有一个值列表…所以我不确定如何处理这个多键、值对o我正在寻求您的建议,我应该如何继续。这是我在结束时尝试过的(有问题的编辑)…我尝试了mapper零件,但在如何识别每个国家和年份时填写了空白:(请指导我)