Java 如何在Hadoop中对值进行排序?

Java 如何在Hadoop中对值进行排序?,java,hadoop,mapreduce,Java,Hadoop,Mapreduce,我有一个历史文件,它由多个(主题页面)组成,每个页面有14行,我需要从中获取一个ID,然后我计算这个特定文档的出现次数,即它在这个历史文件中出现的次数。但是我需要以最高的出现次数显示排序后的输出,然后按主题页面ID显示 在mapper中,我只是获取主题键,并对每个条目使用IntWritable编写一个 然后,我只是总结一下 无法使用辅助排序,因为调用reduce函数后,我会得到每个主题页的总计数 输出如下所示: 主题外观 98763489 67894587 378956 76ApachePig让

我有一个历史文件,它由多个(主题页面)组成,每个页面有14行,我需要从中获取一个ID,然后我计算这个特定文档的出现次数,即它在这个历史文件中出现的次数。但是我需要以最高的出现次数显示排序后的输出,然后按主题页面ID显示

在mapper中,我只是获取主题键,并对每个条目使用IntWritable编写一个

然后,我只是总结一下

无法使用辅助排序,因为调用reduce函数后,我会得到每个主题页的总计数

输出如下所示:

主题外观
98763489
67894587

378956 76

ApachePig让这个问题变得微不足道。你试过了吗?可能重复我想避免使用两个作业。ApachePig是另一个框架,我希望它与Hadoop一起使用。你能提供一个输入和输出示例以便更好地理解吗?