Java 如何在Hadoop中对值进行排序？_Java_Hadoop_Mapreduce

Java 如何在Hadoop中对值进行排序？

java hadoop mapreduce

Java 如何在Hadoop中对值进行排序？,java,hadoop,mapreduce,Java,Hadoop,Mapreduce,我有一个历史文件，它由多个（主题页面）组成，每个页面有14行，我需要从中获取一个ID，然后我计算这个特定文档的出现次数，即它在这个历史文件中出现的次数。但是我需要以最高的出现次数显示排序后的输出，然后按主题页面ID显示在mapper中，我只是获取主题键，并对每个条目使用IntWritable编写一个然后，我只是总结一下无法使用辅助排序，因为调用reduce函数后，我会得到每个主题页的总计数输出如下所示：主题外观 98763489 67894587 378956 76ApachePig让

我有一个历史文件，它由多个（主题页面）组成，每个页面有14行，我需要从中获取一个ID，然后我计算这个特定文档的出现次数，即它在这个历史文件中出现的次数。但是我需要以最高的出现次数显示排序后的输出，然后按主题页面ID显示

在mapper中，我只是获取主题键，并对每个条目使用IntWritable编写一个

然后，我只是总结一下

无法使用辅助排序，因为调用reduce函数后，我会得到每个主题页的总计数

输出如下所示：

主题外观
98763489
67894587

378956 76

ApachePig让这个问题变得微不足道。你试过了吗？可能重复我想避免使用两个作业。ApachePig是另一个框架，我希望它与Hadoop一起使用。你能提供一个输入和输出示例以便更好地理解吗？