如何过滤Hadoop结果输出

如何过滤Hadoop结果输出,hadoop,Hadoop,我的减速机: public static class CustomReducer extends Reducer<Int256Writable, ByteWritable, IntWritable, Int256Writable> 公共静态类CustomReducer扩展了Reducer 基于IntWritable的结果是否大于1,我想过滤Hadoop的输出,以便在条件适用的情况下,所有这些KV对都不会写入输出 到目前为止,我使用的是一种简单的TextOutputFormat,但

我的减速机:

public static class CustomReducer extends Reducer<Int256Writable, ByteWritable, IntWritable, Int256Writable>
公共静态类CustomReducer扩展了Reducer
基于IntWritable的结果是否大于1,我想过滤Hadoop的输出,以便在条件适用的情况下,所有这些KV对都不会写入输出

到目前为止,我使用的是一种简单的TextOutputFormat,但我计划很快改用二进制格式


在输出KV对之前,我如何过滤它们?

天哪,我真蠢。作为记录:不要使用上下文。如果您不希望结果出现在输出中,请将结果写在减缩器中。

因为这是一个简单/明显的答案,我建议您删除该问题。