Hadoop &引用;映射输出物化字节”;vs";映射输出字节“;

Hadoop &引用;映射输出物化字节”;vs";映射输出字节“;,hadoop,mapreduce,Hadoop,Mapreduce,在hadoop作业计数器中,“映射输出物化字节”与“映射输出字节”之间有什么区别?当我禁用映射输出压缩时,我看不到前者,所以我猜它是真实的输出字节(压缩),而后者是未压缩的字节 我认为你是对的。 发件人: MAPREDUCE-2365。FileInputFormat(字节读取)和FileOutputFormat(字节写入)的新计数器。压缩MapOutputSize的新计数器映射\输出\具体化\字节。(赛斯) (自Hadoop 0.20.2以来的更改) 以下是Tom White的《Hadoop最

在hadoop作业计数器中,“映射输出物化字节”与“映射输出字节”之间有什么区别?当我禁用映射输出压缩时,我看不到前者,所以我猜它是真实的输出字节(压缩),而后者是未压缩的字节

我认为你是对的。 发件人:

MAPREDUCE-2365。FileInputFormat(字节读取)和FileOutputFormat(字节写入)的新计数器。压缩MapOutputSize的新计数器映射\输出\具体化\字节。(赛斯)

(自Hadoop 0.20.2以来的更改)

以下是Tom White的《Hadoop最终指南》第三版(表8-2,第261页)的一段引文:

“映射输出物化字节”-映射输出实际写入磁盘的字节数。如果启用了贴图输出压缩,这将反映在计数器值中

“映射输出字节”-作业中所有映射生成的未压缩输出字节数。每次在映射的
OutputCollector

上调用
collect()
方法时递增。我似乎在我的作业详细信息页面中没有看到“映射输出物化字节”。我正在使用Hadoop 2.0.0-mr1-cdh4.2.1。我需要改变一些设置吗。