Hadoop 即使某些映射程序失败,仍在仅映射体系结构中保存已完成映射程序的输出

Hadoop 即使某些映射程序失败,仍在仅映射体系结构中保存已完成映射程序的输出,hadoop,mapreduce,hadoop-streaming,Hadoop,Mapreduce,Hadoop Streaming,我正在运行map-only(reducer的数量=0)map-reduce流作业。在mapper代码的末尾,我显式地编写了map的输出。但是,有时我的一些映射器任务会失败 我希望在HDFS中看到完成的映射器的输出。我的逻辑是,因为并没有减速器,所以输出应该直接写入HDFS。然而,我无法在output HDFS文件夹中看到任何数据,以防单个映射器出现故障。为什么会发生这种情况?我的理解有什么缺陷吗

我正在运行map-only(reducer的数量=0)map-reduce流作业。在mapper代码的末尾,我显式地编写了map的输出。但是,有时我的一些映射器任务会失败

我希望在HDFS中看到完成的映射器的输出。我的逻辑是,因为并没有减速器,所以输出应该直接写入HDFS。然而,我无法在output HDFS文件夹中看到任何数据,以防单个映射器出现故障。为什么会发生这种情况?我的理解有什么缺陷吗