Hadoop 正在运行的映射任务

Hadoop 正在运行的映射任务,hadoop,map,task,back,Hadoop,Map,Task,Back,存在作业运行状态的映像 如您所见,map任务已经完成,reduce任务已经运行到90.74%。根据MapReduce模型,这种情况不应该发生。怎么会这样?为什么?有没有办法解决这个问题 我的环境: Hadoop 1.1.2,r1440782 打开JDK 1.7.0_09-icedtea 如果一个或多个减速机未能从给定的映射任务或任务跟踪器(例如,运行映射任务00001的任务跟踪器由于某种原因失败)中提取临时映射输出,则可能发生这种情况 在这种情况下,Hadoop将在另一个节点上重新运行映射任务

存在作业运行状态的映像

如您所见,map任务已经完成,reduce任务已经运行到90.74%。根据MapReduce模型,这种情况不应该发生。怎么会这样?为什么?有没有办法解决这个问题

我的环境:

  • Hadoop 1.1.2,r1440782
  • 打开JDK 1.7.0_09-icedtea

  • 如果一个或多个减速机未能从给定的映射任务或任务跟踪器(例如,运行映射任务00001的任务跟踪器由于某种原因失败)中提取临时映射输出,则可能发生这种情况

    在这种情况下,Hadoop将在另一个节点上重新运行映射任务。在您的情况下,更复杂的是-看起来您有一个列入黑名单的任务跟踪器和许多失败的任务

    在这种情况下,我的猜测是,在运行reducer阶段的过程中,在单个任务跟踪器上运行的所有reducer任务都失败了,导致任务跟踪器被列入黑名单。在这种情况下,在该节点上运行的任何映射任务都需要重新调度,以便在另一个任务跟踪器上再次运行,因此有5个挂起的映射任务

    至于如何解决这个问题,这是Hadoop内置的一个错误处理案例。你应该检查失败的map任务和失败的reducer任务的日志,寻找线索,因为这可能会有很多问题(磁盘空间、任务跟踪器的最大http线程数、reducer实现的内存要求、自定义可写内容的ser de方法中的错误等)


    请随意调查,并对原始问题(或新问题)进行事后追踪。

    请更具体、更具描述性!