Hadoop 映射任务被卡住,从未完成

Hadoop 映射任务被卡住,从未完成,hadoop,Hadoop,嗨,我正在运行Hadoop作业。我的第66个Map任务总是在完成16.24%并被卡住后由于超时而失败 对于默认的5分钟超时,我收到错误:*任务尝试_201403131358_0001_m_000066_0未能报告状态达1802秒。杀人!**。因此,我将mapred.task.timout增加到0无限时间,期望5分钟的默认超时时间不足以完成任务。但现在我的工作从未结束,地图任务仍然停留在16.24%的水平 有谁能帮我解决这个问题吗?你能详细说明一下你在映射器中做了什么吗?映射器只是使用正则表达式从

嗨,我正在运行Hadoop作业。我的第66个Map任务总是在完成16.24%并被卡住后由于超时而失败

对于默认的5分钟超时,我收到错误:*任务尝试_201403131358_0001_m_000066_0未能报告状态达1802秒。杀人!**。因此,我将mapred.task.timout增加到0无限时间,期望5分钟的默认超时时间不足以完成任务。但现在我的工作从未结束,地图任务仍然停留在16.24%的水平


有谁能帮我解决这个问题吗?

你能详细说明一下你在映射器中做了什么吗?映射器只是使用正则表达式从输入中提取一些字段并将其发送到reducer。您认为Mapper任务会因为代码中的某些问题而卡住吗?。因为我在谷歌上搜索的任务尝试_201403131358_0001_m_000066_0在1802秒内未能报告状态。谋杀!错误,所有的答案都说这是一个与内存消耗有关的问题,可能是因为映射程序处理数据太慢了。是你的正则表达式太复杂还是你的输入太大?此外,您是否在mapper中存储了任何可能非常大的中间数据?正如我所说,我将任务超时时间从mapred-site.xml中的默认设置10分钟增加到30分钟和无限时间,在这两种情况下,任务仍然分别在30分钟和永远停留在16.24%。任务号是66。在我的192个任务中,我不知道为什么只有任务66在完成时有问题。你能检查一下你的代码中是否有无限循环吗?