Hadoop 使tasktracker在失败后等待

Hadoop 使tasktracker在失败后等待,hadoop,mapreduce,Hadoop,Mapreduce,我在Hadoop集群上运行M/R作业,偶尔会在Tasktracker中遇到一些故障。我知道这些失败的性质,并且知道当它发生在任务中时,Tasktracker至少在两分钟内无法正常工作 我的问题很简单:在任务失败后的几分钟内,是否可以让Tasktracker“睡眠”,即不接受任何新任务 提前感谢, 阿德里安也许你可以调整心跳频率?我假设如果心跳间隔时间大于2分钟,jobtracker不会向tasktracker发送新任务?这只是一个想法,不确定它是否是这样运作的。上面的链接包含许多可以设置的心跳属

我在Hadoop集群上运行M/R作业,偶尔会在Tasktracker中遇到一些故障。我知道这些失败的性质,并且知道当它发生在任务中时,Tasktracker至少在两分钟内无法正常工作

我的问题很简单:在任务失败后的几分钟内,是否可以让Tasktracker“睡眠”,即不接受任何新任务

提前感谢,


阿德里安

也许你可以调整心跳频率?我假设如果心跳间隔时间大于2分钟,jobtracker不会向tasktracker发送新任务?这只是一个想法,不确定它是否是这样运作的。上面的链接包含许多可以设置的心跳属性。
mapreduce.tasktracker.tasks.sleeptimebeforesigkill
tasktracker在向任务发送SIGTERM后等待向其发送SIGKILL的时间(以毫秒为单位)。这在WINDOWS上当前未使用,因为任务仅发送一个SIGTERM。这可能也很有趣?谢谢你。在tasktracker级别,我看不出两分钟心跳使用什么参数,不幸的是,我认为它无论如何都不起作用。第二个参数似乎只有在整个tasktracker停止时才会触发,而不是单个任务(我做了一个测试,但它不起作用)。也许你可以提供更多关于任务失败的详细信息,我认为你的问题有点太笼统了,以目前的形式,你的问题可能没有解决方案,但是,如果你能传达更多关于任务失败的细节,可能会有一些技巧(我绝对不是专家,但你的问题可能会引起这里更有经验的hadoop人员的注意)