Hadoop 使tasktracker在失败后等待_Hadoop_Mapreduce

Hadoop 使tasktracker在失败后等待

hadoop mapreduce

Hadoop 使tasktracker在失败后等待,hadoop,mapreduce,Hadoop,Mapreduce,我在Hadoop集群上运行M/R作业，偶尔会在Tasktracker中遇到一些故障。我知道这些失败的性质，并且知道当它发生在任务中时，Tasktracker至少在两分钟内无法正常工作我的问题很简单：在任务失败后的几分钟内，是否可以让Tasktracker“睡眠”，即不接受任何新任务提前感谢, 阿德里安也许你可以调整心跳频率？我假设如果心跳间隔时间大于2分钟，jobtracker不会向tasktracker发送新任务？这只是一个想法，不确定它是否是这样运作的。上面的链接包含许多可以设置的心跳属

我在Hadoop集群上运行M/R作业，偶尔会在Tasktracker中遇到一些故障。我知道这些失败的性质，并且知道当它发生在任务中时，Tasktracker至少在两分钟内无法正常工作

我的问题很简单：在任务失败后的几分钟内，是否可以让Tasktracker“睡眠”，即不接受任何新任务

提前感谢,

阿德里安

也许你可以调整心跳频率？我假设如果心跳间隔时间大于2分钟，jobtracker不会向tasktracker发送新任务？这只是一个想法，不确定它是否是这样运作的。上面的链接包含许多可以设置的心跳属性。

mapreduce.tasktracker.tasks.sleeptimebeforesigkill

tasktracker在向任务发送SIGTERM后等待向其发送SIGKILL的时间（以毫秒为单位）。这在WINDOWS上当前未使用，因为任务仅发送一个SIGTERM。这可能也很有趣？谢谢你。在tasktracker级别，我看不出两分钟心跳使用什么参数，不幸的是，我认为它无论如何都不起作用。第二个参数似乎只有在整个tasktracker停止时才会触发，而不是单个任务（我做了一个测试，但它不起作用）。也许你可以提供更多关于任务失败的详细信息，我认为你的问题有点太笼统了，以目前的形式，你的问题可能没有解决方案，但是，如果你能传达更多关于任务失败的细节，可能会有一些技巧（我绝对不是专家，但你的问题可能会引起这里更有经验的hadoop人员的注意）