Google compute engine 是否有一个';最大重试次数';为了Kubernetes的工作?

Google compute engine 是否有一个';最大重试次数';为了Kubernetes的工作?,google-compute-engine,kubernetes,Google Compute Engine,Kubernetes,我想在Kubernetes上运行批处理作业。我对乔布斯的理解是: 如果我选择restartPolicy:Never,这意味着如果作业失败,它将破坏Pod并(可能)重新调度到另一个节点。如果restartPolicy:OnFailure,它将重新启动现有Pod中的容器。我认为一定数量的失败是不可恢复的。有什么方法可以防止它在一段时间后重新安排或重新启动,并清理无法恢复的作业 我目前的解决方法是使用一些看门狗进程来查看retryTimes,并在指定的重试次数后清理作业。松弛讨论摘要: 否,没有重试限

我想在Kubernetes上运行批处理作业。我对乔布斯的理解是:

如果我选择
restartPolicy:Never
,这意味着如果作业失败,它将破坏Pod并(可能)重新调度到另一个节点。如果
restartPolicy:OnFailure
,它将重新启动现有Pod中的容器。我认为一定数量的失败是不可恢复的。有什么方法可以防止它在一段时间后重新安排或重新启动,并清理无法恢复的作业


我目前的解决方法是使用一些看门狗进程来查看retryTimes,并在指定的重试次数后清理作业。

松弛讨论摘要:


否,没有重试限制。但是,您可以使用
activeDeadlineSeconds
从v1.2开始设置作业的截止日期。系统应退出重新启动,然后在作业到达截止日期时终止作业。

仅供参考,现在已添加为
.spec.backoffLimit