如何快速使Kubernetes准备就绪探测失败?

如何快速使Kubernetes准备就绪探测失败?,kubernetes,readinessprobe,Kubernetes,Readinessprobe,如果我的集群中有一个pod出现故障,则需要大约15秒或更长时间才能通过就绪探测逻辑确定故障,但由于呼叫失败,该逻辑不被接受(因为kubernetes未识别pod故障,因此它将向故障pod发送通信量/我指的是故障pod仍在cluster-p服务端点中) 请在此提出建议,如何立即使就绪探测失败,或在失败时如何立即移除端点,而不会将周期秒减少到5秒以下 以下是我的配置: initialDelaySeconds:90s periodSeconds:5s timeoutSeconds:2s success

如果我的集群中有一个pod出现故障,则需要大约15秒或更长时间才能通过就绪探测逻辑确定故障,但由于呼叫失败,该逻辑不被接受(因为kubernetes未识别pod故障,因此它将向故障pod发送通信量/我指的是故障pod仍在cluster-p服务端点中)

请在此提出建议,如何立即使就绪探测失败,或在失败时如何立即移除端点,而不会将周期秒减少到5秒以下

以下是我的配置:

initialDelaySeconds:90s
periodSeconds:5s
timeoutSeconds:2s
successThreshold:<default>
failureThreshold:<default>
initialDelaySeconds:90s
周期秒:5秒
timeoutSeconds:2s
成功阈值:
故障保持:

提前感谢。

您所能做的就是调整您以满足您的要求:

探测器有许多字段,您可以使用这些字段更精确地 控制活动性和就绪性检查的行为:

  • initialDelaySeconds
    :启动活动性或就绪性探测之前容器启动后的秒数。默认为 0秒。最小值为0

  • periodSeconds
    :执行探测的频率(以秒为单位)。默认为10秒。最小值为1

  • timeoutSeconds
    :探测器超时后的秒数。默认为1秒。最小值为1

  • successThreshold
    :探测器失败后被视为成功的最小连续成功次数。默认值为1。必须是1 为了活泼。最小值为1

  • FailureReshold
    :当探测失败时,Kubernetes会在放弃之前尝试FailureReshold次。生气勃勃时放弃 探测意味着重新启动容器。在准备就绪的情况下,探测 Pod将被标记为未完成。默认值为3。最小值为1

您尚未指定
failureThreshold
,因此它默认为3。您当前使用的值将花费15-20秒来考虑POD失败并重新启动。
如果您为
周期秒数
超时秒数
成功阈值
故障保持时间
设置最小值,您可以期望更频繁的检查和更快的pod重新创建。

您可以做的是调整您以满足您的要求:

探测器有许多字段,您可以使用这些字段更精确地 控制活动性和就绪性检查的行为:

  • initialDelaySeconds
    :启动活动性或就绪性探测之前容器启动后的秒数。默认为 0秒。最小值为0

  • periodSeconds
    :执行探测的频率(以秒为单位)。默认为10秒。最小值为1

  • timeoutSeconds
    :探测器超时后的秒数。默认为1秒。最小值为1

  • successThreshold
    :探测器失败后被视为成功的最小连续成功次数。默认值为1。必须是1 为了活泼。最小值为1

  • FailureReshold
    :当探测失败时,Kubernetes会在放弃之前尝试FailureReshold次。生气勃勃时放弃 探测意味着重新启动容器。在准备就绪的情况下,探测 Pod将被标记为未完成。默认值为3。最小值为1

您尚未指定
failureThreshold
,因此它默认为3。您当前使用的值将花费15-20秒来考虑POD失败并重新启动。
如果设置
周期秒
超时秒
的最小值,
successThreshold
failureThreshold
您可以期待更频繁的检查和更快的pod恢复。

非常感谢您的快速回答。是否有其他方法可以立即从群集IP服务中删除pod?很高兴提供帮助。如果您将我提到的字段设置为它们的最小值,则Pod将被视为失败并重新创建需要1-2秒。它是对准备就绪/活动性探测器提供的容器死锁的最快响应。如果你仍然关心,不要考虑问另一个问题。如果您觉得我们已经讨论了您询问的探测器配置主题,请接受/投票,这样我们就不会在一个问题中混淆多个主题。非常感谢您的快速回答。是否有其他方法可以立即从群集IP服务中删除pod?很高兴提供帮助。如果您将我提到的字段设置为它们的最小值,则Pod将被视为失败并重新创建需要1-2秒。它是对准备就绪/活动性探测器提供的容器死锁的最快响应。如果你仍然关心,不要考虑问另一个问题。如果您觉得我们已经涵盖了您询问的探针配置主题,请接受/投票,这样我们就不会在一个问题中混合多个主题。