Kubernetes 如何根据负载自动调整吊舱数量?

Kubernetes 如何根据负载自动调整吊舱数量?,kubernetes,kubernetes-helm,Kubernetes,Kubernetes Helm,我们有一个大部分时间都相当空闲的服务,因此,如果我们可以在服务30分钟内没有收到任何请求时删除所有pod,那么对我们来说将是非常好的,在下一次出现新请求时,Kubernetes将创建第一个pod并处理响应 是否可以将最小pod实例计数设置为0 我发现目前Kubernetes不支持这一点,有没有办法做到这一点?是的。您可以使用 请参阅水平吊舱自动缩放示例:Kubernetes不支持这种方式,而nginx、apache等web服务器或应用程序引擎(如、)支持这种方式,甚至它们可以软启动,然后在第一个

我们有一个大部分时间都相当空闲的服务,因此,如果我们可以在服务30分钟内没有收到任何请求时删除所有pod,那么对我们来说将是非常好的,在下一次出现新请求时,Kubernetes将创建第一个pod并处理响应

是否可以将最小pod实例计数设置为0


我发现目前Kubernetes不支持这一点,有没有办法做到这一点?

是的。您可以使用


请参阅水平吊舱自动缩放示例:

Kubernetes不支持这种方式,而nginx、apache等web服务器或应用程序引擎(如、)支持这种方式,甚至它们可以软启动,然后在第一个请求到达时立即启动,其缺点是第一个请求总是比较慢。(Kubernetes吊舱不必以这种方式运行可能有一些原因,我可以看到很多设计更改,或者必须为这种非常特殊的情况创建一种新的工作负载类型)


如果吊舱处于空闲状态,它就不会消耗那么多资源。您可以调整pod的请求/限制值,以便请求少量CPU/内存,并将限制设置为更高数量的CPU/内存。pod始终运行的好处是,从理论上讲,您的第一个请求永远不需要等待很长时间才能得到响应。

HPA不会缩小到0个pod,最小pod可以是1(至少)。