Kubernetes 如何根据负载自动调整吊舱数量？_Kubernetes_Kubernetes Helm

Kubernetes 如何根据负载自动调整吊舱数量？

kubernetes

Kubernetes 如何根据负载自动调整吊舱数量？,kubernetes,kubernetes-helm,Kubernetes,Kubernetes Helm,我们有一个大部分时间都相当空闲的服务，因此，如果我们可以在服务30分钟内没有收到任何请求时删除所有pod，那么对我们来说将是非常好的，在下一次出现新请求时，Kubernetes将创建第一个pod并处理响应是否可以将最小pod实例计数设置为0 我发现目前Kubernetes不支持这一点，有没有办法做到这一点？是的。您可以使用请参阅水平吊舱自动缩放示例：Kubernetes不支持这种方式，而nginx、apache等web服务器或应用程序引擎（如、）支持这种方式，甚至它们可以软启动，然后在第一个

我们有一个大部分时间都相当空闲的服务，因此，如果我们可以在服务30分钟内没有收到任何请求时删除所有pod，那么对我们来说将是非常好的，在下一次出现新请求时，Kubernetes将创建第一个pod并处理响应

是否可以将最小pod实例计数设置为0

我发现目前Kubernetes不支持这一点，有没有办法做到这一点？

是的。您可以使用

请参阅水平吊舱自动缩放示例：

Kubernetes不支持这种方式，而nginx、apache等web服务器或应用程序引擎（如、）支持这种方式，甚至它们可以软启动，然后在第一个请求到达时立即启动，其缺点是第一个请求总是比较慢。（Kubernetes吊舱不必以这种方式运行可能有一些原因，我可以看到很多设计更改，或者必须为这种非常特殊的情况创建一种新的工作负载类型）

如果吊舱处于空闲状态，它就不会消耗那么多资源。您可以调整pod的请求/限制值，以便请求少量CPU/内存，并将限制设置为更高数量的CPU/内存。pod始终运行的好处是，从理论上讲，您的第一个请求永远不需要等待很长时间才能得到响应。

HPA不会缩小到0个pod，最小pod可以是1（至少）。