Kubernetes 库伯内特斯在OOM后休息

Kubernetes 库伯内特斯在OOM后休息,kubernetes,Kubernetes,在主节点上的OOM之后,我与Kubernetes面对这个问题。Kubernetes服务看起来正常,日志中没有任何错误或警告消息。但Kubernetes未能处理新部署,它是在OOM发生后创建的 我通过systemctl restart kube-*重新加载了Kubernetes。解决了这个问题,库伯内特斯开始正常工作 我只是想知道这是Kubernetes的预期行为还是bug?似乎问题不是由OOM引起的。无论发生与否,这都是由kube控制器引起的 如果我重新启动kube controller,Kub

在主节点上的OOM之后,我与Kubernetes面对这个问题。Kubernetes服务看起来正常,日志中没有任何错误或警告消息。但Kubernetes未能处理新部署,它是在OOM发生后创建的

我通过
systemctl restart kube-*
重新加载了Kubernetes。解决了这个问题,库伯内特斯开始正常工作


我只是想知道这是Kubernetes的预期行为还是bug?

似乎问题不是由OOM引起的。无论发生与否,这都是由kube控制器引起的


如果我重新启动kube controller,Kubernetes将正常开始进程部署和POD。

如果您可以共享kube controller的日志,那就太好了。但是,当api服务器崩溃/oomkille时,kubernetes的早期版本中可能存在潜在的同步问题(我记得我们在daemonset中看到过类似的问题,我已经向Kubernete社区提交了bug),但这种情况很少

与此同时,我们做了大量工作来准备kubernetes的制作:调整kubernetes和制作需要与kubernetes对话的其他微服务。希望这些博客文章能有所帮助:

这是我们用来调整kubernetes的30多个旋钮


这是关于确保集群稳定性的微服务行为的

“但Kubernetes未能处理新部署,而新部署是在OOM发生后创建的。”——当它未能处理
部署时,事件/日志是什么?