Amazon web services AWS EKS工作节点正在运行”;“未准备就绪”;

Amazon web services AWS EKS工作节点正在运行”;“未准备就绪”;,amazon-web-services,kubernetes,amazon-eks,Amazon Web Services,Kubernetes,Amazon Eks,我正在AWS上创建一个新的EKS Kubernetes群集 当我部署工作负载(从现有集群迁移)时,Kubelet停止发布节点状态,所有工作节点在一分钟内变为“NotReady” 我假设集群中的错误配置不应该导致节点崩溃——但显然确实如此 集群中的错误配置真的会使AWS EKS工作节点“未就绪”吗?在什么情况下会发生这种情况,是否有一些经验法则?CPU负载过高?kube系统中的吊舱崩溃 您可以尝试kubectl description node$BAD\u node或ssh到node,然后尝试su

我正在AWS上创建一个新的EKS Kubernetes群集

当我部署工作负载(从现有集群迁移)时,Kubelet停止发布节点状态,所有工作节点在一分钟内变为“NotReady”

我假设集群中的错误配置不应该导致节点崩溃——但显然确实如此


集群中的错误配置真的会使AWS EKS工作节点“未就绪”吗?在什么情况下会发生这种情况,是否有一些经验法则?CPU负载过高?kube系统中的吊舱崩溃

您可以尝试
kubectl description node$BAD\u node
或ssh到node,然后尝试
sudo dmesg-T

尝试在节点上重新启动kubelet
/etc/init.d/kubelet restart

或删除节点(先排放)

kubectl排水管
kubectl删除节点

这是一个基于评论中的解决方案的社区wiki答案,为了更好的可见性而发布。请随意扩展它


正如@gusto2所建议的,问题在于kubelet吊舱无法调用API服务器@stackoverflowjakob late确认工作节点和主节点之间的连接由于配置错误而中断,并通过检查->EKS status发现该连接。

据我所知,该状态发生在kubelet pod无法调用API服务器时(反之亦然),因此e。G将限制性网络策略应用于kube系统命名空间,第。组或子网可能导致节点“未就绪”。过度使用内存也会产生不良影响。也许您可以一步一步地部署各个配置,看看是什么导致了这种状态。Kubelet日志绝对有助于确定您需要提供更多信息的问题。您正在使用EKS,您有配额吗?您能描述一下节点并提供输出吗?你没有达到你的$balance吗?@gusto2“这种状态发生在kubelet吊舱无法调用API服务器时”-是的,事实就是这样!非常感谢。最后,在AWS控制台中仔细查看EKS的运行状况,我发现工作节点和主节点之间的连接由于一些VPC错误配置而中断。
systemctl restart kubelet
kubectl drain <node-name>
kubectl delete node <node-name>