Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/kubernetes/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Amazon web services Kubernetes调度程序、API服务器和控制器管理器容器未在群集中运行_Amazon Web Services_Kubernetes_Kubectl_Kubeadm - Fatal编程技术网

Amazon web services Kubernetes调度程序、API服务器和控制器管理器容器未在群集中运行

Amazon web services Kubernetes调度程序、API服务器和控制器管理器容器未在群集中运行,amazon-web-services,kubernetes,kubectl,kubeadm,Amazon Web Services,Kubernetes,Kubectl,Kubeadm,大约一个月前,我在AWS中使用。我一直很高兴地在上面安装应用程序,直到最近,我才注意到我的一些pod运行不正常,有些处于“终止”状态或无法初始化 在阅读了一些故障排除指南之后,我意识到“kube系统”名称空间中的核心系统pod中有一些没有运行:kube apiserver、kube controller manager和kube scheduler。这将解释为什么我的部署不再按预期扩展,以及为什么终止POD不会删除。但是,我仍然可以使用kubectl运行命令和查看集群状态。请参见下面的屏幕截图:

大约一个月前,我在AWS中使用。我一直很高兴地在上面安装应用程序,直到最近,我才注意到我的一些pod运行不正常,有些处于“终止”状态或无法初始化

在阅读了一些故障排除指南之后,我意识到“kube系统”名称空间中的核心系统pod中有一些没有运行:kube apiserver、kube controller manager和kube scheduler。这将解释为什么我的部署不再按预期扩展,以及为什么终止POD不会删除。但是,我仍然可以使用kubectl运行命令和查看集群状态。请参见下面的屏幕截图:

不确定从何处着手缓解这一问题。我已经尝试重新启动服务器,我已经用systemctl停止并重新启动了kubeadm,我还尝试手动删除/var/lib/kubelet/pods中的pods。非常感谢您的帮助

编辑:我刚刚意识到我的一些流量可能会被我们在工作节点上安装的名为Twistlock的容器安全工具阻塞。我将与他们协商,因为这可能会阻塞节点上的连接

我意识到在收集每个kubernetes吊舱的日志时可能存在连接问题,请参阅下面的日志摘录(我已编辑了IPs):


编辑:在与我们的Twistlock供应商联系后,我已确认连接问题不是由于Twistlock造成的,因为目前还没有设置任何策略来实际阻止或隔离容器。我对集群的问题仍然存在

你有没有通过kubectl日志检查吊舱日志?有什么有用的吗?是的,我只是一次又一次检查了它们,并发布了集群内的连接肯定存在一些问题,可能是由于我们的容器安全工具。请看我的最新编辑。
kubectl logs kube-controller-manager-ip-*************.us-east-2.compute.internal -n kube-system
E0723 18:33:37.056730       1 route_controller.go:117] Couldn't reconcile node routes: error listing routes: unable to find route table for AWS cluster: kubernetes


kubectl -n kube-system logs kube-apiserver-ip-***************.us-east-2.compute.internal
I0723 18:38:23.380163       1 logs.go:49] http: TLS handshake error from ********: EOF
I0723 18:38:27.511654       1 logs.go:49] http: TLS handshake error from ********: EOF


kubectl -n kube-system logs kube-scheduler-ip-*******.us-east-2.compute.internal
E0723 15:31:54.397921       1 reflector.go:205] k8s.io/kubernetes/vendor/k8s.io/client-go/informers/factory.go:87: Failed to list *v1beta1.ReplicaSet: Get https://**********:6443/apis/extensions/v1beta1/replicasets?limit=500&resourceVersion=0: dial tcp ************: getsockopt: connection refused
E0723 15:31:54.398008       1 reflector.go:205] k8s.io/kubernetes/vendor/k8s.io/client-go/informers/factory.go:87: Failed to list *v1.Node: Get https://*********/api/v1/nodes?limit=500&resourceVersion=0: dial tcp ********:6443: getsockopt: connection refused
E0723 15:31:54.398075       1 reflector.go:205] k8s.io/kubernetes/vendor/k8s.io/client-go/informers/factory.go:87: Failed to list *v1.ReplicationController: Get https://************8:6443/api/v1/replicationcontrollers?limit=500&resourceVersion=0: dial tcp ***********:6443: getsockopt: connection refused
E0723 15:31:54.398207       1 reflector.go:205] k8s.io/kubernetes/vendor/k8s.io/client-go/informers/factory.go:87: Failed to list *v1.Service: Get https://************:6443/api/v1/services?limit=500&resourceVersion=0: dial tcp ***********:6443: getsockopt: connection refused