Amazon web services kubernetes工作节点上服务之间的连接失败

Amazon web services kubernetes工作节点上服务之间的连接失败,amazon-web-services,amazon-ec2,kubernetes,amazon-eks,Amazon Web Services,Amazon Ec2,Kubernetes,Amazon Eks,我有在AWS EKS集群上运行的Nodejs服务。集群有两个工作节点。服务与另一个服务连接 问题是,有时当我重新创建部署时,服务无法连接到另一个服务,而该服务在另一个工作节点上运行 例如:服务1在工作节点1上运行,服务2在工作节点2上运行。如果服务1作为service1:3001(内部DNS)运行,并且当服务2尝试连接该服务时,它将失败 我一次又一次的解决问题 解决方案1:更新AWS控制平面 eksctl utils update-kube-proxy --name acceptance --a

我有在AWS EKS集群上运行的Nodejs服务。集群有两个工作节点。服务与另一个服务连接

问题是,有时当我重新创建部署时,服务无法连接到另一个服务,而该服务在另一个工作节点上运行

例如:服务1在工作节点1上运行,服务2在工作节点2上运行。如果服务1作为service1:3001(内部DNS)运行,并且当服务2尝试连接该服务时,它将失败

我一次又一次的解决问题

解决方案1:更新AWS控制平面

eksctl utils update-kube-proxy --name acceptance --approve
eksctl utils update-aws-node --name acceptance --approve
eksctl utils update-coredns --name acceptance --approve
eksctl update cluster --name acceptance --approve
注意:
我做过一次,当时解决方案2和3不起作用

解决方案2:删除coredns吊舱,让它们自己启动

kubectl delete po coredns-workernode-1 coredns-workernode-2, 
**注意:*
我只在解决方案3不起作用时才这样做

解决方案3: 重新创建部署后再次重新启动服务

这些是我为解决服务之间的连接故障所做的解决方案

注意:当服务在同一工作节点上运行时,不会发生这种情况

更多信息

工作节点AMI:AMI-0b7127e7a2a38802a
EC2类型:t2。中等
库伯内特斯·弗森:1.13.10


这些似乎是临时解决方案,CoreDNS似乎无法正常工作。没有更多的故障排除方法来永久解决这个问题

嗨,失败是什么意思?它是否超时?(节点:21)未处理PromiserEjectionWarning:RequestError:Error:getaddrinfo eNotFind crm:3002类似于上面的,我的服务名称是crm,在这个错误中,您可以尝试使用curl
curl-v-k重新生成它吗https://crm:3002
来自不同的节点?所以我们可以确定它不是配置错误,这就是发生在我身上的情况