Amazon web services kubernetes工作节点上服务之间的连接失败_Amazon Web Services_Amazon Ec2_Kubernetes_Amazon Eks

Amazon web services kubernetes工作节点上服务之间的连接失败

amazon-web-services amazon-ec2 kubernetes

Amazon web services kubernetes工作节点上服务之间的连接失败,amazon-web-services,amazon-ec2,kubernetes,amazon-eks,Amazon Web Services,Amazon Ec2,Kubernetes,Amazon Eks,我有在AWS EKS集群上运行的Nodejs服务。集群有两个工作节点。服务与另一个服务连接问题是，有时当我重新创建部署时，服务无法连接到另一个服务，而该服务在另一个工作节点上运行例如：服务1在工作节点1上运行，服务2在工作节点2上运行。如果服务1作为service1:3001（内部DNS）运行，并且当服务2尝试连接该服务时，它将失败我一次又一次的解决问题解决方案1:更新AWS控制平面 eksctl utils update-kube-proxy --name acceptance --a

我有在AWS EKS集群上运行的Nodejs服务。集群有两个工作节点。服务与另一个服务连接

问题是，有时当我重新创建部署时，服务无法连接到另一个服务，而该服务在另一个工作节点上运行

例如：服务1在工作节点1上运行，服务2在工作节点2上运行。如果服务1作为service1:3001（内部DNS）运行，并且当服务2尝试连接该服务时，它将失败

我一次又一次的解决问题

解决方案1:更新AWS控制平面

eksctl utils update-kube-proxy --name acceptance --approve
eksctl utils update-aws-node --name acceptance --approve
eksctl utils update-coredns --name acceptance --approve
eksctl update cluster --name acceptance --approve

注意：

我做过一次，当时解决方案2和3不起作用

解决方案2:删除coredns吊舱，让它们自己启动

kubectl delete po coredns-workernode-1 coredns-workernode-2,

**注意：*

我只在解决方案3不起作用时才这样做

解决方案3: 重新创建部署后再次重新启动服务

这些是我为解决服务之间的连接故障所做的解决方案

注意：当服务在同一工作节点上运行时，不会发生这种情况

更多信息：

工作节点AMI:AMI-0b7127e7a2a38802a
EC2类型：t2。中等
库伯内特斯·弗森：1.13.10

这些似乎是临时解决方案，CoreDNS似乎无法正常工作。没有更多的故障排除方法来永久解决这个问题

嗨，失败是什么意思？它是否超时？（节点：21）未处理PromiserEjectionWarning:RequestError:Error:getaddrinfo eNotFind crm:3002类似于上面的，我的服务名称是crm，在这个错误中，您可以尝试使用curl

curl-v-k重新生成它吗https://crm:3002

来自不同的节点？所以我们可以确定它不是配置错误，这就是发生在我身上的情况