Amazon ec2 AmazonEC2高可用性 以下场景:

Amazon ec2 AmazonEC2高可用性 以下场景:,amazon-ec2,cloud,high-availability,configuration-management,redundancy,Amazon Ec2,Cloud,High Availability,Configuration Management,Redundancy,有一种全天候运行的服务,停机时间非常昂贵。此服务部署在AmazonEC2上。我知道在两个不同的可用性区域甚至两个不同的区域部署应用程序以防止单点故障的重要性。但是 我的问题是,是否存在任何可能影响应用程序冗余的其他配置问题。我的意思也是指错误的配置(例如DNS的错误配置,在发生故障转移时会使其失败) 为了确保清楚,我正在尝试创建一个应该测试的验证列表,以确保部署在EC2上的应用程序的冗余性 谢谢大家! 作为警告,仅仅因为您将服务放在两个可用性区域并不意味着您是容错的 例如,我的一个设置是在负载平

有一种全天候运行的服务,停机时间非常昂贵。此服务部署在AmazonEC2上。我知道在两个不同的可用性区域甚至两个不同的区域部署应用程序以防止单点故障的重要性。但是

我的问题是,是否存在任何可能影响应用程序冗余的其他配置问题。我的意思也是指错误的配置(例如DNS的错误配置,在发生故障转移时会使其失败)

为了确保清楚,我正在尝试创建一个应该测试的验证列表,以确保部署在EC2上的应用程序的冗余性


谢谢大家!

作为警告,仅仅因为您将服务放在两个可用性区域并不意味着您是容错的

例如,我的一个设置是在负载平衡器上有4台服务器,其中us-east-1a us-east-1b作为两个区域。几个月前亚马逊的宕机导致我的软件出现一些宕机,因为负载平衡器工作不正常。他们仍在转发请求,但我在其中一个区域中的两个死实例也仍在接收请求。负载平衡器逻辑的一部分是删除死实例,但由于负载平衡器队列被积压,这些实例从未被删除。在我的设置中,每个区域有两个负载平衡器,因此对一个负载平衡器的所有请求都超时,因为没有实例响应请求。幸运的是,浏览器使用第二个负载均衡器重试了请求,因此我的提要仍在加载,但速度非常慢

我的建议是,如果您选择在两个区域上只使用两个可用性区域,请确保您的系统不依赖于另一个可用性区域的任何部分,甚至不依赖于负载平衡器。对我来说,在不同的区域启动两个完全独立的系统是不值得的,所以我无法避免将来再次出现这个问题。但是,如果你的软件非常关键,失去服务1小时将支付运行额外硬件的费用,那么正确设置额外服务器绝对值得

我还建议您支付AWS支持费用,并与他们的工程师合作,以确保您的设计在高可用性方面没有任何缺陷

我讨论的问题概述: