Amazon web services AWS ELB延迟问题

Amazon web services AWS ELB延迟问题,amazon-web-services,amazon-ec2,amazon-elb,aws-rds,Amazon Web Services,Amazon Ec2,Amazon Elb,Aws Rds,我有两台带有Ubuntu环境的c3.2x大型EC2机器,都在us-west-2a AZ。两者都包含来自AWS RDS(db.r3.2xlarge)的mySQL数据库的相同代码。这两个实例都添加到ELB。两者都有一个一天运行两次的cron ELB已配置为在阈值超过5.0时发出警报。这两个实例的CPU利用率平均为30-50。在高峰时段达到100%持续一两分钟,然后恢复正常。但ELB每天不断发出三次警报。此时,这两个实例都已完成 CPU - ~50% Memory - total - 149

我有两台带有Ubuntu环境的c3.2x大型EC2机器,都在us-west-2a AZ。两者都包含来自AWS RDS(db.r3.2xlarge)的mySQL数据库的相同代码。这两个实例都添加到ELB。两者都有一个一天运行两次的cron

ELB已配置为在阈值超过5.0时发出警报。这两个实例的CPU利用率平均为30-50。在高峰时段达到100%持续一两分钟,然后恢复正常。但ELB每天不断发出三次警报。此时,这两个实例都已完成

CPU     - ~50%
Memory  - total - 14979
          used  - ~6000
          free  - ~9000
RDS CPU - ~30%
          Connections - 200 to 300 /5,000
根据这一点,我没有发现任何错误的例子。但延迟仍然达到峰值,两个实例都没有响应

到目前为止,我只是从负载平衡器中删除一个实例,重新启动apache,然后重新加载它,并对其他实例执行相同的操作。这项工作做得非常好,实例和ELB在接下来的6-10个小时内工作良好。但这是不可接受的,因为每天有两到三次必须维护服务器,需要它重新启动

我需要知道,是否有任何错误或需要采取任何步骤来解决这个问题


根据您的问题:不清楚ELB警报在监控什么。5.0500秒

我猜发生的情况是,当CPU峰值达到100%时,位于负载平衡器后面的服务响应缓慢/没有响应。警报被触发

更糟糕的是,如果只有一个实例失败(假设cron作业不同时运行),ELB将使该实例停止服务,而另一个实例将占用所有流量。如果一个实例无法获取所有流量,这意味着第二个实例将失败并触发警报


为什么需要在与服务相同的机器上运行cron作业?把它从这些机器上移开是一种选择吗?另外:增加ELB健康检查超时是一种选择吗?

谢谢您的回复。。。1.ELB警报-5000s | 2。当警报警报| 3时,两个实例的CPU利用率平均为50%。我认为cron计划只运行两次,而且不占用太多资源,因为其中的一些10-20次更新查询和一些文件写入操作在不到10秒内完成。我提到要确保除此之外没有cron在运行。您收到的500是什么?(错误?)这是失败的应用程序吗?您是否为在EC2实例上运行的负载平衡器和应用程序设置了日志?5000s是平均延迟(毫秒)。是的,应用程序在EC2实例中运行-c3.2xlargegot。那么一个请求需要5000多秒?如何配置负载平衡器?你们有日志吗?是的,正如AWS网站上的定义所说。我不清楚你的问题——“负载平衡器配置”是的,它已经配置好了,而且服务最好。一旦apache服务器重新启动,两个实例都能正常工作为问题添加了图像