Amazon web services 检测坏的AWS实例

Amazon web services 检测坏的AWS实例,amazon-web-services,amazon-ec2,Amazon Web Services,Amazon Ec2,在检测大型实例集群中的坏实例时,有哪些常见做法 坏实例示例:与群集中的其他实例相比,该实例的CPU使用率非常高,但该实例所做的工作量(处理的HTTP请求数)几乎与其他实例所做的工作量相同。您是在谈论IO问题吗?Amazon保证根据您选择的实例提供CPU和内存量。EBS和本地磁盘性能是另一个问题。很少有处理器与AWS实例过度排队的情况,这可能会产生如您所描述的症状,但一般情况下不会“变坏”。对于给定的实例,在硬件级别上总是可能出现问题,但这也是罕见的,而且症状会有很大的不同。@CIGuy您是对的,

在检测大型实例集群中的坏实例时,有哪些常见做法


坏实例示例:与群集中的其他实例相比,该实例的CPU使用率非常高,但该实例所做的工作量(处理的HTTP请求数)几乎与其他实例所做的工作量相同。

您是在谈论IO问题吗?Amazon保证根据您选择的实例提供CPU和内存量。EBS和本地磁盘性能是另一个问题。很少有处理器与AWS实例过度排队的情况,这可能会产生如您所描述的症状,但一般情况下不会“变坏”。对于给定的实例,在硬件级别上总是可能出现问题,但这也是罕见的,而且症状会有很大的不同。@CIGuy您是对的,这些实例没有“变坏”。从他们被旋转的时候起,他们就很糟糕。当你处理一个巨大的集群时,很有可能你会有一些这样的集群。我正在考虑一些库,它们将检测这些并重新启动实例。我想重新启动会给你一个新的例子。你见过Netflix的看门人猴子吗?它设计用于检测和终止未使用的实例,但它使用一组可以扩展的规则,因此您可以创建一个规则集来检测坏实例。此外,如果终止实例,则无法“重新启动”。当然,您可以创建一个新实例,它将与坏实例分开,只是您可能使用了相同的基本AMI。