Google compute engine Google云计算引擎VM实例组始终自动修复到最大实例数

Google compute engine Google云计算引擎VM实例组始终自动修复到最大实例数,google-compute-engine,autoscaling,google-cloud-stackdriver,google-cloud-logging,google-cloud-monitoring,Google Compute Engine,Autoscaling,Google Cloud Stackdriver,Google Cloud Logging,Google Cloud Monitoring,我已经建立了一个Google Cloud Compute Engine VM实例组(实例数在2到5之间),并将自动修复配置为在3次健康检查失败后启动。这些实例是使用实例模板创建的,其中包含部署我的应用程序的启动脚本。但是,当我试图通过在一个vm上停止应用程序进程来测试自动修复时,失败的实例最终会在自动修复过程中被删除和替换,但在此过程中还会创建3个新实例。我还将实例组的自动修复初始延迟配置为600秒,因此我认为这不是问题所在 启用日志记录后,我检查了实例组的日志中的运行状况检查语句,我发现: 在

我已经建立了一个Google Cloud Compute Engine VM实例组(实例数在2到5之间),并将自动修复配置为在3次健康检查失败后启动。这些实例是使用实例模板创建的,其中包含部署我的应用程序的启动脚本。但是,当我试图通过在一个vm上停止应用程序进程来测试自动修复时,失败的实例最终会在自动修复过程中被删除和替换,但在此过程中还会创建3个新实例。我还将实例组的自动修复初始延迟配置为600秒,因此我认为这不是问题所在

启用日志记录后,我检查了实例组的日志中的运行状况检查语句,我发现:

  • 在运行状况检查状态中首次记录更改后,将执行删除实例操作,然后执行添加实例操作
  • 添加实例操作后,将记录另一个运行状况检查探测结果,运行状况状态从“未知”/“不健康”变为“超时”/“不健康”
  • 大约2分钟后会记录另外三个添加实例操作,这些操作在缩小比例后不久将被删除

  • 有人知道为什么会发生3个额外的添加实例操作吗?有没有可能避免这种情况?

    更新:通过增加自动缩放配置的冷却时间解决了此问题。

    更新:通过增加自动缩放配置的冷却时间解决了此问题。

    如OP所述,该问题通过调整解决。

    如OP所述,该问题通过调整解决