Google compute engine 为什么我的GCE实例每6小时自动重启一次?

Google compute engine 为什么我的GCE实例每6小时自动重启一次?,google-compute-engine,Google Compute Engine,我有以下设置: SSD磁盘上可访问HTTP的n1-standard-1实例的实例模板 实例组,具有80/443的命名端口,在最小/最大=2/10个实例、目标CPU=60%、冷却=60秒和初始延迟=600秒时启用自动缩放 每10秒对端口80进行一次组运行状况检查,阈值为3次尝试 GCE HTTP(S)负载平衡器,上面的组作为HTTP后端,最大CPU=80%,运行状况检查与上面为该组定义的相同 其他一切都是默认的。我从我的图表中看到,我的2个实例经常无明显原因地重新启动。这两个实例每6小时重新启动一

我有以下设置:

  • SSD磁盘上可访问HTTP的n1-standard-1实例的实例模板
  • 实例组,具有80/443的命名端口,在最小/最大=2/10个实例、目标CPU=60%、冷却=60秒和初始延迟=600秒时启用自动缩放
  • 每10秒对端口80进行一次组运行状况检查,阈值为3次尝试
  • GCE HTTP(S)负载平衡器,上面的组作为HTTP后端,最大CPU=80%,运行状况检查与上面为该组定义的相同
  • 其他一切都是默认的。我从我的图表中看到,我的2个实例经常无明显原因地重新启动。这两个实例每6小时重新启动一次,但间隔一小时,因此它们至少不会同时停机。实例模板是由实例的磁盘制作的,该实例在自动缩放组之外可靠地运行了数月(即没有定期、无法解释的重新启动)。我从未见过我的实例在LB仪表板中被列为不健康,但如果我不得不猜测,我会猜测我的健康检查不知何故配置错误。谢谢


    运行“gcloud计算操作列表”会产生类型为“compute.instances.repair.recreateInstance”的事件,这些事件与定期重启完全对应。我不知道为什么会发生这种情况,也没有在搜索中找到任何线索。

    您的实例已重新启动,因为它们可能不健康。请检查所有实例的返回是否正常。如果不是,可能是您的服务器出现了这种情况,也可能是防火墙在130.211.0.0/22()范围内出现了一些配置错误。

    感谢您的调试步骤。问题自行消失,但如果它再次出现,我将尝试这个。当天发生了大规模、协调的DDoS攻击,可能导致异常的网络延迟。