Google cloud platform 为什么我的计算引擎实例要重新启动?

Google cloud platform 为什么我的计算引擎实例要重新启动?,google-cloud-platform,google-compute-engine,Google Cloud Platform,Google Compute Engine,我正在运行一个云负载均衡器,将传入的请求发送到两个CPE实例 它在某些天运行正常,而在另一些天,实例无明显原因地重新启动,因此所有进程(主要是tomcat)都被终止,用户收到错误 我没有运行可抢占的VM实例(我已根据检查) 如何找出实例重新启动的原因?这种经历越来越令人沮丧。 在切换到GCP之前,我曾经运行过一个廉价托管服务器集群多年,从来没有出现过任何问题,而且它要便宜得多。 我原以为我会获得更好的性能和更好的可扩展性,但如果整个设置无法实现,那就没有多大意义 如何获取实例重新启动的任何信息。

我正在运行一个云负载均衡器,将传入的请求发送到两个CPE实例

它在某些天运行正常,而在另一些天,实例无明显原因地重新启动,因此所有进程(主要是tomcat)都被终止,用户收到错误

我没有运行可抢占的VM实例(我已根据检查)

如何找出实例重新启动的原因?这种经历越来越令人沮丧。 在切换到GCP之前,我曾经运行过一个廉价托管服务器集群多年,从来没有出现过任何问题,而且它要便宜得多。 我原以为我会获得更好的性能和更好的可扩展性,但如果整个设置无法实现,那就没有多大意义


如何获取实例重新启动的任何信息。我在日志中找不到任何内容(无论是在负载平衡器中,还是在计算引擎日志中)。

可能是由于运行状况检查或任何其他问题(实时迁移、终止和自动重新启动事件)导致实例失败。也就是说,我建议您检查特定实例,以了解实例重新启动的原因。同时,我还建议您检查,这将帮助您了解并查看实时迁移、终止和自动重新启动此类事件的日志

您如何知道实例正在重新启动?您是否在实例上运行windows或linux?如果是linux,是否有引导日志告诉我们实例何时重新启动?这可能是一个自动缩放的故事,负载变得如此之低,以至于autoscaler决定将实例数减少到零?我正在实例上运行Linux。我在云控制台实例页面(当然还有用户抱怨服务中断的电子邮件)上看到它们重新启动。它们被重新启动了多次(大约20次左右),但只在特定的一天重新启动,日志中没有任何通知。有时它们运行了很多天都没有任何问题,但随后又重新启动了很多次。不知道如何调试这个问题。我想我会在负载平衡器的日志中看到一些东西。一旦转到堆栈驱动程序日志,然后可以指定受影响的实例名称以查看特定实例的日志,还可以提到时间范围。此外,您还可以通过在实例日志中使用本文()来使用此高级筛选器,我在实例日志中找到了感兴趣的信息:info:[0:{code:“STATUS\u MESSAGE”detail\u MESSAGE:“实例组管理器'projects/204806608852/zones/us-central1-f/instanceGroupManagers/ultradox libreoffice'在实例'projects/204806608852/zones/us-central1-f/instances/ultradox libreoffice lsjb'上启动了重新创建实例。原因:实例的当前操作为无,但运行状况不正常。“但是我在运行状况检查的日志中看不到任何内容?我建议运行状况检查不要太过激进,以允许实例组重建不健康的。请参阅“注意:使用单独的运行状况检查进行负载平衡和自动修复。”日志将帮助您跟踪实例中发生的情况。您可以在实例级别设置Stackdriver,这样您就可以拥有可能重新启动的日志或任何其他日志工具,这些工具将帮助您在删除实例后检索日志。