Google cloud platform 为什么我的计算引擎实例要重新启动？_Google Cloud Platform_Google Compute Engine

Google cloud platform 为什么我的计算引擎实例要重新启动？

google-cloud-platform google-compute-engine

Google cloud platform 为什么我的计算引擎实例要重新启动？,google-cloud-platform,google-compute-engine,Google Cloud Platform,Google Compute Engine,我正在运行一个云负载均衡器，将传入的请求发送到两个CPE实例它在某些天运行正常，而在另一些天，实例无明显原因地重新启动，因此所有进程（主要是tomcat）都被终止，用户收到错误我没有运行可抢占的VM实例（我已根据检查）如何找出实例重新启动的原因？这种经历越来越令人沮丧。在切换到GCP之前，我曾经运行过一个廉价托管服务器集群多年，从来没有出现过任何问题，而且它要便宜得多。我原以为我会获得更好的性能和更好的可扩展性，但如果整个设置无法实现，那就没有多大意义如何获取实例重新启动的任何信息。

我正在运行一个云负载均衡器，将传入的请求发送到两个CPE实例

它在某些天运行正常，而在另一些天，实例无明显原因地重新启动，因此所有进程（主要是tomcat）都被终止，用户收到错误

我没有运行可抢占的VM实例（我已根据检查）

如何找出实例重新启动的原因？这种经历越来越令人沮丧。在切换到GCP之前，我曾经运行过一个廉价托管服务器集群多年，从来没有出现过任何问题，而且它要便宜得多。我原以为我会获得更好的性能和更好的可扩展性，但如果整个设置无法实现，那就没有多大意义

如何获取实例重新启动的任何信息。我在日志中找不到任何内容（无论是在负载平衡器中，还是在计算引擎日志中）。

可能是由于运行状况检查或任何其他问题（实时迁移、终止和自动重新启动事件）导致实例失败。也就是说，我建议您检查特定实例，以了解实例重新启动的原因。同时，我还建议您检查，这将帮助您了解并查看实时迁移、终止和自动重新启动此类事件的日志

您如何知道实例正在重新启动？您是否在实例上运行windows或linux？如果是linux，是否有引导日志告诉我们实例何时重新启动？这可能是一个自动缩放的故事，负载变得如此之低，以至于autoscaler决定将实例数减少到零？我正在实例上运行Linux。我在云控制台实例页面（当然还有用户抱怨服务中断的电子邮件）上看到它们重新启动。它们被重新启动了多次（大约20次左右），但只在特定的一天重新启动，日志中没有任何通知。有时它们运行了很多天都没有任何问题，但随后又重新启动了很多次。不知道如何调试这个问题。我想我会在负载平衡器的日志中看到一些东西。一旦转到堆栈驱动程序日志，然后可以指定受影响的实例名称以查看特定实例的日志，还可以提到时间范围。此外，您还可以通过在实例日志中使用本文（）来使用此高级筛选器，我在实例日志中找到了感兴趣的信息：info:[0:{code:“STATUS\u MESSAGE”detail\u MESSAGE:“实例组管理器'projects/204806608852/zones/us-central1-f/instanceGroupManagers/ultradox libreoffice'在实例'projects/204806608852/zones/us-central1-f/instances/ultradox libreoffice lsjb'上启动了重新创建实例。原因：实例的当前操作为无，但运行状况不正常。“但是我在运行状况检查的日志中看不到任何内容？我建议运行状况检查不要太过激进，以允许实例组重建不健康的。请参阅“注意：使用单独的运行状况检查进行负载平衡和自动修复。”日志将帮助您跟踪实例中发生的情况。您可以在实例级别设置Stackdriver，这样您就可以拥有可能重新启动的日志或任何其他日志工具，这些工具将帮助您在删除实例后检索日志。