Google cloud platform GCE实例组在区域\u资源\u池\u中滞留数小时

Google cloud platform GCE实例组在区域\u资源\u池\u中滞留数小时,google-cloud-platform,autoscaling,Google Cloud Platform,Autoscaling,我有一个实例组配置为在所有区域部署:“europe-west3(3/3区域)”。实例重新分发处于“打开”状态。自动缩放和自动修复处于“关闭”状态(开发环境)。实例数为1。谷歌云状态仪表板显示一切正常 今天我试着换一个。早上一次,晚上一次。两次尝试都未能创建新VM,原因是: “项目/xxx/zones/europe-west3-c”区域没有足够的资源来满足请求。请尝试其他区域,或稍后再试 为什么GCE实例组不自动选择一个有足够资源的合适区域?它在同一区域重试数小时。我可以在“错误”选项卡中看到日志

我有一个
实例组
配置为在所有区域部署:“europe-west3(3/3区域)”。实例重新分发处于“打开”状态。自动缩放和自动修复处于“关闭”状态(开发环境)。实例数为1。谷歌云状态仪表板显示一切正常

今天我试着换一个。早上一次,晚上一次。两次尝试都未能创建新VM,原因是:

“项目/xxx/zones/europe-west3-c”区域没有足够的资源来满足请求。请尝试其他区域,或稍后再试

为什么GCE
实例组不自动选择一个有足够资源的合适区域?它在同一区域重试数小时。我可以在“错误”选项卡中看到日志


这是我的
实例组
配置中的一个bug,还是GCE中的bug?您是否认为自动缩放也会以同样荒谬的方式运行,因此也不可靠?

如果由于(区域资源池耗尽或区域资源池耗尽,带有详细信息)而无法创建实例,则表示该区域当前无法满足您的请求。此错误是由于区域中的计算引擎资源不可用,而不是由于您的计算引擎配额

以下是一些有助于缓解压力的提示:

  • 由于这种情况是暂时的,并且可能会根据需求波动而频繁更改,请稍后重试您的请求

  • 如果可能,尝试在该区域或其他区域的其他区域中创建资源
  • 如果可能,请更改您请求的VM的形状。得到较小的机器类型比得到较大的机器类型更容易。对您的请求进行更改,例如减少GPU的数量或使用内存或VCPU更少的自定义VM,可能会允许您的请求继续
  • 使用计算引擎保留在区域内保留资源,以确保所需资源在需要时可用
  • 如果您试图创建一个可抢占的实例,请记住,可抢占的虚拟机是备用容量,因此在需求高峰期可能无法获得
  • 如果在请求新资源时收到“未找到”或“区域内不存在”错误,则表示该区域不提供您请求的资源或计算机类型。请参见区域和分区,以了解每个分区中有哪些功能可用

  • 建议跨多个区域和区域部署和平衡工作负载,以降低停机的可能性,并在需要快速扩展时访问多个资源池。请阅读概述如何在谷歌云平台上构建弹性和可扩展架构的文档。请注意,您目前正在使用谷歌云点播服务,但没有容量保证。我们现在提供了一个名为“预订”的功能,可以保证谷歌云的容量,有关如何使用此功能的详细信息,请参阅文档。

    这不是您的配置或谷歌云中的错误。问题是资源可用性。实例的大小是多少?实例越小(越便宜),需求就越大。尝试较大的实例大小或切换资源类型可用性较高的区域。“如果可能,尝试在另一个区域中创建资源”--问题是实例组会自动管理VM。您不能手动选择VM的创建位置。我希望算法会在下一个有可用资源的区域重试。FTR,我通过将实例组的大小调整为2个vm来“修复”这个问题。这在下一个可用区域“europe-west3-a”中创建了第二个VM。然后,我删除了“europe-west3-c”中卡住的实例,并将实例组重新调整为1个VM。“如果可能,尝试在另一个区域中创建资源”——问题是实例组自动管理VM。您不能手动选择VM的创建位置。我希望算法在下一个有可用资源的区域重试。