Google cloud platform 是否仍然需要坚持配额为20.0的CPU并提交作业?

Google cloud platform 是否仍然需要坚持配额为20.0的CPU并提交作业?,google-cloud-platform,gcp-ai-platform-training,Google Cloud Platform,Gcp Ai Platform Training,每当我试图使用命令向gcloud提交培训作业时 gcloud ml-engine jobs submit training 它给出的配额错误是 The requested 60.0 CPUs exceeds the allowed maximum of 20.0. 即使是我也从未在命令中定义过60.0 CPU。根据谷歌的说法,我们需要增加配额来实现这一目标。 有没有办法坚持配额20.0 CPU并在GCP上培训型号?根据AI平台CPU配额 提到控制台可以请求某些配额,看起来AI平台CPU配额不

每当我试图使用命令向gcloud提交培训作业时

gcloud ml-engine jobs submit training
它给出的配额错误是

The requested 60.0 CPUs exceeds the allowed maximum of 20.0.
即使是我也从未在命令中定义过60.0 CPU。根据谷歌的说法,我们需要增加配额来实现这一目标。 有没有办法坚持配额20.0 CPU并在GCP上培训型号?

根据AI平台CPU配额

提到控制台可以请求某些配额,看起来AI平台CPU配额不在其中;因此,您可以通过此命令为培训工作(默认为20)请求AI平台CPU,并解释此过程


最后但并非最不重要的一点是,升级是必要的。我不太确定这是否是您的情况,如果您已经升级,您可以继续请求更多配额。

我不确定这是否是您的问题解决方案,但以下是我在获得以下信息时所做的:

请求的N个CPU超过了允许的最大值20.0。

gcloud ai平台作业提交培训
。根据和链接,您可以将
--scale tier
参数传递到
submit training
命令,该命令控制工作的某些规格,包括工人数量。在这种情况下,如果您将
--scale tier
设置为STANDARD、PREMIUM或CUSTOM,则CPU工作人员将相应地缩放到新的数字(例如,在您的情况下,它是60.0个CPU)

因为基本层是“单工作实例”,所以只需切换到

gcloud ai平台作业提交培训--扩展层基础-[GPU|TPU]

应该解决这个配额问题。关于增加你们的配额的观点是正确的,但据我所知,在你们的情况下,不需要更多的工人


否则,如果您想加快培训速度,则应查看自定义层和workerCount参数,该参数指定要使用的工人数量(更多信息)。

您所在的地区是什么?您提交的所有参数是什么?您的表格与此页面链接,请更新,我的应用程序