Google cloud platform 如何加快AI平台培训工作队列?
每当我向AI平台提交培训作业时,我都必须等待大约5-10分钟,等待我的培训作业排队后才能开始。这发生在我提交培训包以及提交docker映像时 日志类似于:Google cloud platform 如何加快AI平台培训工作队列?,google-cloud-platform,google-cloud-ml,gcp-ai-platform-training,Google Cloud Platform,Google Cloud Ml,Gcp Ai Platform Training,每当我向AI平台提交培训作业时,我都必须等待大约5-10分钟,等待我的培训作业排队后才能开始。这发生在我提交培训包以及提交docker映像时 日志类似于: T0: "Job creation request has been successfully validated." T0 + 1s: "Waiting for job to be provisioned." T0 + 1s: "Job trainer_20200612_121714 is queued." T0 +
T0: "Job creation request has been successfully validated."
T0 + 1s: "Waiting for job to be provisioned."
T0 + 1s: "Job trainer_20200612_121714 is queued."
T0 + 3s: "Waiting for training program to start."
T0 + 7min: My training job finally starts
这完全站在谷歌一边吗?我的终端是否有任何设置会影响这一点?您所说的“资源调配后5-10分钟”是什么意思?你在日志上看到了什么,或者在屏幕上看到了什么。我将日志添加到我的问题中。我说的“供应”实际上是指排队。更新了此命令。您使用什么命令行?您是否为培训请求特殊硬件?在本例中,我只是使用了
gcloud ai平台作业提交培训$JOB\u NAME--region$region--master image uri$image\u uri
。不,我想这很正常。当我直接在python/Tensorflow中运行没有容器的培训时,开始培训需要2分钟。使用容器映像进行培训可能需要更长的时间。您所说的“调配后5-10分钟”是什么意思?你在日志上看到了什么,或者在屏幕上看到了什么。我将日志添加到我的问题中。我说的“供应”实际上是指排队。更新了此命令。您使用什么命令行?您是否为培训请求特殊硬件?在本例中,我只是使用了gcloud ai平台作业提交培训$JOB\u NAME--region$region--master image uri$image\u uri
。不,我想这很正常。当我直接在python/Tensorflow中运行没有容器的培训时,开始培训需要2分钟。培训集装箱形象的工作可能需要更长的时间。