Warning: file_get_contents(/data/phpspider/zhask/data//catemap/6/apache/9.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Google cloud platform 如何加快AI平台培训工作队列?_Google Cloud Platform_Google Cloud Ml_Gcp Ai Platform Training - Fatal编程技术网

Google cloud platform 如何加快AI平台培训工作队列?

Google cloud platform 如何加快AI平台培训工作队列?,google-cloud-platform,google-cloud-ml,gcp-ai-platform-training,Google Cloud Platform,Google Cloud Ml,Gcp Ai Platform Training,每当我向AI平台提交培训作业时,我都必须等待大约5-10分钟,等待我的培训作业排队后才能开始。这发生在我提交培训包以及提交docker映像时 日志类似于: T0: "Job creation request has been successfully validated." T0 + 1s: "Waiting for job to be provisioned." T0 + 1s: "Job trainer_20200612_121714 is queued." T0 +

每当我向AI平台提交培训作业时,我都必须等待大约5-10分钟,等待我的培训作业排队后才能开始。这发生在我提交培训包以及提交docker映像时

日志类似于:

T0:        "Job creation request has been successfully validated."
T0 + 1s:   "Waiting for job to be provisioned."
T0 + 1s:   "Job trainer_20200612_121714 is queued."
T0 + 3s:   "Waiting for training program to start."

T0 + 7min:  My training job finally starts

这完全站在谷歌一边吗?我的终端是否有任何设置会影响这一点?

您所说的“资源调配后5-10分钟”是什么意思?你在日志上看到了什么,或者在屏幕上看到了什么。我将日志添加到我的问题中。我说的“供应”实际上是指排队。更新了此命令。您使用什么命令行?您是否为培训请求特殊硬件?在本例中,我只是使用了
gcloud ai平台作业提交培训$JOB\u NAME--region$region--master image uri$image\u uri
。不,我想这很正常。当我直接在python/Tensorflow中运行没有容器的培训时,开始培训需要2分钟。使用容器映像进行培训可能需要更长的时间。您所说的“调配后5-10分钟”是什么意思?你在日志上看到了什么,或者在屏幕上看到了什么。我将日志添加到我的问题中。我说的“供应”实际上是指排队。更新了此命令。您使用什么命令行?您是否为培训请求特殊硬件?在本例中,我只是使用了
gcloud ai平台作业提交培训$JOB\u NAME--region$region--master image uri$image\u uri
。不,我想这很正常。当我直接在python/Tensorflow中运行没有容器的培训时,开始培训需要2分钟。培训集装箱形象的工作可能需要更长的时间。