Tensorflow 池到0节点,因为即使pod未执行(使用gpu),它也无法将pod迁移到非gpu节点。请纠正我的理解。cpu的内存限制请求是否也适用于gpu节点?对于上述问题,我在pod中为gpu设置了内存限制,但无法部署。失败,错误为0/3节点可用:2 nvidia.co

Tensorflow 池到0节点,因为即使pod未执行(使用gpu),它也无法将pod迁移到非gpu节点。请纠正我的理解。cpu的内存限制请求是否也适用于gpu节点?对于上述问题,我在pod中为gpu设置了内存限制,但无法部署。失败,错误为0/3节点可用:2 nvidia.co,tensorflow,kubernetes,google-kubernetes-engine,Tensorflow,Kubernetes,Google Kubernetes Engine,池到0节点,因为即使pod未执行(使用gpu),它也无法将pod迁移到非gpu节点。请纠正我的理解。cpu的内存限制请求是否也适用于gpu节点?对于上述问题,我在pod中为gpu设置了内存限制,但无法部署。失败,错误为0/3节点可用:2 nvidia.com/gpu不足,3内存不足。您可以在这里看到pod错误。这是否意味着无法为gpu POD设置内存限制?从我链接的文档重新自动缩放:这将导致仅在gpu节点上调度请求gpu的POD,这可以实现更高效的自动缩放:如果没有足够的pod请求GPU,您的G


池到0节点,因为即使pod未执行(使用gpu),它也无法将pod迁移到非gpu节点。请纠正我的理解。cpu的内存限制请求是否也适用于gpu节点?对于上述问题,我在pod中为gpu设置了内存限制,但无法部署。失败,错误为0/3节点可用:2 nvidia.com/gpu不足,3内存不足。您可以在这里看到pod错误。这是否意味着无法为gpu POD设置内存限制?从我链接的文档重新自动缩放:
这将导致仅在gpu节点上调度请求gpu的POD,这可以实现更高效的自动缩放:如果没有足够的pod请求GPU,您的GPU节点可以快速缩小。
内存不适用于GPU内存。同意,但我的困惑是,假设pod(GPU)被调度到GPU。但它并没有做任何事情,因为并没有请求/事件存在,这导致pod执行gpu程序。现在在这种情况下,即使深度学习程序没有执行,但pod仍然被安排在gpu上。这不允许自动缩放将gpu节点池计数减少到0,因为K8s无法将此pod分配给非gpu机器。总之,我认为真正需要的是按需创建gpu pod并将其分配给可用的gpu,否则生成一个新的gpu实例并将新的pod分配给它。这个计划可行吗?
Message   Reason  First Seen  Last Seen   Count
Back-off restarting failed container    BackOff Jun 21, 2018, 3:18:15 PM    Jun 21, 2018, 4:16:42 PM    143
pulling image "nkumar15/mnist"  Pulling Jun 21, 2018, 3:11:33 PM    Jun 21, 2018, 3:24:52 PM    5
Successfully pulled image "nkumar15/mnist"  Pulled  Jun 21, 2018, 3:12:46 PM    Jun 21, 2018, 3:24:52 PM    5
Created container   Created Jun 21, 2018, 3:12:46 PM    Jun 21, 2018, 3:24:52 PM    5
Started container   Started Jun 21, 2018, 3:12:46 PM    Jun 21, 2018, 3:24:52 PM    5