重新启动Azures Kubernetes群集VM会导致GPU问题
让我的pod启动并工作,使用GPU,一切正常,然后我在门户中重新启动AKS-VM。当执行此操作并重新启动pod时,它将永远挂起。当我运行重新启动Azures Kubernetes群集VM会导致GPU问题,azure,kubernetes,azure-aks,Azure,Kubernetes,Azure Aks,让我的pod启动并工作,使用GPU,一切正常,然后我在门户中重新启动AKS-VM。当执行此操作并重新启动pod时,它将永远挂起。当我运行kubectl description pod myFirstPod时,它说1 alpha.kubernetes.io/nvidia gpu 我做错了什么,或者什么是错的?是否必须删除并重新创建群集?可能是一个错误。你试过删除pod吗?谢谢你的回复!我运行了kubectl delete pod myFirstPod,试图申请一份新工作,但没有成功(这是删除它的正
kubectl description pod myFirstPod
时,它说1 alpha.kubernetes.io/nvidia gpu
我做错了什么,或者什么是错的?是否必须删除并重新创建群集?可能是一个错误。你试过删除pod吗?谢谢你的回复!我运行了
kubectl delete pod myFirstPod
,试图申请一份新工作,但没有成功(这是删除它的正确方法吗?)。在使用kubectl apply-f myFirstPod gpu应用作业后,我删除了AKS虚拟机并构建了一个新的虚拟机。yaml
我终于获得了CreatingContainer
,几分钟后运行了。您可以尝试使用kubectl delete deployment name
命令删除pod的部署。我就此联系了微软,我将在这里发布回复。