无法在带有Docker驱动程序的Minikube上使用GPU

无法在带有Docker驱动程序的Minikube上使用GPU,docker,gpu,minikube,nvidia-docker,Docker,Gpu,Minikube,Nvidia Docker,目标: 我试图在使用默认Docker驱动程序的Minikube集群上使用Nvidia GPU功能 问题: 我可以使用默认的docker上下文使用nvidia docker,但是当切换到minikube docker env时,我得到以下错误: $docker run——GPU所有nvidia/cuda:10.0-base nvidia smi docker:来自守护程序的错误响应:无法选择功能为:[[gpu]]的设备驱动程序“”。 等待容器时出错[0000]:上下文已取消 环境: Ubunt

目标:

我试图在使用默认Docker驱动程序的Minikube集群上使用Nvidia GPU功能

问题:

我可以使用默认的
docker
上下文使用
nvidia docker
,但是当切换到
minikube docker env
时,我得到以下错误:

$docker run——GPU所有nvidia/cuda:10.0-base nvidia smi
docker:来自守护程序的错误响应:无法选择功能为:[[gpu]]的设备驱动程序“”。
等待容器时出错[0000]:上下文已取消
环境:

  • Ubuntu 18.04
  • Minikube v1.10.0
  • Docker版本:
$docker版本
客户:Docker引擎-社区
版本:19.03.10
API版本:1.40
Go版本:go1.13.10
Git提交:9424AEE9
建造时间:2020年5月28日星期四22:16:49
OS/Arch:linux/amd64
实验性:错误
服务器:
发动机:
版本:19.03.2
API版本:1.40(最低版本1.12)
Go版本:go1.12.9
Git提交:6a30dfca03
建造时间:2019年9月11日星期三22:45:55
OS/Arch:linux/amd64
实验性:错误
集装箱:
版本:v1.3.3-14-g449e9269
GitCommit:449e926990f8539fd00844b26c07e2f1e306c760
runc:
版本:1.0.0-rc10
GitCommit:
docker初始化:
版本:0.18.0
GitCommit:
  • Nvidia容器运行时版本:
$nvidia容器运行时--版本
runc版本1.0.0-rc10
提交:DC9208A3303FEEF5B3839F432D9BEB36DF0A9DD
规格:1.0.1-dev
其他信息:

创建群集时使用了:

minikube启动——CPU 3——内存8G
以下
minikube
插件当前已启用:

$minikube插件列表
|-----------------------------|----------|--------------|
|加载项名称|配置文件|状态|
|-----------------------------|----------|--------------|
|仪表板| minikube |禁用|
|默认storageclass | minikube |已启用✅    |
|efk | minikube |禁用|
|freshpod | minikube |禁用|
|gvisor | minikube |禁用|
|舵柄| minikube |失效|
|入口| minikube |禁用|
|已禁用入口dns | minikube ||
|istio | minikube |残疾|
|istio供应器| minikube |禁用|
|logviewer | minikube |已禁用|
|metallb | minikube |禁用|
|metrics服务器| minikube |已禁用|
|nvidia驱动程序安装程序| minikube |已启用✅    |
|nvidia gpu设备插件| minikube |已启用✅    |
|注册表| minikube |已禁用|
|注册表别名| minikube |已禁用|
|已禁用注册表凭据| minikube ||
|已启用存储资源调配器| minikube |✅    |
|存储供应器gluster | minikube |已禁用|
|-----------------------------|----------|--------------|
这是
minikube
上下文之外的一个工作示例:

$docker run——GPU所有nvidia/cuda:10.0-base nvidia smi
星期五6月5日09:23:49 2020
+-----------------------------------------------------------------------------+
|NVIDIA-SMI 440.59驱动程序版本:440.59 CUDA版本:10.2|
|-------------------------------+----------------------+----------------------+
|GPU名称持久化-M |总线Id显示A |易失性解聚。ECC|
|风扇温度性能Pwr:使用率/上限|内存使用率| GPU Util Compute M|
|===============================+======================+======================|
|0 GeForce GTX 106。。。关| 00000000:01:00.0开|不适用|
|0%51C P8 6W/120W | 1293MiB/6077MiB | 0%默认值|
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
|进程:GPU内存|
|GPU PID类型进程名称用法|
|=============================================================================|
+-----------------------------------------------------------------------------+

这是一个社区维基答案。如果需要,可以随意编辑和扩展它

Minikube的docker驱动程序不支持Nvidia GPU。这就给您留下了两个可能的选择:

  • 试着使用和使用。这是一种变通方法,在您的用例中可能不是最好的解决方案

  • 使用或。这两项都得到了官方的支持和记录


  • 我希望这会有帮助。

    你试过这篇文章吗@nischaygoyal这篇文章是关于其他minikube驱动程序的,所以docker驱动程序可能不可能使用minikube运行,所以这就是为什么给你这篇文章的原因minikube@Ash它没有正式的文件记录,可能不可能这样做。然而,特别是可能会有帮助。你看过/试过吗?@Ohimark是的,我已经安装了
    nvidia docker
    ,k8s插件也是如此,尽管我的测试用例甚至还没有达到k8s。是否可以详细说明#1——是否有关于使用这些工具创建具有nvidia容量的minikube节点的说明?