Azure数据科学虚拟机上的CNTK
我有一个带有特斯拉K80 GPU的N系列Azure虚拟机(数据科学虚拟机)。根据英伟达扫描仪,我的GPU驱动程序是最新的。 当我运行CNTK Brainscript时,它会显示“未找到GPU”,并以CPU模式运行。我能做些什么来排除故障Azure数据科学虚拟机上的CNTK,azure,cntk,azure-dsvm,Azure,Cntk,Azure Dsvm,我有一个带有特斯拉K80 GPU的N系列Azure虚拟机(数据科学虚拟机)。根据英伟达扫描仪,我的GPU驱动程序是最新的。 当我运行CNTK Brainscript时,它会显示“未找到GPU”,并以CPU模式运行。我能做些什么来排除故障 requestnodes [MPIWrapper]: using 1 out of 1 MPI nodes on a single host (1 reques ted); we (0) are in (participating) --------------
requestnodes [MPIWrapper]: using 1 out of 1 MPI nodes on a single host (1 reques
ted); we (0) are in (participating)
-------------------------------------------------------------------
Build info:
Built time: Dec 22 2016 01:43:24
Last modified date: Thu Dec 22 01:35:04 2016
Build type: Release
Build target: GPU
With 1bit-SGD: yes
With ASGD: yes
Math lib: mkl
CUDA_PATH: C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8
.0
CUB_PATH: c:\src\cub-1.4.1
CUDNN_PATH: C:\local\cudnn-8.0-windows10-x64-v5.1
Build Branch: HEAD
Build SHA1: 8e8b5ff92eff4647be5d41a5a515956907567126
Built by svcphil on DPHAIM-24
Build Path: C:\jenkins\workspace\CNTK-Build-Windows\Source\CNTK\
-------------------------------------------------------------------
No GPUs found
编辑:以下是NVidia_smi.exe的输出:
C:\Program Files\NVIDIA Corporation\NVSMI>.\nvidia-smi.exe
Fri Jan 13 19:00:43 2017
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 369.30 Driver Version: 369.30 |
|-------------------------------+----------------------+----------------------+
| GPU Name TCC/WDDM | Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 Tesla K80 TCC | 0BD1:00:00.0 Off | Off |
| N/A 43C P8 27W / 149W | 0MiB / 12189MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
| 1 Tesla K80 TCC | 5871:00:00.0 Off | Off |
| N/A 35C P8 34W / 149W | 0MiB / 12189MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| No running processes found |
+-----------------------------------------------------------------------------+
您是否可以运行python笔记本,看看是否可以在设备设置为gpu(id)的情况下运行它们?或者从激活的CNTK python环境中,您可以尝试设置一些设备
import cntk as C
from cntk.device import set_default_device, gpu
C.device.set_default_device(C.device.gpu(0))
这可能会为您提供一些线索,说明这是否是Brainscript特定的问题。安装CUDA后,python脚本和Brainscript现在可以工作了(我安装它是为了运行NVIDIA_SMI)。我不应该假设Azure Data Science映像(仅适用于N系列虚拟机)预先安装了必要的NVIDIA库。:-) 默认情况下,Windows Data Science虚拟机不附带GPU驱动程序、CUDA等。我们有一个名为“DSVM深度学习工具包”的扩展,它添加了驱动程序、CUDA和GPU版的深度学习软件,如CNTK、Tensorflow、MxNet 更多信息:
我们最近还发布了一个内置CUDA、GPU驱动程序和一些更深入的学习工具,可以部署在Azure上的GPU虚拟机或仅CPU虚拟机上 谢谢你的跟进。下面是该脚本的输出:Traceback(最近一次调用last):文件“\testGPU.py”,第3行,在C.device.set_default_device(C.device.gpu(0))文件“E:\local\Anaconda3-4.1.1-Windows-x86_64\envs\cntk-py34\lib\site packages\cntk\device.py”,第76行,在gpu返回cntk_py.DeviceDescriptor.gpu设备(设备id)ValueError:指定的GPU设备id(0)无效。现在正在运行NVIDIA诊断工具,我将返回。这将使我走上正确的道路。如果install.ps在安装启用GPU的CNTK时警告缺少CUDA依赖项,那就太好了。请注意:VM是Windows Server 2012 R2。这是一个标准的NC12 Azure实例。我已尝试从NVIDIA安装驱动程序,但驱动程序安装失败。377.35-tesla-desktop-winserver2008-2012r2-64bit-international-WHQL这是一个很好的了解。谢谢你的报道。将其传递给支持N系列虚拟机的相关团队,以备将来升级。更新:Windows 2016 Data Science虚拟机()附带GPU驱动程序、CUDA和一些框架,如Tensorflow、Mxnet、Microsoft认知工具包、Chainer。我们一直在添加新工具。请查看产品页面了解最新信息。