Nvidia驱动程序错误-CUDA驱动程序版本不适合CUDA运行时版本
我试图称之为Laia——一个人力资源工作的深度学习工具包: 这是我的代码:Nvidia驱动程序错误-CUDA驱动程序版本不适合CUDA运行时版本,cuda,nvidia-docker,Cuda,Nvidia Docker,我试图称之为Laia——一个人力资源工作的深度学习工具包: 这是我的代码: INPUT_DIR=`pwd`/RecognitionHand/dir_input OUTPUT_DIR=`pwd`/RecognitionHand/dir_output CHAR_TRANSCRIBE_FILE=char.txt WORD_TRANSCRIBE_FILE=word.txt rm $INPUT_DIR/filelist/filenames.lst ls -d -1 $INPUT_DIR/images/
INPUT_DIR=`pwd`/RecognitionHand/dir_input
OUTPUT_DIR=`pwd`/RecognitionHand/dir_output
CHAR_TRANSCRIBE_FILE=char.txt
WORD_TRANSCRIBE_FILE=word.txt
rm $INPUT_DIR/filelist/filenames.lst
ls -d -1 $INPUT_DIR/images/* > $INPUT_DIR/filelist/filenames.lst
COMMAND="decode --batch_size 20 --log_level info --symbols_table \
$INPUT_DIR/symbtable/symbs.txt \
$INPUT_DIR/model/model_htr.t7 \
$INPUT_DIR/filelist/filenames.lst> $OUTPUT_DIR/$CHAR_TRANSCRIBE_FILE";
# local volumes mapped to the docker volumes
OPTS=( -u $(id -u):$(id -g) );
[ -d "/home" ] && OPTS+=( -v /home:/home );
[ -d "/mnt" ] && OPTS+=( -v /mnt:/mnt );
[ -d "/media" ] && OPTS+=( -v /media:/media );
[ -d "/tmp" ] && OPTS+=( -v /tmp:/tmp );
# call the GPU docker for transcribing
docker run --rm -t "${OPTS[@]}" laia:active \
bash -c "cd $(pwd) && PATH=\" .:$PATH:\$PATH\" laia-$COMMAND";
最后一个docker命令指的是nvidia docker,我得到了一个奇怪的错误:
THCudaCheck FAIL file=/tmp/luarocks_cutorch-scm-1-918/cutorch/lib/THC/THCGeneral.c line=66 error=35
: CUDA driver version is insufficient for CUDA runtime version
[2020-01-02 14:43:45 WARN] /opt/torch/share/lua/5.1/laia/util/base.lua:39: Optional lua module "cutorch" was not found!
[2020-01-02 14:43:45 WARN] /opt/torch/share/lua/5.1/laia/util/base.lua:39: Optional lua module "cunn" was not found!
[2020-01-02 14:43:45 WARN] /opt/torch/share/lua/5.1/laia/util/base.lua:39: Optional lua module "laia.util.cudnn" was not found!
[2020-01-02 14:43:45 WARN] /opt/torch/share/lua/5.1/laia/util/base.lua:39: Optional lua module "laia.ImageDistorter" was not found!
/opt/torch/bin/luajit: /opt/torch/lib/luarocks/rocks/laia/scm-1/bin/laia-decode:16: attempt to call field 'registerOptions' (a nil value)
stack traceback:
/opt/torch/lib/luarocks/rocks/laia/scm-1/bin/laia-decode:16: in main chunk
[C]: at 0x00405d50
为什么会这样?是否有人在运行nvidia docker时遇到类似错误
CUDA驱动程序版本不适合CUDA运行时版本
意味着系统的英伟达驱动程序与下载的DOCKER映像中的运行库不兼容。你必须(至少)匹配那些版本。
另一件重要的事情是检查您想要使用的工具所需的cuda运行时是什么。假设您遵循了必要的版本并下载了正确的docker映像,则需要更新系统nvidia驱动程序以匹配docker映像。“CUDA驱动程序版本不适合CUDA运行时版本”是一个极为常见的错误,通常与您尝试使用的CUDA版本安装的驱动程序太旧有关。如果你搜索这个确切的错误,你会发现很多关于如何解决它的信息