Nvidia驱动程序错误-CUDA驱动程序版本不适合CUDA运行时版本

Nvidia驱动程序错误-CUDA驱动程序版本不适合CUDA运行时版本,cuda,nvidia-docker,Cuda,Nvidia Docker,我试图称之为Laia——一个人力资源工作的深度学习工具包: 这是我的代码: INPUT_DIR=`pwd`/RecognitionHand/dir_input OUTPUT_DIR=`pwd`/RecognitionHand/dir_output CHAR_TRANSCRIBE_FILE=char.txt WORD_TRANSCRIBE_FILE=word.txt rm $INPUT_DIR/filelist/filenames.lst ls -d -1 $INPUT_DIR/images/

我试图称之为Laia——一个人力资源工作的深度学习工具包:

这是我的代码:

INPUT_DIR=`pwd`/RecognitionHand/dir_input
OUTPUT_DIR=`pwd`/RecognitionHand/dir_output
CHAR_TRANSCRIBE_FILE=char.txt
WORD_TRANSCRIBE_FILE=word.txt

rm $INPUT_DIR/filelist/filenames.lst

ls -d -1 $INPUT_DIR/images/* > $INPUT_DIR/filelist/filenames.lst

COMMAND="decode --batch_size 20  --log_level info   --symbols_table \
    $INPUT_DIR/symbtable/symbs.txt \
    $INPUT_DIR/model/model_htr.t7 \
    $INPUT_DIR/filelist/filenames.lst> $OUTPUT_DIR/$CHAR_TRANSCRIBE_FILE";


# local volumes mapped to the docker volumes
OPTS=( -u $(id -u):$(id -g) );
[ -d "/home" ]  && OPTS+=( -v /home:/home );
[ -d "/mnt" ]   && OPTS+=( -v /mnt:/mnt );
[ -d "/media" ] && OPTS+=( -v /media:/media );
[ -d "/tmp" ]   && OPTS+=( -v /tmp:/tmp );


# call the GPU docker for transcribing
docker run --rm -t "${OPTS[@]}" laia:active \
  bash -c "cd $(pwd) && PATH=\" .:$PATH:\$PATH\" laia-$COMMAND";
最后一个docker命令指的是nvidia docker,我得到了一个奇怪的错误:

THCudaCheck FAIL file=/tmp/luarocks_cutorch-scm-1-918/cutorch/lib/THC/THCGeneral.c line=66 error=35 

: CUDA driver version is insufficient for CUDA runtime version
[2020-01-02 14:43:45  WARN] /opt/torch/share/lua/5.1/laia/util/base.lua:39: Optional lua module "cutorch" was not found!
[2020-01-02 14:43:45  WARN] /opt/torch/share/lua/5.1/laia/util/base.lua:39: Optional lua module "cunn" was not found!
[2020-01-02 14:43:45  WARN] /opt/torch/share/lua/5.1/laia/util/base.lua:39: Optional lua module "laia.util.cudnn" was not found!
[2020-01-02 14:43:45  WARN] /opt/torch/share/lua/5.1/laia/util/base.lua:39: Optional lua module "laia.ImageDistorter" was not found!
/opt/torch/bin/luajit: /opt/torch/lib/luarocks/rocks/laia/scm-1/bin/laia-decode:16: attempt to call field 'registerOptions' (a nil value)
stack traceback:
    /opt/torch/lib/luarocks/rocks/laia/scm-1/bin/laia-decode:16: in main chunk
    [C]: at 0x00405d50
为什么会这样?是否有人在运行nvidia docker时遇到类似错误


CUDA驱动程序版本不适合CUDA运行时版本

意味着系统的英伟达驱动程序与下载的DOCKER映像中的运行库不兼容。你必须(至少)匹配那些版本。


另一件重要的事情是检查您想要使用的工具所需的cuda运行时是什么。假设您遵循了必要的版本并下载了正确的docker映像,则需要更新系统nvidia驱动程序以匹配docker映像。

“CUDA驱动程序版本不适合CUDA运行时版本”是一个极为常见的错误,通常与您尝试使用的CUDA版本安装的驱动程序太旧有关。如果你搜索这个确切的错误,你会发现很多关于如何解决它的信息