如何在Ubuntu 18.04上成功安装CUDA 9.2?
当我不在工作时,我们停电了。当我回来并重新打开计算机时,我继续编写一些脚本,发现Tensorflow被破坏了,问题是/usr/local/cuda中的所有文件都被删除了,所以我的第一个问题是这怎么可能 我试图重新安装cuda,但遇到了一些问题,我将在下面分享。因此,我认为最好是重新安装xubuntu,重新开始,而不是胡闹,但最终还是遇到了完全相同的问题。我有以下设置:如何在Ubuntu 18.04上成功安装CUDA 9.2?,ubuntu,cuda,nvidia,package-managers,Ubuntu,Cuda,Nvidia,Package Managers,当我不在工作时,我们停电了。当我回来并重新打开计算机时,我继续编写一些脚本,发现Tensorflow被破坏了,问题是/usr/local/cuda中的所有文件都被删除了,所以我的第一个问题是这怎么可能 我试图重新安装cuda,但遇到了一些问题,我将在下面分享。因此,我认为最好是重新安装xubuntu,重新开始,而不是胡闹,但最终还是遇到了完全相同的问题。我有以下设置: os: xubuntu 18.04 gpu: 2 x 1080ti cuda toolkit: 9.2 cudnn: 7.2.1
os: xubuntu 18.04
gpu: 2 x 1080ti
cuda toolkit: 9.2
cudnn: 7.2.1
nccl: 2.2
tensorflow 1.10.1 (built from source) with python3
这一点很重要,因为我知道它是有效的,我已经使用我的系统好几个月了
初始设置
从U盘安装Xubuntu
sudo易于升级-y;
sudo添加apt存储库ppa:图形驱动程序/ppa
sudo-apt-get-y;
转到其他驱动程序并选择nvidia-driver-396开源
应用更改
重新启动计算机
sudo apt get安装freelut3 freelut3 dev libxi dev libxmu dev
sudo dpkg-i-强制覆盖cuda-repo-ubuntu1710-9-2-local_9.2.148-1_amd64.deb
sudo apt密钥添加/var/cuda-repo-9-2-local/7fa2af80.pub
sudo-apt-get-y;
问题
从nvidia的cuda工具包中,我之前安装的版本是17.04,尽管我的ubuntu是18.04,他们的步骤4说明:
这还将安装专有的nvidia驱动程序,也可以在以上步骤9中cuda工具包下载dpkg后通过转到其他驱动程序进行安装,该驱动程序名为nvidia二进制驱动程序-nvidia-396专有版本396.37。执行这些操作中的任何一个都将中断
然后我遇到了这个问题,因为我有以下错误:
trying to overwrite '/usr/lib/x86_64-linux-gnu-libGLX_indirect.so.0' which is also in package libglx-mesa0:amd64 18.0.5-0ubuntu~18.04.1
评论6、7和8建议的解决方案不起作用,评论6建议无法实施,因为我的系统没有这样的文件,评论7和8导致与上述相同的错误~。。间接的。所以。0
有一个非常好的教程,这就是为什么我在上面的步骤8中安装了这些包,但是runfile给出了完全相同的错误
因此,我还尝试再次运行install命令,该命令指出:
cuda: Depends: cuda-9-2 (>= 9.2.148) but it is not going to be installed
libcuda1-396 : Depends: nvidia396 (>=396.37) but is not going to be installed
nvidia-opencl-icd-396 : Depends: nvdia-396 (>=396.37) but it is not going to be installed
E: Unmet dependencies. Try 'apt --fix-broken install' with no packages (or specify a solution)
运行该命令将导致相同的错误。到目前为止,我甚至删除了/usr/lib/x86_64-linux-gnu-libGLX_indirect.so.0以查看是否存在任何差异,但只是抛出了相同的错误,以及:
sudo要去cuda
sudo apt获取自动删除-清除cuda
已从/var中删除cuda文件
删除/etc/apt/sources.list.d中的回购协议
我很困惑为什么我不能突然安装nvidia驱动程序和/或cuda驱动程序,因为我知道它可以工作,因为它安装了几个月没有出现问题…有cuda工具包
可以在18.04下载,我建议你从那里试试。
以前需要很多变通方法,因为它没有得到官方支持
如果.deb包不适合您,请下载运行文件。这是一种更具交互性的方式,比deb文件在更多情况下更有效
编辑:因为您确实需要旧版本,我遵循
所以我再次选择了runfile
我确保安装了所有依赖项,并通过以下方式解决了软件包问题:
sudo apt-get install nvidia-cuda-toolkit
sudo apt-get remove nvidia-cuda-toolkit
然后,逐步执行我的命令:
chmod +x cuda_9.2.148_396.37_linux.run
sudo ./cuda_9.2.148_396.37_linux.run
和选择
EULA will show:
accept
You are attempting to install on an unsupported configuration. Do you wish to continue?
(y)es/(n)o [ default is no ]: yes
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 396.37?
(y)es/(n)o/(q)uit: no
Install the CUDA 9.2 Toolkit?
(y)es/(n)o/(q)uit: yes
Enter Toolkit Location
[ default is /usr/local/cuda-9.2 ]:
/usr/local/cuda-9.2 is not writable.
Do you wish to run the installation with 'sudo'?
Note that this feature is deprecated in CUDA 9.2 and will be removed in a future release.
(y)es/(n)o: yes
Do you want to install a symbolic link at /usr/local/cuda?
(y)es/(n)o/(q)uit: yes
Install the CUDA 9.2 Samples?
(y)es/(n)o/(q)uit: yes
Enter CUDA Samples Location
[ default is /home/jan ]:
除了缺少我安装的推荐库之外
sudo apt-get install libglu1-mesa-dev libxi-dev libxmu-dev
没有更大的问题,但请确保阅读并应用安装程序所说的内容,特别是PATH和LD_LIBRARY_PATH,但是,如果您是一名开发人员,我非常确定您在阅读输出时没有问题 是的,但是Tensorflow或PyTorch不支持CUDA版本10,这两个版本我都需要,现在我明白了。稍后我会检查这一点,并尝试提供帮助。请注意,回到较旧的ubuntu可能是唯一合理的方式,因为从17.10到18.04有很多变化。不过,我会看看我们能做些什么:
sudo apt-get install libglu1-mesa-dev libxi-dev libxmu-dev