如何在Ubuntu 18.04上成功安装CUDA 9.2?

如何在Ubuntu 18.04上成功安装CUDA 9.2?,ubuntu,cuda,nvidia,package-managers,Ubuntu,Cuda,Nvidia,Package Managers,当我不在工作时,我们停电了。当我回来并重新打开计算机时,我继续编写一些脚本,发现Tensorflow被破坏了,问题是/usr/local/cuda中的所有文件都被删除了,所以我的第一个问题是这怎么可能 我试图重新安装cuda,但遇到了一些问题,我将在下面分享。因此,我认为最好是重新安装xubuntu,重新开始,而不是胡闹,但最终还是遇到了完全相同的问题。我有以下设置: os: xubuntu 18.04 gpu: 2 x 1080ti cuda toolkit: 9.2 cudnn: 7.2.1

当我不在工作时,我们停电了。当我回来并重新打开计算机时,我继续编写一些脚本,发现Tensorflow被破坏了,问题是/usr/local/cuda中的所有文件都被删除了,所以我的第一个问题是这怎么可能

我试图重新安装cuda,但遇到了一些问题,我将在下面分享。因此,我认为最好是重新安装xubuntu,重新开始,而不是胡闹,但最终还是遇到了完全相同的问题。我有以下设置:

os: xubuntu 18.04
gpu: 2 x 1080ti
cuda toolkit: 9.2
cudnn: 7.2.1
nccl: 2.2
tensorflow 1.10.1 (built from source) with python3
这一点很重要,因为我知道它是有效的,我已经使用我的系统好几个月了

初始设置 从U盘安装Xubuntu sudo易于升级-y; sudo添加apt存储库ppa:图形驱动程序/ppa sudo-apt-get-y; 转到其他驱动程序并选择nvidia-driver-396开源 应用更改 重新启动计算机 sudo apt get安装freelut3 freelut3 dev libxi dev libxmu dev sudo dpkg-i-强制覆盖cuda-repo-ubuntu1710-9-2-local_9.2.148-1_amd64.deb sudo apt密钥添加/var/cuda-repo-9-2-local/7fa2af80.pub sudo-apt-get-y; 问题 从nvidia的cuda工具包中,我之前安装的版本是17.04,尽管我的ubuntu是18.04,他们的步骤4说明:

这还将安装专有的nvidia驱动程序,也可以在以上步骤9中cuda工具包下载dpkg后通过转到其他驱动程序进行安装,该驱动程序名为nvidia二进制驱动程序-nvidia-396专有版本396.37。执行这些操作中的任何一个都将中断

然后我遇到了这个问题,因为我有以下错误:

trying to overwrite '/usr/lib/x86_64-linux-gnu-libGLX_indirect.so.0' which is also in package libglx-mesa0:amd64 18.0.5-0ubuntu~18.04.1
评论6、7和8建议的解决方案不起作用,评论6建议无法实施,因为我的系统没有这样的文件,评论7和8导致与上述相同的错误~。。间接的。所以。0

有一个非常好的教程,这就是为什么我在上面的步骤8中安装了这些包,但是runfile给出了完全相同的错误

因此,我还尝试再次运行install命令,该命令指出:

cuda: Depends: cuda-9-2 (>= 9.2.148) but it is not going to be installed
libcuda1-396 : Depends: nvidia396 (>=396.37) but is not going to be installed
nvidia-opencl-icd-396 : Depends: nvdia-396 (>=396.37) but it is not going to be installed
E: Unmet dependencies. Try 'apt --fix-broken install' with no packages (or specify a solution)
运行该命令将导致相同的错误。到目前为止,我甚至删除了/usr/lib/x86_64-linux-gnu-libGLX_indirect.so.0以查看是否存在任何差异,但只是抛出了相同的错误,以及:

sudo要去cuda sudo apt获取自动删除-清除cuda 已从/var中删除cuda文件 删除/etc/apt/sources.list.d中的回购协议 我很困惑为什么我不能突然安装nvidia驱动程序和/或cuda驱动程序,因为我知道它可以工作,因为它安装了几个月没有出现问题…

有cuda工具包 可以在18.04下载,我建议你从那里试试。 以前需要很多变通方法,因为它没有得到官方支持

如果.deb包不适合您,请下载运行文件。这是一种更具交互性的方式,比deb文件在更多情况下更有效

编辑:因为您确实需要旧版本,我遵循

所以我再次选择了runfile 我确保安装了所有依赖项,并通过以下方式解决了软件包问题:

sudo apt-get install nvidia-cuda-toolkit 
sudo apt-get remove nvidia-cuda-toolkit
然后,逐步执行我的命令:

chmod +x cuda_9.2.148_396.37_linux.run
sudo ./cuda_9.2.148_396.37_linux.run
和选择

EULA will show:
accept

You are attempting to install on an unsupported configuration. Do you wish to continue?
(y)es/(n)o [ default is no ]: yes

Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 396.37?
(y)es/(n)o/(q)uit: no

Install the CUDA 9.2 Toolkit?
(y)es/(n)o/(q)uit: yes

Enter Toolkit Location
 [ default is /usr/local/cuda-9.2 ]: 

/usr/local/cuda-9.2 is not writable.
Do you wish to run the installation with 'sudo'?
Note that this feature is deprecated in CUDA 9.2 and will be removed in a future release.
(y)es/(n)o: yes

Do you want to install a symbolic link at /usr/local/cuda?
(y)es/(n)o/(q)uit: yes

Install the CUDA 9.2 Samples?
(y)es/(n)o/(q)uit: yes

Enter CUDA Samples Location
 [ default is /home/jan ]: 
除了缺少我安装的推荐库之外

sudo apt-get install libglu1-mesa-dev libxi-dev libxmu-dev

没有更大的问题,但请确保阅读并应用安装程序所说的内容,特别是PATH和LD_LIBRARY_PATH,但是,如果您是一名开发人员,我非常确定您在阅读输出时没有问题

是的,但是Tensorflow或PyTorch不支持CUDA版本10,这两个版本我都需要,现在我明白了。稍后我会检查这一点,并尝试提供帮助。请注意,回到较旧的ubuntu可能是唯一合理的方式,因为从17.10到18.04有很多变化。不过,我会看看我们能做些什么:
sudo apt-get install libglu1-mesa-dev libxi-dev libxmu-dev