Linux CUDA 6.5/Ubuntu 14.04/AWS EC2 GPU实例g2.2xlarge缺少drm.ko_Linux_Amazon Ec2_Cuda_Nvidia_Ubuntu 14.04

Linux CUDA 6.5/Ubuntu 14.04/AWS EC2 GPU实例g2.2xlarge缺少drm.ko

linux amazon-ec2 cuda

Linux CUDA 6.5/Ubuntu 14.04/AWS EC2 GPU实例g2.2xlarge缺少drm.ko,linux,amazon-ec2,cuda,nvidia,ubuntu-14.04,Linux,Amazon Ec2,Cuda,Nvidia,Ubuntu 14.04,要在Ubuntu14.04.1 LTS上的AWS EC2 g2.2xlarge实例上安装CUDA 6.5，无论是通过.deb文件还是.run文件安装 .sudo ./cuda_6.5.14_linux_64.run --kernel-source-path=/usr/src/linux-headers-3.13.0-34-generic 我总是在缺少drm.ko时遇到同样的错误。代码编译似乎成功了。下面是日志。（我在安装前重新启动）内核模块编译完成无法确定是否启用了安全引导：没有此类文件或

要在Ubuntu14.04.1 LTS上的AWS EC2 g2.2xlarge实例上安装CUDA 6.5，无论是通过.deb文件还是.run文件安装

.sudo ./cuda_6.5.14_linux_64.run --kernel-source-path=/usr/src/linux-headers-3.13.0-34-generic

我总是在缺少drm.ko时遇到同样的错误。代码编译似乎成功了。下面是日志。（我在安装前重新启动）

内核模块编译完成

无法确定是否启用了安全引导：没有此类文件或目录

内核模块加载错误：没有这样的文件或目录

内核消息：

[3.595939]类型=1400审核（1408809002.911:5）：apparmor=“STATUS”

operation=“profile\u replace”profile=“unconfined”

name=“/usr/lib/NetworkManager/nm dhcp client.action”pid=492

comm=“apparmor\u解析器”

[3.595942]类型=1400审核（1408809002.911:6）：apparmor=“状态”

operation=“profile\u replace”profile=“unconfined”

name=“/usr/lib/connman/scripts/dhclient script”pid=492

comm=“apparmor\u解析器”

[3.596140]类型=1400审核（1408809902.915:7）：apparmor=“状态”

operation=“profile\u replace”profile=“unconfined”

name=“/usr/lib/connman/scripts/dhclient script”pid=492

comm=“apparmor\u解析器”

[4.696067]初始化：故障保护主进程（833）被术语信号终止

[4.793261]类型=1400审核（1408809904.107:8）：apparmor=“STATUS”

operation=“profile\u replace”profile=“unconfined”name=“/sbin/dhclient”

pid=952 comm=“apparmor\u解析器”

[4.793267]类型=1400审核（1408809904.107:9）：apparmor=“STATUS”

operation=“profile\u replace”profile=“unconfined”

name=“/usr/lib/NetworkManager/nm dhcp client.action”pid=952

comm=“apparmor\u解析器”

[5.036249]初始：普利茅斯新贵大桥主流程结束，重生

[6.589233]初始化：udev回退图形主进程（1203）终止

状态1

[136.367014]nvidia:模块许可证“nvidia”会污染内核

[136.367019]由于内核污染而禁用锁调试

[136.370281]nvidia:模块验证失败：签名和/或

所需密钥丢失-污染内核

[136.370383]nvidia:未知符号drm_打开（错误0）

[136.370393]nvidia:未知符号drm_轮询（错误0）

[136.37004]nvidia:未知符号drm_pci_init（错误0）

[136.370449]nvidia：未知符号drm_gem_prime_handle_to_fd（错误 0）

[136.370462]nvidia:未知符号drm_gem_private_object_init（错误 0）

[136.370474]nvidia:未知符号drm_gem_mmap（错误0）

[136.370478]nvidia:未知符号drm_ioctl（错误0）

[136.370486]nvidia:未知符号drm_gem_object_free（错误0）

[136.370496]nvidia:未知符号drm_读取（错误0）

[136.370509]nvidia:未知符号drm_gem_handle_create（错误0）

[136.370515]nvidia:未知符号drm_prime_页面到_sg（错误0）

[136.370550]nvidia:未知符号drm_pci_退出（错误0）

[136.370563]nvidia:未知符号drm_发布（错误0）

[136.370565]nvidia:未知符号drm_gem_prime_导出（错误0）

驱动程序安装无法定位内核源。请确保已安装并设置内核源程序包没错

实际上，在新启动GPU实例之后，

apt get upgrade

希望保留4个包，分别为

linux虚拟版

，

linux映像虚拟版

。我仍然安装了它们，所以严格来说我没有更多的升级。（新设置没有以前的nvidia或任何新司机。）

问题是，

linux-image-virtual

是一个精简的构建，没有

drm.ko

。照办

sudo apt-get install linux-image-extra-virtual

其中包含

drm.ko

然后继续使用

.deb

或

.run

文件安装CUDA。

该错误是由于NVIDIA驱动程序缺少所需的drm模块造成的。默认情况下，Ubuntu AMI安装最小的通用Linux内核（Linux映像虚拟），其中不包括drm模块。要修复它，请安装完整的通用内核linux映像通用。安装linux image extra virtual会起作用，因为它只是linux image generic的过渡包。我建议安装LinuxGeneric以同时包含头和映像。总结如下：

sudo apt-get install linux-generic

在sudo apt get install linux image extra virtual（ubuntu 14.04，cuda 8.0）上也有类似的问题。但是，这个解决方案（

linux-generic

）确实如此。之后的一个重要步骤是通过

sudo-reboot

重新启动系统。只有这样，变化才会得到反映