Linux CUDA 6.5/Ubuntu 14.04/AWS EC2 GPU实例g2.2xlarge缺少drm.ko
要在Ubuntu14.04.1 LTS上的AWS EC2 g2.2xlarge实例上安装CUDA 6.5,无论是通过.deb文件还是.run文件安装Linux CUDA 6.5/Ubuntu 14.04/AWS EC2 GPU实例g2.2xlarge缺少drm.ko,linux,amazon-ec2,cuda,nvidia,ubuntu-14.04,Linux,Amazon Ec2,Cuda,Nvidia,Ubuntu 14.04,要在Ubuntu14.04.1 LTS上的AWS EC2 g2.2xlarge实例上安装CUDA 6.5,无论是通过.deb文件还是.run文件安装 .sudo ./cuda_6.5.14_linux_64.run --kernel-source-path=/usr/src/linux-headers-3.13.0-34-generic 我总是在缺少drm.ko时遇到同样的错误。代码编译似乎成功了。下面是日志。(我在安装前重新启动) 内核模块编译完成 无法确定是否启用了安全引导:没有此类文件或
.sudo ./cuda_6.5.14_linux_64.run --kernel-source-path=/usr/src/linux-headers-3.13.0-34-generic
我总是在缺少drm.ko时遇到同样的错误。代码编译似乎成功了。下面是日志。(我在安装前重新启动)
内核模块编译完成
无法确定是否启用了安全引导:没有此类文件或目录
内核模块加载错误:没有这样的文件或目录
内核消息:
[3.595939]类型=1400审核(1408809002.911:5):apparmor=“STATUS”
operation=“profile\u replace”profile=“unconfined”
name=“/usr/lib/NetworkManager/nm dhcp client.action”pid=492
comm=“apparmor\u解析器”
[3.595942]类型=1400审核(1408809002.911:6):apparmor=“状态”
operation=“profile\u replace”profile=“unconfined”
name=“/usr/lib/connman/scripts/dhclient script”pid=492
comm=“apparmor\u解析器”
[3.596140]类型=1400审核(1408809902.915:7):apparmor=“状态”
operation=“profile\u replace”profile=“unconfined”
operation=“profile\u replace”profile=“unconfined”
name=“/usr/lib/connman/scripts/dhclient script”pid=492
comm=“apparmor\u解析器”
[4.696067]初始化:故障保护主进程(833)被术语信号终止
[4.793261]类型=1400审核(1408809904.107:8):apparmor=“STATUS”
operation=“profile\u replace”profile=“unconfined”name=“/sbin/dhclient”
pid=952 comm=“apparmor\u解析器”
[4.793267]类型=1400审核(1408809904.107:9):apparmor=“STATUS”
operation=“profile\u replace”profile=“unconfined”
name=“/usr/lib/NetworkManager/nm dhcp client.action”pid=952
comm=“apparmor\u解析器”
[5.036249]初始:普利茅斯新贵大桥主流程结束,
重生
[6.589233]初始化:udev回退图形主进程(1203)
终止
状态1
[136.367014]nvidia:模块许可证“nvidia”会污染内核
[136.367019]由于内核污染而禁用锁调试
[136.370281]nvidia:模块验证失败:签名和/或
所需密钥丢失-污染内核
[136.370383]nvidia:未知符号drm_打开(错误0)
[136.370393]nvidia:未知符号drm_轮询(错误0)
[136.37004]nvidia:未知符号drm_pci_init(错误0)
[136.370449]nvidia:未知符号drm_gem_prime_handle_to_fd(错误
0)
[136.370462]nvidia:未知符号drm_gem_private_object_init(错误
0)
[136.370474]nvidia:未知符号drm_gem_mmap(错误0)
[136.370478]nvidia:未知符号drm_ioctl(错误0)
[136.370486]nvidia:未知符号drm_gem_object_free(错误0)
[136.370496]nvidia:未知符号drm_读取(错误0)
[136.370509]nvidia:未知符号drm_gem_handle_create(错误0)
[136.370515]nvidia:未知符号drm_prime_页面到_sg(错误0)
[136.370550]nvidia:未知符号drm_pci_退出(错误0)
[136.370563]nvidia:未知符号drm_发布(错误0)
[136.370565]nvidia:未知符号drm_gem_prime_导出(错误0)
驱动程序安装无法定位内核源。请
确保已安装并设置内核源程序包
没错
实际上,在新启动GPU实例之后,
apt get upgrade
希望保留4个包,分别为linux虚拟版
,linux映像虚拟版
。我仍然安装了它们,所以严格来说我没有更多的升级。(新设置没有以前的nvidia或任何新司机。)
问题是,linux-image-virtual
是一个精简的构建,没有drm.ko
。照办
sudo apt-get install linux-image-extra-virtual
其中包含drm.ko
然后继续使用
.deb
或.run
文件安装CUDA。该错误是由于NVIDIA驱动程序缺少所需的drm模块造成的。
默认情况下,Ubuntu AMI安装最小的通用Linux内核(Linux映像虚拟),其中不包括drm模块。
要修复它,请安装完整的通用内核linux映像通用。
安装linux image extra virtual会起作用,因为它只是linux image generic的过渡包。我建议安装LinuxGeneric以同时包含头和映像。
总结如下:
sudo apt-get install linux-generic
在sudo apt get install linux image extra virtual(ubuntu 14.04,cuda 8.0)上也有类似的问题。但是,这个解决方案(
linux-generic
)确实如此。之后的一个重要步骤是通过sudo-reboot
重新启动系统。只有这样,变化才会得到反映