Cuda 发射超时并被终止

Cuda 发射超时并被终止,cuda,Cuda,我正在使用特斯拉2075(cc 2.0)和CUDA 4.2。我在非显示GPU(特斯拉)上运行我的程序,我得到错误: "the launch timed out and was terminated " 非显示GPU上是否会出现此错误 还有,我怎样才能禁用看门狗定时器呢?我假设您正在Windows上运行。如果是这样,就把特斯拉2075放进去。这将允许计算机访问,Windows不会像显示设备那样管理它,而显示设备将摆脱看门狗定时器。如果您在查找nvidia smi时遇到问题,只需在windows中

我正在使用特斯拉2075(cc 2.0)和CUDA 4.2。我在非显示GPU(特斯拉)上运行我的程序,我得到错误:

"the launch timed out and was terminated "
非显示GPU上是否会出现此错误


还有,我怎样才能禁用看门狗定时器呢?

我假设您正在Windows上运行。如果是这样,就把特斯拉2075放进去。这将允许计算机访问,Windows不会像显示设备那样管理它,而显示设备将摆脱看门狗定时器。如果您在查找nvidia smi时遇到问题,只需在windows中搜索nvidia-smi.exe。(它应该与显示驱动程序一起安装。)然后,如果C2075是系统中唯一的CUDA GPU,则命令如下:
nvidia smi-g 0-dm 1
您也可以执行
nvidia smi--help
以获取该工具的命令行帮助。这可能需要在您更改后重新启动系统,以使卡进入TCC模式

另一方面,如果您在这台机器上运行linux和X-windows,则解决方案会有所不同。一种方法是简单地禁用X,例如将运行级别设置为3并重新启动,但还有其他方法可以做到这一点。但是,您将在另一个GPU上丢失X GUI(我假设您有另一个GPU,因为您说过这是一个非显示GPU)。为了在另一个GPU上保留X和GUI,有必要修改xorg.conf文件,将X强制放到显示GPU上,并将其从计算(特斯拉)GPU上取下。执行此操作的方法会有所不同,但如果您有2个NVIDIA GPU(一个用于显示),则应使用xorg.conf文件相关“display”部分中的BusID参数将X显示强制到单个GPU上。此外,应删除任何其他“显示”部分。例如:

 BusID “PCI:34:0:0”
GPU的PCI ID可通过
lspci
命令或
nvidia smi–a
命令确定


你也可以参考英伟达的驱动程序。

你使用的是什么操作系统?谢谢,解决方案帮助了。我正在使用Ubuntu。下面是一个示例,其中选项4可用于禁用X的看门狗定时器。如果不担心显示性能,则应使用该选项。该链接中的选项4适用于只有一个GPU(用于显示和计算任务)的情况。你让它听起来像你有2个GPU。如果您有一个不用于显示任务的2075 GPU,最好按照我在回答中所述从X中删除该GPU。我使用的是集群,每个节点有2个GPU-特斯拉C2075和GTX580,但由于机箱设计中的一些热限制,特斯拉卡目前充当主显示卡。所以我目前唯一的解决办法就是禁用看门狗定时器。