Cuda 发射超时并被终止_Cuda - Fatal编程技术网

Cuda 发射超时并被终止

cuda

Cuda 发射超时并被终止,cuda,Cuda,我正在使用特斯拉2075（cc 2.0）和CUDA 4.2。我在非显示GPU（特斯拉）上运行我的程序，我得到错误： "the launch timed out and was terminated " 非显示GPU上是否会出现此错误还有，我怎样才能禁用看门狗定时器呢？我假设您正在Windows上运行。如果是这样，就把特斯拉2075放进去。这将允许计算机访问，Windows不会像显示设备那样管理它，而显示设备将摆脱看门狗定时器。如果您在查找nvidia smi时遇到问题，只需在windows中

我正在使用特斯拉2075（cc 2.0）和CUDA 4.2。我在非显示GPU（特斯拉）上运行我的程序，我得到错误：

"the launch timed out and was terminated "

非显示GPU上是否会出现此错误

还有，我怎样才能禁用看门狗定时器呢？

我假设您正在Windows上运行。如果是这样，就把特斯拉2075放进去。这将允许计算机访问，Windows不会像显示设备那样管理它，而显示设备将摆脱看门狗定时器。如果您在查找nvidia smi时遇到问题，只需在windows中搜索nvidia-smi.exe。（它应该与显示驱动程序一起安装。）然后，如果C2075是系统中唯一的CUDA GPU，则命令如下：

nvidia smi-g 0-dm 1

您也可以执行

nvidia smi--help

以获取该工具的命令行帮助。这可能需要在您更改后重新启动系统，以使卡进入TCC模式

另一方面，如果您在这台机器上运行linux和X-windows，则解决方案会有所不同。一种方法是简单地禁用X，例如将运行级别设置为3并重新启动，但还有其他方法可以做到这一点。但是，您将在另一个GPU上丢失X GUI（我假设您有另一个GPU，因为您说过这是一个非显示GPU）。为了在另一个GPU上保留X和GUI，有必要修改xorg.conf文件，将X强制放到显示GPU上，并将其从计算（特斯拉）GPU上取下。执行此操作的方法会有所不同，但如果您有2个NVIDIA GPU（一个用于显示），则应使用xorg.conf文件相关“display”部分中的BusID参数将X显示强制到单个GPU上。此外，应删除任何其他“显示”部分。例如：

 BusID “PCI:34:0:0”

GPU的PCI ID可通过

lspci

命令或

nvidia smi–a

命令确定

你也可以参考英伟达的驱动程序。

你使用的是什么操作系统？谢谢，解决方案帮助了。我正在使用Ubuntu。下面是一个示例，其中选项4可用于禁用X的看门狗定时器。如果不担心显示性能，则应使用该选项。该链接中的选项4适用于只有一个GPU（用于显示和计算任务）的情况。你让它听起来像你有2个GPU。如果您有一个不用于显示任务的2075 GPU，最好按照我在回答中所述从X中删除该GPU。我使用的是集群，每个节点有2个GPU-特斯拉C2075和GTX580，但由于机箱设计中的一些热限制，特斯拉卡目前充当主显示卡。所以我目前唯一的解决办法就是禁用看门狗定时器。