Debugging 在GPU上查询活动CUDA内核集

Debugging 在GPU上查询活动CUDA内核集,debugging,cuda,Debugging,Cuda,有没有一种方法可以要求GPU(或驱动程序)列出GPU上的一组活动(或已调度或已发布)CUDA内核,而无需将CUDA gdb附加到所属CPU进程并挂起它 我在想象,界面可能会是这样的: > list-cuda-kernels $pid gpu 0: kernel_foo gpu 0: kernel_bar gpu 1: kernel_baz 除了cuda gdb(或任何其他cuda调试器)之外,没有任何工具或API可以获取当前运行的内核列表。最新版本的nvidia smi可能会在linux

有没有一种方法可以要求GPU(或驱动程序)列出GPU上的一组活动(或已调度或已发布)CUDA内核,而无需将
CUDA gdb
附加到所属CPU进程并挂起它

我在想象,界面可能会是这样的:

> list-cuda-kernels $pid
gpu 0: kernel_foo
gpu 0: kernel_bar
gpu 1: kernel_baz

除了cuda gdb(或任何其他cuda调试器)之外,没有任何工具或API可以获取当前运行的内核列表。

最新版本的nvidia smi可能会在linux上用特斯拉卡实现您想要的功能。@talonmies nvidia smi无法列出cuda内核。我正在使用基于费米的特斯拉卡,正如Eugene所说,nvidia smi只列出进程,不列出内核。