CUDA visual profiler无法完成执行。建议的设置X配置选项的解决方案';交互式';假装不工作

CUDA visual profiler无法完成执行。建议的设置X配置选项的解决方案';交互式';假装不工作,cuda,nvidia,Cuda,Nvidia,我在执行Cuda Visual profiler时遇到问题。探查器无法完成执行,我收到以下错误 程序运行#18已完成。错误:应用程序:“/home/cnode0/workspace/cuda/pred/pre”。找不到应用程序运行0的探查器数据文件“/home/cnode0/workspace/cuda/pred/temp_compute_Profiler_0_0.csv” 我在行刑期间得到了以下警告 所选计数器“gld指令8位”、“gld指令16位”、“gld指令32位”、“gld指令64位”

我在执行Cuda Visual profiler时遇到问题。探查器无法完成执行,我收到以下错误

程序运行#18已完成。错误:应用程序:“/home/cnode0/workspace/cuda/pred/pre”。找不到应用程序运行0的探查器数据文件“/home/cnode0/workspace/cuda/pred/temp_compute_Profiler_0_0.csv”

我在行刑期间得到了以下警告

所选计数器“gld指令8位”、“gld指令16位”、“gld指令32位”、“gld指令64位”、“gld指令128位”、“gst指令8位”、“gst指令16位”、“gst指令32位”、“gst指令64位”、“gst指令128位”可能导致GPU内核的运行时间超过驱动程序的看门狗超时限制。在这种情况下,驱动程序将终止GPU内核,导致应用程序错误,并且分析数据将不可用。选择这些计数器时,建议将X配置选项“Interactive”设置为false

我已经在这个论坛上看到了一个提议的解决方案

如前所述,我更改了xorg.conf,将交互标志设置为false,如下所示,并重新启动了系统

Section "Device" 
Identifier "Device0" 
Driver         "nvidia"
VendorName     "NVIDIA Corporation" 
Option "Interactive" "0" 
EndSection
但这并不能解决问题。我仍然收到同样的警告。 我正在运行Ubuntu10.04 LTS和nvidia Geforce GT430,驱动程序为285.05.09
有人对此有什么线索吗?

另一个选择是减少收集的硬件计数器的数量,看看这对当前安装是否有帮助

顺便问一下,CUDA工具包的版本是什么?您是否正在使用CUDA 4.1 RC1和驱动程序285.05.09?如果您是注册开发者,您能否确认当前CUDA RC2版本是否存在相同的问题


您还可以向发送复制测试应用程序cudatools@nvidia.com

根据您收到的错误消息-没有为第一次应用程序运行本身生成探查器输出。在第一次运行中,未启用探查器计数器,因此此问题与“gld指令*或“gst指令*”无关。如果在应用程序终止之前存在显式同步调用,则探查器输出可能为空。您可以尝试添加CudDeviceSynchronize()、CudStreamSynchronize()或CudEventSynchronize()在应用程序终止之前调用。您可以通过从命令行运行应用程序并检查命令行探查器输出是否包含一些数据来确认是否存在此问题

> export COMPUTE_PROFILE=1
> <application>
您需要检查探查器日志中是否有任何方法输出。在上面的示例中,第5行是标题行,第6到9行有4个方法


还要注意的是,即使在将交互标志设置为false之后,也会出现可视探查器警告消息“所选计数器”“gld指令8位”“gld指令16位”…。每当“gld指令*或“gst指令*”出现时,都会显示此消息计数器被选中,默认情况下,这些计数器被选中。

这不是一个真正的解决方案,但如果将CUDA_PROFILE环境变量设置为1,则可以测试评测是否有效。您可以将生成的CSV文件导入Visual Profiler以进行进一步检查。CUDA 4.1 RC2已公开发布——您无需注册开发人员即可下载。顺便说一句,你的评论并不是真正的答案,应该在评论流中(供将来参考)。。。
1 # CUDA_PROFILE_LOG_VERSION 2.0 
2 # CUDA_DEVICE 0 Tesla C2075 
3 # CUDA_CONTEXT 1 
4 # TIMESTAMPFACTOR fffff6de60e24570 
5 method,gputime,cputime,occupancy 
6 method=[ memcpyHtoD ] gputime=[ 80.640 ] cputime=[ 278.000 ] 
7 method=[ memcpyHtoD ] gputime=[ 79.552 ] cputime=[ 237.000 ] 
8 method=[ _Z6VecAddPKfS0_Pfi ] gputime=[ 5.760 ] cputime=[ 18.000 ] occupancy=[ 1.000 ] 
9 method=[ memcpyDtoH ] gputime=[ 97.472 ] cputime=[ 647.000 ]