Multithreading CUDA computeprof无法使用多线程

Multithreading CUDA computeprof无法使用多线程,multithreading,qt,cuda,profiler,Multithreading,Qt,Cuda,Profiler,我正在尝试使用CUDA Computeprof(CUDA profiler)评测多线程应用程序 我用Qt实现了两个线程,每个线程使用不同的CUDA上下文。我正在使用CUDA驱动程序API。探查器应用程序仅检测来自第一个(主)线程的CUDA调用,并完全忽略来自另一个线程的调用 有人对此有解决办法或理由吗?我通常使用Nvidia Parallel Nsight来评测多线程应用程序。但我在MonteCarloMultiGPU SDK 3.2示例上测试了CUDA profiler,它确实为同一个会话分析

我正在尝试使用CUDA Computeprof(CUDA profiler)评测多线程应用程序

我用Qt实现了两个线程,每个线程使用不同的CUDA上下文。我正在使用CUDA驱动程序API。探查器应用程序仅检测来自第一个(主)线程的CUDA调用,并完全忽略来自另一个线程的调用


有人对此有解决办法或理由吗?

我通常使用Nvidia Parallel Nsight来评测多线程应用程序。但我在MonteCarloMultiGPU SDK 3.2示例上测试了CUDA profiler,它确实为同一个会话分析了所有CUDA上下文。我正在使用CUDA 4.0附带的CUDA探查器。

可视化探查器一次只能分析一个CUDA上下文。@Talonmes可能会给出一个答案?@Bart:这是一个评论,因为我没有亲自测试过一个“角落案例”,它符合声明的要求,Brano的回答似乎证实了这一点。我怀疑当CUDA>=4.0中使用新的multigpu实现时,可能会出现这种情况,一个线程拥有多个上下文。但是多线程、多GPU的情况不起作用(或者至少在我的很多基于pthreads的线性代数代码中都不起作用),我测试了CUDA 3.2版本的MonteCarloMultiGPU。在CUDA profiler中运行时的输出中,我可以看到输出“启动x线程”。所以我想它确实可以处理多个线程。VisualProfiler仍然是CUDA4.0中的版本