VS2010中使用Nvidia NSight的CUDA性能评测-时间线上的段
我想知道,假设我只调用了一个内核,在应用程序跟踪报告的时间轴视图中,在 进程->CUDA->计算VS2010中使用Nvidia NSight的CUDA性能评测-时间线上的段,cuda,profiling,nvidia,nsight,Cuda,Profiling,Nvidia,Nsight,我想知道,假设我只调用了一个内核,在应用程序跟踪报告的时间轴视图中,在 进程->CUDA->计算 我在时间轴窗口中看到的每个片段是否都代表执行操作的扭曲?如果是,有没有办法让我知道到底有多少线程参与了这个操作?(我假设它不一定是启动内核时指定的数字)在Nsight Visual Studio Edition中,Process\CUDA\Context\Compute行中的每个范围都是内核启动 范围开始时间戳是flatThreadIdx=0的第一条指令执行的时间 范围结束时间戳是内核的完成 N
我在时间轴窗口中看到的每个片段是否都代表执行操作的扭曲?如果是,有没有办法让我知道到底有多少线程参与了这个操作?(我假设它不一定是启动内核时指定的数字)在Nsight Visual Studio Edition中,Process\CUDA\Context\Compute行中的每个范围都是内核启动
- 范围开始时间戳是flatThreadIdx=0的第一条指令执行的时间
- 范围结束时间戳是内核的完成