Cuda 理解nvprof事件域_Cuda_Nvidia_Profiler

Cuda 理解nvprof事件域

cuda

Cuda 理解nvprof事件域,cuda,nvidia,profiler,Cuda,Nvidia,Profiler,我试图理解nvprof中使用的不同事件域之间的差异当我尝试 nvprof --devices 0 --query-events 它列出了分为几个域（域a、域b、域c、域d等）的可用事件我已经读到，根据域的不同，一个事件是计算所有的短信还是很少的短信。但我无法找出哪个领域的事件可以算作所有事件，等等如果有人能解释这些域，那就太好了。在nvprof中，默认情况下，事件会针对所有可以分析的实例进行分析，数据会针对所有可用实例进行推断。如果由于硬件限制，无法分析所有可用实例，nvprof将发出

我试图理解nvprof中使用的不同事件域之间的差异

当我尝试

nvprof --devices 0 --query-events

它列出了分为几个域（域a、域b、域c、域d等）的可用事件

我已经读到，根据域的不同，一个事件是计算所有的短信还是很少的短信。但我无法找出哪个领域的事件可以算作所有事件，等等

如果有人能解释这些域，那就太好了。

在nvprof中，默认情况下，事件会针对所有可以分析的实例进行分析，数据会针对所有可用实例进行推断。如果由于硬件限制，无法分析所有可用实例，nvprof将发出以下警告：

==14882==警告：以下聚合事件值是从有限的概要文件数据中推断出来的，因此可能是不准确的。要查看非聚合事件值，请使用 “--聚合模式关闭”

如果可以分析所有可用实例，则不会看到此消息

您可以在

--events

之前提供

--aggregate mode off

选项，以分析域的所有实例的事件。例如：

/nvprof——聚合模式关闭——事件扭曲启动。/matrixmul

在未来的版本中，有关域的已分析实例和可用实例的信息将在

--query events

选项中提供。

您能解释一下“实例”是什么意思吗？