Cuda 理解nvprof事件域

Cuda 理解nvprof事件域,cuda,nvidia,profiler,Cuda,Nvidia,Profiler,我试图理解nvprof中使用的不同事件域之间的差异 当我尝试 nvprof --devices 0 --query-events 它列出了分为几个域(域a、域b、域c、域d等)的可用事件 我已经读到,根据域的不同,一个事件是计算所有的短信还是很少的短信。但我无法找出哪个领域的事件可以算作所有事件,等等 如果有人能解释这些域,那就太好了。在nvprof中,默认情况下,事件会针对所有可以分析的实例进行分析,数据会针对所有可用实例进行推断。 如果由于硬件限制,无法分析所有可用实例,nvprof将发出

我试图理解nvprof中使用的不同事件域之间的差异

当我尝试

nvprof --devices 0 --query-events
它列出了分为几个域(域a、域b、域c、域d等)的可用事件

我已经读到,根据域的不同,一个事件是计算所有的短信还是很少的短信。但我无法找出哪个领域的事件可以算作所有事件,等等


如果有人能解释这些域,那就太好了。

在nvprof中,默认情况下,事件会针对所有可以分析的实例进行分析,数据会针对所有可用实例进行推断。 如果由于硬件限制,无法分析所有可用实例,nvprof将发出以下警告:

==14882==警告:以下聚合事件值是从有限的概要文件数据中推断出来的,因此可能是 不准确的。要查看非聚合事件值,请使用 “--聚合模式关闭”

如果可以分析所有可用实例,则不会看到此消息

您可以在
--events
之前提供
--aggregate mode off
选项,以分析域的所有实例的事件。例如:

/nvprof——聚合模式关闭——事件扭曲启动。/matrixmul


在未来的版本中,有关域的已分析实例和可用实例的信息将在
--query events
选项中提供。

您能解释一下“实例”是什么意思吗?