Cuda 为什么不';“我不明白吗?”;螺纹“安装已执行”;

Cuda 为什么不';“我不明白吗?”;螺纹“安装已执行”;,cuda,gpu,profiling,nvidia,nvprof,Cuda,Gpu,Profiling,Nvidia,Nvprof,当我列出nvprof的指标时 nvprof——查询事件 我明白了: thread_inst_executed:活动线程执行的指令数。对于每一条指令,它都会增加执行该指令的线程数,包括谓词外线程。它不包括回放 我想使用此指标,因此我使用以下方法收集指标: nvprof--csv--metrics thread_inst_executed、inst_executed_global_loads、inst_executed_local_loads、inst_executed_local_stores、

当我列出nvprof的指标时

nvprof——查询事件
我明白了:

thread_inst_executed:活动线程执行的指令数。对于每一条指令,它都会增加执行该指令的线程数,包括谓词外线程。它不包括回放

我想使用此指标,因此我使用以下方法收集指标:

nvprof--csv--metrics thread_inst_executed、inst_executed_global_loads、inst_executed_local_loads、inst_executed_local_stores、inst_executed_shared_loads、inst_executed_shared__stores、gld_transactions、gst_transactions、local_load_transactions、local_store_transactions、shared_load_transactions、,共享存储事务、二级读事务、二级写事务、dram读事务、dram写事务、sysmem读事务、sysmem写事务。/我的程序我的参数

输出具有我要求的所有指标。。。执行的线程安装除外。为什么它不见了?我怎样才能得到它

当我列出nvprof的指标时

nvprof——查询-事件

这是不一致的用法(强调添加)

使用
nvprof
(或
nvvp
),事件指标

要查询事件,请使用:

--query-events
--query-metrics
要查询指标,您可以使用:

--query-events
--query-metrics
若要配置文件,请求事件度量,您可以使用

--events name_of_event,...
--metrics name_of_metric,...
若要分析,请使用公制度量,您可以使用

--events name_of_event,...
--metrics name_of_metric,...
如果您这样做:

--metrics name_of_event,...

我不知道这种行为是什么,但我不希望它能正常工作

当我列出nvprof的指标时

nvprof——查询-事件

这是不一致的用法(强调添加)

使用
nvprof
(或
nvvp
),事件指标

要查询事件,请使用:

--query-events
--query-metrics
要查询指标,您可以使用:

--query-events
--query-metrics
若要配置文件,请求事件度量,您可以使用

--events name_of_event,...
--metrics name_of_metric,...
若要分析,请使用公制度量,您可以使用

--events name_of_event,...
--metrics name_of_metric,...
如果您这样做:

--metrics name_of_event,...


我不知道行为是什么,但我不希望它能正常工作。

因为事件和指标不是一回事。一方面,您查询了事件。另一方面,您要求提供指标,但提供了事件的名称。如果你真的想列出nvprof的指标,你应该做
--查询指标
而不是
--查询事件
@RobertCrovella:如果你想把它写下来作为一个答案,这对我很有用。@Richard:请随意添加你自己的答案,因为事件和指标不是一回事。一方面,您查询了事件。另一方面,您要求提供指标,但提供了事件的名称。如果你真的想列出nvprof的指标,你应该做
--查询指标
而不是
--查询事件
@RobertCrovella:如果你想把它写下来作为一个答案的话,这对我很有用。@Richard:请随意添加你自己的答案行为是,未识别的指标被悄悄删除了。您可以在对nvprof的同一个调用中指定度量和事件,因此我最终就是这么做的。谢谢你的帮助!其行为是,未被识别的指标被悄悄删除。您可以在对nvprof的同一个调用中指定度量和事件,因此我最终就是这么做的。谢谢你的帮助!