Performance CUDA翘曲执行效率

Performance CUDA翘曲执行效率,performance,cuda,gpgpu,gpu,Performance,Cuda,Gpgpu,Gpu,我可以获得每个内核的warp\u执行效率,但如何获得程序的总warp\u执行效率?注意:计算所有内核的单个数字不太可能用于优化目的 NVIDIA的探查器是以内核为中心的,因此直接查询这些信息是不可能的。但是,您可以运行nvpro--csv--metrics warp\u execution\u efficiency,然后将输出放入Excel、R或您最喜欢的统计软件中,并在其中进行处理 其中一个问题是,warp\u执行效率涉及平均值,因此不能只取平均值。您可能会得到一些VisualProfiler

我可以获得每个内核的warp\u执行效率,但如何获得程序的总warp\u执行效率?

注意:计算所有内核的单个数字不太可能用于优化目的

NVIDIA的探查器是以内核为中心的,因此直接查询这些信息是不可能的。但是,您可以运行
nvpro--csv--metrics warp\u execution\u efficiency
,然后将输出放入Excel、R或您最喜欢的统计软件中,并在其中进行处理


其中一个问题是,warp\u执行效率涉及平均值,因此不能只取平均值。您可能会得到一些VisualProfiler不提供的方便的可视化效果

注意:在所有内核中计算一个数字不太可能用于优化目的

NVIDIA的探查器是以内核为中心的,因此直接查询这些信息是不可能的。但是,您可以运行
nvpro--csv--metrics warp\u execution\u efficiency
,然后将输出放入Excel、R或您最喜欢的统计软件中,并在其中进行处理

其中一个问题是,warp\u执行效率涉及平均值,因此不能只取平均值。您可能会得到一些VisualProfiler不提供的方便的可视化效果