CUDA分析器中的依赖项分析选项
我已经实现了一个程序,它使用单个GPU,使用CUDA分析器中的依赖项分析选项,cuda,nvvp,Cuda,Nvvp,我已经实现了一个程序,它使用单个GPU,使用cudaStreamWaitEvent()函数在两个使用事件的流中设置依赖关系 为了验证这种依赖性,是否可以使用英伟达可视化剖析器上的“依赖性分析”视图?p> 如果没有,那么依赖关系分析视图中的以下每个选项都提供了什么 焦点关键路径 突出显示执行依赖项 有关这些选项的详细信息似乎在中不可用,并且是的,您应该能够使用依赖关系分析功能来验证大多数CUDA同步API的使用情况,包括cudaStreamWaitEvent 要使用上述两个选项中的任何一个,您
cudaStreamWaitEvent()
函数在两个使用事件的流中设置依赖关系
<>为了验证这种依赖性,是否可以使用英伟达可视化剖析器上的“依赖性分析”视图?p>
如果没有,那么依赖关系分析视图中的以下每个选项都提供了什么
- 焦点关键路径
- 突出显示执行依赖项
有关这些选项的详细信息似乎在中不可用,并且是的,您应该能够使用依赖关系分析功能来验证大多数CUDA同步API的使用情况,包括
cudaStreamWaitEvent
要使用上述两个选项中的任何一个,您必须在应用程序跟踪中计算依赖项。为此,在NVIDIA Visual Profiler中,选择“非向导分析”,然后选择“依赖性分析”
现在,您可以启用“高亮显示执行依赖项”,当您将鼠标悬停在时间线上或选中它时,它将以红色高亮显示时间线上每个已分析活动的传入和传出依赖项
如果使用cudaStreamWaitEvent
阻止一个内核,直到另一个独立流中的另一个内核完成为止,如果它们是直接依赖项,则这些内核将以红色突出显示。这可能会引起兴趣