C++ CUDA测量2_syncthread()点之间的时间
我搜索了一点,但我发现的所有东西都只能在CPU代码中进行注释,我如何测量内核中2_syncthread()与1 threadblock之间的部分时间?可能吗 一种方法是使用所述的C++ CUDA测量2_syncthread()点之间的时间,c++,cuda,profiling,gpu,C++,Cuda,Profiling,Gpu,我搜索了一点,但我发现的所有东西都只能在CPU代码中进行注释,我如何测量内核中2_syncthread()与1 threadblock之间的部分时间?可能吗 一种方法是使用所述的clock()或clock64功能 在clock64上搜索cuda标记,以获取其用法的其他示例
clock()
或clock64
功能
在clock64
上搜索cuda标记,以获取其用法的其他示例