可以从设备端代码触发CUDA事件吗?

可以从设备端代码触发CUDA事件吗?,cuda,cuda-events,Cuda,Cuda Events,有没有办法从CUDA中的设备内核触发事件(用于基准测试,类似于CPU代码中的cudaEvents) 例如,假设我想测量从内核启动到启动计算的第一个线程的时间,以及从离开计算的最后一个线程到CPU返回的时间 我可以这样做吗?设备运行时API(与动态并行性一起使用)确实有,但不支持事件计时 因此,不,您不能这样做。一个糟糕的解决方法是写入某个位置,让主机端线程轮询它,并在值更改时触发事件

有没有办法从CUDA中的设备内核触发事件(用于基准测试,类似于CPU代码中的cudaEvents)

例如,假设我想测量从内核启动到启动计算的第一个线程的时间,以及从离开计算的最后一个线程到CPU返回的时间

我可以这样做吗?

设备运行时API(与动态并行性一起使用)确实有,但不支持事件计时


因此,不,您不能这样做。

一个糟糕的解决方法是写入某个位置,让主机端线程轮询它,并在值更改时触发事件