跨并发内核执行的CUDA全局原子操作_Cuda_Atomic_Cuda Streams_Gpu Atomics

跨并发内核执行的CUDA全局原子操作

cuda

跨并发内核执行的CUDA全局原子操作,cuda,atomic,cuda-streams,gpu-atomics,Cuda,Atomic,Cuda Streams,Gpu Atomics,我的CUDA应用程序对卷执行关联缩减。本质上，每个线程都计算值，这些值以原子方式添加到全局内存中相同输出缓冲区的重叠位置是否可以使用不同的输入参数和相同的输出缓冲区同时启动此内核？换句话说，每个内核将共享相同的全局缓冲区，并以原子方式写入所有内核都在同一个GPU上运行。是的，这是可能的。全局内存的原子操作是设备范围的。对于设备上运行的任何代码，它们都是原子的

我的CUDA应用程序对卷执行关联缩减。本质上，每个线程都计算值，这些值以原子方式添加到全局内存中相同输出缓冲区的重叠位置

是否可以使用不同的输入参数和相同的输出缓冲区同时启动此内核？换句话说，每个内核将共享相同的全局缓冲区，并以原子方式写入

所有内核都在同一个GPU上运行。