跨并发内核执行的CUDA全局原子操作
我的CUDA应用程序对卷执行关联缩减。本质上,每个线程都计算值,这些值以原子方式添加到全局内存中相同输出缓冲区的重叠位置 是否可以使用不同的输入参数和相同的输出缓冲区同时启动此内核?换句话说,每个内核将共享相同的全局缓冲区,并以原子方式写入跨并发内核执行的CUDA全局原子操作,cuda,atomic,cuda-streams,gpu-atomics,Cuda,Atomic,Cuda Streams,Gpu Atomics,我的CUDA应用程序对卷执行关联缩减。本质上,每个线程都计算值,这些值以原子方式添加到全局内存中相同输出缓冲区的重叠位置 是否可以使用不同的输入参数和相同的输出缓冲区同时启动此内核?换句话说,每个内核将共享相同的全局缓冲区,并以原子方式写入 所有内核都在同一个GPU上运行。是的,这是可能的。全局内存的原子操作是设备范围的。对于设备上运行的任何代码,它们都是原子的
所有内核都在同一个GPU上运行。是的,这是可能的。全局内存的原子操作是设备范围的。对于设备上运行的任何代码,它们都是原子的