Cuda atomicAdd（）用于GPU上的double_Cuda_Atomic

Cuda atomicAdd（）用于GPU上的double

cuda

Cuda atomicAdd（）用于GPU上的double,cuda,atomic,Cuda,Atomic,我正在GPU上做一个项目，我必须使用atomicAdd（）来实现double，因为cuda不支持double，所以我使用下面的代码，这是NVIDIA提供的 __device__ double atomicAdd(double* address, double val) { unsigned long long int* address_as_ull = (unsigned long long int*)a

我正在GPU上做一个项目，我必须使用atomicAdd（）来实现double，因为cuda不支持double，所以我使用下面的代码，这是NVIDIA提供的

__device__ double atomicAdd(double* address, double val)
{
    unsigned long long int* address_as_ull =
                                          (unsigned long long int*)address;
    unsigned long long int old = *address_as_ull, assumed;
    do {
        assumed = old;
        old = atomicCAS(address_as_ull, assumed, 
                        __double_as_longlong(val + 
                        __longlong_as_double(assumed)));
    } while (assumed != old);
    return __longlong_as_double(old);
}

现在我想知道为什么实现需要一个循环，而（假定！=old）

基本上是因为实现需要一个负载，而这个负载不能以原子方式执行。比较和交换操作是的原子版本

(*address == assumed) ? (assumed + val) : *address

无法保证

*地址

处的值在从

*地址

加载值的周期和使用

atomicCAS调用存储更新值的周期之间不会发生变化。如果发生这种情况，*地址
处的值将不会更新。因此，循环确保重复这两个操作，直到读取操作与比较和交换操作之间的*地址
处的值没有变化，这意味着进行了更新。
谢谢！你的意思是加载操作，假设=old，不是原子的，所以原子函数old=atomicCAS（地址为，假设为，假设为，双值为，长值为，val+，假设为），old的值可能会被更改，add（）应该再次执行，保证当前值也会被添加。否old
是一个线程局部变量。它的值不会改变，除非本地线程改变它。在threads控件之外，唯一可以更改的值是*address
。当它在操作过程中被另一个线程更改时，必须重复调用atomicCAS
，否则更新不会发生。我知道了，循环函数保证*address\u的当前更改值是由当前线程完成的。