在OpenMP中对struct（x，y，z）变量使用原子操作我在C++中开发了一个OpenMP代码（编译器是g++4.82）。在代码的一部分中，我需要对结构数据执行原子添加。strct的定义如下： struct real3 { float x; float y; float z; };_C++_Struct_Openmp_Atomic

在OpenMP中对struct（x，y，z）变量使用原子操作我在C++中开发了一个OpenMP代码（编译器是g++4.82）。在代码的一部分中，我需要对结构数据执行原子添加。strct的定义如下： struct real3 { float x; float y; float z; };

c++ struct

在OpenMP中对struct（x，y，z）变量使用原子操作我在C++中开发了一个OpenMP代码（编译器是g++4.82）。在代码的一部分中，我需要对结构数据执行原子添加。strct的定义如下： struct real3 { float x; float y; float z; };,c++,struct,openmp,atomic,C++,Struct,Openmp,Atomic,我为它定义了加法运算符，如下所示： inline real3 operator+(real3 a, real3 b) { return make_real3(a.x + b.x, a.y + b.y, a.z + b.z); } 我在代码的所有部分都使用这个struct。在程序的一部分中，我需要以原子方式执行添加操作： real3 * m_cforce; real3 fn, ft; int i; /* . . . . some code is here */ #pragma o

我为它定义了加法运算符，如下所示：

inline real3 operator+(real3 a, real3 b)
{ 
  return make_real3(a.x + b.x, a.y + b.y, a.z + b.z);
}

我在代码的所有部分都使用这个struct。在程序的一部分中，我需要以原子方式执行添加操作：

real3 * m_cforce;
real3 fn, ft;
int i;
/*
 . . . .  some code is here 

*/

#pragma omp atomic
m_cforce[i] = m_cforce[i] + (fn + ft);

编译不接受结构real3作为原子加法的操作数。一种解决方案是使用以下代码：

#pragma omp atomic
m_cforce[i].x = m_cforce[i].x + (fn + ft).x;
#pragma omp atomic
m_cforce[i].y = m_cforce[i].y + (fn + ft).y;
#pragma omp atomic
m_cforce[i].z = m_cforce[i].z + (fn + ft).z;

这样，我使用原子学的次数增加了3倍，这将花费我更多的时间。有没有什么方法可以节省我的计算开销

OpenMP原子需要在标量值（简单类型）上运行。原子旨在通过运行时映射到内核级甚至指令级原子。如果不了解您的问题，很难给出一个答案，但对于这类问题，通常有一些建议：

使用线程局部变量（如果可能）。如果只有一个线程可以对其进行写入，那么可以在大部分计算中避免原子，然后在最后减少原子
上面的3原子方法可以工作，但它允许多个线程添加到同一real3中，可能是交错的。由于浮点是非关联的，这可能会导致更不确定的结果。总的来说，这是一个不错的选择
每个共享real3使用OpenMP锁。使用critical就像在包含的代码段周围使用单个锁一样。如果您按照real3使用锁，只要它们接触不同的real3，它们就可以并行运行。OpenMPs锁不是最快的，但它们应该比临界值快

#pragma omp atomic
m_cforce[i].x = m_cforce[i].x + (fn + ft).x;
#pragma omp atomic
m_cforce[i].y = m_cforce[i].y + (fn + ft).y;
#pragma omp atomic
m_cforce[i].z = m_cforce[i].z + (fn + ft).z;

#pragma omp atomic
m_cforce[j].x = m_cforce[j].x - (fn + ft).x;
#pragma omp atomic
m_cforce[j].y = m_cforce[j].y - (fn + ft).y;
#pragma omp atomic
m_cforce[j].z = m_cforce[j].z - (fn + ft).z;

fn+ft

critical

atomic

critical