C++ 支持NUMA的Cpp容器

C++ 支持NUMA的Cpp容器,c++,performance,memory-management,parallel-processing,numa,C++,Performance,Memory Management,Parallel Processing,Numa,是否有一种方便、高效的方式以NUMA感知的方式使用cpp标准容器API 我想在cpp环境中执行OpenMP并行稀疏矩阵向量乘法。 要分配和初始化与NUMA域相关的向量和矩阵值,C代码将以某种方式如下所示: size_t N = 1000000; double* vecVal = malloc (N*sizeof(double)); #pragma OMP parallel for for (size_i=0; i<N; ++i) { vecVal[i] = 0.; } /* do

是否有一种方便、高效的方式以NUMA感知的方式使用cpp标准容器API

我想在cpp环境中执行OpenMP并行稀疏矩阵向量乘法。 要分配和初始化与NUMA域相关的向量和矩阵值,C代码将以某种方式如下所示:

size_t N = 1000000;
double* vecVal = malloc (N*sizeof(double));

#pragma OMP parallel for
for (size_i=0; i<N; ++i)
{
    vecVal[i] = 0.;
}
/* do spMV */
delete vecVal;
std::vector<double> vec;
vec.reserve(N);
double *vecVal = vec.data();

#pragma OMP parallel for
for (size_i=0; i<N; ++i)
{
    vecVal[i] = 0.;
}
/* do spMV */
size\u t N=1000000;
double*vecVal=malloc(N*sizeof(double));
#pragma-OMP并行

对于(size_i=0;i您必须在这里使用一个特殊的numa感知分配器。我们在这里为HPX实现了类似的功能:


基本思想是在分配器分配函数内部进行第一次触摸。用
#omp parallel for schedule(static)
循环替换HPX executor内容,您应该会没事。

resize()不知道NUMA,因为它初始化一个NUMA域上的所有值(第一次触摸)NUMA感知代码删除
一个
malloc
ed内存是一件特殊的事情吗?