复制到CUDA常量内存时设备符号无效_Cuda_Nvidia

复制到CUDA常量内存时设备符号无效

cuda

复制到CUDA常量内存时设备符号无效,cuda,nvidia,Cuda,Nvidia,我有几个图像处理应用程序的文件。由于在执行某些图像处理算法时，图像的行数和列数不会改变，所以我尝试将这些值放入常量内存中。我的应用程序看起来像： Imageproc.cuh ... ... __constant__ int c_rows; __constant__ int c_cols; #ifdef __cplusplus extern "C" { #endif ... ... #ifdef __cplusplus } #endif Imageproc.cu

我有几个图像处理应用程序的文件。由于在执行某些图像处理算法时，图像的行数和列数不会改变，所以我尝试将这些值放入常量内存中。我的应用程序看起来像：

Imageproc.cuh

...
...
__constant__ int c_rows;
__constant__ int c_cols;

#ifdef __cplusplus
   extern "C"
   {
#endif
   ...
   ...
#ifdef __cplusplus
   }
#endif

Imageproc.cu

...
...

int algorithm(float *a, const int rows, const int cols){
   ...
   ...
   checkCudaError(cudaMemcpyToSymbol(&c_rows, &rows, sizeof(int)));
   checkCudaError(cudaMemcpyToSymbol(&c_cols, &cols, sizeof(int)));

   dim3 block(T, T);
   dim3 grid(cols/T+1, rows/T+1);

   kernel<<<grid, block>>>( ... );
   ...
   ...

}

。。。
...
整数算法（浮点*a，常量整数行，常量整数列）{
...
...
选中CUDAERROR（CUDAMEMCPITOSYMBOL（&c_行，&rows，sizeof（int））；
检查CUDAERROR（CUDAMEMCPITOSYMBOL（&c_cols，&cols，sizeof（int））；
dim3块（T，T）；
dim3网格（列/T+1，行/T+1）；
仁（…）；
...
...
}

它编译得很好，但在尝试运行程序时，我得到了无效的设备符号cudamemcpytosymol（&c_行，&rows，sizeof（int））

我不能将这些变量放在常量内存中吗？或者我缺少什么？

如果您的符号声明如下：

__constant__ int c_rows;

然后正确调用

cudaMemcpyToSymbol

就是

int rows = 5;
cudaMemcpyToSymbol(c_rows, &rows, sizeof(int)));

也许这些天我与CUDA失去了联系，但我想hat

cudaMemcpyToSymbol

需要一个字符串作为目标符号名？@PaulR:这在CUDA 4中被弃用，在CUDA 5中被删除。现在一个符号被直接传递（这是因为CUDA在内部使用了适当的ELF头和链接器）