复制到CUDA常量内存时设备符号无效
我有几个图像处理应用程序的文件。由于在执行某些图像处理算法时,图像的行数和列数不会改变,所以我尝试将这些值放入常量内存中。我的应用程序看起来像: Imageproc.cuh复制到CUDA常量内存时设备符号无效,cuda,nvidia,Cuda,Nvidia,我有几个图像处理应用程序的文件。由于在执行某些图像处理算法时,图像的行数和列数不会改变,所以我尝试将这些值放入常量内存中。我的应用程序看起来像: Imageproc.cuh ... ... __constant__ int c_rows; __constant__ int c_cols; #ifdef __cplusplus extern "C" { #endif ... ... #ifdef __cplusplus } #endif Imageproc.cu
...
...
__constant__ int c_rows;
__constant__ int c_cols;
#ifdef __cplusplus
extern "C"
{
#endif
...
...
#ifdef __cplusplus
}
#endif
Imageproc.cu
...
...
int algorithm(float *a, const int rows, const int cols){
...
...
checkCudaError(cudaMemcpyToSymbol(&c_rows, &rows, sizeof(int)));
checkCudaError(cudaMemcpyToSymbol(&c_cols, &cols, sizeof(int)));
dim3 block(T, T);
dim3 grid(cols/T+1, rows/T+1);
kernel<<<grid, block>>>( ... );
...
...
}
。。。
...
整数算法(浮点*a,常量整数行,常量整数列){
...
...
选中CUDAERROR(CUDAMEMCPITOSYMBOL(&c_行,&rows,sizeof(int));
检查CUDAERROR(CUDAMEMCPITOSYMBOL(&c_cols,&cols,sizeof(int));
dim3块(T,T);
dim3网格(列/T+1,行/T+1);
仁(…);
...
...
}
它编译得很好,但在尝试运行程序时,我得到了无效的设备符号cudamemcpytosymol(&c_行,&rows,sizeof(int))
我不能将这些变量放在常量内存中吗?或者我缺少什么?如果您的符号声明如下:
__constant__ int c_rows;
然后正确调用cudaMemcpyToSymbol
就是
int rows = 5;
cudaMemcpyToSymbol(c_rows, &rows, sizeof(int)));
也许这些天我与CUDA失去了联系,但我想hat
cudaMemcpyToSymbol
需要一个字符串作为目标符号名?@PaulR:这在CUDA 4中被弃用,在CUDA 5中被删除。现在一个符号被直接传递(这是因为CUDA在内部使用了适当的ELF头和链接器)