Cuda 不能声明超过512个动态共享内存浮动

Cuda 不能声明超过512个动态共享内存浮动,cuda,Cuda,我在AWS上与CUDA合作,所以我认为计算版本是3.0。我试图声明动态共享内存,并与调试器检查,它从未分配超过512个值。常规共享内存有效 Kern<<<1,1,1024>>>(...) __global__ void Kern(..) { __shared__ float sh[]; } 我使用cuda gdb,在访问超过512个元素时收到一个错误 这里有没有我缺少的配置?我查看了部分文档,没有看到任何限制这么低 第三个内核配置参数此处的值为102

我在AWS上与CUDA合作,所以我认为计算版本是3.0。我试图声明动态共享内存,并与调试器检查,它从未分配超过512个值。常规共享内存有效

Kern<<<1,1,1024>>>(...)
__global__ void Kern(..) {
    __shared__ float sh[];
}
我使用cuda gdb,在访问超过512个元素时收到一个错误


这里有没有我缺少的配置?我查看了部分文档,没有看到任何限制这么低

第三个内核配置参数此处的值为1024:

Kern<<<1,1,1024>>>(...) __global__ void Kern(..) { __shared__ float sh[]; }
您可能还需要阅读《编程指南》中的相关内容

Kern<<<1,1,4096>>>(...) __global__ void Kern(..) { extern __shared__ float sh[]; }