Cuda GPU矩阵加法问题

Cuda GPU矩阵加法问题,cuda,gpgpu,Cuda,Gpgpu,我有巨大的矩阵,我希望矩阵的输出与输入矩阵的大小相同,只是每个单元格从相邻单元格中获取数字的总和 你能指导我如何使用CUDA在GPGPU平台上实现它吗?你必须将所有相邻单元的值作为参数传递给你的内核,这样你才能进行求和。 参数列表中的类似内容和后面的代码: (int ACTIVALCELLVALUE,int adj1,int adj2,int adj3…) { actualCellvalue=actualCellvalue+adj1+adj2+adj3。。。。; } 这可能是错误的,但这正是我从

我有巨大的矩阵,我希望矩阵的输出与输入矩阵的大小相同,只是每个单元格从相邻单元格中获取数字的总和


你能指导我如何使用CUDA在GPGPU平台上实现它吗?

你必须将所有相邻单元的值作为参数传递给你的内核,这样你才能进行求和。 参数列表中的类似内容和后面的代码: (int ACTIVALCELLVALUE,int adj1,int adj2,int adj3…)

{ actualCellvalue=actualCellvalue+adj1+adj2+adj3。。。。; }

这可能是错误的,但这正是我从你的简短描述中得出的结论

问候,,
Peter

什么样的实施环境?OpenCL、Cuda、DirectX、OpenGL、DirectCompute、Matlab?除非你具体说明这个问题,否则我怀疑谁能帮上忙。