C++ nppiResizeSqrPixel_32f_C4R()如何工作?

C++ nppiResizeSqrPixel_32f_C4R()如何工作?,c++,cuda,npp,C++,Cuda,Npp,上述功能如何在cuda中执行操作。我们需要同时编写cudamaloc()或MemCopy(),还是只需要内部调用就可以完成所有这些 我写 nppiResizeSqrPixel_32f_C4R(&in[0],sizeofImage,StepSize,&out[0],StepSizeOutput,DestRoi,Xfactor,YFactor,NULL,NULL,16); 这里“in”是具有输入图像的向量,“out”是空向量。但在执行上述函数后,输出向量仍然为“0”。你能告诉我函数

上述功能如何在cuda中执行操作。我们需要同时编写cudamaloc()或MemCopy(),还是只需要内部调用就可以完成所有这些

我写

nppiResizeSqrPixel_32f_C4R(&in[0],sizeofImage,StepSize,&out[0],StepSizeOutput,DestRoi,Xfactor,YFactor,NULL,NULL,16);

这里“in”是具有输入图像的向量,“out”是空向量。但在执行上述函数后,输出向量仍然为“0”。你能告诉我函数如何调整大小吗

它对设备数据进行操作,因此您需要使用设备分配(例如
cudamaloc
)并将数据复制到设备(例如
cudaMemcpy
)等

关于npp调用的文档数量有限,可以在上找到,并且有一些示例演示了npp库调用的使用情况

对于这些资源未解决的问题,您可能还希望查看“英特尔ipp”文档。npp例程在许多情况下都非常类似于“英特尔ipp”的功能,因此您可以从中获得一些见解。这是一个示例文档


此外,还可以检查任何适当的CUDA或npp调用的返回值,您还可以使用
CUDA memcheck
运行代码,以获取可能出错的提示。

它对设备数据进行操作,因此您需要使用设备分配(例如
cudaMalloc
)并将数据复制到设备(例如
cudaMemcpy
),等等

关于npp调用的文档数量有限,可以在上找到,并且有一些示例演示了npp库调用的使用情况

对于这些资源未解决的问题,您可能还希望查看“英特尔ipp”文档。npp例程在许多情况下都非常类似于“英特尔ipp”的功能,因此您可以从中获得一些见解。这是一个示例文档

还可以检查任何适当的CUDA或npp调用的返回值,您还可以使用
CUDA memcheck
运行代码,以获取可能出现错误的提示