C++ 来自opencv gpu::Convalve的cuda convnet等效方法

C++ 来自opencv gpu::Convalve的cuda convnet等效方法,c++,opencv,image-processing,cuda,convolution,C++,Opencv,Image Processing,Cuda,Convolution,我在CUDA上使用Opencv进行卷积。我知道这也会卷积。任何人都知道如何调用CUDA CUNETE从C++获得类似的逻辑,如OpenCv的GPU::卷积?我想比较哪种实现在CUDA上运行卷积更快,尤其是在图像上运行一批过滤器时。我认为您可以使用位于(我的机器上)文件夹中的CUDA示例: c:\ProgramData\NVIDIA Corporation\CUDA Samples\v5.5\3\u Imaging\卷积可分离\ 这是描述文件:convnet是卷积神经网络,它是(相当复杂和强大的)

我在CUDA上使用Opencv进行卷积。我知道这也会卷积。任何人都知道如何调用CUDA CUNETE从C++获得类似的逻辑,如OpenCv的GPU::卷积?我想比较哪种实现在CUDA上运行卷积更快,尤其是在图像上运行一批过滤器时。

我认为您可以使用位于(我的机器上)文件夹中的CUDA示例: c:\ProgramData\NVIDIA Corporation\CUDA Samples\v5.5\3\u Imaging\卷积可分离\


这是描述文件:

convnet是卷积神经网络,它是(相当复杂和强大的)无监督学习工具。卷积运算(在图像处理中)只是相邻像素值的简单加权求和。代码没有详细的文档记录,因此必须仔细阅读代码。它在训练时会对图像进行卷积,所以我想知道是否有一种方法可以像opencv的gpu::Convalve.+1那样进行卷积。这很有帮助。convnet在它的实现中是否使用它来获得“最佳”性能?我不认为convnet使用可分离卷积,因为并非所有的内核都是可分离的,但卷积网络需要与任意内核进行卷积(它通过训练计算)。我认为它使用了2D卷积的实现。