Python 如何使用低级pytorch API实现卷积运算的变体？_Python_C++_Pytorch_Convolution

Python 如何使用低级pytorch API实现卷积运算的变体？

python c++ pytorch

Python 如何使用低级pytorch API实现卷积运算的变体？,python,c++,pytorch,convolution,Python,C++,Pytorch,Convolution,我的目标是在pytorch中实现卷积运算的一种变体，它需要很高的推理速度我通过PyrORPCPP扩展实现了C++和CUDA中的一个。但是，速度并不令人满意，我想我必须用较低级别的API实现它。似乎aten/src/aten/native/Convolution.cpp是这样做的正确位置，它进一步调用aten/src/THNN/generic/SpatialConvolutionMM.c，所以我修改了SpatialConvolutionMM.c。问题是编译后，我看不到输出上有任何更改。也许THN

我的目标是在pytorch中实现卷积运算的一种变体，它需要很高的推理速度

我通过PyrORPCPP扩展实现了C++和CUDA中的一个。但是，速度并不令人满意，我想我必须用较低级别的API实现它。似乎

aten/src/aten/native/Convolution.cpp

是这样做的正确位置，它进一步调用

aten/src/THNN/generic/SpatialConvolutionMM.c

，所以我修改了

SpatialConvolutionMM.c

。问题是编译后，我看不到输出上有任何更改。也许THNN中的文件以某种方式包装在

ATen/native

中，我就是搞不懂。谁能给我一些建议吗？多谢各位