Python 如何使用低级pytorch API实现卷积运算的变体?
我的目标是在pytorch中实现卷积运算的一种变体,它需要很高的推理速度Python 如何使用低级pytorch API实现卷积运算的变体?,python,c++,pytorch,convolution,Python,C++,Pytorch,Convolution,我的目标是在pytorch中实现卷积运算的一种变体,它需要很高的推理速度 我通过PyrORPCPP扩展实现了C++和CUDA中的一个。但是,速度并不令人满意,我想我必须用较低级别的API实现它。似乎aten/src/aten/native/Convolution.cpp是这样做的正确位置,它进一步调用aten/src/THNN/generic/SpatialConvolutionMM.c,所以我修改了SpatialConvolutionMM.c。问题是编译后,我看不到输出上有任何更改。也许THN
我通过PyrORPCPP扩展实现了C++和CUDA中的一个。但是,速度并不令人满意,我想我必须用较低级别的API实现它。似乎
aten/src/aten/native/Convolution.cpp
是这样做的正确位置,它进一步调用aten/src/THNN/generic/SpatialConvolutionMM.c
,所以我修改了SpatialConvolutionMM.c
。问题是编译后,我看不到输出上有任何更改。也许THNN中的文件以某种方式包装在ATen/native
中,我就是搞不懂。谁能给我一些建议吗?多谢各位