Python 具有三个3x3内核的6x6阵列的二维互相关

Python 具有三个3x3内核的6x6阵列的二维互相关,python,numpy,matrix,matrix-multiplication,convolution,Python,Numpy,Matrix,Matrix Multiplication,Convolution,我有一个6x6矩阵:例如矩阵a array([[ 0, 1, 2, 3, 4, 5], [ 6, 7, 8, 9, 10, 11], [12, 13, 14, 15, 16, 17], [18, 19, 20, 21, 22, 23], [24, 25, 26, 27, 28, 29], [30, 31, 32, 33, 34, 35]]) 我还有一个3x3x3矩阵:例如矩阵B array([[[ 1, 7,

我有一个6x6矩阵:例如矩阵
a

array([[ 0,  1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10, 11],
       [12, 13, 14, 15, 16, 17],
       [18, 19, 20, 21, 22, 23],
       [24, 25, 26, 27, 28, 29],
       [30, 31, 32, 33, 34, 35]])
我还有一个3x3x3矩阵:例如矩阵
B

array([[[ 1, 7, 2],
        [ 5, 9, 3],
        [ 2, 8, 6]],

       [[ 3, 4, 6],
        [ 6, 8, 9],
        [ 4, 2, 8]],

       [[ 6, 4, 7],
        [ 8, 7, 8],
        [ 4, 4, 7]]])
最后,我有一个3x4x4x4矩阵
C
,(4行,4列,3维),它是空的(用
0
s填充)

我想把
B
(即
[1,:,:]
[2,:,:]
[3,:,:,:]
)的每个“三维”乘以
A
。然而,对于每个维度,我想在“窗口”中乘以
B
,每次在
A
上滑动1,直到我不能再往前走,在这一点上,我移回到开始,向下滑动1个单位,然后再次在
B
A
之间逐个滑动,直到结束,然后向下移动并重复,直到你不越过边界。结果存储在矩阵
C
的相应“三维”中。因此,我的结果将是一个
[3x4x4x4]
矩阵

例如,(乘法是给出标量值的点积,
np.sum((np.multiply(x,y))
),所以

想象
B
“overtop”of
A
,从右角开始,我将
A
的3x3部分乘以
B
s[1x3x3]部分,将结果存储在
C

参考
C
第一维度中的第一个单元(位于第一行和第一列)

C[1,0,0]
=340。因为
[[0,1,2],[6,7,8],[12,13,4]
点积
[[1,7,2],[5,9,3],[2,8,6]

B
矩阵在
A
上滑动1,并将我的第二个结果存储在
C

C[1,0,1]
=383。因为
[[1,2,3],[7,8,9],[13,14,15]
点积
[[1,7,2],[5,9,3],[2,8,6]

然后再次对
B[2,:,:]和
B[3,:,:]
A
上滑动,并分别存储在
C2,:,:]
C[3,:,:,:]


做这件事的好方法是什么?

我想你问的是三种不同内核的二维互相关,而不是简单的矩阵乘法

下面的代码并不是实现这一点的最有效方法,但这是否为您提供了所需的答案?我用它来实现二维相关

>>> from scipy.signal import correlate2d
>>> C = np.dstack([correlate2d(A, B[:, :, i], 'valid') for i in range(B.shape[2])])
>>> C.shape
(4, 4, 3)
>>> C
array([[[ 333,  316,  464],
        [ 372,  369,  520],
        [ 411,  422,  576],
        [ 450,  475,  632]],

       [[ 567,  634,  800],
        [ 606,  687,  856],
        [ 645,  740,  912],
        [ 684,  793,  968]],

       [[ 801,  952, 1136],
        [ 840, 1005, 1192],
        [ 879, 1058, 1248],
        [ 918, 1111, 1304]],

       [[1035, 1270, 1472],
        [1074, 1323, 1528],
        [1113, 1376, 1584],
        [1152, 1429, 1640]]])
这里有一种更“有趣”的方法,它不使用scipy,而是使用。我不确定它是否更有效:

>>> import numpy.lib.stride_tricks as st
>>> s, t = A.strides
>>> i, j = A.shape
>>> k, l, m = B.shape
>>> D = st.as_strided(A, shape=(i-k+1, j-l+1, k, l), strides=(s, t, s, t))
>>> E = np.einsum('ijkl,klm->ijm', D, B)
>>> (E == C).all()
True

我不认为你在问什么,我也不理解你的自定义定义,即组合矩阵和点乘法以得到4x4x3的结果。你想做的对我来说更像,而不是矩阵乘法。。。这就是你想要的吗?你正在经历一个数学问题还是一个编程(实现)问题?是的,我正在尝试使用Numpy和no-CovNet工具包@Praveen构建一个非常简单的CNN的卷积部分。如果我在两个3x3矩阵上使用Numpy.dot(),我将得到一个3x3矩阵,但是我正在尝试将点积作为标量值@smci获取。您想使用
correlate
而不是
convolve
<代码>关联
不会在点积之前先旋转内核。如果您查看示例计算,内核没有旋转。@rayryeng这是一个很好的观点。我们不想让轴翻转,没错
scipy.signal.correlate
应该在不旋转每个内核的情况下执行相同的工作。。。。或者您可以自己旋转内核,并让
卷积
撤消旋转。不管怎样。。。但这是正确的答案。请投我一票。“我正要写答案,你抢先给了我。”“Praveen,如果还不算太晚的话,我真的被你的输出搞糊涂了。”。我所说的[4x4x3]是指具有4行、4列和3维的矩阵。我意识到我应该写[3x4x4]。这是因为3x3窗口只能装入6x6矩阵4次,而不会超出边界。我真的不明白怎么会有4个输出和3个内核。Thanks@Bn.F76一个
(4,4,3)
数组正是您想要的,三个内核沿着最后一个轴。如果您想要
(3,4,4)
数组,只需尝试
C.transpose(2,0,1)
,它将移动前面的最后一个轴,这样当您打印出来时,您将看到三个4x4矩阵。