Python 理解numpy np.tensordot_Python_Python 3.x_Numpy_Multidimensional Array_Tensordot

Python 理解numpy np.tensordot

python python-3.x numpy

Python 理解numpy np.tensordot,python,python-3.x,numpy,multidimensional-array,tensordot,Python,Python 3.x,Numpy,Multidimensional Array,Tensordot,我试图理解这个张量函数是如何工作的。我知道它返回的是tensordot积但这一部分对我来说有点难以理解。我所观察到的对于ans，它类似于数组arr1中的列数和arr2中的行数构成最终矩阵对于ans2，arr2中的列数和arr1中的行数是相反的我不懂轴=（[1,0]，[0,1]）。让我知道我对ans和ans2的理解是否正确据我从tensordot文档中了解，您提供的是ans、ans2和ans3中的axis列表（ans和ans2在列表中只有一个元素）。然后，此列表指定要求和的轴。您对ans和

我试图理解这个张量函数是如何工作的。我知道它返回的是tensordot积

但这一部分对我来说有点难以理解。我所观察到的

对于ans，它类似于数组arr1中的列数和arr2中的行数构成最终矩阵

对于ans2，arr2中的列数和arr1中的行数是相反的

我不懂轴=（[1,0]，[0,1]）。让我知道我对ans和ans2的理解是否正确

据我从tensordot文档中了解，您提供的是ans、ans2和ans3中的axis列表（ans和ans2在列表中只有一个元素）。然后，此列表指定要求和的轴。您对ans和ans2的假设是正确的，在ans中，您的第一个元素是arr1的0轴（arr1中的行）和arr2中的1轴（arr2中的列）。我不完全确定从ans3中可以得到什么，但我可以试着自己运行一些示例并看一看。我希望这能给你一点更好的理解

链接：

您忘记显示阵列：

arr1 = np.arange(8).reshape(4, 2)
arr2 = np.arange(4, 12).reshape(2, 4)
ans=np.tensordot(arr1,arr2,axes=([1],[0]))
ans2=np.tensordot(arr1,arr2,axes=([0],[1]))
ans3 = np.tensordot(arr1,arr2, axes=([1,0],[0,1]))

ans

只是普通的点矩阵积：

In [87]: arr1
Out[87]: 
array([[0, 1],
       [2, 3],
       [4, 5],
       [6, 7]])
In [88]: arr2
Out[88]: 
array([[ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])
In [89]: ans
Out[89]: 
array([[  8,   9,  10,  11],
       [ 32,  37,  42,  47],
       [ 56,  65,  74,  83],
       [ 80,  93, 106, 119]])
In [90]: ans2
Out[90]: 
array([[ 76, 124],
       [ 98, 162]])
In [91]: ans3
Out[91]: array(238)

点

乘积之和在

（[1]，[0]）

轴1的

arr1

和轴0的

arr2

上执行（传统的跨列、跨行）。使用2d“跨…求和”短语可能会令人困惑。处理1或3d阵列时更清晰。在这里，匹配的大小2维相加，留下（4,4）

ans2

将它们反转，在4上求和，生成（2,2）：

tensordot

刚刚转换了两个数组并执行了常规的

dot

：

In [94]: np.dot(arr2,arr1)
Out[94]: 
array([[ 76,  98],
       [124, 162]])

ans3

is使用转置和重塑（

ravel

），在两个轴上求和：

In [95]: np.dot(arr1.T,arr2.T)
Out[95]: 
array([[ 76, 124],
       [ 98, 162]])

一般来说，

tensordot

混合使用转置和重塑，将问题简化为二维

np.dot

问题。然后，它可以重塑和转置结果

我发现

einsum

的维度控制更清晰：

In [98]: np.dot(arr1.ravel(),arr2.T.ravel())
Out[98]: 238

随着

einsum

和

matmul/@

的发展，

tensordot

已变得不那么必要。它更难理解，并且没有任何速度或灵活性优势。不要担心理解它

ans3

是其他两个ans的轨迹（对角线总和）：

In [99]: np.einsum('ij,jk->ik',arr1,arr2)
Out[99]: 
array([[  8,   9,  10,  11],
       [ 32,  37,  42,  47],
       [ 56,  65,  74,  83],
       [ 80,  93, 106, 119]])
In [100]: np.einsum('ji,kj->ik',arr1,arr2)
Out[100]: 
array([[ 76, 124],
       [ 98, 162]])
In [101]: np.einsum('ij,ji',arr1,arr2)
Out[101]: 238