Python 理解numpy np.tensordot
我试图理解这个张量函数是如何工作的。我知道它返回的是tensordot积 但这一部分对我来说有点难以理解。我所观察到的 对于ans,它类似于数组arr1中的列数和arr2中的行数构成最终矩阵 对于ans2,arr2中的列数和arr1中的行数是相反的Python 理解numpy np.tensordot,python,python-3.x,numpy,multidimensional-array,tensordot,Python,Python 3.x,Numpy,Multidimensional Array,Tensordot,我试图理解这个张量函数是如何工作的。我知道它返回的是tensordot积 但这一部分对我来说有点难以理解。我所观察到的 对于ans,它类似于数组arr1中的列数和arr2中的行数构成最终矩阵 对于ans2,arr2中的列数和arr1中的行数是相反的 我不懂轴=([1,0],[0,1])。让我知道我对ans和ans2的理解是否正确据我从tensordot文档中了解,您提供的是ans、ans2和ans3中的axis列表(ans和ans2在列表中只有一个元素)。然后,此列表指定要求和的轴。您对ans和
我不懂轴=([1,0],[0,1])。让我知道我对ans和ans2的理解是否正确据我从tensordot文档中了解,您提供的是ans、ans2和ans3中的axis列表(ans和ans2在列表中只有一个元素)。然后,此列表指定要求和的轴。您对ans和ans2的假设是正确的,在ans中,您的第一个元素是arr1的0轴(arr1中的行)和arr2中的1轴(arr2中的列)。我不完全确定从ans3中可以得到什么,但我可以试着自己运行一些示例并看一看。我希望这能给你一点更好的理解
链接:据我从tensordot文档中了解,您提供的是ans、ans2和ans3中的axis列表(ans和ans2在列表中只有一个元素)。然后,此列表指定要求和的轴。您对ans和ans2的假设是正确的,在ans中,您的第一个元素是arr1的0轴(arr1中的行)和arr2中的1轴(arr2中的列)。我不完全确定从ans3中可以得到什么,但我可以试着自己运行一些示例并看一看。我希望这能给你一点更好的理解
链接:您忘记显示阵列:
arr1 = np.arange(8).reshape(4, 2)
arr2 = np.arange(4, 12).reshape(2, 4)
ans=np.tensordot(arr1,arr2,axes=([1],[0]))
ans2=np.tensordot(arr1,arr2,axes=([0],[1]))
ans3 = np.tensordot(arr1,arr2, axes=([1,0],[0,1]))
ans
只是普通的点矩阵积:
In [87]: arr1
Out[87]:
array([[0, 1],
[2, 3],
[4, 5],
[6, 7]])
In [88]: arr2
Out[88]:
array([[ 4, 5, 6, 7],
[ 8, 9, 10, 11]])
In [89]: ans
Out[89]:
array([[ 8, 9, 10, 11],
[ 32, 37, 42, 47],
[ 56, 65, 74, 83],
[ 80, 93, 106, 119]])
In [90]: ans2
Out[90]:
array([[ 76, 124],
[ 98, 162]])
In [91]: ans3
Out[91]: array(238)
点
乘积之和在([1],[0])
轴1的arr1
和轴0的arr2
上执行(传统的跨列、跨行)。使用2d“跨…求和”短语可能会令人困惑。处理1或3d阵列时更清晰。在这里,匹配的大小2维相加,留下(4,4)
ans2
将它们反转,在4上求和,生成(2,2):
tensordot
刚刚转换了两个数组并执行了常规的dot
:
In [94]: np.dot(arr2,arr1)
Out[94]:
array([[ 76, 98],
[124, 162]])
ans3
is使用转置和重塑(ravel
),在两个轴上求和:
In [95]: np.dot(arr1.T,arr2.T)
Out[95]:
array([[ 76, 124],
[ 98, 162]])
一般来说,tensordot
混合使用转置和重塑,将问题简化为二维np.dot
问题。然后,它可以重塑和转置结果
我发现einsum
的维度控制更清晰:
In [98]: np.dot(arr1.ravel(),arr2.T.ravel())
Out[98]: 238
随着einsum
和matmul/@
的发展,tensordot
已变得不那么必要。它更难理解,并且没有任何速度或灵活性优势。不要担心理解它
ans3
是其他两个ans的轨迹(对角线总和):
In [99]: np.einsum('ij,jk->ik',arr1,arr2)
Out[99]:
array([[ 8, 9, 10, 11],
[ 32, 37, 42, 47],
[ 56, 65, 74, 83],
[ 80, 93, 106, 119]])
In [100]: np.einsum('ji,kj->ik',arr1,arr2)
Out[100]:
array([[ 76, 124],
[ 98, 162]])
In [101]: np.einsum('ij,ji',arr1,arr2)
Out[101]: 238
您忘记显示阵列:
arr1 = np.arange(8).reshape(4, 2)
arr2 = np.arange(4, 12).reshape(2, 4)
ans=np.tensordot(arr1,arr2,axes=([1],[0]))
ans2=np.tensordot(arr1,arr2,axes=([0],[1]))
ans3 = np.tensordot(arr1,arr2, axes=([1,0],[0,1]))
ans
只是普通的点矩阵积:
In [87]: arr1
Out[87]:
array([[0, 1],
[2, 3],
[4, 5],
[6, 7]])
In [88]: arr2
Out[88]:
array([[ 4, 5, 6, 7],
[ 8, 9, 10, 11]])
In [89]: ans
Out[89]:
array([[ 8, 9, 10, 11],
[ 32, 37, 42, 47],
[ 56, 65, 74, 83],
[ 80, 93, 106, 119]])
In [90]: ans2
Out[90]:
array([[ 76, 124],
[ 98, 162]])
In [91]: ans3
Out[91]: array(238)
点
乘积之和在([1],[0])
轴1的arr1
和轴0的arr2
上执行(传统的跨列、跨行)。使用2d“跨…求和”短语可能会令人困惑。处理1或3d阵列时更清晰。在这里,匹配的大小2维相加,留下(4,4)
ans2
将它们反转,在4上求和,生成(2,2):
tensordot
刚刚转换了两个数组并执行了常规的dot
:
In [94]: np.dot(arr2,arr1)
Out[94]:
array([[ 76, 98],
[124, 162]])
ans3
is使用转置和重塑(ravel
),在两个轴上求和:
In [95]: np.dot(arr1.T,arr2.T)
Out[95]:
array([[ 76, 124],
[ 98, 162]])
一般来说,tensordot
混合使用转置和重塑,将问题简化为二维np.dot
问题。然后,它可以重塑和转置结果
我发现einsum
的维度控制更清晰:
In [98]: np.dot(arr1.ravel(),arr2.T.ravel())
Out[98]: 238
随着einsum
和matmul/@
的发展,tensordot
已变得不那么必要。它更难理解,并且没有任何速度或灵活性优势。不要担心理解它
ans3
是其他两个ans的轨迹(对角线总和):
In [99]: np.einsum('ij,jk->ik',arr1,arr2)
Out[99]:
array([[ 8, 9, 10, 11],
[ 32, 37, 42, 47],
[ 56, 65, 74, 83],
[ 80, 93, 106, 119]])
In [100]: np.einsum('ji,kj->ik',arr1,arr2)
Out[100]:
array([[ 76, 124],
[ 98, 162]])
In [101]: np.einsum('ij,ji',arr1,arr2)
Out[101]: 238