Computer vision cs231n卷积神经网络

Computer vision cs231n卷积神经网络,computer-vision,conv-neural-network,calculus,Computer Vision,Conv Neural Network,Calculus,我在看斯坦福大学CS231N的在线讲座。我有一个问题,也许是因为某种原因我弄糊涂了。链接是: 转到35:46,在后退函数中,dx的公式为: dx = self.y * dz. 从那以后我就再也不知道了 z = x*y. 所以 有人能解释一下为什么会有这种不同吗 这在他的代码中只是一个奇怪的符号(dz,dx,dy不是通常意义上的用法)。变量dz此处表示成本函数L(完整神经网络)相对于z的导数,而L对x和y的导数则是dx和dy。z对x的导数是y简单地由self.y给出的。记住这些符号后,其

我在看斯坦福大学CS231N的在线讲座。我有一个问题,也许是因为某种原因我弄糊涂了。链接是:

转到35:46,在后退函数中,dx的公式为:

dx = self.y * dz. 
从那以后我就再也不知道了

z = x*y. 
所以


有人能解释一下为什么会有这种不同吗

这在他的代码中只是一个奇怪的符号(dz,dx,dy不是通常意义上的用法)。变量dz此处表示成本函数L(完整神经网络)相对于z的导数,而Lxy的导数则是dxdyzx的导数是y简单地由self.y给出的。记住这些符号后,其余的都遵循链式规则。

因此,如果我错了,请纠正我。dx不是z对L的影响(dL/dz)和y对x的局部梯度(影响)的乘积(只不过是y)。这是正确的吗?dx是z对L的影响与x对z的影响的乘积。神经元计算z=x*y,因此x和y都会影响z,但y在任何时候都不会影响x。我希望这有帮助!现在它完全有道理了。你的解释,再回到过去,完全有道理。谢谢
dx = dz/y