Pytorch 当我包括'；loss.backward（）和#x27；在'；带火炬。无梯度（）：'；？_Pytorch_Backpropagation

Pytorch 当我包括'；loss.backward（）和#x27；在'；带火炬。无梯度（）：'；？

pytorch

Pytorch 当我包括'；loss.backward（）和#x27；在'；带火炬。无梯度（）：'；？,pytorch,backpropagation,Pytorch,Backpropagation,我正在使用PyTorch中的一个线性回归示例。我知道我做错了，包括使用torch.no_grad（）：'时的'loss.backward（）'在内，但为什么它与我的代码配合得很好呢根据，torch.autograd.no_grad是禁用渐变计算的上下文管理器。所以我真的很困惑代码如下：导入火炬导入torch.nn作为nn 将numpy作为np导入将matplotlib.pyplot作为plt导入 #玩具数据集 x_train=np.数组（[[3.3]、[4.4]、[5.5]、[6.71

我正在使用PyTorch中的一个线性回归示例。我知道我做错了，包括使用torch.no_grad（）：'时的'loss.backward（）'在内，但为什么它与我的代码配合得很好呢

根据，

torch.autograd.no_grad

是禁用渐变计算的上下文管理器。所以我真的很困惑

代码如下：

导入火炬
导入torch.nn作为nn
将numpy作为np导入
将matplotlib.pyplot作为plt导入
#玩具数据集
x_train=np.数组（[[3.3]、[4.4]、[5.5]、[6.71]、[6.93]、[4.168]，
[9.779], [6.182], [7.59], [2.167], [7.042], 
[10.791]、[5.313]、[7.997]、[3.1]、dtype=np.32）
y_train=np.数组（[1.7]、[2.76]、[2.09]、[3.19]、[1.694]、[1.573]，
[3.366], [2.596], [2.53], [1.221], [2.827], 
[3.465]、[1.65]、[2.904]、[1.3]、dtype=np.32）
输入大小=1
输出大小=1
纪元=100
学习率=0.05
模型=nn.线性（输入大小、输出大小）
标准=nn.MSELoss（减少='sum'）
optimizer=torch.optim.Adam（model.parameters（），lr=learning\u rate）
#训练
对于范围内的历元（历元）：
#将numpy转换为张量
输入=来自numpy（x列车）的火炬
目标=火炬从努比（y列车）
#前进
输出=模型（输入）
损失=标准（输出，目标）
#落后的
使用手电筒。无梯度（）
模型0_梯度（）
loss.backward（）
optimizer.step（）
打印（'inputs grad:'，inputs.requires_grad）
如果历元%5==0：
打印（'Epoch[{}/{}]，丢失：{:.4f}'。格式（Epoch+1，Epoch，Loss.item（））
预测=模型（火炬从（x列车）开始）。分离（）.numpy（）
plt.绘图（x_系列、y_系列、ro系列、标签=‘原始数据’）
plt.绘图（x_列车，预测，标签='装配线'）
plt.legend（）
plt.show（）
#保存模型检查点
torch.save（model.state\u dict（），'model\linear\u model.ckpt'）

提前感谢您回答我的问题。

这是有效的，因为损失计算发生在

无梯度之前，并且您一直根据损失计算来计算梯度（该计算启用了梯度）
基本上，您可以使用在no_grad
之外计算的渐变继续更新层的权重
当您实际使用no\u grad
时：
for epoch in range(epochs):
    # convert numpy to tensor
    inputs = torch.from_numpy(x_train)
    targets = torch.from_numpy(y_train)
    with torch.no_grad():  # no_grad used here
    # forward
        out = model(inputs)
        loss = criterion(out, targets)
        model.zero_grad()
        loss.backward()
        optimizer.step()
        print('inputs grad : ', inputs.requires_grad)
    if epoch % 5 == 0:
        print ('Epoch [{}/{}], Loss: {:.4f}'.format(epoch+1, epochs, loss.item()))

然后你会得到正确的错误，说：
张量的元素0不需要梯度，也没有梯度fn

也就是说，在不适合使用的地方使用no_grad

如果打印损失的.requires\u grad
，则您将看到损失具有requires\u grad

也就是说，当您这样做时：
for epoch in range(epochs):
    # convert numpy to tensor
    inputs = torch.from_numpy(x_train)
    targets = torch.from_numpy(y_train)

    # forward
    out = model(inputs)
    loss = criterion(out, targets)

    # backward
    with torch.no_grad():
        model.zero_grad()
        loss.backward()

        optimizer.step()
        print('inputs grad : ', inputs.requires_grad)
        print('loss grad : ', loss.requires_grad)  # Prints loss.require_rgad
    if epoch % 5 == 0:
        print ('Epoch [{}/{}], Loss: {:.4f}'.format(epoch+1, epochs, loss.item()))

你会看到：
inputs grad :  False
loss grad :  True

此外
print('inputs grad : ', inputs.requires_grad)

将始终打印False
。也就是说，如果你这样做了
for epoch in range(epochs):
    # convert numpy to tensor
    inputs = torch.from_numpy(x_train)
    targets = torch.from_numpy(y_train)

    print('inputs grad : ', inputs.requires_grad). # Print the inputs.requires_grad

    # forward
    out = model(inputs)
    loss = criterion(out, targets)

    # backward
    with torch.no_grad():
        model.zero_grad()
        loss.backward()

        optimizer.step()
        print('inputs grad : ', inputs.requires_grad)
        print('loss grad : ', loss.requires_grad)
    if epoch % 5 == 0:
        print ('Epoch [{}/{}], Loss: {:.4f}'.format(epoch+1, epochs, loss.item()))

您将获得：
inputs grad :  False
inputs grad :  False
loss grad :  True

也就是说，你用错误的东西来检查你做错了什么。你能做的最好的事情就是再次阅读PyTorch关于梯度力学的文档
 谢谢你的建议，你真的帮了我很多。我以前误解了pytorch上的签名。