Pytorch 我定义了一个损失函数,但向后出现了错误。有人能告诉我如何修复它吗
这是我的损失函数。但这也带来了错误: 回溯(最近一次呼叫最后一次): 文件“/Users/mrfang/channel_capacity/training.py”,第24行,在 loss.backward()文件“/Users/mrfang/anaconda3/lib/python3.6/site packages/torch/tensor.py”, 第150行,向后 torch.autograd.backward(self、gradient、retain\u graph、create\u graph)文件 “/Users/mrfang/anaconda3/lib/python3.6/site packages/torch/autograd/init.py”, 第99行,向后 allow_unreachable=True)#allow_unreachable标志运行时错误:函数lossBackward返回的渐变数不正确 (预期2人,获得1人) 我怎么能修好它呢。非常感谢您的Pytorch 我定义了一个损失函数,但向后出现了错误。有人能告诉我如何修复它吗,pytorch,torch,Pytorch,Torch,这是我的损失函数。但这也带来了错误: 回溯(最近一次呼叫最后一次): 文件“/Users/mrfang/channel_capacity/training.py”,第24行,在 loss.backward()文件“/Users/mrfang/anaconda3/lib/python3.6/site packages/torch/tensor.py”, 第150行,向后 torch.autograd.backward(self、gradient、retain\u graph、create\u gr
向前(ctx,x,输入)
需要两个输入,x
和输入
,因此向后
也应该输出两个梯度,梯度x
和梯度输入
此外,在您的代码片段中,您并没有真正计算自定义渐变,因此您可以使用Pytorch的autograd来计算,而无需定义特殊的函数
如果这是工作代码,并且您要定义自定义损失,那么这里有一个快速样板,说明向后
应该包括哪些内容:
@staticmethod
def前进(ctx,x,输入):
#这是必需的,因此它们在向后调用期间可用
ctx.save_for_backward(x,输入)
#自定义转发
@静力学方法
def向后(ctx、梯度输出):
x、 输入=ctx.U张量
梯度x=梯度输入=无
#这里计算梯度
返回梯度x,梯度输入
您不需要为不需要的输入返回渐变,因此可以为它们返回None
更多信息和信息
class loss(Function):
@staticmethod
def forward(ctx,x,INPUT):
batch_size = x.shape[0]
X = x.detach().numpy()
input = INPUT.detach().numpy()
Loss = 0
for i in range(batch_size):
t_R_r = input[i,0:4]
R_r = t_R_r[np.newaxis,:]
t_R_i = input[i,4:8]
R_i = t_R_i[np.newaxis,:]
t_H_r = input[i,8:12]
H_r = t_H_r[np.newaxis,:]
t_H_i = input[i,12:16]
H_i = t_H_i[np.newaxis,:]
t_T_r = input[i, 16:32]
T_r = t_T_r.reshape(4,4)
t_T_i = input[i, 32:48]
T_i = t_T_i.reshape(4,4)
R = np.concatenate((R_r, R_i), axis=1)
H = np.concatenate((H_r, H_i), axis=1)
temp_t1 = np.concatenate((T_r,T_i),axis=1)
temp_t2 = np.concatenate((-T_i,T_r),axis=1)
T = np.concatenate((temp_t1,temp_t2),axis=0)
phi_r = np.zeros((4,4))
row, col = np.diag_indices(4)
phi_r[row,col] = X[i,0:4]
phi_i = np.zeros((4, 4))
row, col = np.diag_indices(4)
phi_i[row, col] = 1 - np.power(X[i, 0:4],2)
temp_phi1 = np.concatenate((phi_r,phi_i),axis=1)
temp_phi2 = np.concatenate((-phi_i, phi_r), axis=1)
phi = np.concatenate((temp_phi1,temp_phi2),axis=0)
temp1 = np.matmul(R,phi)
temp2 = np.matmul(temp1,T) # error
H_hat = H + temp2
t_Q_r = np.zeros((4,4))
t_Q_r[np.triu_indices(4,1)] = X[i,4:10]
Q_r = t_Q_r + t_Q_r.T
row,col = np.diag_indices(4)
Q_r[row,col] = X[i,10:14]
Q_i = np.zeros((4,4))
Q_i[np.triu_indices(4,1)] = X[i,14:20]
Q_i = Q_i - Q_i.T
temp_Q1 = np.concatenate((Q_r,Q_i),axis=1)
temp_Q2 = np.concatenate((-Q_i,Q_r),axis=1)
Q = np.concatenate((temp_Q1,temp_Q2),axis=0)
t_H_hat_r = H_hat[0,0:4]
H_hat_r = t_H_hat_r[np.newaxis,:]
t_H_hat_i= H_hat[0,4:8]
H_hat_i = t_H_hat_i[np.newaxis,:]
temp_H1 = np.concatenate((-H_hat_i.T,H_hat_r.T),axis=0)
H_hat_H = np.concatenate((H_hat.T,temp_H1),axis=1)
temp_result1 = np.matmul(H_hat,Q)
temp_result2 = np.matmul(temp_result1,H_hat_H)
Loss += np.log10(1+temp_result2[0][0])
Loss = t.from_numpy(np.array(Loss / batch_size))
return Loss
@staticmethod
def backward(ctx,grad_output):
print('gradient')
return grad_output
def criterion(output,input):
return loss.apply(output,input)