Tensorflow 用卷积网络运行时产生nan损失的张量流

Tensorflow 用卷积网络运行时产生nan损失的张量流,tensorflow,Tensorflow,我试图为tensorflow中的房屋编号图像创建卷积神经网络 在运行代码的第一步中,我得到了正确的成本。 这里是到github的链接,我在这里输入了我的代码 请让我知道我在哪里出错损失为NaN,因为梯度刚刚爆炸 您的代码看起来不错,但您的学习率很高。尝试使用较低的学习率(如1e-2或1e-3),看看梯度是否仍在爆炸 在上瘾中,我不知道你在训练中使用的图像是否已经被转换成浮点值并进行缩放以获得零均值和单位范数,但通常这是处理图像时需要的一个步骤,有助于避免梯度爆炸 Tensorflow有这样一

我试图为tensorflow中的房屋编号图像创建卷积神经网络

在运行代码的第一步中,我得到了正确的成本。 这里是到github的链接,我在这里输入了我的代码


请让我知道我在哪里出错

损失为NaN,因为梯度刚刚爆炸

您的代码看起来不错,但您的学习率很高。尝试使用较低的学习率(如
1e-2
1e-3
),看看梯度是否仍在爆炸

在上瘾中,我不知道你在训练中使用的图像是否已经被转换成浮点值并进行缩放以获得零均值和单位范数,但通常这是处理图像时需要的一个步骤,有助于避免梯度爆炸


Tensorflow有这样一个函数:

我在查看代码时看不出有任何错误,但我在Tensorflow中得到NaN的唯一一次,我使用了GradientDescent优化器。你能尝试使用不同的优化器吗,比如tf.train.AdamOptimizer?让我做同样的事情,并会让你知道它是否有效,谢谢