Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/tensorflow/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何在带有RNN的Tensorflow模型中优雅地调试梯度上的nan/inf?_Python_Tensorflow_Neural Network - Fatal编程技术网

Python 如何在带有RNN的Tensorflow模型中优雅地调试梯度上的nan/inf?

Python 如何在带有RNN的Tensorflow模型中优雅地调试梯度上的nan/inf?,python,tensorflow,neural-network,Python,Tensorflow,Neural Network,有时,我们可能会在seq2seq Tensorflow模型的反向支撑过程中遇到一些nan/inf梯度。我们如何轻松找到此类问题的原因,例如,通过查找生成nan/inf的op和时间步长 由于错误发生在反向传播上,我们不能简单地用tf.Print()观察梯度值。同样在RNN模型中,tf.add\u check\u numerics\u ops()不起作用,我们不能使用tf.check\u numerics(),除非我们深入研究凌乱的tf库或手动重新实现控制流。而tfdbg作为一种通用解决方案,在大型

有时,我们可能会在seq2seq Tensorflow模型的反向支撑过程中遇到一些nan/inf梯度。我们如何轻松找到此类问题的原因,例如,通过查找生成nan/inf的op和时间步长

由于错误发生在反向传播上,我们不能简单地用tf.Print()观察梯度值。同样在RNN模型中,tf.add\u check\u numerics\u ops()不起作用,我们不能使用tf.check\u numerics(),除非我们深入研究凌乱的tf库或手动重新实现控制流。而tfdbg作为一种通用解决方案,在大型模型上很难使用,而且速度非常慢