Python 使用三重丢失进行训练:汇总直方图tensorflow中的Nan
我正在尝试训练一个使用三重态丢失的CNN模型。我有8个类(产品)的图像,每个类大约有100个图像Python 使用三重丢失进行训练:汇总直方图tensorflow中的Nan,python,tensorflow,conv-neural-network,Python,Tensorflow,Conv Neural Network,我正在尝试训练一个使用三重态丢失的CNN模型。我有8个类(产品)的图像,每个类大约有100个图像 网络体系结构如下所示: input image -> conv1 -> conv2 -> conv3 -> conv4 -> conv5 -> 28D embedding 182x182 filters 7x7 5x5 3x3 1x1
网络体系结构如下所示:
input image -> conv1 -> conv2 -> conv3 -> conv4 -> conv5 -> 28D embedding
182x182 filters 7x7 5x5 3x3 1x1 1x1
num_outputs 32 64 128 256 28
activation Relu Relu Relu Relu Relu
因此,网络给出了一个28维的嵌入。
然而,在培训期间,它在随机迭代步骤中抛出以下错误:
tensorflow.python.framework.errors_impl.InvalidArgumentError: Nan in summary histogram for: conv2/weights_1
我已经使用了一些超参数,但仍然没有运气,只有迭代步骤
它抛出错误的时间正在更改。下面是我正在尝试的超参数:
batch size : varied if from 2 to 12
learning rate : 0.001 - 0.002
momentum: 0.9 (since batch size is small)
training iter: 2000 (it is never reaching that, before only throws an error)
任何输入都会非常有用。我使用更大的批量解决了这个问题。当批处理中没有三元组时,会发生此错误