Tensorflow模型.fit在while循环中崩溃
我正试图用while循环优化我的ML模型的学习速率参数。 第一个模型完成了它的所有学习步骤,然而,while循环的第二次迭代中的第二次调用,因此model.fit()的第二次调用在第一个历元中已经失败了。没有生成任何输出 编辑:Tensorflow模型.fit在while循环中崩溃,tensorflow,Tensorflow,我正试图用while循环优化我的ML模型的学习速率参数。 第一个模型完成了它的所有学习步骤,然而,while循环的第二次迭代中的第二次调用,因此model.fit()的第二次调用在第一个历元中已经失败了。没有生成任何输出 编辑: 我已经追踪到了张力板回调的问题。如果没有回调,循环将成功地训练所有4个模型,而通过回调,循环将在第二次迭代/模型拟合开始时失败。我做错了什么 for lr in [0.005, 0.001, 0.0005, ...]: tf.keras.backend.clea
我已经追踪到了张力板回调的问题。如果没有回调,循环将成功地训练所有4个模型,而通过回调,循环将在第二次迭代/模型拟合开始时失败。我做错了什么
for lr in [0.005, 0.001, 0.0005, ...]:
tf.keras.backend.clear_session()
...
## create model
model = createModel(...)
model.compile(learning_rate = lr)
tensorboard_callback = tf.keras.callbacks.TensorBoard(...)
model.fit(..., callbacks = [tensorboard_callback])
有人知道我做错了什么,或者为什么这不起作用吗多谢各位 环境: 我在Debian服务器上工作,它有两个Nvidia Tesla V100S(32GB)卡(只有一个用于培训该型号)、128个CPU核和2TB主内存 Python:3.7.9 Tensorflow:2.4.1
实现在Jupyter笔记本中问题已经解决。安装的cuDNN版本不正确。谢谢您可以添加更多关于您使用的回调的详细信息吗?当然可以。TensorBoard回调仅指定日志目录。在for循环的每次迭代中,该目录都会更改。就在第二个model.fit失败之前,将生成日志并在张力板中可用