Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/303.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Tensorflow模型.fit在while循环中崩溃_Tensorflow - Fatal编程技术网

Tensorflow模型.fit在while循环中崩溃

Tensorflow模型.fit在while循环中崩溃,tensorflow,Tensorflow,我正试图用while循环优化我的ML模型的学习速率参数。 第一个模型完成了它的所有学习步骤,然而,while循环的第二次迭代中的第二次调用,因此model.fit()的第二次调用在第一个历元中已经失败了。没有生成任何输出 编辑: 我已经追踪到了张力板回调的问题。如果没有回调,循环将成功地训练所有4个模型,而通过回调,循环将在第二次迭代/模型拟合开始时失败。我做错了什么 for lr in [0.005, 0.001, 0.0005, ...]: tf.keras.backend.clea

我正试图用while循环优化我的ML模型的学习速率参数。 第一个模型完成了它的所有学习步骤,然而,while循环的第二次迭代中的第二次调用,因此model.fit()的第二次调用在第一个历元中已经失败了。没有生成任何输出

编辑:
我已经追踪到了张力板回调的问题。如果没有回调,循环将成功地训练所有4个模型,而通过回调,循环将在第二次迭代/模型拟合开始时失败。我做错了什么

for lr in [0.005, 0.001, 0.0005, ...]:
    tf.keras.backend.clear_session()
    ...
    ## create model
    model = createModel(...)
    model.compile(learning_rate = lr)
    
    tensorboard_callback = tf.keras.callbacks.TensorBoard(...)
    model.fit(..., callbacks = [tensorboard_callback])
有人知道我做错了什么,或者为什么这不起作用吗
多谢各位

环境: 我在Debian服务器上工作,它有两个Nvidia Tesla V100S(32GB)卡(只有一个用于培训该型号)、128个CPU核和2TB主内存 Python:3.7.9 Tensorflow:2.4.1
实现在Jupyter笔记本中

问题已经解决。安装的cuDNN版本不正确。谢谢

您可以添加更多关于您使用的回调的详细信息吗?当然可以。TensorBoard回调仅指定日志目录。在for循环的每次迭代中,该目录都会更改。就在第二个model.fit失败之前,将生成日志并在张力板中可用