Python 如何修复'；RuntimeError:协调器停止，线程仍在运行：QueueRunnerThread-dummy_queue-sync_token_q_EnqueueMany'；_Python_Tensorflow_Deep Learning

Python 如何修复'；RuntimeError:协调器停止，线程仍在运行：QueueRunnerThread-dummy_queue-sync_token_q_EnqueueMany'；

python tensorflow deep-learning

Python 如何修复'；RuntimeError:协调器停止，线程仍在运行：QueueRunnerThread-dummy_queue-sync_token_q_EnqueueMany'；,python,tensorflow,deep-learning,Python,Tensorflow,Deep Learning,我是TensorFlow的新手，每次我训练我的模型时，都会出现以下错误： RuntimeError: Coordinator stopped with threads still running: QueueRunnerThread-dummy_queue-sync_token_q_EnqueueMany 有人有办法修理它吗我在Ubuntu 18.04上，使用Python3.6和TensorFlow 1.12.0版本，并使用ssd\u mobilenet\u v1\u fpn\u share

我是TensorFlow的新手，每次我训练我的模型时，都会出现以下错误：

RuntimeError: Coordinator stopped with threads still running: QueueRunnerThread-dummy_queue-sync_token_q_EnqueueMany

有人有办法修理它吗

我在Ubuntu 18.04上，使用Python3.6和TensorFlow 1.12.0版本，并使用ssd\u mobilenet\u v1\u fpn\u shared\u box\u预测器作为模型。为了训练它，我使用了

legacy/train.py

脚本

我试图研究GitHub问题，但我不了解很多事情。此错误来自：

/home/ant/.local/lib/python3.6/site packages/tensorflow/python/training/coordinator.py

它发生在TensorFlow保存检查点之后

以下是它崩溃时的日志：

INFO:tensorflow:停止训练。
I0412 11:09:09.962124 139983862277952 tf_logging.py:115]停止训练。
信息：tensorflow：完成培训！将模型保存到磁盘。
I0412 11:09:09.962288 139983862277952 tf_logging.py:115]完成培训！将模型保存到磁盘。
回溯（最近一次呼叫最后一次）：
文件“object_detection/train.py”，第184行，在
tf.app.run（）
文件“/home/ant/.local/lib/python3.6/site packages/tensorflow/python/platform/app.py”，第125行，正在运行
_系统出口（主（argv））
文件“/home/ant/.local/lib/python3.6/site packages/tensorflow/python/util/deprecation.py”，第306行，在new_func中
返回函数（*args，**kwargs）
文件“object_detection/train.py”，第180行，主
图\u钩子\u fn=图\u重写器\u fn）
文件“/usr/local/lib/python3.6/dist packages/object_detection-0.1-py3.6.egg/object_detection/legacy/trainer.py”，第415行，列车中
储蓄者=储蓄者）
文件“/home/ant/.local/lib/python3.6/site packages/tensorflow/contrib/slim/python/slim/learning.py”，第785行，列车中
忽略\u活动\u线程=忽略\u活动\u线程）
文件“/home/ant/.local/lib/python3.6/site packages/tensorflow/python/training/supervisor.py”，第832行，在stop中
忽略\u活动\u线程=忽略\u活动\u线程）
文件“/home/ant/.local/lib/python3.6/site packages/tensorflow/python/training/coordinator.py”，第397行，在join中
“.join（掉队者））
RuntimeError:协调器已停止，线程仍在运行：QueueRunnerThread-dummy\u queue-sync\u token\u q\u EnqueueMany

我也有同样的问题，我的tf版本是1.13，然后我升级到1.14版本，也有同样的错误

最后,，我在

。/tensorflow/contrib/slim/python/slim/learning.py

和

。/tensorflow/python/training/supervisor.py

中将

忽略肝脏线程=False

更改为

忽略肝脏线程=True

我有同样的问题，我的tf版本是1.13，然后我升级到了版本1.14，也有同样的错误

最后，我将

ignore\u liver\u threads=False

更改为

ignore\u liver\u threads=True

。

。/tensorflow/contrib/slim/python/slim/learning.py

和

。/tensorflow/python/training/supervisor.py

，好吧，看来我已经临时修复了它：我刚刚删除了管道配置文件中的NUM\u步骤行。它现在每25个步骤为我保存一个检查点。看来我已经临时修复了它：我刚刚删除了管道配置文件中的NUM_steps:行。现在它每25步为我节省一个检查点。