Python 如何修复';RuntimeError:协调器停止,线程仍在运行:QueueRunnerThread-dummy_queue-sync_token_q_EnqueueMany';

Python 如何修复';RuntimeError:协调器停止,线程仍在运行:QueueRunnerThread-dummy_queue-sync_token_q_EnqueueMany';,python,tensorflow,deep-learning,Python,Tensorflow,Deep Learning,我是TensorFlow的新手,每次我训练我的模型时,都会出现以下错误: RuntimeError: Coordinator stopped with threads still running: QueueRunnerThread-dummy_queue-sync_token_q_EnqueueMany 有人有办法修理它吗 我在Ubuntu 18.04上,使用Python3.6和TensorFlow 1.12.0版本,并使用ssd\u mobilenet\u v1\u fpn\u share

我是TensorFlow的新手,每次我训练我的模型时,都会出现以下错误:

RuntimeError: Coordinator stopped with threads still running: QueueRunnerThread-dummy_queue-sync_token_q_EnqueueMany
有人有办法修理它吗

我在Ubuntu 18.04上,使用Python3.6和TensorFlow 1.12.0版本,并使用ssd\u mobilenet\u v1\u fpn\u shared\u box\u预测器作为模型。为了训练它,我使用了
legacy/train.py
脚本

我试图研究GitHub问题,但我不了解很多事情。 此错误来自:
/home/ant/.local/lib/python3.6/site packages/tensorflow/python/training/coordinator.py

它发生在TensorFlow保存检查点之后

以下是它崩溃时的日志:
INFO:tensorflow:停止训练。
I0412 11:09:09.962124 139983862277952 tf_logging.py:115]停止训练。
信息:tensorflow:完成培训!将模型保存到磁盘。
I0412 11:09:09.962288 139983862277952 tf_logging.py:115]完成培训!将模型保存到磁盘。
回溯(最近一次呼叫最后一次):
文件“object_detection/train.py”,第184行,在
tf.app.run()
文件“/home/ant/.local/lib/python3.6/site packages/tensorflow/python/platform/app.py”,第125行,正在运行
_系统出口(主(argv))
文件“/home/ant/.local/lib/python3.6/site packages/tensorflow/python/util/deprecation.py”,第306行,在new_func中
返回函数(*args,**kwargs)
文件“object_detection/train.py”,第180行,主
图\u钩子\u fn=图\u重写器\u fn)
文件“/usr/local/lib/python3.6/dist packages/object_detection-0.1-py3.6.egg/object_detection/legacy/trainer.py”,第415行,列车中
储蓄者=储蓄者)
文件“/home/ant/.local/lib/python3.6/site packages/tensorflow/contrib/slim/python/slim/learning.py”,第785行,列车中
忽略\u活动\u线程=忽略\u活动\u线程)
文件“/home/ant/.local/lib/python3.6/site packages/tensorflow/python/training/supervisor.py”,第832行,在stop中
忽略\u活动\u线程=忽略\u活动\u线程)
文件“/home/ant/.local/lib/python3.6/site packages/tensorflow/python/training/coordinator.py”,第397行,在join中
“.join(掉队者))
RuntimeError:协调器已停止,线程仍在运行:QueueRunnerThread-dummy\u queue-sync\u token\u q\u EnqueueMany

我也有同样的问题,我的tf版本是1.13,然后我升级到1.14版本,也有同样的错误


最后,,我在
。/tensorflow/contrib/slim/python/slim/learning.py
。/tensorflow/python/training/supervisor.py
中将
忽略肝脏线程=False
更改为
忽略肝脏线程=True
我有同样的问题,我的tf版本是1.13,然后我升级到了版本1.14,也有同样的错误


最后,我将
ignore\u liver\u threads=False
更改为
ignore\u liver\u threads=True
。/tensorflow/contrib/slim/python/slim/learning.py
。/tensorflow/python/training/supervisor.py
,好吧,看来我已经临时修复了它:我刚刚删除了管道配置文件中的NUM\u步骤行。它现在每25个步骤为我保存一个检查点。看来我已经临时修复了它:我刚刚删除了管道配置文件中的NUM_steps:行。现在它每25步为我节省一个检查点。