tensorflow.python.framework.errors\u impl.ResourceExhausterRor

tensorflow.python.framework.errors\u impl.ResourceExhausterRor,tensorflow,object-detection,object-detection-api,Tensorflow,Object Detection,Object Detection Api,我正在使用目标检测模块对图像进行分类。 操作系统:Ubuntu 18.04 LTS Python:3.6.7 VirtualEnv:版本:16.4.3 virtualenv内部的Pip3版本:19.0.3 TensorFlow版本:1.13.1 Protoc版本:3.0.0-9 在Windows virtualenv和google colab上工作 python3 legacy/train.py--logtostderr--train\u dir=training/--pipeline\u co

我正在使用目标检测模块对图像进行分类。 操作系统:Ubuntu 18.04 LTS Python:3.6.7 VirtualEnv:版本:16.4.3 virtualenv内部的Pip3版本:19.0.3 TensorFlow版本:1.13.1 Protoc版本:3.0.0-9

在Windows virtualenv和google colab上工作

python3 legacy/train.py--logtostderr--train\u dir=training/--pipeline\u config\u path=training/ssd\u mobilenet\u v1\u pets.config

信息:tensorflow:全局步骤1:损失=18.5013(48.934秒/步) 信息:tensorflow:完成培训!将模型保存到磁盘。 /home/priyank/venv/lib/python3.6/site packages/tensorflow/python/summary/writer/writer.py:386:UserWarning:试图使用关闭的FileWriter。除非显式重新打开FileWriter,否则操作将是noop。 warnings.warn(“试图使用关闭的文件写入程序。” 回溯(最近一次呼叫最后一次): 文件“legacy/train.py”,第184行,在 tf.app.run() 文件“/home/priyank/venv/lib/python3.6/site packages/tensorflow/python/platform/app.py”,第125行,运行中 _系统出口(主(argv)) 文件“/home/priyank/venv/lib/python3.6/site packages/tensorflow/python/util/deprecation.py”,第324行,在new_func中 返回函数(*args,**kwargs) 文件“legacy/train.py”,第180行,主 图\u钩子\u fn=图\u重写器\u fn) 文件“/home/priyank/venv/models master/research/object_detection/legacy/trainer.py”,第416行,列车中 储蓄者=储蓄者) 文件“/home/priyank/venv/lib/python3.6/site packages/tensorflow/contrib/slim/python/slim/learning.py”,第785行,列车中 忽略\u活动\u线程=忽略\u活动\u线程) 文件“/home/priyank/venv/lib/python3.6/site packages/tensorflow/python/training/supervisor.py”,第832行,在stop中 忽略\u活动\u线程=忽略\u活动\u线程) 文件“/home/priyank/venv/lib/python3.6/site packages/tensorflow/python/training/coordinator.py”,第389行,加入 六、重新提升(*自我执行信息提升) 文件“/home/priyank/venv/lib/python3.6/site-packages/six.py”,第693行,重新登录 增值 文件“/home/priyank/venv/lib/python3.6/site packages/tensorflow/python/training/queue\u runner\u impl.py”,第257行,运行中 排队_callable() 文件“/home/priyank/venv/lib/python3.6/site packages/tensorflow/python/client/session.py”,第1257行,在单次运行中 self._call_tf_sessionrun(无,{},[],目标列表,无) 文件“/home/priyank/venv/lib/python3.6/site packages/tensorflow/python/client/session.py”,第1407行,位于调用会话运行中 运行(元数据) tensorflow.python.framework.errors\u impl.ResourceExhaustedError:OOM当使用形状[15,117552777,3]和类型float on/job:localhost/replica:0/任务:0/设备:CPU:0由分配器CPU分配时 [{{node batch}}]]
提示:如果要在OOM发生时查看已分配的张量列表,请在OOM上添加报告张量分配到当前分配信息的RunOptions。

您可以尝试以下修复:
1.在使用非常高的图像分辨率的情况下减少图像尺寸
2.尝试减少批量大小
3.检查是否有其他进程正在占用您的内存


您还可以共享您的配置文件吗?

这是配置文件的链接-尝试将批处理大小(第143行)减少到8或4。如果它们都不起作用,请使用1。此外,如果可能,请使用GPU进行培训。如果您计划在CPU上进行培训(不推荐,因为这需要很长时间),不要运行任何其他程序,因为这会降低计算速度并消耗内存。我已经完成了项目,CPU似乎无法处理负载。我在GoogleColab上成功地运行了这个项目,并建议任何面临同样问题的人在GoogleColab上运行他们的代码,因为它是免费使用的。