tensorflow.python.framework.errors\u impl.ResourceExhausterRor_Tensorflow_Object Detection_Object Detection Api

tensorflow.python.framework.errors\u impl.ResourceExhausterRor

tensorflow

tensorflow.python.framework.errors\u impl.ResourceExhausterRor,tensorflow,object-detection,object-detection-api,Tensorflow,Object Detection,Object Detection Api,我正在使用目标检测模块对图像进行分类。操作系统：Ubuntu 18.04 LTS Python:3.6.7 VirtualEnv:版本：16.4.3 virtualenv内部的Pip3版本：19.0.3 TensorFlow版本：1.13.1 Protoc版本：3.0.0-9 在Windows virtualenv和google colab上工作 python3 legacy/train.py--logtostderr--train\u dir=training/--pipeline\u co

我正在使用目标检测模块对图像进行分类。操作系统：Ubuntu 18.04 LTS Python:3.6.7 VirtualEnv:版本：16.4.3 virtualenv内部的Pip3版本：19.0.3 TensorFlow版本：1.13.1 Protoc版本：3.0.0-9

在Windows virtualenv和google colab上工作

python3 legacy/train.py--logtostderr--train\u dir=training/--pipeline\u config\u path=training/ssd\u mobilenet\u v1\u pets.config

信息：tensorflow:全局步骤1:损失=18.5013（48.934秒/步）信息：tensorflow：完成培训！将模型保存到磁盘。 /home/priyank/venv/lib/python3.6/site packages/tensorflow/python/summary/writer/writer.py:386:UserWarning:试图使用关闭的FileWriter。除非显式重新打开FileWriter，否则操作将是noop。 warnings.warn（“试图使用关闭的文件写入程序。” 回溯（最近一次呼叫最后一次）：文件“legacy/train.py”，第184行，在 tf.app.run（）文件“/home/priyank/venv/lib/python3.6/site packages/tensorflow/python/platform/app.py”，第125行，运行中 _系统出口（主（argv））文件“/home/priyank/venv/lib/python3.6/site packages/tensorflow/python/util/deprecation.py”，第324行，在new_func中返回函数（*args，**kwargs）文件“legacy/train.py”，第180行，主图\u钩子\u fn=图\u重写器\u fn）文件“/home/priyank/venv/models master/research/object_detection/legacy/trainer.py”，第416行，列车中储蓄者=储蓄者）文件“/home/priyank/venv/lib/python3.6/site packages/tensorflow/contrib/slim/python/slim/learning.py”，第785行，列车中忽略\u活动\u线程=忽略\u活动\u线程）文件“/home/priyank/venv/lib/python3.6/site packages/tensorflow/python/training/supervisor.py”，第832行，在stop中忽略\u活动\u线程=忽略\u活动\u线程）文件“/home/priyank/venv/lib/python3.6/site packages/tensorflow/python/training/coordinator.py”，第389行，加入六、重新提升（*自我执行信息提升）文件“/home/priyank/venv/lib/python3.6/site-packages/six.py”，第693行，重新登录增值文件“/home/priyank/venv/lib/python3.6/site packages/tensorflow/python/training/queue\u runner\u impl.py”，第257行，运行中排队_callable（）文件“/home/priyank/venv/lib/python3.6/site packages/tensorflow/python/client/session.py”，第1257行，在单次运行中 self._call_tf_sessionrun（无，{}，[]，目标列表，无）文件“/home/priyank/venv/lib/python3.6/site packages/tensorflow/python/client/session.py”，第1407行，位于调用会话运行中运行（元数据） tensorflow.python.framework.errors\u impl.ResourceExhaustedError:OOM当使用形状[15,117552777,3]和类型float on/job:localhost/replica:0/任务：0/设备：CPU:0由分配器CPU分配时 [{{node batch}}]]

提示：如果要在OOM发生时查看已分配的张量列表，请在OOM上添加报告张量分配到当前分配信息的RunOptions。

您可以尝试以下修复：
1.在使用非常高的图像分辨率的情况下减少图像尺寸
2.尝试减少批量大小
3.检查是否有其他进程正在占用您的内存

您还可以共享您的配置文件吗？

这是配置文件的链接-尝试将批处理大小（第143行）减少到8或4。如果它们都不起作用，请使用1。此外，如果可能，请使用GPU进行培训。如果您计划在CPU上进行培训（不推荐，因为这需要很长时间），不要运行任何其他程序，因为这会降低计算速度并消耗内存。我已经完成了项目，CPU似乎无法处理负载。我在GoogleColab上成功地运行了这个项目，并建议任何面临同样问题的人在GoogleColab上运行他们的代码，因为它是免费使用的。