Tensorflow 训练SSD-MOBILENET V1,损失不会减少

Tensorflow 训练SSD-MOBILENET V1,损失不会减少,tensorflow,training-data,loss-function,object-detection-api,tensorflow-ssd,Tensorflow,Training Data,Loss Function,Object Detection Api,Tensorflow Ssd,我对CNN和tensorflow的一切都不熟悉。我正在训练一个经过预训练的ssd-mobilenev1-pets.config来检测建筑物的柱状物,大约一天,但损失在2-1之间,并且从10小时前开始没有减少。 我意识到我的输入图像是128x128,SSD将de图像大小调整为300*300。 输入图像的大小是否影响训练? 如果是这样的话,我应该用更大的输入图像重新训练网络吗?或者,另一种减少损失的方法是什么?我的火车数据集有660个图像,测试166个,我不知道是否有足够的图像 我真的很感谢您的帮助

我对CNN和tensorflow的一切都不熟悉。我正在训练一个经过预训练的ssd-mobilenev1-pets.config来检测建筑物的柱状物,大约一天,但损失在2-1之间,并且从10小时前开始没有减少。 我意识到我的输入图像是128x128,SSD将de图像大小调整为300*300。 输入图像的大小是否影响训练? 如果是这样的话,我应该用更大的输入图像重新训练网络吗?或者,另一种减少损失的方法是什么?我的火车数据集有660个图像,测试166个,我不知道是否有足够的图像
我真的很感谢您的帮助….

ssd\u mobilenet的损失值可能不同于
更快的\u rcnn
。来自EdjeeElectronics的TensorFlow对象检测教程:

对于我的Faster-RCNN-Inception-V2模型培训,从 大约3.0,并迅速降至0.8以下。我建议允许您的 模型进行训练,直到损失持续下降到0.05以下,这 将采取大约40000个步骤,或大约2小时(取决于方式 强大的CPU和GPU)。注:损失数字将为 如果使用不同的模型,则会有所不同。MobileNet SSD以 损失约20,并应接受培训,直到损失持续 2岁以下

有关更多信息:

SSD Mobilnet体系结构需要额外的培训才能满足要求 然而,R-CNN模型的损失精度值提供了 实用性、可扩展性和在小型设备上的易访问性 这表明SSD模型是进一步研究的有希望的候选者 评估(Fleury和Fleury,2018年)

欲了解更多信息:弗勒里,D.和弗勒里,A.(2018)。实现区域CNN和SSD机器学习目标检测体系结构,用于在暗场显微镜中实时分析血源性病原体。MDPI AG.

  • 我建议您拍摄15%-20%的图像进行测试,涵盖培训数据中的所有种类。正如您所说,您有650多张图像用于培训,150多张图像用于测试。这大约是测试图像的25%。看起来你有足够的图片开始。我知道的越多,就越开心,但是要确保你的模型也有足够的数据可以学习

  • 调整图像大小不会导致丢失。它确保所有图像的一致性,以便模型无偏见地识别它们。损失与图像大小调整无关,只要每个图像的大小都相同

  • 如果您想让您的模型完美匹配,您必须一次又一次地停车并恢复检查点。通常,您可以通过
    重新训练ssd mobilenet,直到损耗始终低于1,从而获得良好的准确度。


    理想情况下,我们希望损耗尽可能低,但我们希望
    确保模型没有过度适配。
    这是一个反复尝试的过程。(0.5到1之间的损失似乎做得很好,但这一切都取决于你。)

  • 我认为您的模型表现不佳的原因是,您有各种各样的测试数据,但没有足够的培训数据。

    模型在训练数据中没有获得足够的知识,无法使模型学习新的测试数据。
    (例如:您的测试数据中有一些建筑物新角度的图像,这些图像在训练数据中没有充分显示)。在这种情况下,我建议您将各种各样的图像放入训练数据中,然后选择图像进行测试,确保您仍然有足够的新姿势训练数据。这就是为什么我建议您使用15%-20%的测试数据

您好,请共享您的配置文件您的损失图以及培训采取了多少步骤?图像大小无关紧要,脚本将能够将图像大小调整为型号所需的大小。你能确认你已经完成了这里给出的每一步吗-