Tensorflow 训练SSD-MOBILENET V1,损失不会减少
我对CNN和tensorflow的一切都不熟悉。我正在训练一个经过预训练的ssd-mobilenev1-pets.config来检测建筑物的柱状物,大约一天,但损失在2-1之间,并且从10小时前开始没有减少。 我意识到我的输入图像是128x128,SSD将de图像大小调整为300*300。 输入图像的大小是否影响训练? 如果是这样的话,我应该用更大的输入图像重新训练网络吗?或者,另一种减少损失的方法是什么?我的火车数据集有660个图像,测试166个,我不知道是否有足够的图像Tensorflow 训练SSD-MOBILENET V1,损失不会减少,tensorflow,training-data,loss-function,object-detection-api,tensorflow-ssd,Tensorflow,Training Data,Loss Function,Object Detection Api,Tensorflow Ssd,我对CNN和tensorflow的一切都不熟悉。我正在训练一个经过预训练的ssd-mobilenev1-pets.config来检测建筑物的柱状物,大约一天,但损失在2-1之间,并且从10小时前开始没有减少。 我意识到我的输入图像是128x128,SSD将de图像大小调整为300*300。 输入图像的大小是否影响训练? 如果是这样的话,我应该用更大的输入图像重新训练网络吗?或者,另一种减少损失的方法是什么?我的火车数据集有660个图像,测试166个,我不知道是否有足够的图像 我真的很感谢您的帮助
我真的很感谢您的帮助….ssd\u mobilenet的损失值可能不同于
更快的\u rcnn
。来自EdjeeElectronics的TensorFlow对象检测教程:
对于我的Faster-RCNN-Inception-V2模型培训,从
大约3.0,并迅速降至0.8以下。我建议允许您的
模型进行训练,直到损失持续下降到0.05以下,这
将采取大约40000个步骤,或大约2小时(取决于方式
强大的CPU和GPU)。注:损失数字将为
如果使用不同的模型,则会有所不同。MobileNet SSD以
损失约20,并应接受培训,直到损失持续
2岁以下
有关更多信息:
SSD Mobilnet体系结构需要额外的培训才能满足要求
然而,R-CNN模型的损失精度值提供了
实用性、可扩展性和在小型设备上的易访问性
这表明SSD模型是进一步研究的有希望的候选者
评估(Fleury和Fleury,2018年)
欲了解更多信息:弗勒里,D.和弗勒里,A.(2018)。实现区域CNN和SSD机器学习目标检测体系结构,用于在暗场显微镜中实时分析血源性病原体。MDPI AG.- 我建议您拍摄15%-20%的图像进行测试,涵盖培训数据中的所有种类。正如您所说,您有650多张图像用于培训,150多张图像用于测试。这大约是测试图像的25%。看起来你有足够的图片开始。我知道的越多,就越开心,但是要确保你的模型也有足够的数据可以学习代码>
- 调整图像大小不会导致丢失。它确保所有图像的一致性,以便模型无偏见地识别它们。损失与图像大小调整无关,只要每个图像的大小都相同
- 如果您想让您的模型完美匹配,您必须一次又一次地停车并恢复检查点。通常,您可以通过
重新训练ssd mobilenet,直到损耗始终低于1,从而获得良好的准确度。
理想情况下,我们希望损耗尽可能低,但我们希望
这是一个反复尝试的过程。(0.5到1之间的损失似乎做得很好,但这一切都取决于你。)确保模型没有过度适配。
- 我认为您的模型表现不佳的原因是,您有各种各样的测试数据,但没有足够的培训数据。
(例如:您的测试数据中有一些建筑物新角度的图像,这些图像在训练数据中没有充分显示)。在这种情况下,我建议您将各种各样的图像放入训练数据中,然后选择图像进行测试,确保您仍然有足够的新姿势训练数据。这就是为什么我建议您使用15%-20%的测试数据模型在训练数据中没有获得足够的知识,无法使模型学习新的测试数据。