Tensorflow 仅在一个数据实例上过度拟合深度学习模型以测试其正确性是否是一种好做法

Tensorflow 仅在一个数据实例上过度拟合深度学习模型以测试其正确性是否是一种好做法,tensorflow,optimization,deep-learning,object-detection,Tensorflow,Optimization,Deep Learning,Object Detection,目前,我正在为人脸检测实现一个对象检测模型,并尝试在一个数据实例上训练我的模型。(输入:图像,目标:标签)。 但是,在对我的模型进行了长时间的训练之后,它无法最优地收敛。或者换言之,我应该说它达到了一个鞍点,它无法从鞍点出来。所以我想知道这是因为数据只是一个实例,模型不知何故无法学习,还是我的损失函数有问题 我正在使用yolo架构和类似yolo的损失函数来训练我的模型。 Adam优化器,用于最大限度地减少时间损失 谢谢,您的问题不清楚,您能否指定损失函数是什么,您的模型是否能够检测到您给他的图像

目前,我正在为人脸检测实现一个对象检测模型,并尝试在一个数据实例上训练我的模型。(输入:图像,目标:标签)。 但是,在对我的模型进行了长时间的训练之后,它无法最优地收敛。或者换言之,我应该说它达到了一个鞍点,它无法从鞍点出来。所以我想知道这是因为数据只是一个实例,模型不知何故无法学习,还是我的损失函数有问题

我正在使用yolo架构和类似yolo的损失函数来训练我的模型。 Adam优化器,用于最大限度地减少时间损失


谢谢,

您的问题不清楚,您能否指定损失函数是什么,您的模型是否能够检测到您给他的图像中的人脸?你能举例说明他在训练后对这张图片的检测结果吗?因此,基本上,我有4个术语(定位损失、对象损失、无对象损失和类损失),它们加起来给出了批处理实例的总损失,但它们的计算方式与yolov2损失函数的定义略有不同。此外,我得到的检测结果也不太好,但我的意思是,仅对一幅图像进行训练和测试,理想情况下应该可以提供非常精确的检测结果,但这并不好。yolo可以肯定地了解一个数据,这意味着您的损失函数实现存在一些问题,请分享您的损失函数。还要解释一下你是如何得出结论的,你进入了一个鞍点@RakeshBalhara我的损失函数与yolov2的损失函数非常相似,唯一的区别在于规模和计算本地化损失的方式,以消除我所面临的NaN问题。我知道这是一个鞍点的方法是基于观察到损耗在很长一段时间内是停滞的,所以每一个历元的损耗率几乎为零,并且通过查看损耗函数图。