Neural network 目标检测可能的回归损失

Neural network 目标检测可能的回归损失,neural-network,computer-vision,object-detection,bounding-box,loss-function,Neural Network,Computer Vision,Object Detection,Bounding Box,Loss Function,许多对象检测算法将边界框预测为(xmin、ymin、xmax、ymax),表示边界框的左上角和右下角。此外,为了避免梯度爆炸,大多数论文建议平滑L1损失或简单L1损失 我的问题是,是否有其他方法的成功尝试 比如说 预测框的左上角点(x,y)、宽度和高度 预测长方体的中心点(x,y)、宽度和高度 预测长方体的中心点(x,y)、大小和纵横比 预测中心点(x,y)、尺寸和tan-1(纵横比) 此外,其中一些选项可能包括某些属性的不同重要性/权重。例如,找到一个好的中心点和尺寸可能比合适的纵横比更重

许多对象检测算法将边界框预测为(xmin、ymin、xmax、ymax),表示边界框的左上角和右下角。此外,为了避免梯度爆炸,大多数论文建议平滑L1损失或简单L1损失

我的问题是,是否有其他方法的成功尝试

比如说

  • 预测框的左上角点(x,y)、宽度和高度
  • 预测长方体的中心点(x,y)、宽度和高度
  • 预测长方体的中心点(x,y)、大小和纵横比
  • 预测中心点(x,y)、尺寸和tan-1(纵横比)
此外,其中一些选项可能包括某些属性的不同重要性/权重。例如,找到一个好的中心点和尺寸可能比合适的纵横比更重要。此外,可能明智的做法是使用L1损耗作为中心点,而L2用于大小或纵横比。你知道有关于这个话题的研究吗

谢谢