Computer vision 我是否可以微调预先训练好的分类CNN,如Resnet和Vgg19,以预测图像中的某些角度?

Computer vision 我是否可以微调预先训练好的分类CNN,如Resnet和Vgg19,以预测图像中的某些角度?,computer-vision,conv-neural-network,Computer Vision,Conv Neural Network,最近,我在Blender中为一匹马建模,并随机改变其头部、颈部和腿部的旋转,并渲染许多图像以构建数据集 之后,我对resnet和vgg19进行了微调,以预测每个部分的旋转,但得到的性能非常差。损失从0.9降至0.6,但没有达到足够低的值,验证集的性能非常差 在我看来,有一些潜在的原因: 1此任务的微调分类模型不适用 2我稍微改变完全连接的层,并在其上添加一个tanh来预测角度的正弦波和余弦波,然后最小化预测和地面真值之间的均方误差。Tanh不适合执行此任务 有没有人有微调模型以预测角度的经验?我

最近,我在Blender中为一匹马建模,并随机改变其头部、颈部和腿部的旋转,并渲染许多图像以构建数据集

之后,我对resnet和vgg19进行了微调,以预测每个部分的旋转,但得到的性能非常差。损失从0.9降至0.6,但没有达到足够低的值,验证集的性能非常差

在我看来,有一些潜在的原因:

1此任务的微调分类模型不适用

2我稍微改变完全连接的层,并在其上添加一个tanh来预测角度的正弦波和余弦波,然后最小化预测和地面真值之间的均方误差。Tanh不适合执行此任务


有没有人有微调模型以预测角度的经验?

我没有微调模型以预测角度的经验。
但就我的目标检测任务经验而言,这项任务可以完成。因为在目标检测中,一些输出是位置坐标。极坐标系和直角坐标系可以通过矩阵乘法相互转换。因此,您可以尝试目标检测的方法。

我可以训练一个端到端网络来进行预测吗?我的意思是,输入图像,输出角度,没有框回归?是的,你可以试试。有很多端到端网络预测盒回归。你应该做的另一件事是把盒子回归到CNN的角度。嗯,你误解了我的话。我的意思是,可以直接从图像中预测角度,而不需要框回归,换句话说,不知道旋转的对象在哪里?