Computer vision 我是否可以微调预先训练好的分类CNN，如Resnet和Vgg19，以预测图像中的某些角度？_Computer Vision_Conv Neural Network

Computer vision 我是否可以微调预先训练好的分类CNN，如Resnet和Vgg19，以预测图像中的某些角度？

computer-vision

Computer vision 我是否可以微调预先训练好的分类CNN，如Resnet和Vgg19，以预测图像中的某些角度？,computer-vision,conv-neural-network,Computer Vision,Conv Neural Network,最近，我在Blender中为一匹马建模，并随机改变其头部、颈部和腿部的旋转，并渲染许多图像以构建数据集之后，我对resnet和vgg19进行了微调，以预测每个部分的旋转，但得到的性能非常差。损失从0.9降至0.6，但没有达到足够低的值，验证集的性能非常差在我看来，有一些潜在的原因： 1此任务的微调分类模型不适用 2我稍微改变完全连接的层，并在其上添加一个tanh来预测角度的正弦波和余弦波，然后最小化预测和地面真值之间的均方误差。Tanh不适合执行此任务有没有人有微调模型以预测角度的经验？我

最近，我在Blender中为一匹马建模，并随机改变其头部、颈部和腿部的旋转，并渲染许多图像以构建数据集

之后，我对resnet和vgg19进行了微调，以预测每个部分的旋转，但得到的性能非常差。损失从0.9降至0.6，但没有达到足够低的值，验证集的性能非常差

在我看来，有一些潜在的原因：

1此任务的微调分类模型不适用

2我稍微改变完全连接的层，并在其上添加一个tanh来预测角度的正弦波和余弦波，然后最小化预测和地面真值之间的均方误差。Tanh不适合执行此任务

有没有人有微调模型以预测角度的经验？

我没有微调模型以预测角度的经验。

但就我的目标检测任务经验而言，这项任务可以完成。因为在目标检测中，一些输出是位置坐标。极坐标系和直角坐标系可以通过矩阵乘法相互转换。因此，您可以尝试目标检测的方法。

我可以训练一个端到端网络来进行预测吗？我的意思是，输入图像，输出角度，没有框回归？是的，你可以试试。有很多端到端网络预测盒回归。你应该做的另一件事是把盒子回归到CNN的角度。嗯，你误解了我的话。我的意思是，可以直接从图像中预测角度，而不需要框回归，换句话说，不知道旋转的对象在哪里？