如何使用TensorFlow最小化两个损失？_Tensorflow

如何使用TensorFlow最小化两个损失？

tensorflow

如何使用TensorFlow最小化两个损失？,tensorflow,Tensorflow,我正在做一个项目，这是本地化的对象在图像中。我将采用的方法是基于中的定位算法网络结构有两个优化头，分类头和回归头。在培训网络时，如何将这两个问题最小化我有一个想法，那就是把这两件事总结成一个损失。但问题是分类损失是softmax损失，回归损失是l2损失，这意味着它们有不同的范围。我认为这不是最好的方法。这取决于您的网络状态如果你的网络仅仅能够提取特征[你使用的是从其他网络保留的权重]，你可以将该权重设置为常量，然后分别训练两个分类头，因为梯度不会流过常量如果不使用预先训练的模型的权重，则

我正在做一个项目，这是本地化的对象在图像中。我将采用的方法是基于中的定位算法

网络结构有两个优化头，分类头和回归头。在培训网络时，如何将这两个问题最小化

我有一个想法，那就是把这两件事总结成一个损失。但问题是分类损失是softmax损失，回归损失是l2损失，这意味着它们有不同的范围。我认为这不是最好的方法。

这取决于您的网络状态

如果你的网络仅仅能够提取特征[你使用的是从其他网络保留的权重]，你可以将该权重设置为常量，然后分别训练两个分类头，因为梯度不会流过常量

如果不使用预先训练的模型的权重，则

必须训练网络以提取特征：因此，使用分类头训练网络，并让梯度从分类头流向第一个卷积滤波器。通过这种方式，您的网络现在可以结合提取的特征对对象进行分类

将卷积滤波器和分类头的学习权重转换为常数张量，并训练回归头

回归头将学习组合从卷积层提取的特征，调整其参数，以最小化L2损失

Tl；医生：

首先对网络进行分类培训

使用

graph\u util将每个学习到的参数转换为常数张量。将变量转换为常数，如“脚本”中所示


训练回归头
这取决于您的网络状态
如果你的网络仅仅能够提取特征[你使用的是从其他网络保留的权重]，你可以将该权重设置为常量，然后分别训练两个分类头，因为梯度不会流过常量
如果不使用预先训练的模型的权重，则
必须训练网络以提取特征：因此，使用分类头训练网络，并让梯度从分类头流向第一个卷积滤波器。通过这种方式，您的网络现在可以结合提取的特征对对象进行分类
将卷积滤波器和分类头的学习权重转换为常数张量，并训练回归头
回归头将学习组合从卷积层提取的特征，调整其参数，以最小化L2损失
Tl；医生：
首先对网络进行分类培训
使用graph\u util将每个学习到的参数转换为常数张量。将变量转换为常数，如“脚本”中所示

训练回归头
伟大的谢谢你的回答。我可以再问一个问题吗？在培训回归主管时，如何表示“背景”类？我现在使用零。有更好的方法吗？你在训练回归负责人：你不需要背景课程。您的训练集包含对象边界框的位置，因此您将学习回归这些坐标，而不是其他坐标。背景是这些坐标之外的一切。我只在分类头中使用背景类，这在训练时未使用（我只显示包含对象的图像），但在网络以本地化模式运行时使用。如果我用回归头预测一些坐标，但分类头告诉我这是背景，我会跳过有意义的位置。谢谢，太好了！谢谢你的回答。我可以再问一个问题吗？在培训回归主管时，如何表示“背景”类？我现在使用零。有更好的方法吗？你在训练回归负责人：你不需要背景课程。您的训练集包含对象边界框的位置，因此您将学习回归这些坐标，而不是其他坐标。背景是这些坐标之外的一切。我只在分类头中使用背景类，这在训练时未使用（我只显示包含对象的图像），但在网络以本地化模式运行时使用。如果我用回归头预测一些坐标，但分类头告诉我这是背景，我会跳过有意义的位置。非常感谢。