Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/visual-studio-2012/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
如何使用TensorFlow最小化两个损失?_Tensorflow - Fatal编程技术网

如何使用TensorFlow最小化两个损失?

如何使用TensorFlow最小化两个损失?,tensorflow,Tensorflow,我正在做一个项目,这是本地化的对象在图像中。我将采用的方法是基于中的定位算法 网络结构有两个优化头,分类头和回归头。在培训网络时,如何将这两个问题最小化 我有一个想法,那就是把这两件事总结成一个损失。但问题是分类损失是softmax损失,回归损失是l2损失,这意味着它们有不同的范围。我认为这不是最好的方法。这取决于您的网络状态 如果你的网络仅仅能够提取特征[你使用的是从其他网络保留的权重],你可以将该权重设置为常量,然后分别训练两个分类头,因为梯度不会流过常量 如果不使用预先训练的模型的权重,则

我正在做一个项目,这是本地化的对象在图像中。我将采用的方法是基于中的定位算法

网络结构有两个优化头,分类头和回归头。在培训网络时,如何将这两个问题最小化


我有一个想法,那就是把这两件事总结成一个损失。但问题是分类损失是softmax损失,回归损失是l2损失,这意味着它们有不同的范围。我认为这不是最好的方法。

这取决于您的网络状态

如果你的网络仅仅能够提取特征[你使用的是从其他网络保留的权重],你可以将该权重设置为常量,然后分别训练两个分类头,因为梯度不会流过常量

如果不使用预先训练的模型的权重,则

  • 必须训练网络以提取特征:因此,使用分类头训练网络,并让梯度从分类头流向第一个卷积滤波器。通过这种方式,您的网络现在可以结合提取的特征对对象进行分类
  • 将卷积滤波器和分类头的学习权重转换为常数张量,并训练回归头
  • 回归头将学习组合从卷积层提取的特征,调整其参数,以最小化L2损失

    Tl;医生:

  • 首先对网络进行分类培训
  • 使用
    graph\u util将每个学习到的参数转换为常数张量。将变量转换为常数,如“脚本”中所示
  • 训练回归头

  • 这取决于您的网络状态

    如果你的网络仅仅能够提取特征[你使用的是从其他网络保留的权重],你可以将该权重设置为常量,然后分别训练两个分类头,因为梯度不会流过常量

    如果不使用预先训练的模型的权重,则

  • 必须训练网络以提取特征:因此,使用分类头训练网络,并让梯度从分类头流向第一个卷积滤波器。通过这种方式,您的网络现在可以结合提取的特征对对象进行分类
  • 将卷积滤波器和分类头的学习权重转换为常数张量,并训练回归头
  • 回归头将学习组合从卷积层提取的特征,调整其参数,以最小化L2损失

    Tl;医生:

  • 首先对网络进行分类培训
  • 使用
    graph\u util将每个学习到的参数转换为常数张量。将变量转换为常数,如“脚本”中所示
  • 训练回归头

  • 伟大的谢谢你的回答。我可以再问一个问题吗?在培训回归主管时,如何表示“背景”类?我现在使用零。有更好的方法吗?你在训练回归负责人:你不需要背景课程。您的训练集包含对象边界框的位置,因此您将学习回归这些坐标,而不是其他坐标。背景是这些坐标之外的一切。我只在分类头中使用背景类,这在训练时未使用(我只显示包含对象的图像),但在网络以本地化模式运行时使用。如果我用回归头预测一些坐标,但分类头告诉我这是背景,我会跳过有意义的位置。谢谢,太好了!谢谢你的回答。我可以再问一个问题吗?在培训回归主管时,如何表示“背景”类?我现在使用零。有更好的方法吗?你在训练回归负责人:你不需要背景课程。您的训练集包含对象边界框的位置,因此您将学习回归这些坐标,而不是其他坐标。背景是这些坐标之外的一切。我只在分类头中使用背景类,这在训练时未使用(我只显示包含对象的图像),但在网络以本地化模式运行时使用。如果我用回归头预测一些坐标,但分类头告诉我这是背景,我会跳过有意义的位置。非常感谢。