Tensorflow 基锚尺寸在单炮多箱探测器中的应用

Tensorflow 基锚尺寸在单炮多箱探测器中的应用,tensorflow,object-detection,object-detection-api,Tensorflow,Object Detection,Object Detection Api,我在地下挖掘是为了几代人都能看到锚箱。在这种动态生成锚盒的情况下,我无法理解base\u anchor\u size的用法。在相应的文件中,没有提到这样的事情。简而言之,有两个问题: base\u anchor\u size参数的用途是什么?重要吗 在原始输入图像的形状为正方形和非正方形的情况下,此参数如何影响训练 在SSD架构中,有固定在前方的锚定标度,例如0.2-0.9范围内的线性值。这些值与图像大小有关。例如,给定320x320图像,则最小的锚点(比例为1:1)将为64x64,最大的锚点将

我在地下挖掘是为了几代人都能看到锚箱。在这种动态生成锚盒的情况下,我无法理解
base\u anchor\u size
的用法。在相应的文件中,没有提到这样的事情。简而言之,有两个问题:

  • base\u anchor\u size
    参数的用途是什么?重要吗
  • 在原始输入图像的形状为
    正方形
    和非正方形的情况下,此参数如何影响训练
    在SSD架构中,有固定在前方的锚定标度,例如0.2-0.9范围内的线性值。这些值与图像大小有关。例如,给定320x320图像,则最小的锚点(比例为1:1)将为64x64,最大的锚点将为288x288。但是,如果您希望在模型中插入较大的图像,例如640x640,但不更改定位尺寸(例如,因为这些图像是远处对象的图像,因此不需要较大的对象;如果不保留定位尺寸不变,则不会在新分辨率上微调模型),然后您可以简单地使用
    base\u anchor\u size=0.5
    ,这意味着相对于输入图像大小,锚点比例将为0.5*[0.2-0.9]

    此参数的默认值为
    [1.0,1.0]
    ,表示没有任何影响


    这些条目对应于图像中可以容纳的最大正方形的
    [高度,宽度]
    相对值,意思是
    [最小(图像高度,图像宽度),最小(图像高度,图像宽度)]
    。因此,例如,如果您的输入图像是VGA,即640x480,那么
    基本锚定大小将被视为相对于
    [480480]

    ,谢谢您的回答。因此,1)如果我是正确的,那么每个层中的框只有一个对应的比例,除了有两个ar=1的框的情况。2) 我们不提供基本锚定大小,因此在任何情况下都会默认为[1.0,1.0]。是否有任何代码可以提前处理此问题?1)是的。2) 是,默认值为[1.0,1.0]。我不理解“提前”的问题。1>这是否意味着在320X320图像中可以检测到的最小对象将是64X64(ar=1,比例为0.2-0.9)?2> 您能否解释一下层(Conv 4-3)上锚箱的尺寸,即比例=0.2,纵横比为1:2?是32X64吗@内内尔萨姆