Tensorflow 基锚尺寸在单炮多箱探测器中的应用_Tensorflow_Object Detection_Object Detection Api

Tensorflow 基锚尺寸在单炮多箱探测器中的应用

tensorflow

Tensorflow 基锚尺寸在单炮多箱探测器中的应用,tensorflow,object-detection,object-detection-api,Tensorflow,Object Detection,Object Detection Api,我在地下挖掘是为了几代人都能看到锚箱。在这种动态生成锚盒的情况下，我无法理解base\u anchor\u size的用法。在相应的文件中，没有提到这样的事情。简而言之，有两个问题： base\u anchor\u size参数的用途是什么？重要吗在原始输入图像的形状为正方形和非正方形的情况下，此参数如何影响训练在SSD架构中，有固定在前方的锚定标度，例如0.2-0.9范围内的线性值。这些值与图像大小有关。例如，给定320x320图像，则最小的锚点（比例为1:1）将为64x64，最大的锚点将

我在地下挖掘是为了几代人都能看到锚箱。在这种动态生成锚盒的情况下，我无法理解

base\u anchor\u size

的用法。在相应的文件中，没有提到这样的事情。简而言之，有两个问题：

base\u anchor\u size

参数的用途是什么？重要吗

在原始输入图像的形状为

正方形

和非正方形的情况下，此参数如何影响训练

在SSD架构中，有固定在前方的锚定标度，例如0.2-0.9范围内的线性值。这些值与图像大小有关。例如，给定320x320图像，则最小的锚点（比例为1:1）将为64x64，最大的锚点将为288x288。但是，如果您希望在模型中插入较大的图像，例如640x640，但不更改定位尺寸（例如，因为这些图像是远处对象的图像，因此不需要较大的对象；如果不保留定位尺寸不变，则不会在新分辨率上微调模型），然后您可以简单地使用

base\u anchor\u size=0.5

，这意味着相对于输入图像大小，锚点比例将为0.5*[0.2-0.9]

此参数的默认值为

[1.0,1.0]

，表示没有任何影响

这些条目对应于图像中可以容纳的最大正方形的

[高度，宽度]

相对值，意思是
[最小（图像高度，图像宽度），最小（图像高度，图像宽度）]
。因此，例如，如果您的输入图像是VGA，即640x480，那么
基本锚定大小将被视为相对于[480480] ，谢谢您的回答。因此，1）如果我是正确的，那么每个层中的框只有一个对应的比例，除了有两个ar=1的框的情况。2）我们不提供基本锚定大小，因此在任何情况下都会默认为[1.0,1.0]。是否有任何代码可以提前处理此问题？1）是的。2）是，默认值为[1.0,1.0]。我不理解“提前”的问题。1>这是否意味着在320X320图像中可以检测到的最小对象将是64X64（ar=1，比例为0.2-0.9）？2> 您能否解释一下层（Conv 4-3）上锚箱的尺寸，即比例=0.2，纵横比为1:2？是32X64吗@内内尔萨姆