Python 3.x YOLO输出图像数组中的最后一个维度对应于什么?

Python 3.x YOLO输出图像数组中的最后一个维度对应于什么?,python-3.x,image-processing,yolo,Python 3.x,Image Processing,Yolo,我在读一篇文章时发现: 第一次检测由第82层进行。对于前81层,网络对图像进行下采样,使得第81层的跨距为32。如果我们有一个416x416的图像,那么生成的特征图的大小将是13x13。这里使用1 x 1检测内核进行了一次检测,为我们提供了13 x 13 x255 在实现YOLO算法、构建模型并将图像作为输入传递到Conv net时,我对这段代码有一个疑问: output_vec = model.predict(img) print([squeeze(a).shape for a in outp

我在读一篇文章时发现:

第一次检测由第82层进行。对于前81层,网络对图像进行下采样,使得第81层的跨距为32。如果我们有一个416x416的图像,那么生成的特征图的大小将是13x13。这里使用1 x 1检测内核进行了一次检测,为我们提供了13 x 13 x255

在实现YOLO算法、构建模型并将图像作为输入传递到Conv net时,我对这段代码有一个疑问:

output_vec = model.predict(img)
print([squeeze(a).shape for a in output_vec])
[(13,13,255),(26,26,255),(52,52,255)]


我明白(13,13);(26, 26); (52,52)是三种不同比例的图像形状,但255对应于什么?

输出通道的数量对应于以下方程式Bx(5+C)

输出特征图中的每个点将预测B边界框,其中每个边界框由5个数字组成:4个用于边界框预测,第五个数字用于此边界框的置信度。 以及它所训练的每个C类的分类置信度


在用椰子训练的YLOV3中,B=3和C=80->3*(5+80)=255。。。谢谢