Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/blackberry/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Deep learning 为什么YOLO将图像分割为网格单元?_Deep Learning_Object Detection_Yolo_Cnn - Fatal编程技术网

Deep learning 为什么YOLO将图像分割为网格单元?

Deep learning 为什么YOLO将图像分割为网格单元?,deep-learning,object-detection,yolo,cnn,Deep Learning,Object Detection,Yolo,Cnn,我正在努力了解YOLO是如何为我正在做的项目工作的。我已经阅读了许多论文、文章和博客文章,但我仍然不确定为什么YOLO将整个图像划分为一个网格单元,并考虑每个单元进行计算。如果我们把整个图像看作一个细胞(没有分裂),会发生什么?这个网格单元的用途是什么?特定单元可以检测到的对象数量是否达到最大值?网格单元将网络预测置于一种更具结构的形式。每个网格单元对应一个特定的图像区域,这些单元预测其中心位于该区域的对象。因此,要利用图像的空间规则性优势,就需要有一个结构化的输出表示 每个网格单元可以对向量进

我正在努力了解YOLO是如何为我正在做的项目工作的。我已经阅读了许多论文、文章和博客文章,但我仍然不确定为什么YOLO将整个图像划分为一个网格单元,并考虑每个单元进行计算。如果我们把整个图像看作一个细胞(没有分裂),会发生什么?这个网格单元的用途是什么?特定单元可以检测到的对象数量是否达到最大值?

网格单元将网络预测置于一种更具结构的形式。每个网格单元对应一个特定的图像区域,这些单元预测其中心位于该区域的对象。因此,要利用图像的空间规则性优势,就需要有一个结构化的输出表示

每个网格单元可以对向量进行预测,该向量的形式为[objectness_值,bbox_h,bbox_w,bbox_cx,bbox_cy,p1,p2,…pn]

  • 客观价值:预测的可信度如何
  • bbox_h、bbox_w、bbox_cx、bbox_cy:分别用于边界框高度、宽度、x轴中心坐标和y轴中心坐标的偏移
  • p1,p2,…pn:每个对象类别的预测类概率。(共n个对象)
更多的网格单元意味着更多的预测。如果有一个网格单元(图像本身),则将有一个边界框。这是不实际的,因为图像中可能有许多对象

请注意,网格单元可以进行多个边界框预测,向输出向量添加更多的bbox偏移