Deep learning 为什么Yolo_9000只使用本地图像信息？_Deep Learning_Object Detection

Deep learning 为什么Yolo_9000只使用本地图像信息？

deep-learning

Deep learning 为什么Yolo_9000只使用本地图像信息？,deep-learning,object-detection,Deep Learning,Object Detection,有一件事让我很困惑，那就是我在读《尤罗9000》的论文。在Yolov2结构中，最终的层大小是13x13，似乎每个单元包含来自原始图像的大约32x32图像信息。对我来说，它似乎只使用局部信息来适合对象检测，我不确定它是否足够或健壮在v1版本中，有一个完整的连接层来结合本地到全局的信息，我觉得这更合理或者我理解错了，这个问题确实困扰着我。谢谢..但是卷积已经使用了这些信息。每个3x3过滤器在每个像素处使用最后一个过滤器的排序舍入信息。这些像素反过来已经卷积并使用其像素的周围信息等等。再加上通

有一件事让我很困惑，那就是我在读《尤罗9000》的论文。
在Yolov2结构中，最终的层大小是13x13，似乎每个单元包含来自原始图像的大约32x32图像信息。对我来说，它似乎只使用局部信息来适合对象检测，我不确定它是否足够或健壮

在v1版本中，有一个完整的连接层来结合本地到全局的信息，我觉得这更合理

或者我理解错了，这个问题确实困扰着我。

谢谢..

但是卷积已经使用了这些信息。每个3x3过滤器在每个像素处使用最后一个过滤器的排序舍入信息。这些像素反过来已经卷积并使用其像素的周围信息等等。再加上通过最大池缩小图像大小，整个图像都是这样覆盖的。

感谢您的回复。是的，窗口贯穿整个图像，但每个窗口只在下一层中引入一个像素（具有新的深度）。例如，输入是32x32x3，我使用深度为16的3x3卷积层，结果是32x32x16。每个3x3过滤器仅收集周围的信息。深度16是唯一的特征尺寸。另一件事，我可以将卷积层作为16X sobel检测器，使用soble canny边缘检测没有全局信息。是的，sobel只是局部信息，但随着下一个sobel滤波器，覆盖范围会增加，如果你添加足够的sobel滤波器，你将在每个像素中加入相关的全局信息。例如，如果您使用3x3 sobel滤波器，则在该特定像素中，您已包含该像素的信息。然后，如果您使用另一个3x3 sobel过滤器，您将合并附近像素的信息，这些像素已经合并了相邻像素，也可以由更大的过滤器内核存档。这种效果会因池操作而放大。谢谢。这是合理的。另一个问题是，似乎需要足够的层来获取全局信息，一层中的深度过滤器不会添加更大的邻域信息，因为它们的大小相同，并且会处理以前层的输出。只是为了确保。谢谢你的回复。非常感谢。