Deep learning 为什么Yolo_9000只使用本地图像信息?

Deep learning 为什么Yolo_9000只使用本地图像信息?,deep-learning,object-detection,Deep Learning,Object Detection,有一件事让我很困惑,那就是我在读《尤罗9000》的论文。 在Yolov2结构中,最终的层大小是13x13,似乎每个单元包含来自原始图像的大约32x32图像信息。对我来说,它似乎只使用局部信息来适合对象检测,我不确定它是否足够或健壮 在v1版本中,有一个完整的连接层来结合本地到全局的信息,我觉得这更合理 或者我理解错了,这个问题确实困扰着我。 谢谢..但是卷积已经使用了这些信息。每个3x3过滤器在每个像素处使用最后一个过滤器的排序舍入信息。这些像素反过来已经卷积并使用其像素的周围信息等等。再加上通

有一件事让我很困惑,那就是我在读《尤罗9000》的论文。
在Yolov2结构中,最终的层大小是13x13,似乎每个单元包含来自原始图像的大约32x32图像信息。对我来说,它似乎只使用局部信息来适合对象检测,我不确定它是否足够或健壮

在v1版本中,有一个完整的连接层来结合本地到全局的信息,我觉得这更合理

或者我理解错了,这个问题确实困扰着我。
谢谢..

但是卷积已经使用了这些信息。每个3x3过滤器在每个像素处使用最后一个过滤器的排序舍入信息。这些像素反过来已经卷积并使用其像素的周围信息等等。再加上通过最大池缩小图像大小,整个图像都是这样覆盖的。

感谢您的回复。是的,窗口贯穿整个图像,但每个窗口只在下一层中引入一个像素(具有新的深度)。例如,输入是32x32x3,我使用深度为16的3x3卷积层,结果是32x32x16。每个3x3过滤器仅收集周围的信息。深度16是唯一的特征尺寸。另一件事,我可以将卷积层作为16X sobel检测器,使用soble canny边缘检测没有全局信息。是的,sobel只是局部信息,但随着下一个sobel滤波器,覆盖范围会增加,如果你添加足够的sobel滤波器,你将在每个像素中加入相关的全局信息。例如,如果您使用3x3 sobel滤波器,则在该特定像素中,您已包含该像素的信息。然后,如果您使用另一个3x3 sobel过滤器,您将合并附近像素的信息,这些像素已经合并了相邻像素,也可以由更大的过滤器内核存档。这种效果会因池操作而放大。谢谢。这是合理的。另一个问题是,似乎需要足够的层来获取全局信息,一层中的深度过滤器不会添加更大的邻域信息,因为它们的大小相同,并且会处理以前层的输出。只是为了确保。谢谢你的回复。非常感谢。