Image processing 更快的RCNN,为什么conv';s的结果可以成为bbox_三角洲吗?

Image processing 更快的RCNN,为什么conv';s的结果可以成为bbox_三角洲吗?,image-processing,tensorflow,computer-vision,deep-learning,detection,Image Processing,Tensorflow,Computer Vision,Deep Learning,Detection,这就是代码 我很困惑,rpn\u bbox\u pred仅仅是卷积的结果 而rpn\u bbox\u pred正在成为bbox\u三角洲 我不能理解这一点。假设我们有一个(3,2,36)conv的结果 请注意: 36 = 4 * 9 因此,整形后,(3,2)的每个点有9个建议 如节目所示: import numpy as np a = [[[1]*36,[2]*36],[[3]*36,[4]*36],[[5]*36,[6]*36]] a = np.array(a) print(a.reshap

这就是代码

我很困惑,
rpn\u bbox\u pred
仅仅是卷积的结果

rpn\u bbox\u pred
正在成为
bbox\u三角洲

我不能理解这一点。

假设我们有一个
(3,2,36)
conv的结果

请注意:

36 = 4 * 9
因此,整形后,
(3,2)
的每个点有9个建议

如节目所示:

import numpy as np
a = [[[1]*36,[2]*36],[[3]*36,[4]*36],[[5]*36,[6]*36]]
a = np.array(a)
print(a.reshape([-1,4]))
在程序中,每个
(3,2)
特征映射都是
[[1,2],[3,4],[5,6]]

打印结果:

[[1 1 1 1]
 [1 1 1 1]
 [1 1 1 1]
 [1 1 1 1]
 [1 1 1 1]
 [1 1 1 1]
 [1 1 1 1]
 [1 1 1 1]
 [1 1 1 1]
 [2 2 2 2]
 [2 2 2 2]
 [2 2 2 2]
 [2 2 2 2]
 [2 2 2 2]
 [2 2 2 2]
 [2 2 2 2]
 [2 2 2 2]
 [2 2 2 2]
 [3 3 3 3]
 [3 3 3 3]
 [3 3 3 3]
 [3 3 3 3]
 [3 3 3 3]
 [3 3 3 3]
 [3 3 3 3]
 [3 3 3 3]
 [3 3 3 3]
 [4 4 4 4]
 [4 4 4 4]
 [4 4 4 4]
 [4 4 4 4]
 [4 4 4 4]
 [4 4 4 4]
 [4 4 4 4]
 [4 4 4 4]
 [4 4 4 4]
 [5 5 5 5]
 [5 5 5 5]
 [5 5 5 5]
 [5 5 5 5]
 [5 5 5 5]
 [5 5 5 5]
 [5 5 5 5]
 [5 5 5 5]
 [5 5 5 5]
 [6 6 6 6]
 [6 6 6 6]
 [6 6 6 6]
 [6 6 6 6]
 [6 6 6 6]
 [6 6 6 6]
 [6 6 6 6]
 [6 6 6 6]
 [6 6 6 6]]