Machine learning 如何标记YOLO的培训数据

Machine learning 如何标记YOLO的培训数据,machine-learning,deep-learning,computer-vision,object-detection,Machine Learning,Deep Learning,Computer Vision,Object Detection,我有一个关于如何为YOLO算法标记训练数据的问题 假设每个标签Y,我们需要指定[Pc,bx,by,bh,bw],其中Pc是存在的指示器(1=存在,0=不存在),(bx,by)是相关对象中心的相对位置,(bh,bw)是包含对象的边界框的相对尺寸 以下图为例,包含一辆黑色汽车的单元格(1,2)应该有一个标签Y=[1,0.4,0.3,0.9,0.5]。对于没有汽车的任何单元格,它们都应该有一个标签[0、、、、?、?] [] 但是如果我们有这样一个更精细的网格,其中每个单元格的尺寸都小于地面真值边界框。

我有一个关于如何为YOLO算法标记训练数据的问题

假设每个标签Y,我们需要指定[Pc,bx,by,bh,bw],其中Pc是存在的指示器(1=存在,0=不存在),(bx,by)是相关对象中心的相对位置,(bh,bw)是包含对象的边界框的相对尺寸

以下图为例,包含一辆黑色汽车的单元格(1,2)应该有一个标签Y=[1,0.4,0.3,0.9,0.5]。对于没有汽车的任何单元格,它们都应该有一个标签[0、、、、?、?] []

但是如果我们有这样一个更精细的网格,其中每个单元格的尺寸都小于地面真值边界框。

假设汽车的地面真值边界框是红色框,地面真值中心点是红点,位于单元格2中

对于单元格2,其标签Y=[1,0.9,0.1,2,2],是否正确?
对于第1、3、4单元,它们会有什么样的标签?他们有Pc=1还是Pc=0?如果Pc=1,bx和by将如何?(我记得bx,by的值应该在0到1之间。但是在单元格1,3,4中,没有感兴趣对象的中心点)

实际上,它包含在单元格2中的中点。根据Y.O.L.O.算法,单元格1、3、4将显示Pc=0,该算法仅计算包含中点的单元格,并计算边界框,如您所述,使用bx、bx、bh、bw。对于Y=[1,0.9,0.1,2,2]的命题,我认为如果你把点(0,0)作为左上角,Y更可能是Y=[1,0.2,0.57,0.21,0.15],用19 x 19的网格计算,如下所示