Machine learning 如何标记YOLO的培训数据_Machine Learning_Deep Learning_Computer Vision_Object Detection

Machine learning 如何标记YOLO的培训数据

machine-learning deep-learning computer-vision

Machine learning 如何标记YOLO的培训数据,machine-learning,deep-learning,computer-vision,object-detection,Machine Learning,Deep Learning,Computer Vision,Object Detection,我有一个关于如何为YOLO算法标记训练数据的问题假设每个标签Y，我们需要指定[Pc，bx，by，bh，bw]，其中Pc是存在的指示器（1=存在，0=不存在），（bx，by）是相关对象中心的相对位置，（bh，bw）是包含对象的边界框的相对尺寸以下图为例，包含一辆黑色汽车的单元格（1,2）应该有一个标签Y=[1,0.4,0.3,0.9,0.5]。对于没有汽车的任何单元格，它们都应该有一个标签[0、、、、？、？] [] 但是如果我们有这样一个更精细的网格，其中每个单元格的尺寸都小于地面真值边界框。

我有一个关于如何为YOLO算法标记训练数据的问题

假设每个标签Y，我们需要指定[Pc，bx，by，bh，bw]，其中Pc是存在的指示器（1=存在，0=不存在），（bx，by）是相关对象中心的相对位置，（bh，bw）是包含对象的边界框的相对尺寸

以下图为例，包含一辆黑色汽车的单元格（1,2）应该有一个标签Y=[1,0.4,0.3,0.9,0.5]。对于没有汽车的任何单元格，它们都应该有一个标签[0、、、、？、？] []

但是如果我们有这样一个更精细的网格，其中每个单元格的尺寸都小于地面真值边界框。

假设汽车的地面真值边界框是红色框，地面真值中心点是红点，位于单元格2中

对于单元格2，其标签Y=[1,0.9,0.1,2,2]，是否正确？

对于第1、3、4单元，它们会有什么样的标签？他们有Pc=1还是Pc=0？如果Pc=1，bx和by将如何？（我记得bx，by的值应该在0到1之间。但是在单元格1,3,4中，没有感兴趣对象的中心点）

实际上，它包含在单元格2中的中点。根据Y.O.L.O.算法，单元格1、3、4将显示Pc=0，该算法仅计算包含中点的单元格，并计算边界框，如您所述，使用bx、bx、bh、bw。对于Y=[1,0.9,0.1,2,2]的命题，我认为如果你把点（0,0）作为左上角，Y更可能是Y=[1,0.2,0.57,0.21,0.15]，用19 x 19的网格计算，如下所示