Image processing 使用YOLO v2检测多个类时出现的问题和失败，而单类检测几乎是准确的_Image Processing_Machine Learning_Conv Neural Network_Object Detection_Yolo

Image processing 使用YOLO v2检测多个类时出现的问题和失败，而单类检测几乎是准确的

image-processing machine-learning

Image processing 使用YOLO v2检测多个类时出现的问题和失败，而单类检测几乎是准确的,image-processing,machine-learning,conv-neural-network,object-detection,yolo,Image Processing,Machine Learning,Conv Neural Network,Object Detection,Yolo,对于一个课程项目，我正在训练一个单通道网络来检测图像中的多个仪器符号。下面显示了这些类的一小部分我使用YOLO v2来训练和检测图像中的多个类。由于这类符号的数据集不存在，我用以下两种方法对上面显示的四个符号执行了数据扩充以0.5度的步长旋转每种符号类型，从而提供每节课720张图片此外，获得的720幅图像经过高斯模糊处理（5x5过滤器）。这将数据集增加到每个类1440个图像 YOLO v2的配置文件仅在以下行上更改：第3行：批处理=64 第4行：细分=64（细分大小为8会

对于一个课程项目，我正在训练一个单通道网络来检测图像中的多个仪器符号。下面显示了这些类的一小部分

我使用YOLO v2来训练和检测图像中的多个类。由于这类符号的数据集不存在，我用以下两种方法对上面显示的四个符号执行了数据扩充

以0.5度的步长旋转每种符号类型，从而提供每节课720张图片
此外，获得的720幅图像经过高斯模糊处理（5x5过滤器）。
这将数据集增加到每个类1440个图像

YOLO v2的配置文件仅在以下行上更改：

第3行：批处理=64
第4行：细分=64（细分大小为8会导致CUDA内存不足）
第244行：类=4
第237行：过滤器=（类+5）*5=45

用于训练的图像大小为500x500，整个数据集分为80%和20%的比例用于训练和测试

网络训练运行到3100次迭代，平均损失为0.048

然而，训练结果让我有点困惑，因为在多类检测的情况下，结果是相当意外的。在测试图像上的单类分类中，网络的性能与预期一样（尽管对于两个类来说不是很好，可能可以改进），如下所示：

但是，当我尝试对测试图像执行多类检测时，检测和分类完全失败，如下面的结果图像所示：

如果我改变测试图像中符号之间的空间距离，那么边界框和类预测将变得更加随机。因此，关于这个问题，我有几个问题：

由于YOLO还隐式执行数据扩充，因此我的数据增强过程会干扰训练吗

我是否需要将图像调整为精确的416X416，作为YOLO v2所需的输入

我知道YOLO v2是一个非常沉重的CNN架构，可能这并不适用于此类图像，但单类分类结果太有希望被忽略。那么，有人能找出为什么它在多类检测中完全失败吗

我应该按原样使用YOLO v2还是修改它以检测图像中的这些符号？我想如果我修改了，我可能会失去更多，并进一步恶化检测

选择两种方式进行数据扩充（DA）有什么具体原因吗？查看此链接，了解专门针对YOLO的完整DA。使用YOLO训练您自己的数据可能会很有趣。还有另一个SO帖子可能会把你带到某个地方。