Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/image-processing/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Image processing 使用YOLO v2检测多个类时出现的问题和失败,而单类检测几乎是准确的_Image Processing_Machine Learning_Conv Neural Network_Object Detection_Yolo - Fatal编程技术网

Image processing 使用YOLO v2检测多个类时出现的问题和失败,而单类检测几乎是准确的

Image processing 使用YOLO v2检测多个类时出现的问题和失败,而单类检测几乎是准确的,image-processing,machine-learning,conv-neural-network,object-detection,yolo,Image Processing,Machine Learning,Conv Neural Network,Object Detection,Yolo,对于一个课程项目,我正在训练一个单通道网络来检测图像中的多个仪器符号。下面显示了这些类的一小部分 我使用YOLO v2来训练和检测图像中的多个类。 由于这类符号的数据集不存在,我用以下两种方法对上面显示的四个符号执行了数据扩充 以0.5度的步长旋转每种符号类型,从而提供 每节课720张图片 此外,获得的720幅图像经过高斯模糊处理 (5x5过滤器)。 这将数据集增加到每个类1440个图像 YOLO v2的配置文件仅在以下行上更改: 第3行:批处理=64 第4行:细分=64(细分大小为8会

对于一个课程项目,我正在训练一个单通道网络来检测图像中的多个仪器符号。下面显示了这些类的一小部分

我使用YOLO v2来训练和检测图像中的多个类。 由于这类符号的数据集不存在,我用以下两种方法对上面显示的四个符号执行了数据扩充

  • 以0.5度的步长旋转每种符号类型,从而提供 每节课720张图片
  • 此外,获得的720幅图像经过高斯模糊处理 (5x5过滤器)。
    这将数据集增加到每个类1440个图像
YOLO v2的配置文件仅在以下行上更改:

  • 第3行:批处理=64
  • 第4行:细分=64(细分大小为8会导致CUDA内存不足)
  • 第244行:类=4
  • 第237行:过滤器=(类+5)*5=45
用于训练的图像大小为500x500,整个数据集分为80%和20%的比例用于训练和测试

网络训练运行到3100次迭代,平均损失为0.048

然而,训练结果让我有点困惑,因为在多类检测的情况下,结果是相当意外的。在测试图像上的单类分类中,网络的性能与预期一样(尽管对于两个类来说不是很好,可能可以改进),如下所示:

但是,当我尝试对测试图像执行多类检测时,检测和分类完全失败,如下面的结果图像所示:

如果我改变测试图像中符号之间的空间距离,那么边界框和类预测将变得更加随机。 因此,关于这个问题,我有几个问题:

  • 由于YOLO还隐式执行数据扩充,因此我的数据 增强过程会干扰训练吗
  • 我是否需要将图像调整为精确的416X416,作为YOLO v2所需的输入
  • 我知道YOLO v2是一个非常沉重的CNN架构,可能 这并不适用于此类图像,但单类分类结果太有希望被忽略。那么,有人能找出为什么它在多类检测中完全失败吗
  • 我应该按原样使用YOLO v2还是修改它以检测图像中的这些符号?我想如果我修改了,我可能会失去更多,并进一步恶化检测
    选择两种方式进行数据扩充(DA)有什么具体原因吗?查看此链接,了解专门针对YOLO的完整DA。使用YOLO训练您自己的数据可能会很有趣。还有另一个SO帖子可能会把你带到某个地方。