Python 如何使用带有图像的边界框进行多标签图像培训?

Python 如何使用带有图像的边界框进行多标签图像培训?,python,tensorflow,machine-learning,image-processing,Python,Tensorflow,Machine Learning,Image Processing,我正在从事图像分类的机器学习,并成功地完成了几个项目。所有项目都有始终属于一个类的图像。现在我想尝试在每个图像上有多个标签的图像。我读到我必须在图像周围画框(边界框)进行训练。 我的问题是 我是否必须将这些区域裁剪成单个图像并像以前一样用于训练? 绘制的框仅用于裁剪 或者我们真的将原始图像和方框坐标(左上角[X,Y],宽度和高度)输入到训练中了吗 欢迎提供与此相关的任何教程。基本上,您需要检测图像中属于不同类别的各种对象。下面是图片中对象检测的位置 “对象检测”尝试对图像中各种对象的标签进行分

我正在从事图像分类的机器学习,并成功地完成了几个项目。所有项目都有始终属于一个类的图像。现在我想尝试在每个图像上有多个标签的图像。我读到我必须在图像周围画框(边界框)进行训练。 我的问题是

  • 我是否必须将这些区域裁剪成单个图像并像以前一样用于训练?
  • 绘制的框仅用于裁剪
  • 或者我们真的将原始图像和方框坐标(左上角[X,Y],宽度和高度)输入到训练中了吗

  • 欢迎提供与此相关的任何教程。

    基本上,您需要检测图像中属于不同类别的各种对象。下面是图片中对象检测的位置

    “对象检测”尝试对图像中各种对象的标签进行分类 图像并预测边界框

    目标检测有很多算法。如果您是经验丰富的TensorFlow用户,可以直接使用。您可以选择所需的体系结构,并将注释与图像一起提供

    若要注释图像(在框周围绘制边界框并单独存储),可以使用工具

    您可以参考以下博客:

  • 您可以使用可用的预训练对象检测器,而不是训练一个全新的对象检测器。该系统可以对80个对象进行分类。如果需要分类的对象包含在这些对象中,则可以获得一个准备构建的模型。模型围绕您感兴趣的对象绘制边界框

    您可以根据需要裁剪图像的这一部分并在其上构建分类器