Python 如何使用带有图像的边界框进行多标签图像培训？_Python_Tensorflow_Machine Learning_Image Processing

Python 如何使用带有图像的边界框进行多标签图像培训？

python tensorflow machine-learning image-processing

Python 如何使用带有图像的边界框进行多标签图像培训？,python,tensorflow,machine-learning,image-processing,Python,Tensorflow,Machine Learning,Image Processing,我正在从事图像分类的机器学习，并成功地完成了几个项目。所有项目都有始终属于一个类的图像。现在我想尝试在每个图像上有多个标签的图像。我读到我必须在图像周围画框（边界框）进行训练。我的问题是我是否必须将这些区域裁剪成单个图像并像以前一样用于训练？绘制的框仅用于裁剪或者我们真的将原始图像和方框坐标（左上角[X，Y]，宽度和高度）输入到训练中了吗欢迎提供与此相关的任何教程。基本上，您需要检测图像中属于不同类别的各种对象。下面是图片中对象检测的位置 “对象检测”尝试对图像中各种对象的标签进行分

我正在从事图像分类的机器学习，并成功地完成了几个项目。所有项目都有始终属于一个类的图像。现在我想尝试在每个图像上有多个标签的图像。我读到我必须在图像周围画框（边界框）进行训练。我的问题是

我是否必须将这些区域裁剪成单个图像并像以前一样用于训练？

绘制的框仅用于裁剪

或者我们真的将原始图像和方框坐标（左上角[X，Y]，宽度和高度）输入到训练中了吗

欢迎提供与此相关的任何教程。

基本上，您需要检测图像中属于不同类别的各种对象。下面是图片中对象检测的位置
“对象检测”尝试对图像中各种对象的标签进行分类图像并预测边界框
目标检测有很多算法。如果您是经验丰富的TensorFlow用户，可以直接使用。您可以选择所需的体系结构，并将注释与图像一起提供
若要注释图像（在框周围绘制边界框并单独存储），可以使用工具
您可以参考以下博客：

您可以使用可用的预训练对象检测器，而不是训练一个全新的对象检测器。该系统可以对80个对象进行分类。如果需要分类的对象包含在这些对象中，则可以获得一个准备构建的模型。模型围绕您感兴趣的对象绘制边界框
您可以根据需要裁剪图像的这一部分并在其上构建分类器