Python 我如何将[xmin-ymin-xmax-ymax]格式转换为图像中规格化的[x-y-width-height]？_Python_Object Detection_Microsoft Custom Vision

Python 我如何将[xmin-ymin-xmax-ymax]格式转换为图像中规格化的[x-y-width-height]？

python

Python 我如何将[xmin-ymin-xmax-ymax]格式转换为图像中规格化的[x-y-width-height]？,python,object-detection,microsoft-custom-vision,Python,Object Detection,Microsoft Custom Vision,我正在用微软的软件构建一个自定义的vision应用程序我正在使用在对象检测项目中标记图像时，需要使用规范化坐标指定每个标记对象的区域我有一个包含图像注释的XML文件，例如名为sample_1.jpg： <annotation> <filename>sample_1.jpg</filename> <size> <width>410</width> <heigh

我正在用微软的软件构建一个自定义的vision应用程序

我正在使用

在对象检测项目中标记图像时，需要使用规范化坐标指定每个标记对象的区域

我有一个包含图像注释的XML文件，例如名为

sample_1.jpg

：

<annotation>
        <filename>sample_1.jpg</filename>
    <size>
        <width>410</width>
        <height>400</height>
        <depth>3</depth>
    </size>
    <object>
        <bndbox>
            <xmin>159</xmin>
            <ymin>15</ymin>
            <xmax>396</xmax>
            <ymax>302</ymax>
        </bndbox>
    </object>
</annotation>


示例_1.jpg
410
400
3.
159
15
396
302

我必须将边界框坐标从xmin、xmax、ymin、ymax转换为根据提供的教程标准化的x、y、w、h坐标

有人能给我一个转换函数吗？

假设x/ymin和x/ymax分别是您的边界角，左上角和右下角。然后：

x = xmin
y = ymin
w = xmax - xmin
h = ymax - ymin

然后，您需要对这些值进行规格化，这意味着将它们作为整个图像的一部分，因此只需将每个值除以其各自的大小即可：

x = xmin / width
y = ymin / height
w = (xmax - xmin) / width
h = (ymax - ymin) / height

这假设是左上角原点，如果不是这样，则必须应用移位因子。

在这种情况下，x和y是什么意思？