Python 如何为深度学习培训数据集创建地面真相边界框？_Python_Deep Learning_Faster Rcnn

Python 如何为深度学习培训数据集创建地面真相边界框？

python deep-learning

Python 如何为深度学习培训数据集创建地面真相边界框？,python,deep-learning,faster-rcnn,Python,Deep Learning,Faster Rcnn,我正在做一个项目，我想使用mask RCNN识别一组图像中的对象。但是，我很难理解如何为地面真实数据创建边界框（编码像素）。有人能给我指出正确的方向或进一步解释吗？边界框通常是手工标注的。大多数深入学习的人使用单独的应用程序进行标记。我相信这个套餐很受欢迎：我开发了自己的RoR标签解决方案，因为它有助于将工作分配给几个人。如果您想查看，则存储库是开源的：我认为称之为“编码像素”有点误导。边界框是带标签的矩形数据类型，这意味着它们完全由矩形角的类型（汽车、公共汽车、卡车）和（x、y）坐标定

我正在做一个项目，我想使用mask RCNN识别一组图像中的对象。但是，我很难理解如何为地面真实数据创建边界框（编码像素）。有人能给我指出正确的方向或进一步解释吗？

边界框通常是手工标注的。大多数深入学习的人使用单独的应用程序进行标记。我相信这个套餐很受欢迎：

我开发了自己的RoR标签解决方案，因为它有助于将工作分配给几个人。如果您想查看，则存储库是开源的：

我认为称之为“编码像素”有点误导。边界框是带标签的矩形数据类型，这意味着它们完全由矩形角的类型（汽车、公共汽车、卡车）和（x、y）坐标定义

用于定义边界框的软件通常包括图像显示元素，以及允许用户在UI上拖动边界框的功能。我的应用程序使用单选按钮列表来选择对象类型（汽车、公共汽车等）；然后用户绘制一个边界框

完全标记图像的结果是一个文本文件，其中每一行表示一个边界框。您应该查看培训算法的库文档，以准确了解输入边界框所需的格式

在我自己的应用程序中，我开发了一些功能来比较不同用户的边界框。在任何大型ML工作中，您都可能会遇到一些错误标记的图像，因此您确实需要一个工具来识别这些图像，因为它会严重降低您的结果。

谢谢您提供的所有信息！你的应用程序看起来很棒。我试试看。我很感激你的帮助help@DominickAugustine不客气，如果您有任何问题，请随时在Github上提交问题。@AMC“如何定义和创建边界框”是一个非常明确的编程问题。这当然是切实可行的。我认为这个问题也不属于明确禁止的范畴：它不是家庭作业，也不是“我的代码不工作”，等等。你认为违反了什么规则？