Deep learning 使用图像中的多个对象训练更快的R-CNN_Deep Learning

Deep learning 使用图像中的多个对象训练更快的R-CNN

deep-learning

Deep learning 使用图像中的多个对象训练更快的R-CNN,deep-learning,Deep Learning,我想用我自己的图像训练更快的R-CNN网络来检测人脸。我检查了很多Github库，但这是我经常找到的培训文件的示例： /data/imgs/img_001.jpg,837,346,981,456,cow /data/imgs/img_002.jpg,215,312,279,391,cat 但我找不到一个例子来说明如何使用包含两个对象的图像进行训练。如果是： 1) /data/imgs/img_001.jpg,837,346,981,456,cow,215,312,279,391,cow 或

我想用我自己的图像训练更快的R-CNN网络来检测人脸。我检查了很多Github库，但这是我经常找到的培训文件的示例：

/data/imgs/img_001.jpg,837,346,981,456,cow
/data/imgs/img_002.jpg,215,312,279,391,cat

但我找不到一个例子来说明如何使用包含两个对象的图像进行训练。如果是：

1)  /data/imgs/img_001.jpg,837,346,981,456,cow,215,312,279,391,cow

或

我只是忍不住说：“精神错乱的定义是一遍又一遍地做同样的事情，期待不同的结果。”
（请注意，这纯粹是出于娱乐目的，无意以任何方式侮辱您；如果我认为您的问题不值得回答，我不会花时间回答您的问题）

在第二个示例中，您将输入完全相同的输入数据，但需要网络学习两种不同的结果。但是，正如您已经注意到的，对于许多库来说，每个图像支持多个标签并不常见

通常，这纯粹是为了简单起见，因为它要求您更改度量，以适应多个输出：现在您可以有多个“目标”，而不是一个热编码目标

这在目标检测任务中更具挑战性（而不是如前所述的目标分类），因为您现在必须决定如何表示目标
如果可能的话，我个人会限制自己为每个图像标记一个类，或者查看另一个支持该类的图像库，因为重写那么多代码的努力可能不值得在结果上进行微小的改进

2)  /data/imgs/img_001.jpg,837,346,981,456,cow
    /data/imgs/img_001.jpg,215,312,279,391,cow