Deep learning 使用图像中的多个对象训练更快的R-CNN

Deep learning 使用图像中的多个对象训练更快的R-CNN,deep-learning,Deep Learning,我想用我自己的图像训练更快的R-CNN网络来检测人脸。我检查了很多Github库,但这是我经常找到的培训文件的示例: /data/imgs/img_001.jpg,837,346,981,456,cow /data/imgs/img_002.jpg,215,312,279,391,cat 但我找不到一个例子来说明如何使用包含两个对象的图像进行训练。如果是: 1) /data/imgs/img_001.jpg,837,346,981,456,cow,215,312,279,391,cow 或

我想用我自己的图像训练更快的R-CNN网络来检测人脸。我检查了很多Github库,但这是我经常找到的培训文件的示例:

/data/imgs/img_001.jpg,837,346,981,456,cow
/data/imgs/img_002.jpg,215,312,279,391,cat
但我找不到一个例子来说明如何使用包含两个对象的图像进行训练。如果是:

1)  /data/imgs/img_001.jpg,837,346,981,456,cow,215,312,279,391,cow


我只是忍不住说:“精神错乱的定义是一遍又一遍地做同样的事情,期待不同的结果。”
(请注意,这纯粹是出于娱乐目的,无意以任何方式侮辱您;如果我认为您的问题不值得回答,我不会花时间回答您的问题)

在第二个示例中,您将输入完全相同的输入数据,但需要网络学习两种不同的结果。但是,正如您已经注意到的,对于许多库来说,每个图像支持多个标签并不常见

通常,这纯粹是为了简单起见,因为它要求您更改度量,以适应多个输出:现在您可以有多个“目标”,而不是一个热编码目标

这在目标检测任务中更具挑战性(而不是如前所述的目标分类),因为您现在必须决定如何表示目标
如果可能的话,我个人会限制自己为每个图像标记一个类,或者查看另一个支持该类的图像库,因为重写那么多代码的努力可能不值得在结果上进行微小的改进

2)  /data/imgs/img_001.jpg,837,346,981,456,cow
    /data/imgs/img_001.jpg,215,312,279,391,cow