Deep learning 使用图像中的多个对象训练更快的R-CNN
我想用我自己的图像训练更快的R-CNN网络来检测人脸。我检查了很多Github库,但这是我经常找到的培训文件的示例:Deep learning 使用图像中的多个对象训练更快的R-CNN,deep-learning,Deep Learning,我想用我自己的图像训练更快的R-CNN网络来检测人脸。我检查了很多Github库,但这是我经常找到的培训文件的示例: /data/imgs/img_001.jpg,837,346,981,456,cow /data/imgs/img_002.jpg,215,312,279,391,cat 但我找不到一个例子来说明如何使用包含两个对象的图像进行训练。如果是: 1) /data/imgs/img_001.jpg,837,346,981,456,cow,215,312,279,391,cow 或
/data/imgs/img_001.jpg,837,346,981,456,cow
/data/imgs/img_002.jpg,215,312,279,391,cat
但我找不到一个例子来说明如何使用包含两个对象的图像进行训练。如果是:
1) /data/imgs/img_001.jpg,837,346,981,456,cow,215,312,279,391,cow
或
我只是忍不住说:“精神错乱的定义是一遍又一遍地做同样的事情,期待不同的结果。”
(请注意,这纯粹是出于娱乐目的,无意以任何方式侮辱您;如果我认为您的问题不值得回答,我不会花时间回答您的问题) 在第二个示例中,您将输入完全相同的输入数据,但需要网络学习两种不同的结果。但是,正如您已经注意到的,对于许多库来说,每个图像支持多个标签并不常见 通常,这纯粹是为了简单起见,因为它要求您更改度量,以适应多个输出:现在您可以有多个“目标”,而不是一个热编码目标 这在目标检测任务中更具挑战性(而不是如前所述的目标分类),因为您现在必须决定如何表示目标
如果可能的话,我个人会限制自己为每个图像标记一个类,或者查看另一个支持该类的图像库,因为重写那么多代码的努力可能不值得在结果上进行微小的改进
2) /data/imgs/img_001.jpg,837,346,981,456,cow
/data/imgs/img_001.jpg,215,312,279,391,cow