Algorithm 当训练一个健壮的级联分类器时要考虑哪些建议?

Algorithm 当训练一个健壮的级联分类器时要考虑哪些建议?,algorithm,opencv,machine-learning,computer-vision,classification,Algorithm,Opencv,Machine Learning,Computer Vision,Classification,我正在训练一个级联分类器来检测图像中的动物。不幸的是,我的假阳性率相当高(使用Haar和LBP的假阳性率非常高,使用HOG的假阳性率可以接受)。我想知道怎样才能改进我的分类器 以下是我的问题: 稳健检测所需的训练样本量是多少?我在某个地方读到需要4000个pos和800个neg样品。这是一个好的估计吗 培训样本应该有多大的不同?是否有方法量化图像差异,以包括/排除可能的“重复”数据 我应该如何处理被遮挡的对象?我应该只训练动物可见的部分,还是选择我的投资回报率,使平均投资回报率保持不变 重遮挡

我正在训练一个级联分类器来检测图像中的动物。不幸的是,我的假阳性率相当高(使用Haar和LBP的假阳性率非常高,使用HOG的假阳性率可以接受)。我想知道怎样才能改进我的分类器

以下是我的问题:

  • 稳健检测所需的训练样本量是多少?我在某个地方读到需要4000个pos和800个neg样品。这是一个好的估计吗
  • 培训样本应该有多大的不同?是否有方法量化图像差异,以包括/排除可能的“重复”数据
  • 我应该如何处理被遮挡的对象?我应该只训练动物可见的部分,还是选择我的投资回报率,使平均投资回报率保持不变
  • 重遮挡物体:动物有腿、臂、尾、头等。由于某些身体部位经常被遮挡,选择“躯干”作为ROI有意义吗
  • 我是否应该尝试缩小我的图像尺寸,并在较小的图像尺寸上进行训练?这有可能改善情况吗
我愿意接受任何指点

  • 4000位-800负是一个糟糕的比率。负样本的问题是,你需要尽可能多地训练你的系统,因为——所有类似haar的特征选择过程的核心算法——高度依赖于它们。使用4000/10000将是一个很好的增强
  • 探测“动物”是一个难题。由于您的问题是一个决策过程,而这已经是一个决策过程,因此您的分类范围正在增加复杂性。先从猫开始。有一个检测猫的系统。然后将同样的方法应用到狗身上。比如说,拥有40个系统,检测不同的动物,并在以后的工作中使用它们
  • 对于培训,不要将遮挡对象用作正面。i、 e.如果要检测正面,则只应用位置和方向更改来训练正面,而不包括前面的任何其他对象
  • 降尺度并不重要,因为haar分类器本身将所有内容降尺度为24x24。当你有足够的时间观看整个维奥拉·琼斯的演讲
  • 祝你好运

+1;全面的回答应该会让你走上正确的轨道。关于如何处理误报有什么建议吗?对于我当前的数据,分类器倾向于拾取小的圆形对象,即使我为训练数据提供的ROI没有与这些圆形对象重叠,并且ROI比错误检测的对象大得多。有什么建议吗?请注意,您应用的任何培训模式(ROI)都是灰度化、阈值化和缩小到24x24。你的系统决定了这一点的重要性。例如,由于您提供的正面信息(动物)有鼻子,因此线条特征(a)具有重要性(更高的权重)。它应该在图像中被检测出来,以便将某物归类为动物。而对于否定,则相反。ROI的大小并不重要。让你的积极面彼此相似。确保底片上没有动物般的图案。