Algorithm 当训练一个健壮的级联分类器时要考虑哪些建议？_Algorithm_Opencv_Machine Learning_Computer Vision_Classification

Algorithm 当训练一个健壮的级联分类器时要考虑哪些建议？

algorithm opencv machine-learning computer-vision

Algorithm 当训练一个健壮的级联分类器时要考虑哪些建议？,algorithm,opencv,machine-learning,computer-vision,classification,Algorithm,Opencv,Machine Learning,Computer Vision,Classification,我正在训练一个级联分类器来检测图像中的动物。不幸的是，我的假阳性率相当高（使用Haar和LBP的假阳性率非常高，使用HOG的假阳性率可以接受）。我想知道怎样才能改进我的分类器以下是我的问题：稳健检测所需的训练样本量是多少？我在某个地方读到需要4000个pos和800个neg样品。这是一个好的估计吗培训样本应该有多大的不同？是否有方法量化图像差异，以包括/排除可能的“重复”数据我应该如何处理被遮挡的对象？我应该只训练动物可见的部分，还是选择我的投资回报率，使平均投资回报率保持不变重遮挡

我正在训练一个级联分类器来检测图像中的动物。不幸的是，我的假阳性率相当高（使用Haar和LBP的假阳性率非常高，使用HOG的假阳性率可以接受）。我想知道怎样才能改进我的分类器

以下是我的问题：

稳健检测所需的训练样本量是多少？我在某个地方读到需要4000个pos和800个neg样品。这是一个好的估计吗
培训样本应该有多大的不同？是否有方法量化图像差异，以包括/排除可能的“重复”数据
我应该如何处理被遮挡的对象？我应该只训练动物可见的部分，还是选择我的投资回报率，使平均投资回报率保持不变
重遮挡物体：动物有腿、臂、尾、头等。由于某些身体部位经常被遮挡，选择“躯干”作为ROI有意义吗
我是否应该尝试缩小我的图像尺寸，并在较小的图像尺寸上进行训练？这有可能改善情况吗

我愿意接受任何指点

4000位-800负是一个糟糕的比率。负样本的问题是，你需要尽可能多地训练你的系统，因为——所有类似haar的特征选择过程的核心算法——高度依赖于它们。使用4000/10000将是一个很好的增强
探测“动物”是一个难题。由于您的问题是一个决策过程，而这已经是一个决策过程，因此您的分类范围正在增加复杂性。先从猫开始。有一个检测猫的系统。然后将同样的方法应用到狗身上。比如说，拥有40个系统，检测不同的动物，并在以后的工作中使用它们
对于培训，不要将遮挡对象用作正面。i、 e.如果要检测正面，则只应用位置和方向更改来训练正面，而不包括前面的任何其他对象
降尺度并不重要，因为haar分类器本身将所有内容降尺度为24x24。当你有足够的时间观看整个维奥拉·琼斯的演讲
祝你好运

+1；全面的回答应该会让你走上正确的轨道。关于如何处理误报有什么建议吗？对于我当前的数据，分类器倾向于拾取小的圆形对象，即使我为训练数据提供的ROI没有与这些圆形对象重叠，并且ROI比错误检测的对象大得多。有什么建议吗？请注意，您应用的任何培训模式（ROI）都是灰度化、阈值化和缩小到24x24。你的系统决定了这一点的重要性。例如，由于您提供的正面信息（动物）有鼻子，因此线条特征（a）具有重要性（更高的权重）。它应该在图像中被检测出来，以便将某物归类为动物。而对于否定，则相反。ROI的大小并不重要。让你的积极面彼此相似。确保底片上没有动物般的图案。