Computer vision 图像中简单三维物体的视点不变检测与识别_Computer Vision_Classification_Object Recognition_Haar Classifier

Computer vision 图像中简单三维物体的视点不变检测与识别

computer-vision

Computer vision 图像中简单三维物体的视点不变检测与识别,computer-vision,classification,object-recognition,haar-classifier,Computer Vision,Classification,Object Recognition,Haar Classifier,我有一组简单的刚性3D对象，我希望从图像中检测和识别它们（比如说5到10个类）。这些对象很简单，因为它们是一种颜色的圆柱体或带有简单图案（例如条纹）的矩形，或者类似的简单形状。这些对象彼此之间存在显著差异（例如，没有两个类，一个是大圆柱体，另一个是相同但较小的圆柱体）。由于纹理非常简单（实体和/或简单图案），单词袋方法失败（它们不包含大量的唯一边）虽然一种可能的方法是手动编码每个分类器（手动特征提取等），但是否有一种简单的数据驱动方法（例如Haar/LBP分类器）可以工作？如果Haar或LB

我有一组简单的刚性3D对象，我希望从图像中检测和识别它们（比如说5到10个类）。这些对象很简单，因为它们是一种颜色的圆柱体或带有简单图案（例如条纹）的矩形，或者类似的简单形状。这些对象彼此之间存在显著差异（例如，没有两个类，一个是大圆柱体，另一个是相同但较小的圆柱体）。由于纹理非常简单（实体和/或简单图案），单词袋方法失败（它们不包含大量的唯一边）

虽然一种可能的方法是手动编码每个分类器（手动特征提取等），但是否有一种简单的数据驱动方法（例如Haar/LBP分类器）可以工作？如果Haar或LBP能够很好地解决这个问题，那么如何解决未知相对视点的问题（以及通过这种视角扭曲、旋转等）？仅仅从所有可能的角度为一个对象提供正面图像会收敛吗？或者通常会做其他事情吗？检测和识别应该实时运行。

根据您对问题的描述，我发现基于Haar或LBP的检测器有几个缺点。首先，这些特性不使用颜色，这在这里似乎很重要。其次，使用Haar或LBP特征的分类器对平面内和平面外旋转非常敏感。如果对象可以处于任何三维方向，则需要离散三维旋转的范围，并为每个旋转训练单独的检测器。例如，对于人脸检测，通常使用两个检测器：一个用于正面，另一个用于轮廓面。最后，如果没有足够的纹理用于单词包，也可能没有足够的纹理用于Haar或LBP

由于您的对象是简单的3D形状，我将首先尝试使用Hough变换检测直线和圆，并尝试将它们分组以形成对象的轮廓。

是的，这就是我如何处理Haar/LBP的方向。关于你的最后一句话，如何处理分组部分？这是一个很难回答的问题。关于这个问题有很多研究论文。谷歌“感知分组”。也许在你的情况下，颜色会是一个很好的线索。