Computer vision 图像中简单三维物体的视点不变检测与识别

Computer vision 图像中简单三维物体的视点不变检测与识别,computer-vision,classification,object-recognition,haar-classifier,Computer Vision,Classification,Object Recognition,Haar Classifier,我有一组简单的刚性3D对象,我希望从图像中检测和识别它们(比如说5到10个类)。这些对象很简单,因为它们是一种颜色的圆柱体或带有简单图案(例如条纹)的矩形,或者类似的简单形状。这些对象彼此之间存在显著差异(例如,没有两个类,一个是大圆柱体,另一个是相同但较小的圆柱体)。 由于纹理非常简单(实体和/或简单图案),单词袋方法失败(它们不包含大量的唯一边) 虽然一种可能的方法是手动编码每个分类器(手动特征提取等),但是否有一种简单的数据驱动方法(例如Haar/LBP分类器)可以工作?如果Haar或LB

我有一组简单的刚性3D对象,我希望从图像中检测和识别它们(比如说5到10个类)。这些对象很简单,因为它们是一种颜色的圆柱体或带有简单图案(例如条纹)的矩形,或者类似的简单形状。这些对象彼此之间存在显著差异(例如,没有两个类,一个是大圆柱体,另一个是相同但较小的圆柱体)。 由于纹理非常简单(实体和/或简单图案),单词袋方法失败(它们不包含大量的唯一边)


虽然一种可能的方法是手动编码每个分类器(手动特征提取等),但是否有一种简单的数据驱动方法(例如Haar/LBP分类器)可以工作?如果Haar或LBP能够很好地解决这个问题,那么如何解决未知相对视点的问题(以及通过这种视角扭曲、旋转等)?仅仅从所有可能的角度为一个对象提供正面图像会收敛吗?或者通常会做其他事情吗?检测和识别应该实时运行。

根据您对问题的描述,我发现基于Haar或LBP的检测器有几个缺点。首先,这些特性不使用颜色,这在这里似乎很重要。其次,使用Haar或LBP特征的分类器对平面内和平面外旋转非常敏感。如果对象可以处于任何三维方向,则需要离散三维旋转的范围,并为每个旋转训练单独的检测器。例如,对于人脸检测,通常使用两个检测器:一个用于正面,另一个用于轮廓面。最后,如果没有足够的纹理用于单词包,也可能没有足够的纹理用于Haar或LBP


由于您的对象是简单的3D形状,我将首先尝试使用Hough变换检测直线和圆,并尝试将它们分组以形成对象的轮廓。

是的,这就是我如何处理Haar/LBP的方向。关于你的最后一句话,如何处理分组部分?这是一个很难回答的问题。关于这个问题有很多研究论文。谷歌“感知分组”。也许在你的情况下,颜色会是一个很好的线索。