Computer vision 图像分类问题

Computer vision 图像分类问题,computer-vision,svm,sift,cbir,Computer Vision,Svm,Sift,Cbir,我的目标是从我的目录中将图像分类为几个预定义的类别之一(运动鞋、衬衫、高跟鞋、手表……),然后从目录返回类似的图像 我使用稠密的SIFT进行特征提取,用一袋视觉单词和SVM表示每个图像进行分类。我所有的训练图像都取自目录 问题是,我查询的图像是从相机拍摄的,这些图像看起来与目录图像非常不同。例如,“我的目录”中的所有高跟鞋/运动鞋仅包含以一个特定角度拍摄的右脚鞋,而“我的查询图像”也包含脚跟和脚的一部分,并且拍摄照片的角度可能不同(与目录图像的偏差) 因此,只有当我的查询(测试)图像是目录中的图

我的目标是从我的目录中将图像分类为几个预定义的类别之一(运动鞋、衬衫、高跟鞋、手表……),然后从目录返回类似的图像

我使用稠密的SIFT进行特征提取,用一袋视觉单词和SVM表示每个图像进行分类。我所有的训练图像都取自目录

问题是,我查询的图像是从相机拍摄的,这些图像看起来与目录图像非常不同。例如,“我的目录”中的所有高跟鞋/运动鞋仅包含以一个特定角度拍摄的右脚鞋,而“我的查询图像”也包含脚跟和脚的一部分,并且拍摄照片的角度可能不同(与目录图像的偏差)

因此,只有当我的查询(测试)图像是目录中的图像(我没有用于训练的图像)时,分类才起作用,而不是从相机拍摄的图像

我该如何进行?这是我的特征向量还是训练数据本身的问题?如果我不能更改培训数据,还有什么我可以使用的吗?我是否应该使用完全不同的方法(而不是一堆废话)


谢谢

您可以通过添加目录图像的仿射变换来放大训练数据。不知道那会有多大帮助。嗨,迪福。更改培训数据!,若视点仍然是一个主要问题,那个么试试稀疏筛弓。也可以尝试使用稠密的sift示例SVM,以及一大堆不同的视图示例。示例支持向量机:。但总的来说,泛化的问题,特别是对新观点的泛化问题是开放的。@QED很抱歉评论我自己,但只是回忆说稀疏筛选可能不适合像闪亮治疗这样的无纹理对象。嗨,谢谢你的回复。我去看看。你对使用卷积神经网络做同样的事情有什么看法?