Computer vision 计算机视觉数据集

Computer vision 计算机视觉数据集,computer-vision,vision,Computer Vision,Vision,我正在测试用于图像分类的计算机视觉算法。我想找到一个包含几类对象的数据集,例如猫和狗。该数据集应该具有每个类中的所有可变性,这是由于类的内在可变性造成的。就是,我不想担心从不同角度或在不同照明条件下拍摄的照片等。一个类别内的几乎所有变化都应归因于该类别的内在变化,例如,猫的类别将包含许多不同的图像,因为猫实际上看起来彼此不同,并不是因为图像是在不同的条件下产生的 优选地,对象将被“剪切”(在均匀背景上)。数据集的大小并不重要。合成图像(可能由3D图形软件生成)也可以。图片需要贴上分类标签 有人知

我正在测试用于图像分类的计算机视觉算法。我想找到一个包含几类对象的数据集,例如猫和狗。该数据集应该具有每个类中的所有可变性,这是由于类的内在可变性造成的。就是,我不想担心从不同角度或在不同照明条件下拍摄的照片等。一个类别内的几乎所有变化都应归因于该类别的内在变化,例如,猫的类别将包含许多不同的图像,因为猫实际上看起来彼此不同,并不是因为图像是在不同的条件下产生的

优选地,对象将被“剪切”(在均匀背景上)。数据集的大小并不重要。合成图像(可能由3D图形软件生成)也可以。图片需要贴上分类标签


有人知道这样的数据集吗?

计算机视觉在线似乎有一个非常全面的简历和图像处理数据集列表:

几年前,我用这个库尝试了支持向量机:


试试加州理工学院256数据集:


它将为您提供一个与社区中使用的其他算法进行比较的良好基础

我想可能对你有帮助。它说,它涉及8000万个微小图像数据集的标记子集。通过提供的方法,在Python、Matlab或C(二进制版本)上加载数据集似乎很容易。

我列出了一些我们在博士期间一直在研究的图像数据集,但你应该在web上找到很多。根据您所描述的内容,您正在寻找具有groundtruth的对象识别任务或分割数据集

您可能会感兴趣: “ALOI是为科学目的而记录的一千个小物体的彩色图像集合。为了捕捉物体记录中的感官变化,我们系统地改变了每个物体的视角、照明角度和照明颜色,另外还捕获了宽基线立体图像。我们记录了一百多个图像每个对象的图像集,共产生110250个图像集。”

这本书对你来说可能也很有趣。IIRC也有用于交通标志的地面真相分割面具

无论哪种情况,你都应该能够用你想要的任何东西来替换背景(如果你想让任务变得更复杂的话)

祝识别任务顺利(如果仍然相关)

也就是说,我不想担心从照片上 不同的视角或在不同的照明条件下等。 一个类别中几乎所有的变化都应归因于 该类别的内在变异性,例如猫的类别 包含许多不同的图像,因为猫实际上看起来不同 不是因为图像是在不同的环境下产生的 条件

这不太现实。事实上,您最终将得到一个在实践中根本不起作用的系统,或者只在非常受限的环境中工作

我知道的一个这样的数据集(我不喜欢这样的数据集)是。
该数据库包含用于评估目标检测算法的汽车侧视图图像。(单刻度+多刻度)

试试PASCAL、ImageNet和SUN。加州理工学院和MSRC都是老一套的


你可能也想读这篇文章:不带偏见地看待数据集偏差-托拉尔巴(麻省理工)和埃弗罗斯(CMU):people.csail.MIT.edu/Torralba/publications/datasets_cvpr11.pdf‎

我对加州理工101很熟悉。像加州理工学院101和256这样的数据集的用途是相似的,但与我正在寻找的不同。在加州理工学院101中,对象的大小基本相同,并且在图像中居中,但这并没有得到很好的控制(这不是真正的重点)。我特别感兴趣的是一个数据集,其中所有对象都规范化为同一视图,最好在灰色背景上剪切。这意味着我正在寻找一个非常“容易”的数据集…加州理工大学很容易,MSR颜色也很容易。请参阅此()CIFAR不工作的原因与Caltech256不工作的原因相同。我真的需要标准化的图像,例如相同大小的猫和狗,面向相同的方向,相同的灯光等。无论如何,谢谢。这是另一组数据集