计算机视觉数据集

我正在测试用于图像分类的计算机视觉算法。我想找到一个包含几类对象的数据集,例如猫和狗。这个数据集应该具有每个类中的所有可变性,这是由于类的内在可变性。也就是说,我不想担心从不同视角或不同光照条件下拍摄的照片等。类别中的几乎所有变化都应该归因于该类别的固有可变性,例如猫的类别将包含许多不同的图像,因为猫实际上看起来彼此不同,而不是因为图像是在不同条件下产生的。 优选地,物体将被“切出”(在均匀的背景上)。数据集的大小并不重要。合成图像(可能使用3D图形软件生成)也可以。图像需要标有其类别。 有谁知道这样的数据集?     
已邀请:
Computer Vision Online似乎有一个非常全面的CV和图像处理数据集列表: http://computervisiononline.com/datasets     
几年前我用这个库尝试过SVM: http://www.cs.columbia.edu/CAVE/software/softlib/coil-100.php     
试试caltech 256数据集:http://www.vision.caltech.edu/Image_Datasets/Caltech256/ 它将为您提供与社区中使用的其他算法进行比较的良好基础。     
我列出了我们在博士期间一直在研究的一些图像数据集 - 但你应该在网上找到很多这些数据集。根据您的描述,您正在寻找具有groundtruth的对象识别任务或分段数据集。 ALOI数据集可能对您有意义: “ALOI是一千个小物体的彩色图像集合,为了科学目的而记录。为了捕捉物体记录中的感官变化,我们系统地改变了每个物体的视角,照明角度和照明颜色,并且另外捕获了宽-baseline立体图像。我们记录了每个对象的一百多张图像,共收集了110,250张图像。“ 交通标志识别数据集也可能对您有意义。 IIRC还有交通标志的地面真相分割掩模。 在任何一种情况下,你都应该能够用你想要的任何东西替换背景(如果你想让任务更加复杂)。 祝贺识别任务好运(如果仍然相关)。     
我认为CIFAR数据集可能对您有所帮助。它说它涉及8000万个微小图像数据集的标记子集。通过提供的方式在Python,Matlab或C(二进制版本)上加载数据集似乎很容易。     
  也就是说,我不想担心拍摄的照片   不同的观点或不同的照明条件等   几乎所有类别中的可变性都应该归因于   该类别的内在可变性,例如猫的类别   包含许多不同的图像因为猫实际上看起来不同   相互之间,不是因为图像是在不同的情况下产生的   条件。 这不太现实。实际上,您最终会得到一个在实践中根本不起作用的系统 - 或者仅限于非常有限的环境中。 我知道的一个这样的数据集(我不关心这样的数据集)是UIUC汽车数据集。 该数据库包含用于评估对象检测算法的汽车侧视图的图像。 (单尺+多尺度)     
试试PASCAL,ImageNet&太阳。加州理工学院和MSRC已经过时了。 您可能也想阅读本文:无偏见数据集偏见 - 托拉尔巴(MIT)& Efros(CMU):people.csail.mit.edu/torralba/publications/datasets_cvpr11.pdf     

要回复问题请先登录注册