一、介绍

VOC 数据是 PASCAL VOC Challenge 用到的数据集,官网:http://host.robots.ox.ac.uk/pascal/VOC/

备注:VOC数据集常用的均值为:mean_RGB=(122.67891434, 116.66876762, 104.00698793)

Pytorch 上通用的数据集的归一化指标为:mean=(0.485, 0.456, 0.406) , std=(0.229, 0.224, 0.225)

voc2007 官网:http://host.robots.ox.ac.uk/pascal/VOC/voc2007/index.html

注意:在 VOC 官方给出的数据集中,只有 VOC2007 是给出了带有标记的测试集的。其他年份的数据集是没有给测试集,只给的有带标记的验证集。

二、VOCdevikit

里面是开发工具包代码和文档。解压后如下:

如图所示,里面是一些 MATLAB 代码,就是用这些代码处理的这个数据集,具体可以看看 devkit_doc.pdf, 就是一个比较详细的说明书。

三、VOCtrainval_06-Nov-2007

这个里面是具体的图片数据。

Annotations

里面是图片的标注信息,打开之后全是xml文件,文件名就是图像名称。

ImageSets

图像标签集合,里面划分了训练集、验证集、测试集。

这3个文件夹对应的是 VOC challenge 中3类不同的任务。

Main:对应 classification 和 detection 两个任务

在这里面一共有63个文件。

如何得到的:

train.txt、 trainval.txt、 val.txt:划分的训练集、验证集、测试集

剩余60个文件:20 * 3(类别名_train.txt、类别名_trainval.txt、类别名_val.txt ) = 60

VOC 2007 类别(20类):

  • person

  • bird, cat, cow, dog, horse, sheep

  • aeroplane, bicycle, boat, bus, car, motorbike, train

  • bottle, chair, dining table, pottedplant, sofa, tv/monitor

然后打开这些子类的文本文档的时候,会稍显不同,以 aeroplane_train.txt (飞机)为例:

该文件一共有2501行,说明此任务训练集图片共有2501个。在

图像ID 后面还有一个数字(-1,1,0)。

意义如下:

-1:表示当前图像中没有该类物体;

1:表示当前图像中有该类物体;

0:表示当前图像中该类物体只露出了一部分。

Layout、Segmentation 为另外两个任务。

所以这3个文件夹中包含的是3类不同的任务需要用到的不同的图片集合。

其中 Layout Segmentation

train.txt 表示的是训练集,val.txt 表示的是验证集, trainval.txt 是把前两者写到了一起

JPEGImages

里面全都是原始图片数据,一共有5011张个图像。

SegmentationClass

该文件夹是专门用于 Segmentation 任务的一个文件夹,里面存放的是 Segmentation 任务的 label 信息。用于Semantic segmentation [语义分割]。这里的图片共有20+1(背景色)种颜色

该文件夹中的图片共有422张,在 Imageseets/Segmentation 文件夹中的 trainval.txt 文档,也有422行。

SegmentationObject

用于 Instance Segmentation(实例分割)。在Class里面,一张图片里如果有多架飞机,那么会全部标注为红色。而在Object里面,同一张图片里面的飞机会被不同颜色标注出来。

四、VOCtest_06-Nov-2007

VOCtrainval_06-Nov-2007

五、数据下载

【目标检测数据集】VOC2007 数据集介绍

硬性的标准其实限制不了无限可能的我们,所以啊!少年们加油吧!

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐