【目标检测数据集】VOC2007 数据集介绍

VOC 数据是 PASCAL VOC Challenge 用到的数据集，官网：http://host.robots.ox.ac.uk/pascal/VOC/备注：VOC数据集常用的均值为：Pytorch 上通用的数据集的归一化指标为：voc2007 官网：http://host.robots.ox.ac.uk/pascal/VOC/voc2007/index.html注意：在 VOC 官方给出的数

牧子川

3962人浏览 · 2024-04-13 19:57:22

牧子川 · 2024-04-13 19:57:22 发布

一、介绍

VOC 数据是 PASCAL VOC Challenge 用到的数据集，官网：http://host.robots.ox.ac.uk/pascal/VOC/

备注：VOC数据集常用的均值为：mean_RGB=(122.67891434, 116.66876762, 104.00698793)

Pytorch 上通用的数据集的归一化指标为：mean=(0.485, 0.456, 0.406) , std=(0.229, 0.224, 0.225)

voc2007 官网：http://host.robots.ox.ac.uk/pascal/VOC/voc2007/index.html

注意：在 VOC 官方给出的数据集中，只有 VOC2007 是给出了带有标记的测试集的。其他年份的数据集是没有给测试集，只给的有带标记的验证集。

二、VOCdevikit

里面是开发工具包代码和文档。解压后如下：

如图所示，里面是一些 MATLAB 代码，就是用这些代码处理的这个数据集，具体可以看看 devkit_doc.pdf，就是一个比较详细的说明书。

三、VOCtrainval_06-Nov-2007

这个里面是具体的图片数据。

Annotations

里面是图片的标注信息，打开之后全是xml文件，文件名就是图像名称。

ImageSets

图像标签集合，里面划分了训练集、验证集、测试集。

这3个文件夹对应的是 VOC challenge 中3类不同的任务。

Main：对应 classification 和 detection 两个任务

在这里面一共有63个文件。

如何得到的：

train.txt、 trainval.txt、 val.txt：划分的训练集、验证集、测试集

剩余60个文件：20 * 3（类别名_train.txt、类别名_trainval.txt、类别名_val.txt ） = 60

VOC 2007 类别（20类）：

person
bird, cat, cow, dog, horse, sheep
aeroplane, bicycle, boat, bus, car, motorbike, train
bottle, chair, dining table, pottedplant, sofa, tv/monitor

然后打开这些子类的文本文档的时候，会稍显不同，以 aeroplane_train.txt （飞机）为例：

该文件一共有2501行，说明此任务训练集图片共有2501个。在

图像ID 后面还有一个数字（-1，1，0）。

意义如下：

-1：表示当前图像中没有该类物体；

1：表示当前图像中有该类物体；

0：表示当前图像中该类物体只露出了一部分。

Layout、Segmentation 为另外两个任务。

所以这3个文件夹中包含的是3类不同的任务需要用到的不同的图片集合。

其中 Layout 和 Segmentation：

train.txt 表示的是训练集，val.txt 表示的是验证集， trainval.txt 是把前两者写到了一起

JPEGImages

里面全都是原始图片数据，一共有5011张个图像。

SegmentationClass

该文件夹是专门用于 Segmentation 任务的一个文件夹，里面存放的是 Segmentation 任务的 label 信息。用于Semantic segmentation [语义分割]。这里的图片共有20+1(背景色)种颜色。

该文件夹中的图片共有422张，在 Imageseets/Segmentation 文件夹中的 trainval.txt 文档，也有422行。

SegmentationObject

用于 Instance Segmentation（实例分割）。在Class里面，一张图片里如果有多架飞机，那么会全部标注为红色。而在Object里面，同一张图片里面的飞机会被不同颜色标注出来。

四、VOCtest_06-Nov-2007

同 VOCtrainval_06-Nov-2007

五、数据下载

【目标检测数据集】VOC2007 数据集介绍

硬性的标准其实限制不了无限可能的我们，所以啊！少年们加油吧！

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

全家桶集齐！Qwen3.5四款小模型上线魔乐社区，附昇腾全套实践教程

魔乐社区

Pont - 搭建前后端之桥：高效、灵活的接口管理工具

Pont 是一款强大的数据服务层解决方案，它能够帮助开发者快速搭建前后端之间的桥梁，实现接口的高效管理和代码自动生成。无论是新手还是有经验的开发者，都能通过 Pont 轻松处理接口文档、生成类型安全的 API 代码，从而显著提升开发效率。[![Pont 工具标志](https://raw.gitcode.com/gh_mirrors/po/pont/raw/3f1b7d4bbba3fd2dda