深度学习（一）：深度学习图像数据库详解

夜风里唱

3095人浏览 · 2019-07-15 20:31:51

夜风里唱 · 2019-07-15 20:31:51 发布

1. MNIST手写数字分类图像集

地址：http://yann.lecun.com/exdb/mnist/

手写数字识别图像库，共70000张图片，其中60000张训练集图片，10000张测试集图片，图像大小28x28，黑底白字样式

train-images-idx3-ubyte.gz：训练集图片

train-labels-idx1-ubyte.gz：训练集图片对应数字标签

t10k-images-idx3-ubyte.gz：测试集图片

t10k-labels-idx1-ubyte.gz：测试集图片对应数字标签

下载后需转为lmdb或leveldb格式

2. CIFAR分类图像集

CIFAR-10图像集包含60000张32x32的彩色图片，共分10个类别，每个类别6000张图片。其中50000张为训练集图片，10000张为测试集图片。训练集中每个类别5000张图片，测试集中每个类别1000张图片，训练集与测试集中图片类别均随机分布。

图片共10个类别，包括：飞机、小汽车（含轿车与SUV）、鸟、猫、鹿、狗、青蛙、马、船、卡车（仅含大卡车，不含皮卡）。

链接中有3个不同格式的版本可下载：

CIFAR-10 python version：适用于Tensorflow、Pytorch等基于Python开发的框架
CIFAR-10 Matlab version：适用于Matlab
CIFAR-10 binary version (suitable for C programs)：适用于Caffe，下载后需转为lmdb或leveldb格式

CIFAR-10 binary version (suitable for C programs)解压后如下所示，训练集图片分为5个包（batch），每个包都为bin后缀，每个包有10000张图片。测试集有1个包，包含10000张图片。训练集中可能有的包的类别中的图片数可能多于其他类别的，但总的来说，所有训练集中每个类别都是5000张图片。

CIFAR-100 包含60000张图片，共100个类别，每个类别600张图片。其中训练集50000张，每个类别500张。测试集10000张，每个类别100张。CIFAR-100的100个类别，又可分为20个大类（superclass）,每张图片包含所属的精准类（即100个类别中的类），以及所属的大类的类别。分属的类别如下：

3. Pascal VOC

Pascal VOC挑战赛是视觉对象分类识别与检测的一个基准测试，从2005年到2012年每年都举行一场图像识别的挑战赛。2012年后不再举办，但其数据质量好，标注完备，非常适合用来测试算法性能。较常用的Pascal VOC数据集有Pascal VOC2007与Pascal VOC2012。

Pascal VOC2007图片集包括20个目录：人类；动物（鸟、猫、牛、狗、马、羊）；交通工具（飞机、自行车、船、公共汽车、小轿车、摩托车、火车）；室内（瓶子、椅子、餐桌、盆栽植物、沙发、电视）。总共9963张图片包含24640这个标注对象。

待续。。。

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

小参数・大码力・易部署 | Qwen3.6-27B上线魔乐社区，基于昇腾的部署教程来了

继一周前模型开源发布后，千问再度开源Qwen3.6-27B —— 一个拥有270亿参数的稠密多模态模型，也是社区呼声最高的模型规格。Qwen3.6-27B 依然支持多模态思考与非思考模式，在智能体编程方面达到了旗舰级表现，全面超越前代开源旗舰 Qwen3.5-397B-A17B（总参数397B / 激活参数17B的MoE模型）。作为稠密架构，它无需MoE路由即可部署，是开发者在实用、可广泛部署规模