深度学习(一):深度学习图像数据库详解
1. MNIST手写数字分类图像集地址:http://yann.lecun.com/exdb/mnist/手写数字识别图像库,共70000张图片,其中60000张训练集图片,10000张测试集图片,图像大小28x28,黑底白字样式train-images-idx3-ubyte.gz:训练集图片train-labels-idx1-ubyte.gz:训练集图片对应数字标签t10k-...
1. MNIST手写数字分类图像集
地址:http://yann.lecun.com/exdb/mnist/
手写数字识别图像库,共70000张图片,其中60000张训练集图片,10000张测试集图片,图像大小28x28,黑底白字样式
train-images-idx3-ubyte.gz:训练集图片
train-labels-idx1-ubyte.gz:训练集图片对应数字标签
t10k-images-idx3-ubyte.gz:测试集图片
t10k-labels-idx1-ubyte.gz:测试集图片对应数字标签
下载后需转为lmdb或leveldb格式
2. CIFAR分类图像集
CIFAR-10图像集包含60000张32x32的彩色图片,共分10个类别,每个类别6000张图片。其中50000张为训练集图片,10000张为测试集图片。训练集中每个类别5000张图片,测试集中每个类别1000张图片,训练集与测试集中图片类别均随机分布。
图片共10个类别,包括:飞机、小汽车(含轿车与SUV)、鸟、猫、鹿、狗、青蛙、马、船、卡车(仅含大卡车,不含皮卡)。

链接中有3个不同格式的版本可下载:
- CIFAR-10 python version:适用于Tensorflow、Pytorch等基于Python开发的框架
- CIFAR-10 Matlab version:适用于Matlab
- CIFAR-10 binary version (suitable for C programs):适用于Caffe,下载后需转为lmdb或leveldb格式
CIFAR-10 binary version (suitable for C programs)解压后如下所示,训练集图片分为5个包(batch),每个包都为bin后缀,每个包有10000张图片。测试集有1个包,包含10000张图片。训练集中可能有的包的类别中的图片数可能多于其他类别的,但总的来说,所有训练集中每个类别都是5000张图片。

CIFAR-100 包含60000张图片,共100个类别,每个类别600张图片。其中训练集50000张,每个类别500张。测试集10000张,每个类别100张。CIFAR-100的100个类别,又可分为20个大类(superclass),每张图片包含所属的精准类(即100个类别中的类),以及所属的大类的类别。分属的类别如下:

3. Pascal VOC
Pascal VOC挑战赛是视觉对象分类识别与检测的一个基准测试,从2005年到2012年每年都举行一场图像识别的挑战赛。2012年后不再举办,但其数据质量好,标注完备,非常适合用来测试算法性能。较常用的Pascal VOC数据集有Pascal VOC2007与Pascal VOC2012。
Pascal VOC2007图片集包括20个目录:人类;动物(鸟、猫、牛、狗、马、羊);交通工具(飞机、自行车、船、公共汽车、小轿车、摩托车、火车);室内(瓶子、椅子、餐桌、盆栽植物、沙发、电视)。总共9963张图片包含24640这个标注对象。

待续。。。
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐



所有评论(0)