深度学习常用数据集获取
2007版本Train data and Validation data:http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tarTest data:http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar工具包:http:
- MNIST手写数据集:http://yann.lecun.com/ehttps://cremi.org/data/xdb/mnist/index.html
- 百度EasyDL平台的水果分类数据集:百度网盘
- Imagenet图像分类数据集(1400多万幅图片,涵盖2万多个类别):http://www.image-net.org/about-stats
- CIFAR-10图像分类数据集:http://www.cs.toronto.edu/~kriz/cifar.html
- Open Image图像分类数据集(900万张图像URL的数据集,被分为6000多类,比ImageNet包含更真实的实体存在):https://github.com/openimages/dataset
- CALVIN研究组数据集 -眼睛跟踪对象检测,imagenet边界框,同步活动,stickman和身体姿势,youtube对象,脸,马,玩具,视觉属性等):http://calvin-vision.net/datasets/
- 大型CelebFaces属性数据集(人脸数据集):http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html
- LFW-10面部图像数据集,用于学习相对属性:http://cvit.iiit.ac.in/projects/relativeParts/
- HAT人像识别数据库(包括27个人类图像属性):https://jurie.users.greyc.fr/datasets/hat.html
- WIDER人类属性数据集:http://mmlab.ie.cuhk.edu.hk/projects/WIDERAttribute.html
- Caltech-UCSD鸟类200-2011数据集:http://www.vision.caltech.edu/visipedia/CUB-200-2011.html
-
Goldfinch(GOOGLe图像搜索数据集,精细粒子数据集 - 精细的鸟类(11K种类),蝴蝶(14K:种),飞机(409种)和狗(515种)识别的大规模数据集):https://github.com/google/goldfinch
-
Sports-1M - 体育视频分类数据集(包含487类和1.2M影片):https://cs.stanford.edu/people/karpathy/deepvideo/
-
糖尿病视网膜病变分类数据集(多实例学习特征空间):https://github.com/ragavvenkatesan/np-mil/blob/master/data/DR_data.mat
-
Aberystwyth叶评估数据集(手工标记一段时间的植物叶级分割图像):https://zenodo.org/record/168158#.Xrue03Y-ZhE
-
脊柱CT图像数据集(用于脊柱定位):http://spineweb.digitalimaginggroup.ca/spineweb/index.php?n=Main.Datasets
-
磁共振肿瘤结构图像数据库(肿瘤结构识别与分割):http://braintumorsegmentation.org/
-
CREMI:MICCAI 2016挑战赛图像数据集(6卷神经组织电子显微镜,神经元和突触分割,突触伴侣注释):https://cremi.org/data/
-
CRCHisto表型 - 标记细胞核数据(结肠直肠癌组织学图像,由近30,000个点状细胞核组成,超过22,000个标记细胞类型):https://warwick.ac.uk/fac/sci/dcs/research/tia/data/crchistolabelednucleihe/
-
计算机断层扫描肺气肿数据库:https://lauge-soerensen.github.io/emphysema-database/
-
DIADEM图像数据库(轴突和树突状形态学竞赛的数字重建):http://diademchallenge.org/
-
DIARETDB1图像数据库(标准糖尿病视网膜病变数据库):http://www2.it.lut.fi/project/imageret/diaretdb1/
-
乌德勒支大学视网膜图像数据集(用于血管提取的数字视网膜图像):https://drive.grand-challenge.org/
-
KID内窥镜图像数据集(用于医疗决策支持的胶囊内窥镜数据库):https://mdss.uth.gr/datasets/endoscopy/kid/
-
植物叶片分割挑战赛CVPPP(烟草和拟南芥植物图像):https://www.plant-phenotyping.org/CVPPP2014-dataset
-
Masaryk大学细胞图像数据集(2D/3D合成图像的细胞/组织为基准):https://cbia.fi.muni.cz/datasets/
-
小鼠胚胎跟踪数据库(细胞分裂事件检测):http://celltracking.bio.nyu.edu/
-
植物表型数据集(适用于植物和叶片检测,分割,跟踪和物种识别):https://www.plant-phenotyping.org/datasets-home
-
格罗宁根大学视网膜图像数据集(血管分叉和交叉的实况):http://www.cs.rug.nl/~imaging/databases/retina_database/retinalfeatures_database.html
-
视网膜结构分析图像数据集(400+视网膜图像,具有地面真实分段和医学注释):http://cecas.clemson.edu/~ahoover/stare/
-
脊柱与心脏成像数据集(伦敦安大略省数字成像组):http://www.digitalimaginggroup.ca/members/shuo.php
-
合成迁移细胞图像数据集(超过98个时间帧的人造迁移细胞—嗜中性粒细胞,各种级别的高斯/泊松噪声和不同路径特征与地面实况):https://github.com/phagosight/phagosight/wiki
-
VascuSynth血管图像数据集(血管合成器在3D体积中产生血管,具有地面真相结构的3D血管树):http://vascusynth.cs.sfu.ca/Data.html
-
约克心脏MRI数据集:http://www.cse.yorku.ca/~mridataset/
-
斯坦福大学大型新型心脏运动视频数据集:https://echonet.github.io/dynamic/index.html#access
-
自闭症脑成像对照数据集(539例ASD患者和573例典型对照患者的功能MRI图像):http://preprocessed-connectomes-project.org/abide/
-
阿尔茨海默氏病神经影像学倡议(ADNI) MRI数据库:http://adni.loni.usc.edu/data-samples/access-data/
-
结肠癌的CT结肠造影术影像数据集(用于诊断结肠癌,包括没有息肉、6-9mm息肉和大于10mm息肉的患者数据):https://wiki.cancerimagingarchive.net/display/Public/CT+COLONOGRAPHY#dc149b9170f54aa29e88f1119e25ba3e
-
肺图像数据库联盟(LIDC):https://wiki.cancerimagingarchive.net/display/Public/LIDC-IDRI#
-
乳腺钼靶筛查数字数据库DDSM:http://www.eng.usf.edu/cvprg/
-
前列腺癌磁共振成像MSI图像数据集:http://i2cvb.github.io/
-
Caltech101(现256)类别对象识别数据库:http://www.vision.caltech.edu/Image_Datasets/Caltech101/Caltech101.html
-
卡塔尼亚鱼类物种识别(15种鱼类,约20,000个样本训练图像和附加测试图像):http://perceive.dieei.unict.it/index-dataset.php?name=Fish_Species
-
LISA交通标志数据集(在6610帧上的47个美国标志类型的视频,7855个注释):http://cvrr.ucsd.edu/LISA/lisa-traffic-sign-dataset.html
-
Microsoft对象类识别图像数据库:https://www.microsoft.com/en-us/research/project/image-understanding/
-
NORB 50玩具图像数据库:https://cs.nyu.edu/~ylclab/data/norb-v1.0-small/
-
雨滴检测数据集:https://collections.durham.ac.uk/catalog?utf8=%E2%9C%93&q=breckon
-
UIUC汽车影像数据库:https://cogcomp.seas.upenn.edu/Data/Car/
-
CMP门面数据库(包括606个修正的外墙图像):http://cmp.felk.cvut.cz/~tylecr1/facade/
-
LM + SUN数据集(包含45,676幅图像,主要是城市或人类相关场景):http://www.cs.unc.edu/~jtighe/Papers/ECCV10/lmsun/index.html
-
巴塞罗纳城市景观数据集:http://www.cs.unc.edu/~jtighe/Papers/ECCV10/
-
悉尼房屋图像数据集(具有准确3D房屋形状的街景房屋图像):http://www.cs.toronto.edu/housecraft/
-
瑞典高速公路和城市道路图像数据集:http://www.cvl.isy.liu.se/en/research/datasets/traffic-signs-dataset/
-
麻省理工学院CBCL StreetScenes挑战框架:http://cbcl.mit.edu/software-datasets/streetscenes/
-
开源口罩遮挡人脸数据集RMFD(武汉大学):https://github.com/X-zhangyang/Real-World-Masked-Face-Dataset
-
宾汉顿大学3D静态和动态面部表情数据库(3D面部表情):http://www.cs.binghamton.edu/~lijun/Research/3DFE/3DFE_Analysis.html
-
生物识别数据集(与虹膜识别相关的生物识别数据库):http://zbum.ia.pw.edu.pl/EN/node/46
-
哥伦比亚大学凝视脸部图像数据集(5,880张超过5头姿势的56人的图像和21个凝视方向):https://www.cs.columbia.edu/CAVE/databases/columbia_gaze/
-
FaceScrub数据集(一个拥有超过100,000张人脸图像,530人,男性和女性1:1):http://vintage.winklerbros.net/facescrub.html
-
面部识别技术(FERET)数据库(美国国家标准与技术研究所):https://www.nist.gov/itl
-
麻省理工学院CBCL人脸识别数据库(生物与计算学习中心):http://cbcl.mit.edu/software-datasets/heisele/facerecognition-database.html
-
PubFig人脸图像数据库(公众人脸数据库):https://www1.cs.columbia.edu/CAVE/databases/pubfig/
-
耶鲁大学人脸数据库(576人观看条件):https://www.face-rec.org/databases/
-
YouTube Faces DB数据集(3,425个视频,1,595个不同的人):http://www.cs.tau.ac.il/~wolf/ytfaces/
-
宽面脸部检测基准数据集(32203张有393703张贴面的图像):http://shuoyang1213.me/WIDERFACE/
-
FVC指纹验证竞赛2002数据集(博洛尼亚大学):http://bias.csr.unibo.it/fvc2002/databases.asp
-
FVC指纹验证竞赛2004数据集(博洛尼亚大学):http://bias.csr.unibo.it/fvc2004/databases.asp
-
指纹手册细节标记(FM3)数据库:http://www.ekds.gov.tr/bio/databases.html
-
NIST指纹数据库(美国国家标准与技术研究所):https://www.nist.gov/srd
-
MBT纹理数据集(154新图像加上112个具有各种变换的原始图像):http://multibandtexture.recherche.usherbrooke.ca/
-
哥伦比亚特区和乌得勒支大学纹理数据库(反射和纹理图像数据):https://www1.cs.columbia.edu/CAVE/software/curet/index.php
-
DynTex动态纹理数据库:http://dyntex.univ-lr.fr/database.html
-
OpenSurfaces纹理数据集(由数以万计的内部消费者照片分割的曲面示例组成,并用材质参数,纹理信息和上下文信息进行注释):http://opensurfaces.cs.cornell.edu/publications/opensurfaces/
-
奥卢纹理数据库(奥卢大学):http://www.outex.oulu.fi/
-
可描述的纹理数据集(牛津大学、5640个图像):http://www.robots.ox.ac.uk/~vgg/data/dtd/
-
纹理分割数据生成器和基准测试(布拉格大学):https://mosaic.utia.cas.cz/
-
萨尔斯堡纹理图像数据库(STex奥地利萨尔斯堡附近捕获的大量476色纹理图像):http://wavelab.at/sources/STex/
-
表面和材料的乌普萨拉纹理数据集 (织物,谷物等表面纹理):http://www.cb.uu.se/~gustaf/texture/
-
MIT视觉纹理数据集:https://vismod.media.mit.edu/vismod/imagery/VisionTexture/vistex.html
- PASCAL VOC
- 2007版本
- Train data and Validation data:http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar
- Test data:http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar
- 工具包:http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCdevkit_08-Jun-2007.tar
- Documentation:http://host.robots.ox.ac.uk/pascal/VOC/voc2007/devkit_doc_07-Jun-2007.pdf
- 2010版本
- Train data and Validation data:http://host.robots.ox.ac.uk/pascal/VOC/voc2010/VOCtrainval_03-May-2010.tar
- Test data:
- 工具包:http://host.robots.ox.ac.uk/pascal/VOC/voc2010/VOCdevkit_08-May-2010.tar
- Documentation:http://host.robots.ox.ac.uk/pascal/VOC/voc2010/devkit_doc_08-May-2010.pdf
- 2012版本
- Train data and Validation data:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar
- Test data:
- 工具包:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCdevkit_18-May-2011.tar
- Documentation:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/devkit_doc.pdf
- 2007版本
-
coco
-
2014版本、2015版本、2017版本:https://cocodataset.org/#download
-
获取coco数据集脚本:https://github.com/Eureca2017/PyTorch-YOLOv3/tree/master/data
-
运行脚本 ./get_coco_dataset.sh
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐

所有评论(0)