SBD数据集

数据集下载在百度云盘：链接：https://pan.baidu.com/s/1-kYEZtOo99VJGHrKlOK5dQ 提取码：jgx7里面的benchmark，表示SBD数据集dataset包含以下：train.txt 8498行图像的名字索引val.txt 2857行图像的名字索引img文件夹，里面11355全是jpg图像文件（隶属于voc的JPEGImag.........

Wanderer001

2715人浏览 · 2022-06-10 20:36:34

Wanderer001 · 2022-06-10 20:36:34 发布

参考 SBD数据集 - 云+社区 - 腾讯云

数据集下载在百度云盘：链接：https://pan.baidu.com/s/1-kYEZtOo99VJGHrKlOK5dQ 提取码：jgx7

里面的benchmark，表示SBD数据集

dataset包含以下：

train.txt 8498行图像的名字索引

val.txt 2857行图像的名字索引

img文件夹，里面11355全是jpg图像文件（隶属于voc的JPEGImage文件夹下的17125张jpg图像）

cls文件夹，里面11355全是mat文件

inst文件夹，里面11355全是mat文件

sbd数据属于voc2012数据集，但是voc数据集的训练或者验证图片的标签图非常少。但是sbd给出的很多，所以可以综合这两个数据集得到更加多的验证集和数据集标签。

下面给出的一些数据：

voc数据集标签：

voc_trainval：2913 voc_train：1464 voc_ val：1449

sbd数据集标签：

sbd_train：8498 sbd_val：2857

因此可以得到增强版的数据集标签：

train_aug = voc_trian + sbd_train - 重复的图片 8829

train_aug_val = voc_val - sbd_train（就是剔除掉已经是trian_aug里面的图片） 904

上面两个就是常见的扩增数据集，总共有9733张标注图。

但是我们注意到sbd也有val集合，所以标注图像可以继续进行扩增：

val_aug = voc_val + sbd_val - 重复的图片 - train_aug 3202

所以train_aug和val_aug两个加起来就是最大的扩充数据集，总共有12031张标注图。

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

全家桶集齐！Qwen3.5四款小模型上线魔乐社区，附昇腾全套实践教程

魔乐社区

Pont - 搭建前后端之桥：高效、灵活的接口管理工具

Pont 是一款强大的数据服务层解决方案，它能够帮助开发者快速搭建前后端之间的桥梁，实现接口的高效管理和代码自动生成。无论是新手还是有经验的开发者，都能通过 Pont 轻松处理接口文档、生成类型安全的 API 代码，从而显著提升开发效率。[![Pont 工具标志](https://raw.gitcode.com/gh_mirrors/po/pont/raw/3f1b7d4bbba3fd2dda