SBD数据集
数据集下载在百度云盘:链接:https://pan.baidu.com/s/1-kYEZtOo99VJGHrKlOK5dQ 提取码:jgx7里面的benchmark,表示SBD数据集dataset包含以下:train.txt 8498行图像的名字索引val.txt 2857行图像的名字索引img文件夹,里面11355全是jpg图像文件(隶属于voc的JPEGImag.........
数据集下载在百度云盘:链接:https://pan.baidu.com/s/1-kYEZtOo99VJGHrKlOK5dQ 提取码:jgx7
里面的benchmark,表示SBD数据集
dataset包含以下:
train.txt 8498行图像的名字索引
val.txt 2857行图像的名字索引
img文件夹,里面11355全是jpg图像文件(隶属于voc的JPEGImage文件夹下的17125张jpg图像)
cls文件夹, 里面11355全是mat文件
inst文件夹, 里面11355全是mat文件
sbd数据属于voc2012数据集,但是voc数据集的训练或者验证图片的标签图非常少。但是sbd给出的很多,所以可以综合这两个数据集得到更加多的验证集和数据集标签。
下面给出的一些数据:
voc数据集标签:
voc_trainval:2913 voc_train:1464 voc_ val:1449
sbd数据集标签:
sbd_train:8498 sbd_val:2857
因此可以得到增强版的数据集标签:
train_aug = voc_trian + sbd_train - 重复的图片 8829
train_aug_val = voc_val - sbd_train(就是剔除掉已经是trian_aug里面的图片) 904
上面两个就是常见的扩增数据集,总共有9733张标注图。
但是我们注意到sbd也有val集合,所以标注图像可以继续进行扩增:
val_aug = voc_val + sbd_val - 重复的图片 - train_aug 3202
所以train_aug和val_aug两个加起来就是最大的扩充数据集,总共有12031张标注图。
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐


所有评论(0)