【YOLOv8 实战】10 组服饰类目标检测数据集分享 | 附数据加载 + 预处理代码
【YOLOv8 实战】10 组服饰类目标检测数据集分享 | 附数据加载 + 预处理代码
·
服饰类目标检测是电商视觉分拣、智能安防、工业质检等领域的核心技术模块,而高质量标注数据集是提升模型精度的关键前提。目前公开服饰数据集存在品类单一、标注粗糙等问题,本文整理 10 组聚焦衣帽鞋袜的细分数据集,全部兼容 YOLOv8 格式,并附上实操代码,助力算法开发效率翻倍。
一、 数据集核心参数
| 序号 | 数据集名称 | 规格参数 | 标注信息 | 适用场景 | |
|---|---|---|---|---|---|
| 1 | 场景化头部配饰(帽子)检测数据集 | 1853 张,1920×1080,JPG | YOLOv8 格式,标注精度≥96%,12 类帽子标签 | 安全帽识别、电商分拣 | |
| 2 | 多品类服饰基础数据集 | 2488 张,分辨率多样,JPG | 未标注,原始样本 | 自定义标注任务、预训练 | |
| 3 | 黄 / 白双色安全头盔检测数据集 | 2071 张,1280×720,JPG | YOLOv8 格式,标注精度≥95%,2 类颜色标签 | 工地安防、骑行检测 | |
| 4 | 多花色帽子细分数据集 | 1067 张,1920×1080,JPG | YOLOv8 格式,8 类花色标签 | 细粒度分类、穿搭推荐 | |
| 5 | 多色系安全头盔数据集 | 5678 张,1280×720,JPG | YOLOv8 格式,6 类颜色标签 | 大规模模型训练 | |
| 6 | 棒球帽多色系细分数据集 | 1568 张,1920×1080,JPG | YOLOv8 格式,标注精度≥97%,5 类色系 | 电商品类分拣 | |
| 7 | 多类型帽子检测数据集 | 1559 张,1920×1080,JPG | YOLOv8 格式,10 类帽子类型 | 风格分类、品类识别 | |
| 8 | 多花色长筒袜数据集 | 1266 张,1920×1080,JPG | YOLOv8 格式,7 类花色标签 | 袜子分拣、搭配系统 | |
| 9 | 黑白双色帽子对比数据集 | 1730 张,1920×1080,JPG | YOLOv8 格式,标注精度≥96%,2 类颜色 | 二分类算法验证 | |
| 10 | 工业螺丝帽颜色数据集(补充) | 1420 张,640×480,JPG | YOLOv8 格式,3 类颜色标签 | 服饰辅料质检 |
注:第 10 组为工业补充数据,可用于跨品类检测模型训练。
二、 技术实操:数据集加载与预处理(附 Python 代码)
1. YOLOv8 数据集加载代码
python
运行
from ultralytics import YOLO
import os
# 数据集配置文件路径
data_path = "data/clothes.yaml"
# 加载预训练模型
model = YOLO("yolov8n.pt")
# 加载数据集并验证格式
model.val(data=data_path, imgsz=640, batch=16)
2. 未标注数据集补标 + 格式转换(LabelImg 工具调用)
python
运行
# 快速启动LabelImg工具(需提前pip install labelImg)
import os
os.system("labelImg data/raw_images data/annotations --labels data/labels.txt")
# 转换为YOLOv8格式(xml转txt)
os.system("python xml2txt.py --input data/annotations --output data/labels")
3. 数据增强代码(提升模型泛化能力)
python
运行
import albumentations as A
import cv2
transform = A.Compose([
A.RandomResizedCrop(height=640, width=640, scale=(0.8, 1.0)),
A.HorizontalFlip(p=0.5),
A.RandomBrightnessContrast(p=0.2),
], bbox_params=A.BboxParams(format='yolov8', label_fields=['class_labels']))
# 应用增强到单张图片
img = cv2.imread("sample.jpg")
bboxes = [[x1, y1, x2, y2, label] for x1,y1,x2,y2,label in annotations]
augmented = transform(image=img, bboxes=bboxes, class_labels=[label for _,_,_,_,label in bboxes])
三、 训练调参建议
- 小样本数据集(如 1067 张花色帽子):采用迁移学习,学习率设为
0.001,迭代 50 轮,冻结主干网络。 - 大样本数据集(如 5678 张头盔数据):从头训练,学习率设为
0.01,迭代 100 轮,开启早停机制(patience=5)。
四、 合规声明
- 数据集仅限学术研究、模型训练使用。
五、 后续分享
后续将更新服饰检测模型部署教程(TensorRT/ONNX),以及更多细分场景数据集。如需数据集获取方式,欢迎关注博主,私信交流。
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐


所有评论(0)