【YOLOv8 实战】10 组服饰类目标检测数据集分享 | 附数据加载 + 预处理代码

地理探险家

709人浏览 · 2024-07-10 22:21:27

地理探险家 · 2024-07-10 22:21:27 发布

服饰类目标检测是电商视觉分拣、智能安防、工业质检等领域的核心技术模块，而高质量标注数据集是提升模型精度的关键前提。目前公开服饰数据集存在品类单一、标注粗糙等问题，本文整理 10 组聚焦衣帽鞋袜的细分数据集，全部兼容 YOLOv8 格式，并附上实操代码，助力算法开发效率翻倍。

一、数据集核心参数

序号	数据集名称	规格参数	标注信息	适用场景
1	场景化头部配饰（帽子）检测数据集	1853 张，1920×1080，JPG	YOLOv8 格式，标注精度≥96%，12 类帽子标签	安全帽识别、电商分拣
2	多品类服饰基础数据集	2488 张，分辨率多样，JPG	未标注，原始样本	自定义标注任务、预训练
3	黄 / 白双色安全头盔检测数据集	2071 张，1280×720，JPG	YOLOv8 格式，标注精度≥95%，2 类颜色标签	工地安防、骑行检测
4	多花色帽子细分数据集	1067 张，1920×1080，JPG	YOLOv8 格式，8 类花色标签	细粒度分类、穿搭推荐
5	多色系安全头盔数据集	5678 张，1280×720，JPG	YOLOv8 格式，6 类颜色标签	大规模模型训练
6	棒球帽多色系细分数据集	1568 张，1920×1080，JPG	YOLOv8 格式，标注精度≥97%，5 类色系	电商品类分拣
7	多类型帽子检测数据集	1559 张，1920×1080，JPG	YOLOv8 格式，10 类帽子类型	风格分类、品类识别
8	多花色长筒袜数据集	1266 张，1920×1080，JPG	YOLOv8 格式，7 类花色标签	袜子分拣、搭配系统
9	黑白双色帽子对比数据集	1730 张，1920×1080，JPG	YOLOv8 格式，标注精度≥96%，2 类颜色	二分类算法验证
10	工业螺丝帽颜色数据集（补充）	1420 张，640×480，JPG	YOLOv8 格式，3 类颜色标签	服饰辅料质检

注：第 10 组为工业补充数据，可用于跨品类检测模型训练。

二、技术实操：数据集加载与预处理（附 Python 代码）

1. YOLOv8 数据集加载代码

python

运行

from ultralytics import YOLO
import os

# 数据集配置文件路径
data_path = "data/clothes.yaml"
# 加载预训练模型
model = YOLO("yolov8n.pt")
# 加载数据集并验证格式
model.val(data=data_path, imgsz=640, batch=16)

2. 未标注数据集补标 + 格式转换（LabelImg 工具调用）

python

运行

# 快速启动LabelImg工具（需提前pip install labelImg）
import os
os.system("labelImg data/raw_images data/annotations --labels data/labels.txt")
# 转换为YOLOv8格式（xml转txt）
os.system("python xml2txt.py --input data/annotations --output data/labels")

3. 数据增强代码（提升模型泛化能力）

python

运行

import albumentations as A
import cv2

transform = A.Compose([
    A.RandomResizedCrop(height=640, width=640, scale=(0.8, 1.0)),
    A.HorizontalFlip(p=0.5),
    A.RandomBrightnessContrast(p=0.2),
], bbox_params=A.BboxParams(format='yolov8', label_fields=['class_labels']))

# 应用增强到单张图片
img = cv2.imread("sample.jpg")
bboxes = [[x1, y1, x2, y2, label] for x1,y1,x2,y2,label in annotations]
augmented = transform(image=img, bboxes=bboxes, class_labels=[label for _,_,_,_,label in bboxes])

三、训练调参建议

小样本数据集（如 1067 张花色帽子）：采用迁移学习，学习率设为0.001，迭代 50 轮，冻结主干网络。
大样本数据集（如 5678 张头盔数据）：从头训练，学习率设为0.01，迭代 100 轮，开启早停机制（patience=5）。

四、合规声明

数据集仅限学术研究、模型训练使用。

五、后续分享

后续将更新服饰检测模型部署教程（TensorRT/ONNX），以及更多细分场景数据集。如需数据集获取方式，欢迎关注博主，私信交流。

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

小参数・大码力・易部署 | Qwen3.6-27B上线魔乐社区，基于昇腾的部署教程来了

继一周前模型开源发布后，千问再度开源Qwen3.6-27B —— 一个拥有270亿参数的稠密多模态模型，也是社区呼声最高的模型规格。Qwen3.6-27B 依然支持多模态思考与非思考模式，在智能体编程方面达到了旗舰级表现，全面超越前代开源旗舰 Qwen3.5-397B-A17B（总参数397B / 激活参数17B的MoE模型）。作为稠密架构，它无需MoE路由即可部署，是开发者在实用、可广泛部署规模