Skin-Problem-MultiLabel 皮肤问题多标签分类数据集-4,828张图片 皮肤识别 深度学习 ResNet 迁移学习 智能美妆 皮肤健康 医疗辅助 AR试妆
Skin-Problem-MultiLabel 皮肤问题多标签分类数据集-4,828张图片 皮肤识别 深度学习 ResNet 迁移学习 智能美妆 皮肤健康 医疗辅助 AR试妆
📦点击查看-已发布目标检测数据集合集(持续更新)
| 数据集名称 | 图像数量 | 应用方向 | 博客链接 |
|---|---|---|---|
| 🔌 电网巡检检测数据集 | 1600 张 | 电力设备目标检测 | 点击查看 |
| 🔥 火焰 / 烟雾 / 人检测数据集 | 10000张 | 安防监控,多目标检测 | 点击查看 |
| 🚗 高质量车牌识别数据集 | 10,000 张 | 交通监控 / 车牌识别 | 点击查看 |
| 🌿 农田杂草航拍检测数据集 | 1,200 张 | 农业智能巡检 | 点击查看 |
| 🐑 航拍绵羊检测数据集 | 1,700 张 | 畜牧监控 / 航拍检测 | 点击查看 |
| 🌡️ 热成像人体检测数据集 | 15,000 张 | 热成像下的行人检测 | 点击查看 |

🧴 Skin-Problem-MultiLabel 皮肤问题多标签分类数据集-4,828张图片-文章末添加wx领取数据集

🧴 Skin-Problem-MultiLabel 皮肤问题多标签分类数据集介绍
📌 数据集概览
本项目是专注于面部皮肤问题自动识别的计算机视觉数据集,共包含约 4,828 张高分辨率人脸图像,主要用于训练深度学习模型对10种常见皮肤状况进行多标签分类。与传统单标签分类不同,该数据集允许一张图片同时标注多个皮肤问题,更贴近真实世界中皮肤状态复杂多样的情况。适用于智能美妆、皮肤健康管理、医疗辅助诊断等领域的图像理解任务。
- 图像数量:4,828 张
- 类别数:10 类(多标签)
- 适用任务:多标签图像分类(Multi-label Image Classification)
- 适配模型:ResNet、EfficientNet、MobileNet、Vision Transformer 等主流分类框架
包含类别
| 类别 | 英文名称 | 描述 |
|---|---|---|
| 痘痘 | Acne | 面部出现的炎症性丘疹或脓疱 |
| 黑头 | Blackheads | 毛孔内氧化的皮脂和角质形成的黑色小点 |
| 色斑 | Dark Spots | 由日晒、炎症或荷尔蒙引起的色素沉着 |
| 干燥肌 | Dry Skin | 皮肤缺水、脱屑、缺乏光泽 |
| 眼袋 | Eye bags | 下眼睑浮肿或脂肪堆积形成的凸起 |
| 正常肌 | Normal Skin | 无明显瑕疵、纹理均匀的健康皮肤 |
| 油性肌 | Oily Skin | T区或全脸出油旺盛、毛孔粗大 |
| 毛孔 | Pores | 皮肤表面可见的毛囊开口,常伴随油脂分泌 |
| 泛红 | Skin Redness | 皮肤局部或整体呈现红色,可能由过敏或炎症引起 |
| 皱纹 | Wrinkles | 因衰老或表情习惯形成的皮肤褶皱 |
数据集覆盖了日常护肤中最关注的10大皮肤问题,能有效提升模型在复杂皮肤状态下的多维度感知与分类能力。
🎯 应用场景
该数据集非常适用于以下场景与研究方向:
-
智能美妆与护肤推荐
根据用户上传的自拍,自动识别多种皮肤问题,并推荐针对性的护肤品或化妆品。 -
皮肤健康管理APP
帮助用户持续追踪皮肤状态变化,提供个性化的护理方案和改善建议。 -
医疗辅助诊断系统
为皮肤科医生提供AI初筛工具,快速标记可疑区域,提高诊疗效率。 -
药妆与护肤品研发
用于评估新产品对特定皮肤问题(如痘痘、色斑)的效果,加速临床测试。 -
虚拟试妆与AR应用
结合人脸识别技术,在虚拟化妆前分析皮肤状态,实现“因肤施妆”。 -
美容院与医美机构
作为客户建档工具,客观记录皮肤状况,提升服务专业度与客户信任感。
🖼 数据样本展示
以下展示部分数据集内的样本图片:

数据集包含多种真实皮肤问题图像:
- 多问题共存:一张图可同时标注“Acne + Oily Skin + Pores”等多种问题
- 多样光照条件:自然光、室内灯、手机闪光灯下拍摄的清晰图像
- 不同严重程度:从轻微到明显的各种皮肤问题表现
- 背景干扰较少:多数图像聚焦面部,减少无关元素干扰
- 真实用户案例:包含不同肤色、性别、年龄的真实用户照片
图像质量高、问题特征明显、标注方式贴近现实,特别适合训练高精度的多标签皮肤问题识别模型。
✅ 使用建议
-
数据预处理优化
- 统一图像尺寸(推荐224x224或384x384)
- 标准化像素值范围(归一化至[0,1]或使用ImageNet均值方差)
- 应用数据增强:旋转、翻转、亮度调整、随机裁剪、色彩抖动
-
模型训练策略
- 使用预训练模型进行迁移学习(如ImageNet上训练的EfficientNet-B4)
- 采用Sigmoid激活函数+二元交叉熵损失(BCELoss)处理多标签任务
- 对稀有标签采用加权损失或过采样策略
-
实际部署考虑
- 边缘设备优化:使用TensorFlow Lite或ONNX Runtime压缩模型
- Web端集成:通过Flask/Django后端提供API接口
- 移动端部署:支持iOS/Android平台的实时识别
-
应用场景适配
- APP集成:开发“拍图识肤”功能,提升用户体验与转化率
- 云端批处理:大规模图像数据的批量处理和分析
- 多模态融合:结合用户输入的护肤历史、生活习惯提升推荐准确性
-
性能监控与改进
- 建立混淆矩阵分析易混淆类别(如Dry Skin vs Normal Skin,Redness vs Acne)
- 收集边缘案例(微小瑕疵、化妆影响、光线反射)进行模型强化
- 定期更新模型以适应新皮肤问题或更细粒度的分类需求
🌟 数据集特色
- 高质量多标签标注:由皮肤科医生或专业美容师审核校正,确保问题准确性
- 现实场景贴合:允许一张图存在多个标签,更符合真实皮肤状态
- 人群多样性高:涵盖不同肤色、性别、年龄的真实用户样本
- 技术兼容性好:支持主流深度学习框架与部署平台
- 持续扩展潜力:可轻松添加新皮肤问题(如敏感肌、玫瑰痤疮)或细分亚型
📈 商业价值
该数据集在以下商业领域具有重要价值:
- 美妆科技公司:开发AI肤质分析引擎,应用于品牌官网、电商平台或线下门店
- 健康管理平台:打造“皮肤健康管家”功能,提升用户粘性与付费转化
- 药妆与护肤品企业:实现个性化产品推荐,优化营销策略与用户体验
- 医美与美容院:提升服务专业度,建立数字化客户档案,增加复购率
- 教育科技公司:开发美容护肤教学工具,提升从业者技能水平
🔗 技术标签
计算机视觉 多标签分类 皮肤识别 深度学习 ResNet 迁移学习 智能美妆 皮肤健康 医疗辅助 AR试妆
注意: 本数据集适用于研究、教育和商业用途。使用时请严格遵守隐私保护与伦理规范,不得用于侵犯个人肖像权或歧视性目的。建议在关键决策场景中结合人工复核,并明确告知用户结果仅为参考,需由专业医疗机构确认。
YOLOv8 训练实战
本教程介绍如何使用 YOLOv8 对目标进行识别与检测。涵盖环境配置、数据准备、训练模型、模型推理和部署等全过程。
📦 1. 环境配置
建议使用 Python 3.8+,并确保支持 CUDA 的 GPU 环境。
# 创建并激活虚拟环境(可选)
python -m venv yolov8_env
source yolov8_env/bin/activate # Windows 用户使用 yolov8_env\Scripts\activate
安装 YOLOv8 官方库 ultralytics
pip install ultralytics
📁 2. 数据准备
2.1 数据标注格式(YOLO)
每张图像对应一个 .txt 文件,每行代表一个目标,格式如下:
<class_id> <x_center> <y_center> <width> <height>
所有值为相对比例(0~1)。
类别编号从 0 开始。
2.2 文件结构示例
datasets/
├── images/
│ ├── train/
│ └── val/
├── labels/
│ ├── train/
│ └── val/
2.3 创建 data.yaml 配置文件
path: ./datasets
train: images/train
val: images/val
nc: 11
names: ['Bent_Insulator', 'Broken_Insulator_Cap', '', ...]
🚀 3. 模型训练
YOLOv8 提供多种模型:yolov8n, yolov8s, yolov8m, yolov8l, yolov8x。可根据设备性能选择。
yolo detect train \
model=yolov8s.pt \
data=./data.yaml \
imgsz=640 \
epochs=50 \
batch=16 \
project=weed_detection \
name=yolov8s_crop_weed
| 参数 | 类型 | 默认值 | 说明 |
|---|---|---|---|
model |
字符串 | - | 指定基础模型架构文件或预训练权重文件路径(.pt/.yaml) |
data |
字符串 | - | 数据集配置文件路径(YAML 格式),包含训练/验证路径和类别定义 |
imgsz |
整数 | 640 | 输入图像的尺寸(像素),推荐正方形尺寸(如 640x640) |
epochs |
整数 | 100 | 训练总轮次,50 表示整个数据集会被迭代 50 次 |
batch |
整数 | 16 | 每个批次的样本数量,值越大需要越多显存 |
project |
字符串 | - | 项目根目录名称,所有输出文件(权重/日志等)将保存在此目录下 |
name |
字符串 | - | 实验名称,用于在项目目录下创建子文件夹存放本次训练结果 |
关键参数补充说明:
-
model=yolov8s.pt- 使用预训练的 YOLOv8 small 版本(平衡速度与精度)
- 可用选项:
yolov8n.pt(nano)/yolov8m.pt(medium)/yolov8l.pt(large)
-
data=./data.yaml# 典型 data.yaml 结构示例 path: ../datasets/weeds train: images/train val: images/val names: 0: Bent_Insulator 1: Broken_Insulator_Cap 2: ... 3: ...
📈 4. 模型验证与测试
4.1 验证模型性能
yolo detect val \
model=runs/detect/yolov8s_crop_weed/weights/best.pt \
data=./data.yaml
| 参数 | 类型 | 必需 | 说明 |
|---|---|---|---|
model |
字符串 | 是 | 要验证的模型权重路径(通常为训练生成的 best.pt 或 last.pt) |
data |
字符串 | 是 | 与训练时相同的 YAML 配置文件路径,需包含验证集路径和类别定义 |
关键参数详解
-
model=runs/detect/yolov8s_crop_weed/weights/best.pt- 使用训练过程中在验证集表现最好的模型权重(
best.pt) - 替代选项:
last.pt(最终epoch的权重) - 路径结构说明:
runs/detect/ └── [训练任务名称]/ └── weights/ ├── best.pt # 验证指标最优的模型 └── last.pt # 最后一个epoch的模型
- 使用训练过程中在验证集表现最好的模型权重(
-
data=./data.yaml- 必须与训练时使用的配置文件一致
- 确保验证集路径正确:
val: images/val # 验证集图片路径 names: 0: crop 1: weed
常用可选参数
| 参数 | 示例值 | 作用 |
|---|---|---|
batch |
16 | 验证时的批次大小 |
imgsz |
640 | 输入图像尺寸(需与训练一致) |
conf |
0.25 | 置信度阈值(0-1) |
iou |
0.7 | NMS的IoU阈值 |
device |
0/cpu | 选择计算设备 |
save_json |
True | 保存结果为JSON文件 |
典型输出指标
Class Images Instances P R mAP50 mAP50-95
all 100 752 0.891 0.867 0.904 0.672
crop 100 412 0.912 0.901 0.927 0.701
weed 100 340 0.870 0.833 0.881 0.643
4.2 推理测试图像
yolo detect predict \
model=runs/detect/yolov8s_crop_weed/weights/best.pt \
source=./datasets/images/val \
save=True
🧠 5. 自定义推理脚本(Python)
from ultralytics import YOLO
import cv2
# 加载模型
model = YOLO('runs/detect/yolov8s_crop_weed/weights/best.pt')
# 推理图像
results = model('test.jpg')
# 可视化并保存结果
results[0].show()
results[0].save(filename='result.jpg')
🛠 6. 部署建议
✅ 本地运行:通过 Python 脚本直接推理。
🌐 Web API:可用 Flask/FastAPI 搭建检测接口。
📦 边缘部署:YOLOv8 支持导出为 ONNX,便于在 Jetson、RKNN 等平台上部署。
导出示例:
yolo export model=best.pt format=onnx
📌 总结流程
| 阶段 | 内容 |
|---|---|
| ✅ 环境配置 | 安装 ultralytics, PyTorch 等依赖 |
| ✅ 数据准备 | 标注图片、组织数据集结构、配置 YAML |
| ✅ 模型训练 | 使用命令行开始训练 YOLOv8 模型 |
| ✅ 验证评估 | 检查模型准确率、mAP 等性能指标 |
| ✅ 推理测试 | 运行模型检测实际图像目标 |
| ✅ 高级部署 | 导出模型,部署到 Web 或边缘设备 |
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐
所有评论(0)