YOLO26训练数据集配置：data.yaml修改详细步骤

本文介绍了如何在星图GPU平台上自动化部署最新 YOLO26 官方版训练与推理镜像，快速搭建目标检测环境。基于该镜像，用户可高效完成自定义数据集的训练与推理任务，典型应用于图像中物体识别与定位，如智能安防、自动驾驶等场景，显著提升开发效率。

leniou的牙膏

1200人浏览 · 2026-01-23 03:19:44

leniou的牙膏 · 2026-01-23 03:19:44 发布

YOLO26训练数据集配置：data.yaml修改详细步骤

最新 YOLO26 官方版训练与推理镜像
本镜像基于 YOLO26 官方代码库 构建，预装了完整的深度学习开发环境，集成了训练、推理及评估所需的所有依赖，开箱即用。

1. 镜像环境说明

核心框架: pytorch == 1.10.0
CUDA版本: 12.1
Python版本: 3.9.5
主要依赖: torchvision==0.11.0, torchaudio==0.10.0, cudatoolkit=11.3, numpy, opencv-python, pandas, matplotlib, tqdm, seaborn 等。

该环境已为YOLO26的训练和推理任务做好全面准备，无需手动安装复杂依赖，节省大量部署时间。所有工具链均已验证兼容，确保模型运行稳定高效。

2. 快速上手

在这里插入图片描述
启动完是这样的

2.1 激活环境与切换工作目录

在使用前，请先激活 Conda 环境，命令如下：

conda activate yolo

在这里插入图片描述

镜像启动后，默认代码存放在系统盘。为了方便后续修改和调试，建议将代码复制到数据盘进行操作。执行以下命令完成复制：

cp -r /root/ultralytics-8.4.2 /root/workspace/

在这里插入图片描述

进入新目录开始工作：

cd /root/workspace/ultralytics-8.4.2

在这里插入图片描述

这样可以避免对原始文件造成误改，也便于管理自定义训练任务。

2.2 模型推理

要测试模型效果，可运行 detect.py 文件。首先检查或修改该脚本内容如下：

# -*- coding: utf-8 -*-
"""
@Auth ：落花不写码
@File ：detect.py
@IDE ：PyCharm
@Motto :学习新思想，争做新青年
"""

from ultralytics import YOLO

if __name__ == '__main__':

    # Load a model
    model = YOLO(model=r'yolo26n-pose.pt')
    model.predict(source=r'./ultralytics/assets/zidane.jpg',
                  save=True,
                  show=False,
                  )

参数说明：

model参数：填入模型权重文件路径，支持 .pt 格式，如 yolo26n.pt 或 yolo26s.pt。
source参数：指定输入源，可以是本地图片、视频路径，或摄像头编号（如 0 表示默认摄像头）。
save参数：设为 True 可自动保存检测结果图像或视频，推荐开启以便后续查看。
show参数：是否实时显示窗口画面，服务器环境下通常设为 False 以减少资源占用。

运行推理命令：

python detect.py

在这里插入图片描述

推理完成后，结果会保存在 runs/detect/predict/ 目录下，终端也会输出检测信息，包括类别、置信度和处理耗时。

2.3 模型训练

训练自定义目标检测模型的关键一步是正确配置 data.yaml 文件。这个文件告诉YOLO你的数据集结构、类别名称以及训练验证集的位置。

3.1 data.yaml 文件结构解析

YOLO格式的数据集必须包含一个 data.yaml 配置文件，其基本结构如下：

train: /root/workspace/ultralytics-8.4.2/datasets/mydata/images/train
val: /root/workspace/ultralytics-8.4.2/datasets/mydata/images/val

nc: 80
names: ['person', 'bicycle', 'car', 'motorcycle', 'airplane', 'bus', 'train', 'truck', 'boat', ...]

各字段含义：

train：训练集图像路径（绝对路径或相对路径均可）
val：验证集图像路径
nc：number of classes，即类别总数
names：类别名称列表，顺序需与标签索引一致

注意：每张图片对应的标签文件应位于 labels 文件夹中，且命名与图片相同，格式为 .txt，每行表示一个对象，格式为 class_id center_x center_y width height（归一化坐标）。

3.2 修改 data.yaml 实例

假设你上传了自己的数据集，存放于 /root/workspace/ultralytics-8.4.2/datasets/custom_data/，则 data.yaml 应修改为：

train: ../datasets/custom_data/images/train
val: ../datasets/custom_data/images/val

nc: 3
names: ['cat', 'dog', 'bird']

确保路径正确无误，否则训练会报错找不到数据。

3.3 train.py 训练脚本配置

接下来修改 train.py 文件，加载模型并启动训练：

# -*- coding: utf-8 -*-
"""
@Auth ：落花不写码
@File ：train.py
@IDE ：PyCharm
@Motto :学习新思想，争做新青年
"""
import warnings
warnings.filterwarnings('ignore')
from ultralytics import YOLO

if __name__ == '__main__':
    model = YOLO(model='/root/workspace/ultralytics-8.4.2/ultralytics/cfg/models/26/yolo26.yaml')
    model.load('yolo26n.pt')  # 加载预训练权重,改进或者做对比实验时候不建议打开，因为用预训练模型整体精度没有很明显的提升
    model.train(data=r'data.yaml',
                imgsz=640,
                epochs=200,
                batch=128,
                workers=8,
                device='0',
                optimizer='SGD',
                close_mosaic=10,
                resume=False,
                project='runs/train',
                name='exp',
                single_cls=False,
                cache=False,
                )

关键参数解释：