今天用到了 YOLOv8, 这里简单记录下运行 yolov8 的步骤。

运行

  1. 使用 git 下载源码
git clone https://github.com/ultralytics/ultralytics.git
  1. 安装 requirements.txt 要求的包
pip install -r requirements.txt
  1. 安装其他包
pip install ultralytics
pip install yolo
  1. 在 github 下载预训练权重放到项目根目录下
    这里下载的是 yolov8n.pt
    在这里插入图片描述
    在这里插入图片描述
  2. 验证环境
yolo predict model=yolov8n.pt source=ultralytics/assets

若报错 Usage: yolo [OPTIONS] COMMAND [ARGS]…, 可以用命令

python setup.py install

最终运行结果如图所示。
在这里插入图片描述

训练voc2007数据集

这里采用 yolov8 原始训练模型与 voc2007数据集进行训练。
首先在项目根目录下新建一个文件夹 datasets,然后在 datasets 下新建一个文件夹 voc2007 并把数据集放到该文件夹下,因为之前在使用 yolov7时已经处理好了voc2007数据集,所以就直接拿过来用了。
voc2007数据集
修改 data.yaml 和 yolov8.yaml。与使用 yolov7 训练一样,这里同样需要修改这两个文件。

voc2007.yaml内容如下,为方便查找,该文件放到了voc2007文件夹下:

 Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]

# Path: /home/dell/fmk/ultralytics/datesets
# train: voc2007/train.txt
# val: voc2007/val.txt
# test: voc2007/test.txt

train: /home/dell/fmk/ultralytics/datesets/voc2007/train.txt
val: /home/dell/fmk/ultralytics/datesets/voc2007/val.txt
test: /home/dell/fmk/ultralytics/datesets/voc2007/test.txt

# Classes
nc: 20  # number of classes
names: ['aeroplane', 'bicycle', 'bird', 'boat', 'bottle', 'bus', 'car', 'cat', 'chair', 'cow', 'diningtable', 'dog', 'horse', 'motorbike', 'person', 'pottedplant', 'sheep', 'sofa', 'train', 'tvmonitor' ]

在 ultralytics/ultralytics/cfg/models/v8 下找到 yolov8.yaml, 并将 nc 值修改为20, 内容如下

# Ultralytics YOLO 🚀, AGPL-3.0 license
# YOLOv8 object detection model with P3-P5 outputs. For Usage examples see https://docs.ultralytics.com/tasks/detect

# Parameters
nc: 20  # number of classes
scales: # model compound scaling constants, i.e. 'model=yolov8n.yaml' will call yolov8.yaml with scale 'n'
  # [depth, width, max_channels]
  n: [0.33, 0.25, 1024]  # YOLOv8n summary: 225 layers,  3157200 parameters,  3157184 gradients,   8.9 GFLOPs
  s: [0.33, 0.50, 1024]  # YOLOv8s summary: 225 layers, 11166560 parameters, 11166544 gradients,  28.8 GFLOPs
  m: [0.67, 0.75, 768]   # YOLOv8m summary: 295 layers, 25902640 parameters, 25902624 gradients,  79.3 GFLOPs
  l: [1.00, 1.00, 512]   # YOLOv8l summary: 365 layers, 43691520 parameters, 43691504 gradients, 165.7 GFLOPs
  x: [1.00, 1.25, 512]   # YOLOv8x summary: 365 layers, 68229648 parameters, 68229632 gradients, 258.5 GFLOPs

# YOLOv8.0n backbone
backbone:
  # [from, repeats, module, args]
  - [-1, 1, Conv, [64, 3, 2]]  # 0-P1/2
  - [-1, 1, Conv, [128, 3, 2]]  # 1-P2/4
  - [-1, 3, C2f, [128, True]]
  - [-1, 1, Conv, [256, 3, 2]]  # 3-P3/8
  - [-1, 6, C2f, [256, True]]
  - [-1, 1, Conv, [512, 3, 2]]  # 5-P4/16
  - [-1, 6, C2f, [512, True]]
  - [-1, 1, Conv, [1024, 3, 2]]  # 7-P5/32
  - [-1, 3, C2f, [1024, True]]
  - [-1, 1, SPPF, [1024, 5]]  # 9

# YOLOv8.0n head
head:
  - [-1, 1, nn.Upsample, [None, 2, 'nearest']]
  - [[-1, 6], 1, Concat, [1]]  # cat backbone P4
  - [-1, 3, C2f, [512]]  # 12

  - [-1, 1, nn.Upsample, [None, 2, 'nearest']]
  - [[-1, 4], 1, Concat, [1]]  # cat backbone P3
  - [-1, 3, C2f, [256]]  # 15 (P3/8-small)

  - [-1, 1, Conv, [256, 3, 2]]
  - [[-1, 12], 1, Concat, [1]]  # cat head P4
  - [-1, 3, C2f, [512]]  # 18 (P4/16-medium)

  - [-1, 1, Conv, [512, 3, 2]]
  - [[-1, 9], 1, Concat, [1]]  # cat head P5
  - [-1, 3, C2f, [1024]]  # 21 (P5/32-large)

  - [[15, 18, 21], 1, Detect, [nc]]  # Detect(P3, P4, P5)

开始训练

yolo task=detect mode=train model=yolov8.yaml data=datesets/voc2007/voc2007.yaml

这里有个地方没太搞懂,咋用预训练模型呢,是直接将这里的 model 改成 下载好的与训练模型么, 例如 model=yolov8n.pt,这样么,这样的话岂不是没法修改 yolov8.yaml 文件里面的类别数量了,会出现 data.yaml 和 yolov8.yaml 类别对不上的错误么。
我直接用 model=yolov8.pt试了,也没有出错,蹲个大佬解释下

用预训练模型训练结果
训练结果
用 yolov8.yaml 训练出的结果
在这里插入图片描述

验证

yolo task=detect mode=val model=runs/detect/train/weights/best.pt split=test data=datesets/voc2007/voc2007.yaml

测试集结果
在这里插入图片描述
具体需要使用哪些参数可以参考 ultralytics/ultralytics/cfg/default.yaml 文件,训练和验证是主要注意的为 task, mode, model, data, val, split 等几个参数。

task: detect是目标检测;segment是分割;classify是分类
mode: train是训练, val是验证, predict 是推理测试
model: 指明使用的网络结构
data: 数据集的设置
split: test 是测试集;val是验证集

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐