YOLOv8运行voc2007数据集简记

今天用到了 YOLOv8, 这里简单记录下运行 yolov8 的步骤。

凤鸣觑

2301人浏览 · 2023-11-28 14:57:45

凤鸣觑 · 2023-11-28 14:57:45 发布

今天用到了 YOLOv8, 这里简单记录下运行 yolov8 的步骤。

运行

使用 git 下载源码

git clone https://github.com/ultralytics/ultralytics.git

安装 requirements.txt 要求的包

pip install -r requirements.txt

安装其他包

pip install ultralytics
pip install yolo

在 github 下载预训练权重放到项目根目录下
这里下载的是 yolov8n.pt
验证环境

yolo predict model=yolov8n.pt source=ultralytics/assets

若报错 Usage: yolo [OPTIONS] COMMAND [ARGS]…，可以用命令

python setup.py install

最终运行结果如图所示。
在这里插入图片描述

训练voc2007数据集

这里采用 yolov8 原始训练模型与 voc2007数据集进行训练。
首先在项目根目录下新建一个文件夹 datasets，然后在 datasets 下新建一个文件夹 voc2007 并把数据集放到该文件夹下，因为之前在使用 yolov7时已经处理好了voc2007数据集，所以就直接拿过来用了。

修改 data.yaml 和 yolov8.yaml。与使用 yolov7 训练一样，这里同样需要修改这两个文件。

voc2007.yaml内容如下，为方便查找，该文件放到了voc2007文件夹下：

 Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]

# Path: /home/dell/fmk/ultralytics/datesets
# train: voc2007/train.txt
# val: voc2007/val.txt
# test: voc2007/test.txt

train: /home/dell/fmk/ultralytics/datesets/voc2007/train.txt
val: /home/dell/fmk/ultralytics/datesets/voc2007/val.txt
test: /home/dell/fmk/ultralytics/datesets/voc2007/test.txt

# Classes
nc: 20  # number of classes
names: ['aeroplane', 'bicycle', 'bird', 'boat', 'bottle', 'bus', 'car', 'cat', 'chair', 'cow', 'diningtable', 'dog', 'horse', 'motorbike', 'person', 'pottedplant', 'sheep', 'sofa', 'train', 'tvmonitor' ]

在 ultralytics/ultralytics/cfg/models/v8 下找到 yolov8.yaml, 并将 nc 值修改为20，内容如下

# Ultralytics YOLO 🚀, AGPL-3.0 license
# YOLOv8 object detection model with P3-P5 outputs. For Usage examples see https://docs.ultralytics.com/tasks/detect

# Parameters
nc: 20  # number of classes
scales: # model compound scaling constants, i.e. 'model=yolov8n.yaml' will call yolov8.yaml with scale 'n'
  # [depth, width, max_channels]
  n: [0.33, 0.25, 1024]  # YOLOv8n summary: 225 layers,  3157200 parameters,  3157184 gradients,   8.9 GFLOPs
  s: [0.33, 0.50, 1024]  # YOLOv8s summary: 225 layers, 11166560 parameters, 11166544 gradients,  28.8 GFLOPs
  m: [0.67, 0.75, 768]   # YOLOv8m summary: 295 layers, 25902640 parameters, 25902624 gradients,  79.3 GFLOPs
  l: [1.00, 1.00, 512]   # YOLOv8l summary: 365 layers, 43691520 parameters, 43691504 gradients, 165.7 GFLOPs
  x: [1.00, 1.25, 512]   # YOLOv8x summary: 365 layers, 68229648 parameters, 68229632 gradients, 258.5 GFLOPs

# YOLOv8.0n backbone
backbone:
  # [from, repeats, module, args]
  - [-1, 1, Conv, [64, 3, 2]]  # 0-P1/2
  - [-1, 1, Conv, [128, 3, 2]]  # 1-P2/4
  - [-1, 3, C2f, [128, True]]
  - [-1, 1, Conv, [256, 3, 2]]  # 3-P3/8
  - [-1, 6, C2f, [256, True]]
  - [-1, 1, Conv, [512, 3, 2]]  # 5-P4/16
  - [-1, 6, C2f, [512, True]]
  - [-1, 1, Conv, [1024, 3, 2]]  # 7-P5/32
  - [-1, 3, C2f, [1024, True]]
  - [-1, 1, SPPF, [1024, 5]]  # 9

# YOLOv8.0n head
head:
  - [-1, 1, nn.Upsample, [None, 2, 'nearest']]
  - [[-1, 6], 1, Concat, [1]]  # cat backbone P4
  - [-1, 3, C2f, [512]]  # 12

  - [-1, 1, nn.Upsample, [None, 2, 'nearest']]
  - [[-1, 4], 1, Concat, [1]]  # cat backbone P3
  - [-1, 3, C2f, [256]]  # 15 (P3/8-small)

  - [-1, 1, Conv, [256, 3, 2]]
  - [[-1, 12], 1, Concat, [1]]  # cat head P4
  - [-1, 3, C2f, [512]]  # 18 (P4/16-medium)

  - [-1, 1, Conv, [512, 3, 2]]
  - [[-1, 9], 1, Concat, [1]]  # cat head P5
  - [-1, 3, C2f, [1024]]  # 21 (P5/32-large)

  - [[15, 18, 21], 1, Detect, [nc]]  # Detect(P3, P4, P5)

开始训练

yolo task=detect mode=train model=yolov8.yaml data=datesets/voc2007/voc2007.yaml

这里有个地方没太搞懂，咋用预训练模型呢，是直接将这里的 model 改成下载好的与训练模型么，例如 model=yolov8n.pt，这样么，这样的话岂不是没法修改 yolov8.yaml 文件里面的类别数量了，会出现 data.yaml 和 yolov8.yaml 类别对不上的错误么。
我直接用 model=yolov8.pt试了，也没有出错，蹲个大佬解释下

用预训练模型训练结果

用 yolov8.yaml 训练出的结果
在这里插入图片描述

验证

yolo task=detect mode=val model=runs/detect/train/weights/best.pt split=test data=datesets/voc2007/voc2007.yaml

测试集结果
在这里插入图片描述
具体需要使用哪些参数可以参考 ultralytics/ultralytics/cfg/default.yaml 文件，训练和验证是主要注意的为 task, mode, model, data, val, split 等几个参数。

task: detect是目标检测；segment是分割；classify是分类
mode: train是训练， val是验证， predict 是推理测试
model：指明使用的网络结构
data: 数据集的设置
split: test 是测试集；val是验证集

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

工业物联网时序数据库选型指南：Apache IoTDB 技术架构与实战解析

魔乐社区

面向未来的工业大数据架构：时序数据库（TSDB）选型避坑指南和国产化思考

魔乐社区

基于springboot框架会议室预约网站管理系统设计与实现

魔乐社区

所有评论(0)

查看更多评论

凤鸣觑

@weixin_46515691

已为社区贡献5条内容