前言

核心内容来自博客链接1博客连接2希望大家多多支持作者
本文记录用,防止遗忘

计算机视觉——SSD和YOLO简介

课件(单发多框检测SSD)

生成锚框

  • 对每个像素,生成多个以它为中心的锚框
  • 给定n个大小 s1, ...,s2,和m个高宽比,那么生成 n+m-1 个锚框,其大小和高宽比分别为:(s1,r1),(s2,r1),...,(sn,r1),(s1,r2),...,(s1,rm),
  • 在这里插入图片描述

    SSD模型

  • 一个基础网络来抽取特征,然后多个卷积层块来减半高宽
  • 在每段都生成锚框:底部段来拟合小物体,顶部段来拟合大物体
  • 对每个锚框预测类别和边缘框
  • 在这里插入图片描述

    效果

    在这里插入图片描述

    总结

  • SSD通过单神经网络来检测模型
  • 以每个像素为中心的产生多个锚框
  • 在多个段的输出上进行多尺度的检测
  • 课件(YOLO)

    YOLO(你只看一次)

  • SSD中锚框大量重叠,因此浪费了很多计算
  • YOLO将图片均匀分成S×S个锚框
  • 每个锚框预测B个边缘框
  • 后续版本(V2,V3,V4...)有持续改进
  • 在这里插入图片描述

    效果

    在这里插入图片描述

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐