深度学习目标检测如何快速入门并水一篇论文?
主要用来修改程序,然后调试程序B 站看教程+书籍《Python 编程:从入门到实践》跑案例运行终端输入命令来控制程序的执行只需掌握最常用的那十几个命令(搜一下就有整理)有效地构建和训练目标检测模型照着网上的源码能跑通就行①如卷积神经网络弄清楚基本原理是什么?包含哪些基本结构?这些结构又有 什么作用?②掌握一些常用的目标检测网络如 yolo:了解 yolo 源码,并且能够根据源码 找到 yolo 网
一、基础知识
1、编程语言
①Python 语言:主要用来修改程序,然后调试程序
B 站看教程+书籍《Python 编程:从入门到实践》跑案例
②Linux 命令:运行终端输入命令来控制程序的执行
只需掌握最常用的那十几个命令(搜一下就有整理)
③PyTorch 框架:有效地构建和训练目标检测模型
照着网上的源码能跑通就行
2、深度学习目标检测网络原理
①如卷积神经网络
弄清楚基本原理是什么?包含哪些基本结构?这些结构又有 什么作用?
②掌握一些常用的目标检测网络
如 yolo:了解 yolo 源码,并且能够根据源码 找到 yolo 网络结构图的对应的每一部分,这样你改进网络结构的时候才知道是 在源码的哪些地方进行
二、资源分享
为了方便大家学习,我精心整理了一份超全的深度学习资料,还有80G人工智能资料包(如下图)
不仅有入门级教程,配套课件,还有进阶实战,源码数据集,更有面试题帮你提升~



需要的兄弟可以按照这个图的方式免费获取

三、实操
下载目标检测网络的源码和公开的数据集,刚开始的目标就是把程序跑通然后能 完整的训练一遍,主要是学习和熟悉一下预处理这些操作
100+深度学习常用开源数据集(同上面的资料一起)
包含小目标检测、目标检测、缺陷检测、人脸识别、图像分割、图像识别等方向

深度学习实战项目合集(同上面的资料一起)

四、论文
第 1 步:找到 baseline 论文
从本方向的一些开山之作、经典 sota 以及近三年的顶会顶刊文章中选取 1-3 篇 作为你的 baseline,可以到 paper with code 下载这些开源代码
一个优质的 baseline 通常具备以下特点:
1、发表的时间是近两到三年的:太老的话,审稿人可能不会认可你的对比方法; 而最新的 SOTA 论文往往过于强大,难以超越且优化难度大(超越 SOTA 并不是发论文的必要条件)可以选择一些文章比较新,但性能比较差的作对 比,发个三区四区足够了
2、具备开源代码且有完整的文档(readme),各部分内容详细、清晰, 如训练、测试、损失函数、网络结构等模块界定明确。 (GitHub 上星标较多的更佳,这表明该代码被广泛使用且质量可靠)
3、此外,论文中的公式应清晰明了,方便对照代码理解公式,当你掌握如何将理论公式转化为代码时,就基本入门了
AI 顶会论文合集:

第 2 步:深入剖析 baseline 代码
当你找到了不错的 baseline 论文后,就要深入阅读、使用它的代码了
阅读代码的诀窍:
- 按照 github 的文档配置好你的环境,(pytorch 和 tf 都特别好配置)
- 根据 readme 的步骤,下载相应的数据,运行相应的脚本,让它的训练能流 畅地跑通;(如果在中间报了错,一般都是 library 版本不符)
- 当你成功运行开源代码或遇到算法相关的 bug 时,可以使用一款优秀的 IDE(如 Pycharm)进入 debug 模式。在该模式下,可结合实际数据逐步 分析代码。对于看不懂的步骤,可对照论文流程并通过谷歌查询 API 使用方法。很多单独查看难以理解的代码,结合着 tensor shape,或者处理过 后的数据的 shape/value 就能理解
- 如果时间允许,建议对选定的几篇 baseline 都这样跑一遍,并且用笔记记 录下大概流程
第 3 步:搭建自己的 pipeline
- 可以在第三步选定的 baseline 基础上进行改进,关键在于修改数据读取和预处理部分。此阶段先不要添加自己的模型,先用 baseline 的模型跑通你自己的数据
- 再把你自己的 idea 加入 pipeline,创新点主要集中在提出更好的模型或者改进训练机制方面,模型或损失函数相关内容在网络上通常能找到结构类似的代码,直接按照他们的格式仿写即可(比如你要做轻量级图像分割,那大概率可以借鉴 Unet)
对 baseline 最简单粗暴的改进就是改网络结构
改网络结构主要有 5 种方式:串联、并联、交互、融合、连接
可以整合不同论文中的模块,比如某篇论文的 A 模块是卷积结构,可用于提取局部特征;另一篇论文的 B 模块是 attention 机制,可提取全局特征;将 AB 并联后就可以说能提取多尺度特征如果效果有提升,就可以做消融实验,论文就有东西可以写了。解释一下为 什么加入 A 效果有提升,为什么加入 B 效果有提升,再说一下新模型的优缺点。“A 能提取局部特征,B 能提取全局特征,我们设计了这个新模型,它综合了 A+B 的.....能力,所以效果得以提升......”
深度学习论文即插即用模块:
涵盖了各种注意力机制,卷积变体,Transformer 变体等

第 4 步:撰写论文
当你完成上述 3 步后,只需要会一些写作套路就行,推荐一个UP的合集,详细讲解了从选题到投稿的全流程写作套路,感兴趣可以去看看:读论文的silan学长

还有一份超全的论文资料合集(写作教程/科研工具/开题报告&文献综述模板/创新点干货等)

需要的资料的小伙伴可以按照这个图的方式免费获取

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐


所有评论(0)