人体姿态估计——CPMs

论文:《Convolutional Pose Machines 》1.概述CPMs由一系列预测器组成，这些预测器经过训练，可在每个图像位置进行密集预测。本文的主要贡献包含：a：使用级联（sequential）卷积结构学习隐式空间模型。b：系统地设计和训练CPMs来学习图像特征和依赖图像的空间模型（各个关节的关系）2.CPMs的模型架构CPM采用CNN的方式来进行特征提取和上下文信息...

Peanut_范

1515人浏览 · 2020-04-20 22:18:40

Peanut_范 · 2020-04-20 22:18:40 发布

论文:《Convolutional Pose Machines 》

1.概述

CPMs由一系列预测器组成，这些预测器经过训练，可在每个图像位置进行密集预测。
本文的主要贡献包含：
a：使用级联（sequential）卷积结构学习隐式空间模型。
b：系统地设计和训练CPMs来学习图像特征和依赖图像的空间模型（各个关节的关系）

2.CPMs的模型架构

在这里插入图片描述
CPM采用CNN的方式来进行特征提取和上下文信息提取，以heatmap的形式表示预测结果（能够保留空间信息），在全卷积的结构下使用中间监督进行端到端的训练和测试，极大提高了关键点检测的准确率。
Heatmap的好处： 在于空间位置信息的保存，这个非常重要。一方面，可以保留multi-modal的信息，比如没有很好的context信息的情况下，是很难区分左右手的，所以图片中左右手同时都可能有比较好的响应，这种heatmap的形式便于后续的cascade进行refinement优化。另外一个方面，人体姿态估计这个问题本身的自由度很大，直接regression的方式对自由度小的问题比如人脸landmark是比较适合的，但是对于自由度大的姿态估计问题整体的建模能力会比较弱。相反，heatmap是比较中间状态的表示，所以信息的保存会更丰富。

3.参考

https://zhuanlan.zhihu.com/p/102468356
https://blog.csdn.net/shenxiaolu1984/article/details/51094959
https://zhuanlan.zhihu.com/p/56131599

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

量化挑战赛冠军专访：4小时啃下W4A8量化，我靠的是这些经验

魔乐社区

「极限压缩量化未来」Modelers GeekDay上海站圆满落幕

魔乐社区

替你试过了，消费级显卡可以跑的开源文生图SOTA模型，顶级渲染、高密度文本绘图

魔乐社区

所有评论(0)

查看更多评论

Peanut_范

@u013841196

已为社区贡献8条内容

人体姿态估计——CPMs

Peanut_范

论文:《Convolutional Pose Machines 》

1.概述

2.CPMs的模型架构

3.参考

所有评论(0)

温馨提示：您尚未绑定手机号

Peanut_范