人体姿态估计——CPMs
论文:《Convolutional Pose Machines 》1.概述CPMs由一系列预测器组成,这些预测器经过训练,可在每个图像位置进行密集预测。本文的主要贡献包含:a:使用级联(sequential)卷积结构学习隐式空间模型。b:系统地设计和训练CPMs来学习图像特征和依赖图像的空间模型(各个关节的关系)2.CPMs的模型架构CPM采用CNN的方式来进行特征提取和上下文信息...
论文:《Convolutional Pose Machines 》
1.概述
CPMs由一系列预测器组成,这些预测器经过训练,可在每个图像位置进行密集预测。
本文的主要贡献包含:
a:使用级联(sequential)卷积结构学习隐式空间模型。
b:系统地设计和训练CPMs来学习图像特征和依赖图像的空间模型(各个关节的关系)
2.CPMs的模型架构

CPM采用CNN的方式来进行特征提取和上下文信息提取,以heatmap的形式表示预测结果(能够保留空间信息),在全卷积的结构下使用中间监督进行端到端的训练和测试,极大提高了关键点检测的准确率。
Heatmap的好处: 在于空间位置信息的保存,这个非常重要。一方面,可以保留multi-modal的信息,比如没有很好的context信息的情况下,是很难区分左右手的,所以图片中左右手同时都可能有比较好的响应,这种heatmap的形式便于后续的cascade进行refinement优化。另外一个方面,人体姿态估计这个问题本身的自由度很大,直接regression的方式对自由度小的问题比如人脸landmark是比较适合的,但是对于自由度大的姿态估计问题整体的建模能力会比较弱。相反,heatmap是比较中间状态的表示,所以信息的保存会更丰富。
3.参考
https://zhuanlan.zhihu.com/p/102468356
https://blog.csdn.net/shenxiaolu1984/article/details/51094959
https://zhuanlan.zhihu.com/p/56131599
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐



所有评论(0)