RCNN算法流程
CNN其实就是图像分类网络,只不过是在图像分类中在CNN提取特征展平处理之后,要经过一个全连接层(输出通道数为类别个数)和softmax层,这里把这部分去掉了,从而每个框框留下了4096维的特征向量,总共为【2000,4096】。a、SVM是一个二分类器,这里以VOC数据集为例,有20个类别,所以需要20个SVM分类器【4096,20】,每个分类器会输出是该类别的得分。b、对于SVM输出矩阵【20
介绍:2014年提出,之前目标检测为手工提取特征,为深度学习提取目标特征的开山之作。
一、总体流程可分为四个步骤

二、各个步骤
1.候选区域的生成

2.对于每个候选区域,使用深度网络提取特征

CNN其实就是图像分类网络,只不过是在图像分类中在CNN提取特征展平处理之后,要经过一个全连接层(输出通道数为类别个数)和softmax层,这里把这部分去掉了,从而每个框框留下了4096维的特征向量,总共为【2000,4096】。
3.特征送入每一类的分类器,判定类别
a、SVM是一个二分类器,这里以VOC数据集为例,有20个类别,所以需要20个SVM分类器【4096,20】,每个分类器会输出是该类别的得分。


b、对于SVM输出矩阵【2000,20】,对于每一列,代表这两千个候选框中属于该类别的分数,对于该列,通过非极大值抑制的方式剔除重叠建议框,如此循环,直到把该类别的2000个候选框遍历完。

4.使用回归器精细修正候选框位置

其实这里可以分为两步。第一步是上一步筛选出来的20个类别的建议框之后(从【2000,20】个建议框中筛选得到的),会对这些建议框进一步筛选,每个类别的建议框(【2000,1】筛选得到的)中会与标注该类别的真实grounf_truth计算IOU,筛选出大于阈值的候选框。
第二步是对于上一步【2000,20】个候选框中筛选出来的,找到该候选框对应当的第二步提取得到的4096维的向量(从【2000,4096】中筛选),用20个回归器分别对20个类别中剩余的建议框回归操作(分类器输出为【目标建议框中心X偏移量,Y偏移量,边界框高度缩放因子,宽度缩放因子】),通过得到的输出对于边界框进行调整。
三、总结


FasterRCNN

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐



所有评论(0)