目录

前言

课题背景和意义

实现技术思路

一、算法基础

二、EL-YOLO模型

实现效果图样例

最后


前言


    📅大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备,一边要为毕业设计耗费大量精力。近几年各个学校要求的毕设项目越来越难,有不少课题是研究生级别难度的,对本科同学来说是充满挑战。为帮助大家顺利通过和节省时间与精力投入到更重要的就业和考试中去,学长分享优质的选题经验和毕设项目与技术思路。

🚀对毕设有任何疑问都可以问学长哦!

选题指导: https://blog.csdn.net/qq_37340229/article/details/128243277

大家好,这里是海浪学长毕设专题,本次分享的课题是

🎯基于机器视觉的虹膜图像人眼定位及分类算法-yolo

课题背景和意义

针对当前的人眼定位算法应对复杂环境的抗干扰能力不强、定位准确度较差以及无左右眼分类的问题,提出 了一种基于轻量级网络的虹膜图像人眼定位及左右眼分类算法。利用YOLO 算法结合高性能的轻量级网络模型设 EL-YOLO 模型,损失函数引入广义交并比( GIoU),使得网络训练可以快速收敛,且定位精度高。 虹膜相较于指纹、面部等生理特征,具备着先天的与外在隔离的优势,有着极高的稳定性。与常见的指纹、面部相比有着更好的唯一性,防欺骗性与防伪性很好,有着广泛的应用前景。但是虹膜认证设备采集的图片一般包含上半个面部,以及一些背景干扰等,如何
精确高效地从整幅图片中定位出人眼的位置,是虹膜识别设备处理获取虹膜图像的首要步骤。 传统的人眼定位算法大致可以分为基于人眼的固有特征、基于方向梯度直方图(HOG)和支持向量机(SVM)的人眼定位算法。该方法依赖于人眼的灰度梯度变化,在人脸面部图像较大时,由于鼻孔部位的灰度梯度值同样变化较大,因而出现了误检的情形。同样在应对光照变化较大,图像质量较低以及戴眼镜等情形下,准确定位人眼。

实现技术思路

一、算法基础

特征图信息表示
YOLOV3-tiny 是一种单阶段目标检测网络,与 R-CNN、 Fast R-CNN Faster R-CNN MTCNN 等两阶段目标检测网络相比,存在着目标检测速度快的优点。网络经过一系列卷积层的特征提取,在最终输出时分成两个分支,特征图面积越小,单位面积上的语义信息越丰富。

深度可分离卷积

 MobileNet作为高性能的轻量级网络,其参数量极大减少,主要依赖的就是深度可分离卷积。深度可分离卷积分为两步:深度卷积(Depthwise Convolution)与点卷积(Pointwise Convolution)。深度卷积即对输入每个通道进行平面卷积,获得与输入图像通道数相同的特征图像。其卷积步骤如图:

 锚点框

YOLO 网络的每一层锚点框的数目是人为设定的,其中每个锚点的大小是按照具体训练的数据集进行 K -means 聚类获得,其算法流程如图 。 锚点框当作超参数用于网络训练,可以加快网络对
于定位目标的查找。

定位目标的边框实际信息需要对特征网络预测的信息进行解码,边界框如图 所示,其中虚线框是预设锚点框.

二、EL-YOLO模型

由于 YOLOV3-tiny 网络模型的主干网络使用大量的卷积层,所以YOLOV3-tiny 的模型大小达到 33.8 MB 。 原 YOLOV3-tiny 网络用于 80 类别物体的识别定位;而且原模型输入图像为彩色图像,背景复杂多变需要较大的网络模型去提取特征。
人眼定位及分类模型设计
在主干网络中使用 MobileNetV3 block构成特征提取网络。单个MobileNetV3网络块由点卷积通道膨胀、深度卷积、点卷积通道压缩、SENet块、逆残差结构这些主要部分构成。

其中, PW DW 分别代表深度卷积与点卷积, NL 代表非线性激活函数,主要用到三种激活函数 h-swish、 h-sigmoid 以及 ReLU h-swish 激活函数相对于 swish 函数计算更快,其表达式为:

EL-YOLO 网络的整体结构如图:

 

损失函数设计
整体的网络训练损失由边框交并比( IoU )损失、置信度损失以及类别损失构成。在此 IoU 损失引入广义交并比(GIoU ),这个相较于传统的 IoU 可以反映出预测框和标签框在没有交集时的远近,即在 IoU 0 时, GIoU 不为 0 ,训练梯度不为 0 ,依然可以进行反向传播, 训练网络。GIoU 的表达式为:

左右眼类别损失与边框损失相似,仅仅考虑在有目标时候的损失情况,LossCls 的计算公式为:

 置信损失不仅需要考虑有目标时的置信损失,也需要考虑无检测目标的置信损失,因为这是确定目标位置的首要信息。 LossConf 的计算公式为:

λ allobj 是预测的所有格点的系数,即该格点处是否有目标都要乘以该系数。 λ allobj 系数后的因子为交叉熵损失。 λ allobj 的计算公式如下:

 λallobj 是衡量预测整体结构与标签之间的距离情况

实现效果图样例

虹膜的应用场景有很多,在信息安全领域,用智能手机它支持虹膜解屏。在银行、重要岗位等要害部位,虹膜是刷眼进入的唯一通道,有效提高了安全性。在公共安全领域,虹膜识别快捷通道已经开始应用,出入境更加便捷。乘车、购物、工作、旅行,基于虹膜验证的场景将越来越普遍,虹膜识别将逐步取代密码、钥匙,成为保护信息安全的秘密武器。

虹膜识别:

我是海浪学长,创作不易,欢迎点赞、关注、收藏、留言。

毕设帮助,疑难解答,欢迎打扰!

最后

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐