CNN卷积神经网络之LeNet-5原理与实战
1、LeNet-5网络结构:

在这里插入图片描述

1.1、LeNet-5由两个部分组成:

(1)特征提取部分:由两个卷积层和两个平均池化层组成;
(2)全连接层:由三个全连接层组成;

1.2、模型单元结构:

一个卷积层;一个sigmoid激活函数;一个池化层;

1.3、数据的传输:

(1)卷积层输入为4维的数据(B,C,W,H)、卷积层输出为4维的数据(B,FN,OW,OH);
(2)全连接层的输入为2维数据(B,L)、全连接层的输出为2维数据(B,FL);

B:Batch size(批次大小),表示一次处理的样本数量;

C:Channels(通道数),对于彩色图像通常是3,对于灰度图像则是1,对于卷积神经网络(CNN)中的特征图,通道数可能更多,取决于网络的深度和结构;

H:Height(高度),图像的高度,以像素为单位;

W:Width(宽度),图像的宽度,以像素为单位;

2、LeNet-5网络参数详解:

在卷积神经网络中,下面的关系需牢记:

(1)卷积核的通道数,必须要和输入特征图的通道一样(同时卷积核每个通道的形状大小也必须一样)
卷积操作是在每个通道上独立进行的。因此,如果你有一个3通道(例如RGB)的输入特征图,每个卷积核也必须有3个通道,以便能够与输入特征图的每个通道进行卷积操作。这确保了卷积操作能够考虑到输入特征图的所有通道信息;

(2)输出特征图的个数 = 卷积核的个数
输出特征图的个数确实等于卷积核的个数。每个卷积核都会在输入特征图上进行卷积操作并产生一个输出特征图。因此,如果你有6个卷积核,那么你将得到6个输出特征图;

(3)输出的特征图的通道数 = 卷积核的个数
这句话与第2句是等价的,只是换了一种说法。输出特征图的“通道数”实际上就是输出特征图的个数,它们都是由卷积核的个数决定的。每个输出特征图可以被视为一个通道,因此输出特征图的通道数就是卷积核的个数;
在这里插入图片描述

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐