kernel: 内核是一个2维矩阵,长 × 宽;

filter:滤波器是一个三维立方体,长× 宽 × 深度,  其中深度便是由 多少张内核构成; 可以说kernel 是filter 的基本元素, 多张kernel 组成一个filter;

那么, 一个filter 中应该包含多少张 kernel 呢?

答:是由输入的通道个数所确定, 即,输入通道是3个特征时,则后续的每一个filter中包含3张kernel ;

                                                               filter输入通道是包含128个特征时, 则一个filter中所包含kernel 数是128张。

那么一层中应该有多少个filter 构成呢?

答: 我们想要提取多少个特征,即我们想要输出多少个特征,那么这一层就设置多少个filter;

              一个filter 负责提取某一种特征,N个filter 提取 N 个 特征;
 

我们可以认为Filter扫过一张图片这件事,其实就是Convolution,这也是为什么Convolutional Layer要叫做Convolutional Layer的关系。

Pooling做的事情就是把图片变小,比如我们做完Convolution以后我们会得到一张图片,这一张图片裡面有很多的 Channel,那做完 Pooling 以后,我们就是把这张图片的 Channel 不变,本来 64 个 Channel 还是 64 个 Channel,但是我们会把图片变得比较狭长一点。

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐