使用VGG网络进行MNIST图像分类

1 问题VGG网络由牛津大学的Oxford Visual Geometry Group于2015年提出。从诞生之后就收到了学界的广泛关注。VGG网络，可以应用在人脸识别、图像分类等方面。VGG有两种结构，分别为16层和19层。具体结构在其文献做了详细表述，如下图所示。为了学习VGG网络，本组拟采用配置A在MNIST数据集上进行图像分类实验。2 方法首先MNIST的数据大小为28*28，需要进行re

算法与编程之美

670人浏览 · 2023-01-19 00:00:09

算法与编程之美 · 2023-01-19 00:00:09 发布

1 问题

VGG网络由牛津大学的Oxford Visual Geometry Group于2015年提出。从诞生之后就收到了学界的广泛关注。

VGG网络，可以应用在人脸识别、图像分类等方面。VGG有两种结构，分别为16层和19层。具体结构在其文献做了详细表述，如下图所示。

为了学习VGG网络，本组拟采用配置A在MNIST数据集上进行图像分类实验。

2 方法

首先MNIST的数据大小为28*28，需要进行resize才能作为VGG网络的输入；同时，本次实验只需要进行10分类，因此将网络本身的最后一层原做1000分类的soft-max层移除，替换为FC-10。网络实现代码如下：

获取数据后进行resize操作：

实验部分代码如下:

实验结果：

3 结语

VGG主要工作是证明了增加网络的深度能够在一定程度上影响网络最终的性能，从本次实验也可以看出，短时间少周期的训练并不能使得如此庞大的网络拥有很好的效果，而在比较小的网络如LeNet-5这样的网络上往往几个周期就能得到较高的精度。遗憾的是因为实验设备性能限制，网络的运行速度很慢，受限于内存大小，BatchSize的大小受限，最大只能到32，没有充足的调整空间。

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

全家桶集齐！Qwen3.5四款小模型上线魔乐社区，附昇腾全套实践教程

魔乐社区

Pont - 搭建前后端之桥：高效、灵活的接口管理工具

Pont 是一款强大的数据服务层解决方案，它能够帮助开发者快速搭建前后端之间的桥梁，实现接口的高效管理和代码自动生成。无论是新手还是有经验的开发者，都能通过 Pont 轻松处理接口文档、生成类型安全的 API 代码，从而显著提升开发效率。[![Pont 工具标志](https://raw.gitcode.com/gh_mirrors/po/pont/raw/3f1b7d4bbba3fd2dda