1 问题

VGG网络由牛津大学的Oxford Visual Geometry Group于2015年提出。从诞生之后就收到了学界的广泛关注。

08ab21a3c37f6a52b489f6ca5992e86f.png

VGG网络,可以应用在人脸识别、图像分类等方面。VGG有两种结构,分别为16层和19层。具体结构在其文献做了详细表述,如下图所示。

a30b6e3b8602b2d9c8bb261d014b2480.png

为了学习VGG网络,本组拟采用配置A在MNIST数据集上进行图像分类实验。

2 方法

首先MNIST的数据大小为28*28,需要进行resize才能作为VGG网络的输入;同时,本次实验只需要进行10分类,因此将网络本身的最后一层原做1000分类的soft-max层移除,替换为FC-10。网络实现代码如下:

18adfd8d10b1e11a92d2e33cd6aa4e9f.png

获取数据后进行resize操作:

29e3e50b569b8c47a7068e39668fb769.png

实验部分代码如下:

8b8c0c022f5bee5f98f174334f796785.png

6b3fba0d32c5218baec7f506a1e9224d.png

bb3e81da458e717150d2ee10f391e9aa.png

e6fac52b49a14b258c8fadbd78b129ec.png

7e78f9fee083b6ffed4208ed444226b4.png

0f028803487076a788b83dc7a6fd4d24.png

b9655d3ce494f61570133630e8484b5e.png

ba1af01b9bbf003d980b23517c766c7f.png

实验结果:

42f1fe1f98a4e659c8efa8c193c9ea65.png

3 结语

VGG主要工作是证明了增加网络的深度能够在一定程度上影响网络最终的性能,从本次实验也可以看出,短时间少周期的训练并不能使得如此庞大的网络拥有很好的效果,而在比较小的网络如LeNet-5这样的网络上往往几个周期就能得到较高的精度。遗憾的是因为实验设备性能限制,网络的运行速度很慢,受限于内存大小,BatchSize的大小受限,最大只能到32,没有充足的调整空间。

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐