深度学习训练中迭代次数对最后预测结果的影响

深度学习训练中迭代次数对最后预测结果的影响代码的运行环境源代码控制迭代次数代码的运行环境win10专业版Anaconda2020.02 +tensorflow1.14.0 + keras2.2.5源代码源代码主要来自杨培文的《深度学习入门图像处理》这本书，进行了一些微小的改变：把数据集cifar-10改成cifar-100。from __future__ import print_function

老秦子弟

6662人浏览 · 2020-11-17 22:53:34

老秦子弟 · 2020-11-17 22:53:34 发布

深度学习训练中迭代次数对最后预测结果的影响

代码的运行环境

win10专业版
Anaconda2020.02 +tensorflow1.14.0 + keras2.2.5

源代码

源代码主要来自杨培文的《深度学习入门图像处理》这本书，进行了一些微小的改变：把数据集cifar-10改成cifar-100。

from __future__ import print_function
import numpy as np
from keras.callbacks import TensorBoard
from keras.models import Sequential
from keras.optimizers import Adam
from keras.layers import Dense, Dropout, Activation, Flatten
from keras.layers import Conv2D, MaxPool2D
from keras.utils import np_utils
from keras import backend as K
from keras.callbacks import ModelCheckpoint
from keras.datasets import cifar100
from keras.preprocessing.image import ImageDataGenerator

from keras.backend.tensorflow_backend import set_session
import tensorflow as tf
config = tf.ConfigProto()
config.gpu_options.allow_growth=True
set_session(tf.Session(config=config))


np.random.seed(42)
print("Initialized!")

##############################################################
#定义变量
batch_size = 32 # 32
nb_classes = 100 # 类别
nb_epoch = 500
img_rows, img_cols = 32, 32 #图像的长宽像素大小
nb_filters = [32, 32, 64, 64]
pool_size = (2,2)
kernel_size = (3, 3) #卷积核大小
# (x_train, y_train), (x_test, y_test) = cifar100.load_data(label_mode='fine')

 #通过下面这一语句可以将数据自动下载到C:\Users\dell.keras\datasets里
(X_train, y_train), (X_test, y_test) = cifar100.load_data(label_mode='fine') 
X_train = X_train.astype("float32") / 255
X_test = X_test.astype("float32") / 255

y_train = y_train
y_test = y_test

input_shape = (img_rows, img_cols, 3)
Y_train =  np_utils.to_categorical(y_train, nb_classes)
Y_test = np_utils.to_categorical(y_test, nb_classes)
##################################################################

#上游部分，基于生成器的批量生成输入模块
datagen = ImageDataGenerator(
                    featurewise_center = False,
                    samplewise_center = False,
                    featurewise_std_normalization = False,
                    samplewise_std_normalization = False,
                    zca_whitening = False,
                    rotation_range = 0,
                    width_shift_range = 0.1,
                    height_shift_range = 0.1,
                    horizontal_flip = True,
                    vertical_flip = False)

datagen.fit(X_train)

#用各种零件搭建深度神经网络
model = Sequential()
model.add(Conv2D(nb_filters[0], kernel_size, padding = 'same',
                input_shape = X_train.shape[1:]))
model.add(Activation('relu'))
model.add(Conv2D(nb_filters[1], kernel_size))
model.add(Activation('relu'))
model.add(MaxPool2D(pool_size = pool_size))
model.add(Dropout(0.01)) # 0.25

model.add(Conv2D(nb_filters[2], kernel_size, padding = 'same'))
model.add(Activation('relu'))
model.add(Conv2D(nb_filters[3], kernel_size))
model.add(Activation('relu'))
model.add(MaxPool2D(pool_size = pool_size))
model.add(Dropout(0.01)) # 0.25
model.add(Flatten())
model.add(Dense(512))
model.add(Activation('relu'))
model.add(Dropout(0.01)) # 0.5
model.add(Dense(nb_classes))
model.add(Activation('softmax'))


###############################################################
#下游部分，使用凸优化模块训练模型

adam = Adam(lr=0.0001)
model.compile(loss = 'categorical_crossentropy',
                   optimizer=adam,
                   metrics=['accuracy'])

################################################################3
#最后开始训练模型，并且评估模型的准确性
#训练模型
best_model = ModelCheckpoint("cifar100_best.h5", monitor='val_loss', verbose=0, save_best_only=True)
tb = TensorBoard(log_dir="./logs")
model.fit_generator(datagen.flow(X_train, Y_train, batch_size=batch_size),
                        steps_per_epoch=X_train.shape[0] // batch_size,
                        epochs=nb_epoch, verbose=1,
                        validation_data=(X_test, Y_test), callbacks=[best_model,tb])
###############################################################

# 模型评分
score = model.evaluate(X_test, Y_test, verbose=0)
# 输出结果
print('Test score:', score[0])
print("Accuracy: %.2f%%" % (score[1]*100))                   
print("Compiled!")

控制迭代次数

从书上最开始的迭代50次到500次，可以看到最后预测的结果会有一个提升。这次具体是从40%左右到50%，但是到50%之后基本上不会因为迭代次数的增加而提升预测率了。为了验证这个猜想，今天跑了迭代次数 =2000的实验，结果如下图：在这里插入图片描述
可见预测的精确度达到50%，提升的空间很小。

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

Pont - 搭建前后端之桥：高效、灵活的接口管理工具

Pont 是一款强大的数据服务层解决方案，它能够帮助开发者快速搭建前后端之间的桥梁，实现接口的高效管理和代码自动生成。无论是新手还是有经验的开发者，都能通过 Pont 轻松处理接口文档、生成类型安全的 API 代码，从而显著提升开发效率。[![Pont 工具标志](https://raw.gitcode.com/gh_mirrors/po/pont/raw/3f1b7d4bbba3fd2dda

魔乐社区

如何快速上手 hvac：HashiCorp Vault Python 客户端零基础入门指南

**hvac** 是 HashiCorp Vault 的 Python 3.X 客户端库，专为开发者提供简单高效的 Vault 交互方式。无论你是需要管理密钥、配置身份验证，还是实现安全的秘密数据存储，hvac 都能帮助你轻松搞定 Vault 的各项操作。本文将带你零基础快速入门，从安装到基础操作，让你在几分钟内即可上手使用这个强大的工具。[![hvac 客户端 Logo](https://r

魔乐社区

提升Angular2-HN性能的7个实用技巧：让新闻加载速度飞起来

Angular2-HN是一款基于Angular构建的Progressive Hacker News客户端，专为追求高效新闻浏览体验的用户设计。本文将分享7个实用技巧，帮助你优化Angular2-HN的性能，让新闻加载速度显著提升，带来更流畅的阅读体验。## 1. 启用Service Worker缓存关键资源Service Worker是提升Angular应用性能的强大工具，它可以在后台缓存