作为一个初入深度学习的小白,mnist数据集的训练自然少不了,以下是我训练数据集时的总结和一些问题。

深度学习模型图
在这里插入图片描述

模型可以用以下公式概括:
out=relu { relu { relu[ X@w1+b1 ] @w2+b2 }@w3+b3 }
pred=argmax(out)
loss = tf.reduce_sum(tf.square(out - y)) / x.shape[0]
minimize loss→[w1’,b1’,w2’,b2’,w3’,b3’]
参数调整完成后,可以对新的输入x进行运算从而得到对应的输出
总的来说有四个步骤

# Step1. compute output
降维
# [b, 784] => [b, 10]
# Step2. compute loss
计算损失函数
# Step3. optimize and update w1, w2, w3, b1, b2, b3
优化和更新参数
# Step4.loop
循环训练

先导入数据集和函数

import  os
import  tensorflow as tf
from    tensorflow import keras
from    tensorflow.keras import layers, optimizers, datasets

引入数据和打包

# 屏蔽通知和警告信息,减少用处不大的问题输出
os.environ['TF_CPP_MIN_LOG_LEVEL']='2'

(x,y),(x_val,y_val)=datasets.mnist.load_data()
x = tf.convert_to_tensor(x,dtype=tf.float32)/255.#/255.0图像归一化
y = tf.convert_to_tensor(y, dtype=tf.int32)#将python的数据类型(列表和矩阵)转换成TensorFlow可用的tensor数据类型
y = tf.one_hot(y,depth=10) #depth一个标量,用于定义一个 one hot 维度的深度
print(x.shape, y.shape)
train_dataset = tf.data.Dataset.from_tensor_slices((x,y)).batch(200)#将标签和特征值进行配对,并打包成200一组

模型

model = keras.Sequential([
    layers.Dense(512, activation='relu'),
    layers.Dense(256, activation='relu'),
    layers.Dense(10)])
#序列模型Sequential:各层之间是依次顺序的线性关系,或者逐层添加网络结构
#dense :全连接层,相当于添加一个层
# activation:激活函数,即神经网络的非线性变化
optimizer = optimizers.SGD(learning_rate=0.001)#梯度下降优化器,下降参数为0.001

定义迭代函数

def train_epoch(epoch):  #epoch迭代一次
    #step4
    for step, (x, y) in enumerate(train_dataset):

        with tf.GradientTape() as tape:
            # GradientTape:高效计算
            # [b, 28, 28] => [b, 784],-1代表任意数
            x=tf.reshape(x,(-1,28*28))
            #step1, [b, 784] => [b, 10]
            out = model(x)
            # step2
            loss = tf.reduce_sum(tf.square(out - y)) / x.shape[0]#tf.reduce_sum函数计算一个张量的各个维度上元素的总和

        #step3
        grads = tape.gradient(loss, model.trainable_variables)
        # w' = w - lr * grad
        optimizer.apply_gradients(zip(grads, model.trainable_variables))

        if step % 100 == 0:
            print(epoch, step, 'loss:', loss.numpy())

重复训练30次

def train():
    for epoch in range(30):
        train_epoch(epoch)

主函数

if __name__ == '__main__':
    train()

输出结果

(60000, 28, 28) (60000, 10)
0 0 loss: 1.42484
0 100 loss: 0.8951918
0 200 loss: 0.77708554
1 0 loss: 0.63764215
1 100 loss: 0.64172584
1 200 loss: 0.60275674
...
29 0 loss: 0.2451232
29 100 loss: 0.27935135
29 200 loss: 0.2533118

遇到的问题

①忘记缩进了
这是我用python时的老毛病了,而且程序也没报错
②显存溢出,报错Allocation of 188160000 exceeds 10% of system memory
我的笔记本GPU有点老,所以显存溢出
解决方法:降低batch_size等,或释放些内存增加可用内存

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐