从零开始：使用 PyTorch 构建一个简单的神经网络并进行训练

本文介绍了如何使用PyTorch构建一个简单神经网络进行MNIST手写数字分类。首先讲解了神经网络的基本结构和关键组件（输入层、隐藏层、输出层及激活函数）。随后详细展示了如何用PyTorch定义网络结构（继承nn.Module类）、加载MNIST数据集并进行预处理。文章还涵盖了模型训练的关键步骤：定义损失函数（交叉熵）和优化器（Adam）、正向/反向传播过程。最后演示了如何评估模型性能，在测试集上

shanwei_spider

767人浏览 · 2025-07-18 09:24:33

shanwei_spider · 2025-07-18 09:24:33 发布

前言

深度学习已经成为人工智能领域的核心技术，而神经网络作为其基础模型，广泛应用于图像识别、自然语言处理、语音识别等多个领域。PyTorch，作为当前最流行的深度学习框架之一，以其灵活性、易用性和高效性，已经成为数据科学家和研究人员的首选工具。

本文将带你一步步了解如何使用 PyTorch 构建一个简单的神经网络。我们将从神经网络的基础概念出发，介绍如何定义、训练并评估一个基础的前馈神经网络（Feedforward Neural Network）。如果你是刚接触深度学习的新人，或者希望快速了解 PyTorch 的使用，这篇文章会为你提供清晰的思路和实践经验。

一、神经网络基础概念

在开始编码之前，首先了解一下神经网络的基本结构：

输入层（Input Layer）：接收数据的特征值，每个节点代表一个特征。
隐藏层（Hidden Layer）：对输入数据进行处理的层，可以有多个隐藏层。
输出层（Output Layer）：神经网络的最终结果层，输出预测值。
激活函数（Activation Function）：用于引入非线性，从而使得神经网络能学习复杂的映射关系。

常见的激活函数包括 ReLU、Sigmoid、Tanh 等。

二、PyTorch 构建神经网络

PyTorch 提供了一个非常简洁且易用的 API 来构建神经网络模型。你只需要继承 torch.nn.Module 类并实现其 __init__ 和 forward 方法，即可定义一个自定义模型。

1. 安装 PyTorch

在开始编码之前，确保你已经安装了 PyTorch。如果还没有安装，可以通过以下命令进行安装：

pip install torch torchvision

2. 定义神经网络

假设我们要构建一个用于分类任务的简单神经网络，它有两个隐藏层，激活函数使用 ReLU，最终输出一个二分类结果。

import torch
import torch.nn as nn
import torch.optim as optim

class SimpleNN(nn.Module):
    def __init__(self):
        super(SimpleNN, self).__init__()
        # 定义神经网络层
        self.fc1 = nn.Linear(28 * 28, 128)  # 输入层到第一个隐藏层
        self.fc2 = nn.Linear(128, 64)       # 第一个隐藏层到第二个隐藏层
        self.fc3 = nn.Linear(64, 10)        # 第二个隐藏层到输出层
        self.relu = nn.ReLU()               # 激活函数
        self.softmax = nn.Softmax(dim=1)    # 输出层使用 softmax 激活函数进行多类分类

    def forward(self, x):
        x = x.view(-1, 28 * 28)  # 展平输入图像（28x28像素）
        x = self.relu(self.fc1(x))  # 经过第一个隐藏层
        x = self.relu(self.fc2(x))  # 经过第二个隐藏层
        x = self.fc3(x)  # 输出层
        return self.softmax(x)  # 返回预测结果

3. 解释模型结构

nn.Linear(in_features, out_features)：这是一个全连接层（fully connected layer），它将 in_features 个输入特征映射到 out_features 个输出特征。
nn.ReLU()：ReLU 激活函数，在计算每个神经元的输出时，将负值归零，增加非线性。
nn.Softmax(dim=1)：Softmax 激活函数将输出的 logits 转化为概率分布，通常用于多分类问题。

三、准备数据

在实际应用中，我们需要用数据来训练神经网络。在这里，我们以经典的 MNIST 数据集为例，进行手写数字分类任务。

MNIST 数据集包含了 60,000 张 28x28 像素的训练图像和 10,000 张测试图像，图像中的数字范围是 0 到 9。

4. 加载数据

PyTorch 提供了 torchvision 库来方便地加载和处理图像数据。我们可以通过以下方式加载 MNIST 数据集：

from torchvision import datasets, transforms

# 数据预处理：将图像转换为张量并归一化
transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.5,), (0.5,))])

# 下载训练数据集和测试数据集
trainset = datasets.MNIST(root='./data', train=True, download=True, transform=transform)
testset = datasets.MNIST(root='./data', train=False, download=True, transform=transform)

# 加载数据
trainloader = torch.utils.data.DataLoader(trainset, batch_size=64, shuffle=True)
testloader = torch.utils.data.DataLoader(testset, batch_size=64, shuffle=False)

5. 数据处理说明

transforms.ToTensor()：将图像转换为 PyTorch 的张量格式。
transforms.Normalize((0.5,), (0.5,))：归一化处理，将图像的像素值缩放到 -1 到 1 之间。

四、训练神经网络

一旦定义了模型并准备好了数据，接下来我们就可以训练神经网络了。

6. 定义损失函数和优化器

# 创建模型
model = SimpleNN()

# 定义损失函数（交叉熵损失）
criterion = nn.CrossEntropyLoss()

# 使用 Adam 优化器
optimizer = optim.Adam(model.parameters(), lr=0.001)

nn.CrossEntropyLoss()：用于多分类任务的损失函数，它结合了 softmax 和 log，计算模型输出与实际标签之间的差异。
optim.Adam：一种高效的优化器，广泛用于训练深度神经网络。

7. 训练过程

num_epochs = 5

for epoch in range(num_epochs):
    model.train()  # 设置模型为训练模式
    running_loss = 0.0
    for inputs, labels in trainloader:
        # 清空梯度
        optimizer.zero_grad()
        
        # 前向传播
        outputs = model(inputs)
        
        # 计算损失
        loss = criterion(outputs, labels)
        
        # 反向传播
        loss.backward()
        
        # 更新权重
        optimizer.step()
        
        running_loss += loss.item()

    print(f"Epoch [{epoch+1}/{num_epochs}], Loss: {running_loss/len(trainloader)}")

8. 训练过程说明

optimizer.zero_grad()：清空之前的梯度，因为 PyTorch 会默认累加梯度。
loss.backward()：计算梯度。
optimizer.step()：更新模型参数。

五、评估模型

训练完成后，我们可以在测试数据集上评估模型的性能。

9. 模型评估

model.eval()  # 设置模型为评估模式
correct = 0
total = 0

with torch.no_grad():  # 在评估时不需要计算梯度
    for inputs, labels in testloader:
        outputs = model(inputs)
        _, predicted = torch.max(outputs, 1)  # 获取预测结果
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

accuracy = 100 * correct / total
print(f'Accuracy on test set: {accuracy}%')

torch.no_grad()：关闭梯度计算，节省内存，提升推理效率。

六、总结与展望

在这篇文章中，我们介绍了如何使用 PyTorch 构建一个简单的神经网络模型，并进行了训练与评估。通过具体的代码示例，展示了如何定义神经网络结构、加载数据、训练模型以及评估模型性能。

通过这些基础操作，你可以构建更复杂的神经网络模型，应用于图像分类、自然语言处理等领域。随着深度学习的不断发展，PyTorch 也不断推出新的特性和工具，帮助开发者更高效地构建和部署深度学习模型。

希望本文能够帮助你更好地理解神经网络的构建过程，并掌握在 PyTorch 中的实现方法。深度学习是一个快速发展的领域，掌握好基础知识和框架使用，将为你今后的学习和工作打下坚实的基础。

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

【计算机视觉】Pixel逐像素分类&Mask掩码分类理解摘要

魔乐社区

计算机视觉（opencv）实战三十二——CascadeClassifier 人脸微笑检测（摄像头）

本文从原理到实现，详细介绍了基于 OpenCV Haar 分类器的人脸与微笑检测：讲解了 Haar 特征和级联检测原理。对代码逐行拆解并解释参数含义。画出完整流程图，帮助理解执行过程。给出了常见问题和优化建议，甚至扩展到深度学习方法。这种方法简单、轻量、实时性好，非常适合入门和小型应用项目。但如果需要更高准确率和更强鲁棒性，建议使用深度学习检测器替代 Haar 分类器。