PyTorch入门：开启深度学习之旅

# 安装CPU版本的PyTorch  
pip install torch torchvision torchaudio  
  
# 安装GPU版本的PyTorch（假设CUDA版本为10.2）  
pip install torch==1.8.1+cu102 torchvision==0.9.1+cu102 torchaudio==0.8.1 -f https://download.pytorch.org/whl/torch_stable.html

三、PyTorch基础

1. 张量（Tensor）

张量是PyTorch中的基本数据结构，类似于NumPy中的数组。我们可以使用PyTorch提供的函数创建和操作张量，如加法、乘法、转置等。

import torch  
  
# 创建一个张量  
x = torch.tensor([1.0, 2.0, 3.0])  
print(x)  
  
# 对张量进行加法操作  
y = x + 2  
print(y)

2. 自动求导（Autograd）

PyTorch的自动求导功能是深度学习中非常重要的一部分。它可以帮助我们自动计算梯度，从而进行模型的优化。通过使用torch.autograd.Function类或者torch.Tensor的.backward()方法，我们可以轻松实现梯度的计算。

# 创建一个需要求导的张量，requires_grad=True  
x = torch.tensor([1.0, 2.0, 3.0], requires_grad=True)  
  
# 定义一个函数 y = x^2  
y = x ** 2  
  
# 计算y关于x的梯度  
y.backward()  
  
# 输出x的梯度，即dy/dx  
print(x.grad)  # 输出：tensor([2., 4., 6.])

3. 神经网络模块（nn）

PyTorch的nn模块提供了大量预定义的神经网络层和模块，如卷积层、池化层、全连接层等。我们可以使用这些模块快速构建自己的神经网络模型。

import torch.nn as nn  
import torch.nn.functional as F  
  
# 定义一个简单的全连接神经网络  
class SimpleNet(nn.Module):  
    def __init__(self, input_size, hidden_size, output_size):  
        super(SimpleNet, self).__init__()  
        self.fc1 = nn.Linear(input_size, hidden_size)  
        self.fc2 = nn.Linear(hidden_size, output_size)  
  
    def forward(self, x):  
        x = F.relu(self.fc1(x))  
        x = self.fc2(x)  
        return x  
  
# 实例化网络  
net = SimpleNet(10, 50, 2)  
print(net)

4. 优化器（optim）

优化器用于在训练过程中更新模型的参数。PyTorch提供了多种优化器算法，如SGD、Adam等。我们可以选择合适的优化器，并根据需要调整学习率等超参数。

import torch.optim as optim  
  
# 定义损失函数和优化器  
criterion = nn.CrossEntropyLoss()  
optimizer = optim.SGD(net.parameters(), lr=0.01)  
  
# 假设有一个输入数据和目标标签  
input_data = torch.randn(32, 10)  
target_labels = torch.randint(0, 2, (32,))  
  
# 前向传播  
outputs = net(input_data)  
  
# 计算损失  
loss = criterion(outputs, target_labels)  
  
# 反向传播和优化  
optimizer.zero_grad()  # 清空之前的梯度  
loss.backward()  # 反向传播，计算当前梯度  
optimizer.step()  # 根据梯度更新权重

四、构建简单的神经网络模型

假设我们要用PyTorch构建一个简单的全连接神经网络来对手写数字进行分类，我们可以利用torchvision库来加载MNIST数据集，并使用上面定义的SimpleNet模型结构。

import torchvision  
import torchvision.transforms as transforms  
  
# 数据预处理  
transform = transforms.Compose(  
    [transforms.ToTensor(),  
     transforms.Normalize((0.5,), (0.5,))])  
  
# 下载并加载训练集  
trainset = torchvision.datasets.MNIST('~/.pytorch/MNIST_data/', download=True, train=True, transform=transform)  
trainloader = torch.utils.data.DataLoader(trainset, batch_size=64, shuffle=True)  
  
# 实例化网络和优化器  
net = SimpleNet(28*28, 500, 10)  # 输入为28x28的图片展平后的向量

五、训练模型

现在，我们有了数据加载器、网络模型和优化器，接下来就可以开始训练模型了。

import torch  
  
# 定义训练函数  
def train(net, trainloader, criterion, optimizer, epoch):  
    net.train()  # 设置模型为训练模式  
    running_loss = 0.0  
    for i, data in enumerate(trainloader, 0):  
        inputs, labels = data  
        optimizer.zero_grad()  # 清除梯度  
  
        # 前向传播  
        outputs = net(inputs.view(-1, 28*28))  
        loss = criterion(outputs, labels)  
  
        # 反向传播和优化  
        loss.backward()  
        optimizer.step()  
  
        # 打印统计信息  
        running_loss += loss.item()  
        if i % 2000 == 1999:  # 每2000个mini-batches打印一次  
            print('[%d, %5d] loss: %.3f' %  
                  (epoch + 1, i + 1, running_loss / 2000))  
            running_loss = 0.0  
  
# 训练模型  
num_epochs = 5  
for epoch in range(num_epochs):  
    train(net, trainloader, criterion, optimizer, epoch)  
  
print('Finished Training')

六、测试模型

训练完成后，我们需要测试模型的性能。我们可以使用测试数据集来评估模型的准确度。

# 加载测试集  
testset = torchvision.datasets.MNIST('~/.pytorch/MNIST_data/', download=True, train=False, transform=transform)  
testloader = torch.utils.data.DataLoader(testset, batch_size=64, shuffle=False)  
  
# 定义测试函数  
def test(net, testloader):  
    net.eval()  # 设置模型为评估模式  
    correct = 0  
    total = 0  
    with torch.no_grad():  # 不需要计算梯度  
        for data in testloader:  
            images, labels = data  
            outputs = net(images.view(-1, 28*28))  
            _, predicted = torch.max(outputs.data, 1)  
            total += labels.size(0)  
            correct += (predicted == labels).sum().item()  
  
    print('Accuracy of the network on the 10000 test images: %d %%' % (  
        100 * correct / total))  
  
# 测试模型  
test(net, testloader)

七、总结与展望

通过以上的代码示例，我们展示了如何使用PyTorch构建和训练一个简单的神经网络模型。从数据加载到模型定义，再到训练和测试，整个流程得以完整展现。然而，深度学习是一个复杂且广阔的领域，还有很多高级功能和技巧等待我们去探索和学习。

在未来的学习过程中，我们可以进一步探索模型的改进、优化器的选择、正则化技巧、批量归一化、卷积神经网络等更高级的主题。同时，结合具体的应用场景，我们可以利用PyTorch构建更加复杂和实用的深度学习模型，解决实际问题。

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

全家桶集齐！Qwen3.5四款小模型上线魔乐社区，附昇腾全套实践教程

魔乐社区

Pont - 搭建前后端之桥：高效、灵活的接口管理工具

Pont 是一款强大的数据服务层解决方案，它能够帮助开发者快速搭建前后端之间的桥梁，实现接口的高效管理和代码自动生成。无论是新手还是有经验的开发者，都能通过 Pont 轻松处理接口文档、生成类型安全的 API 代码，从而显著提升开发效率。[![Pont 工具标志](https://raw.gitcode.com/gh_mirrors/po/pont/raw/3f1b7d4bbba3fd2dda

魔乐社区

如何快速上手 hvac：HashiCorp Vault Python 客户端零基础入门指南

**hvac** 是 HashiCorp Vault 的 Python 3.X 客户端库，专为开发者提供简单高效的 Vault 交互方式。无论你是需要管理密钥、配置身份验证，还是实现安全的秘密数据存储，hvac 都能帮助你轻松搞定 Vault 的各项操作。本文将带你零基础快速入门，从安装到基础操作，让你在几分钟内即可上手使用这个强大的工具。[![hvac 客户端 Logo](https://r