PyTorch 深度学习笔记（十一）：Swish 激活函数的 PyTorch 实现与训练效果验证

Swish 激活函数是 Google 提出的一种新型激活函数，其定义为 $f(x) = x \cdot \sigma(\beta x)$，其中 $\sigma$ 为 Sigmoid 函数，$\beta$ 为可学习的参数。Swish 激活函数在多个任务上表现优于 ReLU 激活函数。Swish 激活函数的 PyTorch 实现有多种方式，可以直接使用内置函数或自定义实现。

2501_93877429

295人浏览 · 2025-10-24 20:55:00

2501_93877429 · 2025-10-24 20:55:00 发布

PyTorch 实现与训练效果验证

Swish 激活函数是 Google 提出的一种新型激活函数，其定义为 $f(x) = x \cdot \sigma(\beta x)$，其中 $\sigma$ 为 Sigmoid 函数，$\beta$ 为可学习的参数。Swish 激活函数在多个任务上表现优于 ReLU 激活函数。

Swish 激活函数的 PyTorch 实现

Swish 激活函数的 PyTorch 实现有多种方式，可以直接使用内置函数或自定义实现。

方法一：使用 `torch.nn.Swish`（PyTorch 1.7+）

import torch
import torch.nn as nn
import torch.nn.functional as F

class Model(nn.Module):
    def __init__(self):
        super().__init__()
        self.fc1 = nn.Linear(784, 256)
        self.fc2 = nn.Linear(256, 10)
    
    def forward(self, x):
        x = F.swish(self.fc1(x))
        x = F.swish(self.fc2(x))
        return x

方法二：手动实现 Swish

class Swish(nn.Module):
    def forward(self, x):
        return x * torch.sigmoid(x)  # 或使用 beta 参数

训练效果验证

Swish 激活函数通常在实际任务中表现良好，以下是其训练效果的验证方法：

对比实验

任务验证
- 在 CIFAR-10 和 CIFAR-100 数据集上训练 ResNet 模型，使用 Swish 代替 ReLU 激活函数。
- 观察准确率和损失曲线的变化。
训练日志
- 记录训练过程中的损失、准确率以及学习率变化。
- 分析 Swish 是否有助于梯度传播和模型收敛。