python打卡 DAY 50 预训练模型+CBAM模块

optimizer = torch.optim.Adam([
    {'params': model.backbone.parameters(), 'lr': 1e-5},    # 预训练部分
    {'params': model.cbam.parameters(), 'lr': 1e-3},        # 新增CBAM
    {'params': model.fc.parameters(), 'lr': 1e-4}           # 分类头
])

b. 三阶段微调策略

阶段1：冻结特征提取器

操作：冻结所有预训练层
训练：仅训练新增CBAM模块和分类头
目的：初步适应目标任务

阶段2：部分解冻

操作：解冻最后1-2个stage的ResNet层
训练：同时训练解冻层+CBAM+分类头
学习率：比阶段1略低

阶段3：全网络微调

操作：解冻全部网络层
训练：整体微调，使用更小学习率
技巧：添加学习率warmup

代码实现示例

from torchvision.models import resnet50
import torch.nn as nn

class ResNet_CBAM(nn.Module):
    def __init__(self, num_classes):
        super().__init__()
        # 加载预训练ResNet
        self.backbone = resnet50(pretrained=True)  
        
        # 在layer2-4后插入CBAM
        self.backbone.layer2 = nn.Sequential(
            self.backbone.layer2,
            CBAM(512)
        )
        self.backbone.layer3 = nn.Sequential(
            self.backbone.layer3,
            CBAM(1024)
        )
        self.backbone.layer4 = nn.Sequential(
            self.backbone.layer4,
            CBAM(2048)
        )
        
        # 替换分类头
        self.backbone.fc = nn.Linear(2048, num_classes)

    def forward(self, x):
        return self.backbone(x)

总结

架构设计：CBAM应插入残差块之后或网络关键位置
训练策略：采用分阶段、差异化学习率微调
性能平衡：保持预训练特征的同时有效集成CBAM
实践建议：从小学习率开始，逐步解冻网络层

@浙大疏锦行

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

小参数・大码力・易部署 | Qwen3.6-27B上线魔乐社区，基于昇腾的部署教程来了

继一周前模型开源发布后，千问再度开源Qwen3.6-27B —— 一个拥有270亿参数的稠密多模态模型，也是社区呼声最高的模型规格。Qwen3.6-27B 依然支持多模态思考与非思考模式，在智能体编程方面达到了旗舰级表现，全面超越前代开源旗舰 Qwen3.5-397B-A17B（总参数397B / 激活参数17B的MoE模型）。作为稠密架构，它无需MoE路由即可部署，是开发者在实用、可广泛部署规模