基于FederatedScope构建自定义联邦学习案例的完整指南

凌崧铖

450人浏览 · 2025-11-11 20:32:47

凌崧铖 · 2025-11-11 20:32:47 发布

基于FederatedScope构建自定义联邦学习案例的完整指南

【免费下载链接】FederatedScope An easy-to-use federated learning platform 项目地址: https://gitcode.com/gh_mirrors/fe/FederatedScope

前言

FederatedScope作为一款功能强大的联邦学习框架，不仅提供了丰富的内置组件，还允许用户灵活地自定义各个模块。本文将详细介绍如何在该框架中构建完整的自定义联邦学习案例，包括数据集加载、模型构建、训练器定制和评估指标扩展四个关键环节。

一、自定义数据集加载

1.1 数据集格式要求

在FederatedScope中，自定义数据集需要返回一个字典结构，其中：

键(key)表示客户端ID
值(value)是包含'train'、'test'或'val'的数据字典

1.2 实现步骤

以MNIST数据集为例，我们可以这样实现：

def load_my_data(config):
    # 数据预处理
    transform = transforms.Compose([
        transforms.ToTensor(),
        transforms.Normalize(mean=[0.9637], std=[0.1592])
    ])
    
    # 加载原始数据
    data_train = MNIST(root=config.data.root, train=True, transform=transform)
    data_test = MNIST(root=config.data.root, train=False, transform=transform)
    
    # 按客户端数量分割数据
    data_dict = {}
    train_per_client = len(data_train) // config.federate.client_num
    test_per_client = len(data_test) // config.federate.client_num
    
    for client_idx in range(1, config.federate.client_num + 1):
        dataloader_dict = {
            'train': DataLoader([...], config.data.batch_size, shuffle=True),
            'test': DataLoader([...], config.data.batch_size, shuffle=False)
        }
        data_dict[client_idx] = dataloader_dict
    
    return data_dict, config

1.3 注册数据集

实现数据加载函数后，需要通过register_data进行注册：

from federatedscope.register import register_data

register_data("mycvdata", call_my_data)

二、自定义模型构建

2.1 模型实现规范

FederatedScope支持PyTorch和TensorFlow模型。以下是一个卷积神经网络的实现示例：

class MyNet(torch.nn.Module):
    def __init__(self, in_channels, h=32, w=32, hidden=2048, class_num=10):
        super(MyNet, self).__init__()
        self.conv1 = torch.nn.Conv2d(in_channels, 32, 5, padding=2)
        self.conv2 = torch.nn.Conv2d(32, 64, 5, padding=2)
        self.fc1 = torch.nn.Linear((h//4)*(w//4)*64, hidden)
        self.fc2 = torch.nn.Linear(hidden, class_num)
        
    def forward(self, x):
        x = self.conv1(x)
        x = F.relu(F.max_pool2d(x, 2))
        x = self.conv2(x)
        x = F.relu(F.max_pool2d(x, 2))
        x = torch.flatten(x, 1)
        x = F.relu(self.fc1(x))
        x = self.fc2(x)
        return x

2.2 模型注册

实现模型后，需要通过register_model进行注册：

from federatedscope.register import register_model

register_model("mycnn", call_my_net)

三、自定义训练器

3.1 训练器实现方式

FederatedScope推荐通过继承GeneralTorchTrainer来实现自定义训练器：

from federatedscope.core.trainers import GeneralTorchTrainer

class MyTrainer(GeneralTorchTrainer):
    def _hook_on_batch_forward(self, ctx):
        # 自定义前向传播逻辑
        data = ctx.data_batch.to(ctx.device)
        pred = ctx.model(data)
        loss = ctx.criterion(pred, data.y)
        ctx.loss_batch = loss.item()
        ctx.y_true = data.y
        ctx.y_prob = pred

3.2 训练器注册

实现训练器后，需要通过register_trainer进行注册：

from federatedscope.register import register_trainer

register_trainer('mycvtrainer', call_my_trainer)

四、自定义评估指标

4.1 指标实现方式

评估指标需要基于上下文(ctx)进行计算：

def cal_my_metric(ctx, **kwargs):
    # 示例：计算训练数据量
    return ctx["num_train_data"]

4.2 指标注册

实现指标后，需要通过register_metric进行注册：

from federatedscope.register import register_metric

register_metric("mymetric", call_my_metric)

五、完整案例配置与运行

5.1 基础配置

cfg = global_cfg.clone()
cfg.data.type = 'mycvdata'
cfg.model.type = 'mycnn'
cfg.trainer.type = 'mycvtrainer'
cfg.eval.metric = ['mymetric']

5.2 联邦学习参数配置

cfg.federate.mode = 'standalone'  # 运行模式
cfg.federate.local_update_steps = 5  # 本地更新步数
cfg.federate.total_round_num = 20  # 总轮数
cfg.federate.client_num = 5  # 客户端数量

5.3 训练参数配置

cfg.train.optimizer.lr = 0.001  # 学习率
cfg.criterion.type = 'CrossEntropyLoss'  # 损失函数

5.4 启动联邦学习

Fed_runner = FedRunner(data=data,
                      server_class=get_server_cls(cfg),
                      client_class=get_client_cls(cfg),
                      config=cfg.clone())
Fed_runner.run()

结语

通过本文的指导，您已经掌握了在FederatedScope框架中构建完整自定义联邦学习案例的方法。从数据准备到模型训练，再到评估指标扩展，FederatedScope提供了高度灵活的接口，使研究人员能够快速实现各种联邦学习算法。建议读者在实际应用中，根据具体需求调整各模块的实现细节，以获得最佳性能。

【免费下载链接】FederatedScope An easy-to-use federated learning platform 项目地址: https://gitcode.com/gh_mirrors/fe/FederatedScope

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

小参数・大码力・易部署 | Qwen3.6-27B上线魔乐社区，基于昇腾的部署教程来了

继一周前模型开源发布后，千问再度开源Qwen3.6-27B —— 一个拥有270亿参数的稠密多模态模型，也是社区呼声最高的模型规格。Qwen3.6-27B 依然支持多模态思考与非思考模式，在智能体编程方面达到了旗舰级表现，全面超越前代开源旗舰 Qwen3.5-397B-A17B（总参数397B / 激活参数17B的MoE模型）。作为稠密架构，它无需MoE路由即可部署，是开发者在实用、可广泛部署规模