深度学习_L2正则化

phac123

895人浏览 · 2023-02-09 14:23:25

phac123 · 2023-02-09 14:23:25 发布

文章目录

参考博客
正则化介绍
正则化的实现

参考博客

深入理解L1、L2正则化
 PyTorch 实现L2正则化以及Dropout的操作

正则化介绍

正则化（Regularization）是机器学习中一种常用的技术，其主要目的是控制模型复杂度，减小过拟合。最基本的正则化方法是在原目标（代价）函数中添加惩罚项，对复杂度高的模型进行“惩罚”。其数学表达形式为：
$\check{J}(w; X, y)=J(w; X, y) + \alpha\Omega(w)$
式中 $X, y$ 为训练样本和相应标签, $w$ 为权重系数向量; $J ()$ 为目标函数, $\Omega(w)$ 即为惩罚项, 可理解为模型"规模"的某种度量; 参数 $\alpha$ 控制正则化的强弱. 不同的 $\Omega$ 函数对权重w的最优解有不同的偏好, 因而会产生不同的正则化效果. 最常用的 $\Omega$ 函数有两种, 即 $l_1$ 范数与 $l_2$ 范数, 相应称之为 $l_1$ 正则化和 $l_2$ 正则化.此时有:
$l_1: \Omega(w)=||w||_1=\sum_i|w_i|$
$l_2: \Omega(w)=||w||_2=\sqrt{\sum_iw_i^2}$

正则化的实现

在Pytorch中正则化的实现只需要一行代码, 如下:

optimizer = torch.optim.SGD(model.parameters(), \
lr=config.learning_rate, momentum=0.9, weight_decay=0.000001)

在这个函数调用中 $weight\_decay=0.001$ 就是L2范数.

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

小参数・大码力・易部署 | Qwen3.6-27B上线魔乐社区，基于昇腾的部署教程来了

继一周前模型开源发布后，千问再度开源Qwen3.6-27B —— 一个拥有270亿参数的稠密多模态模型，也是社区呼声最高的模型规格。Qwen3.6-27B 依然支持多模态思考与非思考模式，在智能体编程方面达到了旗舰级表现，全面超越前代开源旗舰 Qwen3.5-397B-A17B（总参数397B / 激活参数17B的MoE模型）。作为稠密架构，它无需MoE路由即可部署，是开发者在实用、可广泛部署规模