吴恩达深度学习学习笔记——C2W2——算法优化-1

1.1 Mini-batch 梯度下降法Mini-batch是指将大的数据集分成更小规模的子集采用mini-batch梯度下降，在每次遍历完一个mini-batch后即可更新参数，而不用等待遍历完全部训练集才更新参数1.2 理解 mini-batch 梯度下降法Mini-batch梯度下降不如Batch梯度下降那么平滑，但是整体趋势还是下降的选择mini-batch的大小：当size = m时，即

预见未来to50

588人浏览 · 2021-01-29 17:21:16

预见未来to50 · 2021-01-29 17:21:16 发布

1.1 Mini-batch 梯度下降法

Mini-batch是指将大的数据集分成更小规模的子集

采用mini-batch梯度下降，在每次遍历完一个mini-batch后即可更新参数，而不用等待遍历完全部训练集才更新参数

1.2 理解 mini-batch 梯度下降法

Mini-batch梯度下降不如Batch梯度下降那么平滑，但是整体趋势还是下降的

选择mini-batch的大小：

当size = m时，即为普通的batch梯度下降

当size = 1时，即为随机（stochastic）梯度下降

通常，选择折中的大小，mini-batch的大小也可作为一个超参数（hyper-parameter）进行确定

Mini-batch的大小通常选择为2的整数次幂（否则，训练速度可能会断崖式下降）

1.3 指数加权平均

通过加权平均，可以让数据更加“平滑”

指数加权平均（vt = βvt-1 + (1-β)θt），β值越高，数据曲线更平滑，但同时曲线会更加向右偏移

1.4 理解指数加权平均

指数加权平均中的β有什么含义？β值越高，相当于在计算新值（当前值）时考虑了更多的历史数据

指数加权平均的实现示例，其优点是占用内存小（只用一行代码表示旧值）

1.5 指数加权平均的偏差修正

采用指数加权平均后，头部数据值会明显偏低（出现偏差），可对此进行修正

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

cover

全家桶集齐！Qwen3.5四款小模型上线魔乐社区，附昇腾全套实践教程

Pont - 搭建前后端之桥：高效、灵活的接口管理工具

Pont 是一款强大的数据服务层解决方案，它能够帮助开发者快速搭建前后端之间的桥梁，实现接口的高效管理和代码自动生成。无论是新手还是有经验的开发者，都能通过 Pont 轻松处理接口文档、生成类型安全的 API 代码，从而显著提升开发效率。[![Pont 工具标志](https://raw.gitcode.com/gh_mirrors/po/pont/raw/3f1b7d4bbba3fd2dda

cover

魔乐社区月度精选（26年2月）

所有评论(0)

查看更多评论

预见未来to50

已为社区贡献19条内容