【深度学习笔记】Logistic 模型求解

本专栏是网易云课堂人工智能课程《神经网络与深度学习》的学习笔记，视频由网易云课堂与 deeplearning.ai 联合出品，主讲人是吴恩达 Andrew Ng 教授。感兴趣的网友可以观看网易云课堂的视频进行深入学习，也欢迎对神经网络与深度学习感兴趣的网友一起交流 ~

洋洋Young

1243人浏览 · 2023-06-25 23:10:10

洋洋Young · 2023-06-25 23:10:10 发布

本专栏是网易云课堂人工智能课程《神经网络与深度学习》的学习笔记，视频由网易云课堂与 deeplearning.ai 联合出品，主讲人是吴恩达 Andrew Ng 教授。感兴趣的网友可以观看网易云课堂的视频进行深入学习，视频的链接如下：

https://mooc.study.163.com/course/2001281002

也欢迎对神经网络与深度学习感兴趣的网友一起交流 ~

1 梯度下降法

2 前向传播与反向传播

3 向量化技巧

1 梯度下降法

在 Logistic 模型中，代价函数 $J(\omega, b)$ 是关于参数 $\omega$ 和 $b$ 的函数，

$J(\omega, b) = \frac{1}{m} \sum_{i=1}^{m} L(\hat y^{(i)}, y^{(i)})$

这里的目标是寻找参数 $\omega$ 和 $b$ ，使得 $J(\omega, b)$ 达到最小。

$J(\omega, b)$ 是关于 $\omega$ 和 $b$ 的凸函数（Convex function），因此可以使用梯度下降法寻找参数的最优值。梯度下降法的思路是：从随机的初始点开始，然后朝下降速度最快（负梯度）的方向前进，迭代若干次数，或者收敛到某个最优解时停止。 $\omega$ 和 $b$ 的一次迭代公式如下：

$\omega := \omega - \alpha \cdot \partial J(\omega, b) / \partial \omega$

$b := b - \alpha \, \cdot \partial J(\omega, b) / \partial b$

式中 $\alpha$ 称为学习率（Learning rate），用于控制梯度下降法的每一次迭代的步长。

在迭代的过程中，代价函数 $J(\omega, b)$ 沿着负梯度方向不断减小，因此称这种方法为梯度下降法（Gradient Descent Algorithm）。

2 前向传播与反向传播

在 Logistic 模型的训练过程中，存在前向传播和反向传播两个过程。前向传播（Forward propagation）是指从输入 $x$ 到中间特征 $z$ ，再到最终输出 $y$ 的计算过程。前向传播用于计算模型输出值，以及对训练样本的损失函数值。

反向传播（Backward propagation）指损失函数值的偏差，从后往前传播的过程。反向传播用于更新模型参数。

对于单个训练样本，计算损失函数在该样本上的偏导数

$\partial L(a,y) /\partial a = -y/a + (1-y)/(1-a)$

$\partial L(a,y) /\partial z \, = \partial L(a,y) /\partial a \cdot \partial a /\partial z = a - y$

参数的迭代步长为

$\partial L(a,y) / \partial \omega = (a - y) \cdot x$

$\partial L(a,y) / \partial b = a - y$

对于 m 个训练样本，成本函数值是 m 个代价函数值的平均值，

$J(\omega, b) = \frac{1}{m} \sum_{i=1}^{m} L(a^{(i)}, y^{(i)})$

迭代步长为

$\partial J(\omega, b) / \partial \omega = \frac{1}{m} \sum_{i=1}^{m} (a^{(i)} - y^{(i)}) \cdot x$

$\partial J(\omega, b) / \partial b = \frac{1}{m} \sum_{i=1}^{m} a^{(i)} - y^{(i)}$

3 向量化技巧

向量化 Logistic 回归，可以同时处理整个训练集，在编写代码时，不出现显式的 for 循环语句。做法是构建一个更大的矩阵 X，矩阵 X 的每一列，是每个样本的特征 $x$ ，此时矩阵 X 为一个 nx 行 m 列矩阵，这里 nx 是特征的个数。

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

全家桶集齐！Qwen3.5四款小模型上线魔乐社区，附昇腾全套实践教程

魔乐社区

Pont - 搭建前后端之桥：高效、灵活的接口管理工具

Pont 是一款强大的数据服务层解决方案，它能够帮助开发者快速搭建前后端之间的桥梁，实现接口的高效管理和代码自动生成。无论是新手还是有经验的开发者，都能通过 Pont 轻松处理接口文档、生成类型安全的 API 代码，从而显著提升开发效率。[![Pont 工具标志](https://raw.gitcode.com/gh_mirrors/po/pont/raw/3f1b7d4bbba3fd2dda

魔乐社区

如何快速上手 hvac：HashiCorp Vault Python 客户端零基础入门指南

**hvac** 是 HashiCorp Vault 的 Python 3.X 客户端库，专为开发者提供简单高效的 Vault 交互方式。无论你是需要管理密钥、配置身份验证，还是实现安全的秘密数据存储，hvac 都能帮助你轻松搞定 Vault 的各项操作。本文将带你零基础快速入门，从安装到基础操作，让你在几分钟内即可上手使用这个强大的工具。[![hvac 客户端 Logo](https://r