数学基础知识总结 —— 13. 什么是回归分析常用的「最小二乘法」

文章目录「最小二乘法」的提出背景从一个简单的例子开始参考资料「最小二乘法」的提出背景最小二乘法通常归功于高斯（Carl Friedrich Gauss，1795），但最小二乘法是由阿德里安-马里·勒让德（Adrien-Marie Legendre）首先发表的。它对应的英文是 least squares method，在大陆地区的翻译一般是最小二乘法，或最小平方法。它是一种对离散数据求拟合，并通过均

打码的老程

3457人浏览 · 2022-01-30 15:00:24

打码的老程 · 2022-01-30 15:00:24 发布

文章目录

「最小二乘法」的提出背景
从一个简单的例子开始
参考资料

「最小二乘法」的提出背景

最小二乘法通常归功于高斯（Carl Friedrich Gauss，1795），但最小二乘法是由阿德里安-马里·勒让德（Adrien-Marie Legendre）首先发表的。它对应的英文是 least squares method，在大陆地区的翻译一般是最小二乘法，或最小平方法。它是一种对离散数据求拟合，并通过均方差最小的约束条件来达成于目标数据之间最少误差的数学建模方法。

在这里插入图片描述

用上图进行解释会更明了一些，当我们有一组离散数据（图中红点所示），试图寻找某个能最大程度表示红点之间的趋势关系的函数 $f (x)$ ，这时就可以利用最小二乘法的概念，建模得到比较理想的解。

由于最小二乘法通常被表述为离散点对均值的回归问题，所以它被分类为一种 回归问题，而且也是回归问题中最常用的方法。对于最小二乘法来说，它的最佳拟合，即 残差（残差为：观测值与模型提供的拟合值之间的差距）平方总和的最小化。 当问题在自变量（x变量）有重大不确定性时，那么使用简易回归和最小二乘法会发生问题；在这种情况下，须另外考虑变量-误差-拟合模型所需的方法，而不是最小二乘法。

最小二乘问题分为两种：线性或普通的最小二乘法，和 非线性的最小二乘法，取决于在所有未知数中的残差是否为线性。线性的最小二乘问题发生在统计回归分析中；它有一个封闭形式的解决方案。非线性的问题通常经由迭代细致化来解决；在每次迭代中，系统由线性近似，因此在这两种情况下核心演算是相同的。

在本章中，我会介绍线性问题的求解，而对于非线性问题的求解，可以参考我其他博文的内容。

从一个简单的例子开始

假设某次实验得到4个离散数据 $(x, y)$ ，它们分别如下

x	y
1	6
2	5
3	7
4	10

现在我们要试图找到一条直线 $\omega x + b$ ，它与上述数据的距离最短，于是可以有

$(1\omega + b)] ^2 + [5 - (2 \omega + b)]^2 + \\ [7 - (3 \omega + b)]^2 + [10 - (4 \omega + b)]^2$

$\omega - 56 b + 30 \omega^2 + 20 \omega b + 4 b^2$

这里的 $S$ 表示残差，或者说叫方差和，我们的目标是找到最合适的 $\omega$ 和 $b$ ，使得 $S$ 最小。找到最小组合的方法，除了一个参数一个参数的试验以外，还可以利用导数的性质，找到令偏导数 $\frac{\partial S}{\partial \omega} = 0$ 和 $\frac{\partial S}{\partial b} = 0$ 的情况，对于我们来说，求导数显然最为便捷，于是：

$\frac{\partial S}{\partial \omega} = -154 + 60 \omega + 20b = 0$

$\frac{\partial S}{\partial b} = -56 + 20 \omega + 8 b= 0$

于是最终得到

$\left \{ \begin{matrix} \omega = 1.4 \\ b = 3.5 \end{matrix} \right.$

我们即得到方程

$y = 1.4 x + 3.5$

是对上述问题最佳的拟合函数。

参考资料

https://zh.wikipedia.org/wiki/%E6%9C%80%E5%B0%8F%E4%BA%8C%E4%B9%98%E6%B3%95

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

【计算机视觉】Pixel逐像素分类&Mask掩码分类理解摘要

魔乐社区

计算机视觉（opencv）实战三十二——CascadeClassifier 人脸微笑检测（摄像头）

本文从原理到实现，详细介绍了基于 OpenCV Haar 分类器的人脸与微笑检测：讲解了 Haar 特征和级联检测原理。对代码逐行拆解并解释参数含义。画出完整流程图，帮助理解执行过程。给出了常见问题和优化建议，甚至扩展到深度学习方法。这种方法简单、轻量、实时性好，非常适合入门和小型应用项目。但如果需要更高准确率和更强鲁棒性，建议使用深度学习检测器替代 Haar 分类器。