通用近似原理及证明-为什么神经网络可以拟合任意函数

通用近似原理及证明

Jeffrey_oWang

1976人浏览 · 2024-12-07 15:23:37

Jeffrey_oWang · 2024-12-07 15:23:37 发布

通用近似定理（Universal Approximation Theorem）表明：

一个至少有一个隐藏层的神经网络【输入层-隐藏层-输出层】，同时要求激活函数有挤压性质，如 Sigmoid 函数、ReLU 函数，且输出层是线性的。这样的神经网络在隐藏层神经元足够多的情况下，能以任意的精度去近似任何连续函数。

证明：

Step1. 问题定义：设F是一个定义在n维单位立方体 $0,1]^n$ 上的连续函数族， $C([0,1]^n)$ 表示上的连续函数空间，对于 $\in F$ ，我们希望用一个神经网络来逼近这个函数。

Step2. 构造单层前馈神经网络：输入 $(x_1, x_2, \cdots, x_n) \in [0, 1]^n$ ，输出为y，隐藏层有m个神经元，激活函数为 $σ\sigma$ ，输出层为线性函数y， $w_i$ 是输出权重， $v_{i,j}$ 是输入权重， $b_i$ 是偏置，则输出函数可表示为，其实 $w_i$ 是我们的要学习的参数
$\sum_{i = 1}^{m} w_{i} \sigma \left( \sum_{j = 1}^{n} v_{ij} x_{j}+b_{i} \right)$
Step3. 构造损失函数：
$\int_{[0,1]^n} (y - f(x))^2 dx$

Step4. Weierstrass 逼近定理表明对于任意给定的在闭区间上连续的函数，可以用 多项式函数来逼近。由于激活函数 $σ\sigma$ 是连续的， $∣σ(x)−p(x)∣<ϵ,∀x∈R\forall \epsilon > 0, \exists p(x) \text{ }, \text{ s.t. }|\sigma(x)-p(x)|<\epsilon, \forall x\in\mathbb{R}$

进而化简误差函数和目标函数：
$\sum_{i = 1}^{m} w_{i}p(\sum_{j = 1}^{n} v_{ij}x_{j}+b_{i}) \\ E = \int_{[0,1]^n} \left( \sum_{i = 1}^{m} w_{i}p \left( \sum_{j = 1}^{n} v_{ij}x_{j}+b_{i} \right) - f(x) \right)^2 dx$
Step5. 由于 $f$ 是连续函数， $p$ 是多项式函数，所以函数 $∑i=1mwip(∑j=1nvijxj+bi)−f(x)\sum_{i = 1}^{m} w_{i}p\left(\sum_{j = 1}^{n} v_{ij}x_{j}+b_{i}\right)-f(x)$ 是连续函数。根据连续函数在闭区间上的性质(Weierstrass逼近定理)，对于任意的 $ϵ>0\epsilon > 0$ ，存在一个正数 $M$ ，使得对于所有的 $x∈[0,1]nx\in [0, 1]^{n}$
$\left|\sum_{i = 1}^{m} w_{i}p\left(\sum_{j = 1}^{n} v_{ij}x_{j}+b_{i}\right)-f(x)\right| < \frac{\epsilon}{2}$
绝对值小于，则去绝对值号可得到 $dx<ϵ2\int_{[0,1]^n} (f(x) - f(x')) \, dx < \frac{\epsilon}{2}$ 得证。其实本质就是根据微分法将定义域区间划分为若干的小立方体，那么在每个小立方体上都可以用一个多项式函数 $p_i$ 来逼近 $f (x)$ 在该小立方体的上取值，将这些多项式函数组合即可得到y。

Step6. 最终可以使得对于所有的 $\in [0, 1]^n$ ，有 $∣y−f(x)∣<ϵ\vert y - f(x) \vert < \epsilon$ ，其中 $ϵ\epsilon$ 是一个任意小的正数，表示逼近的精度。得证神经网络可以以任意精度逼近任意非线性函数。

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

全家桶集齐！Qwen3.5四款小模型上线魔乐社区，附昇腾全套实践教程

魔乐社区

Pont - 搭建前后端之桥：高效、灵活的接口管理工具

Pont 是一款强大的数据服务层解决方案，它能够帮助开发者快速搭建前后端之间的桥梁，实现接口的高效管理和代码自动生成。无论是新手还是有经验的开发者，都能通过 Pont 轻松处理接口文档、生成类型安全的 API 代码，从而显著提升开发效率。[![Pont 工具标志](https://raw.gitcode.com/gh_mirrors/po/pont/raw/3f1b7d4bbba3fd2dda

魔乐社区

如何快速上手 hvac：HashiCorp Vault Python 客户端零基础入门指南

**hvac** 是 HashiCorp Vault 的 Python 3.X 客户端库，专为开发者提供简单高效的 Vault 交互方式。无论你是需要管理密钥、配置身份验证，还是实现安全的秘密数据存储，hvac 都能帮助你轻松搞定 Vault 的各项操作。本文将带你零基础快速入门，从安装到基础操作，让你在几分钟内即可上手使用这个强大的工具。[![hvac 客户端 Logo](https://r