笔记(待续)-基于梯度下降法的RBF神经网络控制

在离散神经网络控制系统中，常采用梯度下降法实现神经网络权值的学习。一、基于RBF神经网络的监督控制基于RBF神经网络的监督控制：初始阶段采用PD反馈控制，然后过渡到神经网络控制。在控制过程中，如果出现较大的误差，则PD控制起主导作用，神经网络控制起调节作用。图1：基于RBF神经网络的监督控制系统框图总的控制输入为u(k)=un(k)+up(k)u(k) = u_n(k) + u_p(k)u(k)=

Leweslyh

4306人浏览 · 2021-04-13 11:35:16

Leweslyh · 2021-04-13 11:35:16 发布

在离散神经网络控制系统中，常采用梯度下降法实现神经网络权值的学习。

一、基于RBF神经网络的监督控制

基于RBF神经网络的监督控制：初始阶段采用PD反馈控制，然后过渡到神经网络控制。在控制过程中，如果出现较大的误差，则PD控制起主导作用，神经网络控制起调节作用。

图1：基于RBF神经网络的监督控制系统框图

总的控制输入为 $u(k) = u_n(k) + u_p(k)$ ，误差指标为（有点儿费解）：
$\frac{1}{2} (u_n(k) - u(k))^2$

采用梯度下降法，网络权值学习算法为：
$\begin{aligned} & \Delta w_j(k) = - \eta \frac{\partial E(k)}{\partial w_j} = \eta (u_n(k) - u(k)) h_j(k) \\ & w_j(k) = w_j(k-1) + \Delta w_j(k) + \alpha (w_j(k-1) - w_j(k-2)) \end{aligned} \tag{1}$

其中， $\eta$ 为学习速率， $\eta \in [0,1]$ ； $\alpha$ 为动量因子， $\alpha \in [0,1]$ 。

二、基于RBF神经网络的模型参考自适应控制

什么是学习呢？就是根据一定的规则（梯度下降法），通过加入新的数据来不断调整神经网络的参数。

这一部分的思想和笔记-神经网络滑模控制设计方法的《基于神经网络的直接自适应滑模控制》类似。

图1：基于RBF神经网络的模型参考自适应控制系统框图

设理想跟踪指令为 $y_m(k)$ ，定义跟踪误差为：
$e(k) = y_m(k) - y(k)$

网络权值学习误差指标为：
$\frac{1}{2} e(k)^2$

控制输入为RBF神经网络的输出：
$h_1 w_1 + \cdots + h_j w_j + \cdots + h_m w_m$

其中， $m$ 为隐藏层的节点个数， $w_j$ 为节点的权值， $h_j$ 为高斯基函数的输出。

根据梯度下降法，网络的学习算法为：
$\begin{aligned} & \Delta w_j(k) = - \eta \frac{\partial E(k)}{\partial w} = \eta e_c(k) \frac{\partial y (k)}{\partial u (k)} h_j \\ & w_j(k) = w_j(k-1) + \Delta w_j(k) + \alpha \Delta w_j(k) \end{aligned} \tag{1}$

其中， $\eta$ 为学习速率， $\eta \in [0,1]$ ； $\alpha$ 为动量因子， $\alpha \in [0,1]$ 。

同理，可得：
$\begin{aligned} & \Delta b_j(k) = - \eta \frac{\partial E(k)}{\partial b_j} = \eta e_c(k) \frac{\partial y(k)}{\partial u(k)} \frac{\partial u(k)}{\partial b_j} = \eta e_c(k) \frac{\partial y(k)}{\partial u(k)} w_j h_j \frac{|| \boldsymbol{x} - \boldsymbol{c}_ij ||^2}{b_j^3} \\ & b_j(k) = b_j(k-1) + \eta \Delta b_j(k) + \alpha \left( b_j(k-1) - b_j(k-2) \right) \end{aligned} \tag{2}$

和
$\begin{aligned} & \Delta c_{ij}(k) = - \eta \frac{\partial E(k)}{\partial c_{ij}} = \eta e_c(k) \frac{\partial y(k)}{\partial u(k)} \frac{\partial u(k)}{\partial c_{ij}} = \eta e_c(k) \frac{\partial y(k)}{\partial u(k)} w_j h_j \frac{x_i - c_{ij}}{b_j^2} \\ & c_{ij}(k) = c_{ij}(k-1) + \eta \Delta c_{ij}(k) + \alpha \left( c_{ij}(k-1) - c_{ij}(k-2) \right) \end{aligned} \tag{3}$

其中， $\frac{\partial y(k)}{\partial u(k)}$ 为Jacobian矩阵，表征系统输出对控制输入的灵敏度。

三、RBF自校正控制

即用RBF神经网络逼近被控对象的未知部分，其设计思想和笔记-神经网络滑模控制设计方法的《一种简单的RBF网络自适应滑模控制》类似。

四、总结

《RBF神经网络自适应控制MATLAB仿真》一书，RBF神经网络的作用和多项式逼近、模糊逼近等是一样的，都满足万能逼近原理，用来逼近/拟合模型未知部分。
感觉和局部线性化思想有点共通的地方。
为什么叫“学习算法”呢？就是根据一定的规则（比如本书第三章的梯度下降法），随着数据的增加，对RBF神经网络中的参数进行调整。

什么是快乐星球，什么是快乐星球，如果你想知道什么是快乐星球的话，我现在就带你研究，什么是快乐星球。

参考文献

刘金琨. RBF神经网络自适应控制matlab仿真[M]. 清华大学出版社, 2014.

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

替你试过了，消费级显卡可以跑的开源文生图SOTA模型，顶级渲染、高密度文本绘图

魔乐社区

量化挑战赛冠军专访：4小时啃下W4A8量化，我靠的是这些经验

魔乐社区

小参数・大码力・易部署 | Qwen3.6-27B上线魔乐社区，基于昇腾的部署教程来了

继一周前模型开源发布后，千问再度开源Qwen3.6-27B —— 一个拥有270亿参数的稠密多模态模型，也是社区呼声最高的模型规格。Qwen3.6-27B 依然支持多模态思考与非思考模式，在智能体编程方面达到了旗舰级表现，全面超越前代开源旗舰 Qwen3.5-397B-A17B（总参数397B / 激活参数17B的MoE模型）。作为稠密架构，它无需MoE路由即可部署，是开发者在实用、可广泛部署规模