运用高斯核模型进行最小二乘回归_从「线性回归」到「强化学习」(一)
线性回归(linear regression)是最基础的机器学习、统计学习模型,一般出现在教材或者科普读物的前两章。今天要从线性回归为起点,串讲一些机器学习的概念。这篇文章更像是地图,只给出了地名,而非具体过程。但当你有了地图,按图索骥即可。所以本文的目标是把分散的概念联系起来,从最简单的线性回归说到...主动学习(可能也会包含一点强化学习)。这篇文章我们会先从最简单线性回归入手,从一元推广到多元
线性回归(linear regression)是最基础的机器学习、统计学习模型,一般出现在教材或者科普读物的前两章。今天要从线性回归为起点,串讲一些机器学习的概念。这篇文章更像是地图,只给出了地名,而非具体过程。但当你有了地图,按图索骥即可。所以本文的目标是把分散的概念联系起来,从最简单的线性回归说到...主动学习(可能也会包含一点强化学习)。
这篇文章我们会先从最简单线性回归入手,从一元推广到多元,再到使用核函数(kernel tricks)处理非线性数据。之后我们会简单讨论参数估计的一种方法,最大似然估计,并提供它与线性回归中以最小二乘法优化间的关系,并提供另一种解释。该系列的下一篇文章会介绍最大后验估计(MAP)以及一些简单的贝叶斯思想。在了解了贝叶斯视角后,我们会把MAP的思想带入线性回归,介绍贝叶斯线性回归(Bayesian linear regression)。从贝叶斯线性回归,我们会开始从把参数考虑为随机变量推广到把函数考虑为random function,并和这篇文章中提到的核函数(kernel tricks)结合起来,并介绍高斯过程(Gaussian Process)。在了解了高斯过程后,我们会把高斯过程运用于主动学习(active learning),分析勘探(exploration)和利用(exploitation)间的的取舍(trade-off),并完成这个系列。
1. 一元线性回归
一般来说,我们假设有
2. 多元线性回归
在一维的基础上,我们稍加推广,就可以得到多维下的表达,比如
3. 线性回归、特征空间与核函数
虽然我们把回归问题推广到了高维,但实用价值依然很低,因为我们的线性假设,也就是在
但这种手动操作带来一种问题是我们怎么知道如何生成新的特征空间呢?为什么是x1x2而不是x1^2或者x1^2+x2^3呢?显然这样的组合是无穷多的,我们不可能有无穷多的资源去评估每一种可能性。在这种情况下,另一个广为人知的方法就是使用核函数K(X,X'),即选择合适的kernel,而无需实际去计算在被“投射后”原始输入所处的高维空间中的具体坐标,核函数K可以高校的计算出输入量在高维空间中的某种关系(比如相似度),且K的输入<,>形式需要满足是内积计算。不难看出,只要选用合适的核函数K,我们就可以使得原始版本的线性回归变得无比复杂。选择核函数也就是一个升维过程,也是人们在支持向量机里面说的那个核。本质上支持向量机就是一个线性模型+核函数的组合,目标是将在原始向量空间中线性不可分的问题,也就是线性模型解决的不了的问题投到高维空间上,使得可以找到一个超平面来满足线性模型的解。多说一句为什么机器学习里面要把模型写成矩阵和向量,主要是为了运算更加方便,计算机很擅长进行矩阵运算而非简单的嵌套循环。很多看起来很复杂的结论其实很容易用程序语言表达,稍后说到的高斯过程就是其中一例。
4. 最大似然估计(MLE)
MLE是一种统计上的参数估计方法。假设我们的模型
我们一开始提到的线性回归问题也可以被理解为一组参数寻优问题,此处的参数就是w。我们可以把
最大似然估计就是求解w的取值如何可以使得
不难看出,这个答案与上面第二节的最小方差作为损失函数得到的答案一致。这是巧合吗?也是也不是。第二节的最小方差可以被理解为最大似然中假设高斯噪音,而特定最大似然函数也可以被直接解读为损失函数。另一种解读是对于独立同分布的数据,最大似然其实是在最小化估计出来的参数
用最大似然求解后还可以进一步估计
5. 下节预告
在明白了最简单的基本概念后,我们会从最大似然出发,介绍最大后验估计(MAP)以及一些简单的贝叶斯思想。在了解了贝叶斯视角后,我们会把MAP的思想带入线性回归,介绍贝叶斯线性回归(Bayesian linear regression)。从贝叶斯线性回归,我们会开始从把参数考虑为随机变量推广到把函数考虑为random function,并和这篇文章中提到的核函数,或者说kernel tricks结合起来,介绍高斯过程(Gaussian Process)。在了解了高斯过程后,我们会把高斯过程运用于主动学习(active learning),分析勘探(exploration)和利用(exploitation)间的的取舍(trade-off),并完成这个系列。
重申,这一系列文章的目的是串联起看似关联没那么大的基本概念,提供一种思考地图。因为篇幅与时间限制,跳过了很多推导,建议感兴趣的读者根据关键词搜索,补充背景知识。
也欢迎大家关注、留言、指正或者提问,下节敬请期待。
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐



所有评论(0)