浙江大学-机器学习-支持向量机-板书记录（源自B站仅记录

线性可分 vs 线性不可分从线性可分开始分析并推导到线性不可分线性可分问题求解将平行线插到的向量叫做支持向量所以适用于小样本公式1 ↑只要线性可分就存在一个w和b所以最小化||w|| 就是最大化d 系数1/2是为了求导方便而限制条件则是表示每一个样本都在两条线之外，如果不满足线性可分这里就找不到一组w和b即局部最优解即为全局最优解求局部最优解即可使用梯度下降（上升）法总结SVM处理非线性可

努力敲代码的小方

514人浏览 · 2021-08-01 10:40:41

努力敲代码的小方 · 2021-08-01 10:40:41 发布

线性可分 vs 线性不可分

线性可分
线性不可分

思路：从线性可分开始分析并推导到线性不可分

线性可分问题求解

定义：将平行线插到的向量叫做支持向量
即那些用于确定分割线的向量 ( 所以适用于小样本 )

在这里插入图片描述
公式1 ↑
只要线性可分就存在一个w和b

在这里插入图片描述

所以最小化||w|| 就是最大化d 系数1/2是为了求导方便
而限制条件则是表示每一个样本都在两条线之外，如果不满足线性可分这里就找不到一组w和b

在这里插入图片描述
即局部最优解即为全局最优解
求局部最优解即可使用梯度下降（上升）法

总结

在这里插入图片描述

SVM处理非线性可分问题

在这里插入图片描述
松弛变量允许部分向量的分类错误
最小化函数限制松弛变量不能太大

正则项让整个目标函数规范化（如从仅处理线性扩展到处理非线性）

c 不断尝试取最好值

SVM需要事先设定的参数并不多 c是一个

如何解决非线性问题

在这里插入图片描述

在低维无法线性可分的情况下，升到高维就有可能变成线性可分

此处的例子就需要想出一个5*1的w和一个常数b使得上面的两个与下面的两个经过运算之后结果分离
某一个解：

在这里插入图片描述

此时的w也不再是低纬，而是与变化后的x一样的维度
对于任意的一组需要分类的数据，当维度上升到无限维时，线性可分的概率是1
在这里插入图片描述
但此时w也需要是无限维，此时，SVM提出：

这里的1指的是最小化1/2||w||…那个式子

所以，借助核函数，我们不需要知道具体的映射函数的具体形式，只需要得到两个无限维向量内积得到的常数结果即可
在这里插入图片描述
高斯核对应的两个向量的维度是无限的

这里当d确定时，下面两个向量的维度也是有限的