【统计学习方法】第二章感知机和课后习题

第二章感知机在学习一个模型的时候应该问：模型的适用条件要解决什么问题对应统计学习方法的三个要素，假设空间，策略，算法感知机要解决的问题是二分类问题，假设是数据是可分的。2.1 感知机模型符号说明：输入空间：X⊆RnX \subseteq R^{n}X⊆Rn输入变量：x∈Xx \in Xx∈X输出空间：Y={+1,−1}Y=\{+1,-1\}Y={+1,−1}输出变量：y∈{+1,−1}y \in

刘大望

802人浏览 · 2020-06-15 21:43:02

刘大望 · 2020-06-15 21:43:02 发布

第二章感知机

在学习一个模型的时候应该问：

模型的适用条件
要解决什么问题
对应统计学习方法的三个要素，假设空间，策略，算法
感知机要解决的问题是二分类问题，假设是数据是可分的。

2.1 感知机模型

符号说明：
输入空间： $\subseteq R^{n}$
输入变量： $\in X$
输出空间： $Y=\{+1,-1\}$
输出变量： $\in\{+1,-1\}$
假设空间：
$f(x)=sign⁡(w⋅x+b)f(x)=\operatorname{sign}(w \cdot x+b)$
其中sign是符号函数
感知机模型

2.2 感知机的学习策略

损失函数：
误分类点到超平面的距离：
$b)=-\sum_{x_{i} \in M} y_{i}\left(w \cdot x_{i}+b\right)$
其中M是误分类点的集合。

2.4 感知机学习算法

2.4.1 随机梯度下降：

输入：
训练数据集 $T=[(x1,y1),…,(xN,yN))T=\left[\left(x_{1}, y_{1}\right), \dots,\left(x_{N}, y_{N}\right)\right)$
学习率 $η\eta$

选取初值 $w_{0}, b_{0}$
在训练集中选取数据 $(xi,yi)\left(x_{i}, y_{i}\right)$
如果 $yi(w⋅xi+b)≤0y_{i}\left(w \cdot x_{i}+b\right) \leq 0$
$w:=w+ηyixiw:=w+\eta y_{i} x_{i}$
$b:=b+ηyib:=b+\eta y_{i}$
转至2，直到训练集中没有误分类的点

输出w,b
在这里插入图片描述

2.4.2 感知机模型的对偶形式

感知机模型的对偶形式
$f(χ)=sign⁡(∑j=1Nαjyjxj⋅x+b)α=(α1,⋯αN)T\begin{array}{c} f(\chi)=\operatorname{sign}\left(\sum_{j=1}^{N} \alpha_{j} y_{j} x_{j} \cdot x+b\right) \\ \alpha=\left(\alpha_{1}, \cdots \alpha_{N}\right)^{T} \end{array}$

算法：
输入：
训练数据集 $T=[(x1,y1),…,(xN,yN))T=\left[\left(x_{1}, y_{1}\right), \dots,\left(x_{N}, y_{N}\right)\right)$
学习率 $η\eta$
1.初值 $α:=0,b:=0\alpha:=0, b:=0$
2.在训练集中选取数据 $(xi,yi)\left(x_{i}, y_{i}\right)$
3.如果 $yi(∑j=1Nαjyjxj⋅x+b)≤0y_{i}\left(\sum_{j=1}^{N} \alpha_{j} y_{j} x_{j} \cdot x+b\right) \leq 0$
$αi:=αi+η\alpha_{i}:=\alpha_{i}+\eta$
$b:=b+ηyib:=b+\eta y_{i}$
4. 转至2，直到训练集中没有误分类的点

输出w,b

对于随机梯度下降来说，对偶形式更新参数要少。

习题

2.1 Minsky与Papert指出：感知机因为是线性模型，所以不能表示复杂的函数，如异或（XOR）。验证感知机为什么不能表示异或。
首先看一下异或：
简单理解，如果两个数a和b进行异或操作。如果a、b两个值不相同，则异或结果为1。如果a、b两个值相同，异或结果为0。
在这里插入图片描述

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

全家桶集齐！Qwen3.5四款小模型上线魔乐社区，附昇腾全套实践教程

魔乐社区

Pont - 搭建前后端之桥：高效、灵活的接口管理工具

Pont 是一款强大的数据服务层解决方案，它能够帮助开发者快速搭建前后端之间的桥梁，实现接口的高效管理和代码自动生成。无论是新手还是有经验的开发者，都能通过 Pont 轻松处理接口文档、生成类型安全的 API 代码，从而显著提升开发效率。[![Pont 工具标志](https://raw.gitcode.com/gh_mirrors/po/pont/raw/3f1b7d4bbba3fd2dda

魔乐社区

如何快速上手 hvac：HashiCorp Vault Python 客户端零基础入门指南

**hvac** 是 HashiCorp Vault 的 Python 3.X 客户端库，专为开发者提供简单高效的 Vault 交互方式。无论你是需要管理密钥、配置身份验证，还是实现安全的秘密数据存储，hvac 都能帮助你轻松搞定 Vault 的各项操作。本文将带你零基础快速入门，从安装到基础操作，让你在几分钟内即可上手使用这个强大的工具。[![hvac 客户端 Logo](https://r