【机器学习入门】统计学习三要素

统计学习方法都是由模型、策略和算法构成的，统计学习三要素：方法 = 模型 + 策略 + 算法构建一种统计学习方法就是确定具体的统计学习三要素。什么是模型？统计学习首要考虑的问题是学习什么样的模型，在监督学习中，模型就是所要学习的条件概率分布或决策函数。什么是决策？决策就是考虑按照什么样的准则学习或选择最优的模型。损失函数：度量模型一次预测的好坏；风险函数：度量平均意义下模型预测的好坏。常见损失函数

ailx10

331人浏览 · 2019-03-25 21:15:48

ailx10 · 2019-03-25 21:15:48 发布

统计学习方法都是由模型、策略和算法构成的，统计学习三要素：

方法 = 模型 + 策略 + 算法

构建一种统计学习方法就是确定具体的统计学习三要素。

什么是模型？

统计学习首要考虑的问题是学习什么样的模型，在监督学习中，模型就是所要学习的条件概率分布或决策函数。

什么是决策？

决策就是考虑按照什么样的准则学习或选择最优的模型。

损失函数：度量模型一次预测的好坏；
风险函数：度量平均意义下模型预测的好坏。

常见损失函数：

0-1损失函数：

$L(Y,f(X))= \begin{equation} \left\{ \begin{array}{lr} 1, & Y \neq f(X) \\ 0, & Y = f(X)& \end{array} \right. \end{equation}$

平方损失函数：

绝对损失函数：

$L(Y,f(X)) = \left| Y - f(X) \right|$

对数损失函数（对数似然损失函数）：

损失函数越小，本次模型就越好。

风险函数是损失函数的期望，风险函数最小就是最优模型：

是期望的意思（expected）。

$R_{exp} (f) = E_{P}[L(Y,f(X))] = \int_{\chi,\gamma}^{}L(y,f(x))P(x,y)dxdy$

由于联合分布

是未知的，所以风险函数

$R_{exp} (f)$ 不能直接计算，靠学习啦。

期望风险（风险函数）是模型关于联合分布的期望损失；
经验风险是模型关于训练样本集的平均损失。

假定一个训练数据集：

$T = \{ (x_{1},y_{1}),(x_{2},y_{2}),...(x_{N},y_{N})\}$

模型

关于训练数据集的平均损失称为经验风险（empirical），记做

$R_{emp}$ 。

$R_{emp} = \dfrac{1}{N}\sum_{i=1}^{N}{L(y_{i},f(x_{i}))}$

根据大数定律，当样本容量
趋于无穷大时候，经验风险将无限接近期望风险。

什么是统计学习算法？

算法是指学习模型的具体计算方法，统计学习基于训练数据集，根据学习策略，从假设空间中选择最优模型，最后考虑根据什么样的计算方法求解最优模型。

这时，统计学习问题归结为最优化问题，统计学习的算法称为求解最优化问题的算法。一般来说，解析解都是不存在的，我们一般用数值计算的防范求解。如何保证找到全局最优解，并使求解的过程非常高效，这是一个重要的问题。

参考文献：《统计学习方法》

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

揭秘易开发核心功能：页面信息提取与无障碍服务配置详解

易开发（DeveloperHelper）是一款专为Android开发者打造的快速开发工具，核心功能包括界面分析、页面信息提取、加固脱壳等，完美支持Android 9.0系统。本文将深入解析其两大核心功能——**页面信息提取**与**无障碍服务配置**，帮助开发者快速掌握使用技巧，提升开发效率。## 一、无障碍服务：易开发的核心引擎 🚀无障碍服务是易开发实现界面分析的基础，通过系统级别的

魔乐社区

CameraManager性能优化：提升iOS相机应用响应速度的10个技巧

CameraManager是一款简单易用的Swift类库，专为iOS开发者打造，提供了创建自定义相机视图所需的全部配置。在移动应用开发中，相机功能的响应速度直接影响用户体验，本文将分享10个实用技巧，帮助你优化CameraManager的性能，打造流畅的相机应用。### 1. 合理设置会话预设（Session Preset）会话预设直接影响相机的分辨率和性能消耗。在`Sources/Came

魔乐社区

如何用pyecharts-gallery制作交互式地图？AMap与BMap组件实战教程

pyecharts-gallery是一个基于pyecharts的开源项目，提供了丰富的Echarts官方示例模仿实现，帮助开发者快速掌握交互式数据可视化技能。本文将聚焦于如何利用该项目中的AMap和BMap组件，轻松创建专业级交互式地图应用。## 一、快速入门：项目准备与环境搭建要开始使用pyecharts-gallery制作交互式地图，首先需要获取项目源码。通过以下命令克隆仓库：``

魔乐社区

所有评论(0)

查看更多评论

ailx10

@admin_gt

已为社区贡献4条内容