复试项目（Day_1：机器学习与深度学习）

K最近邻居（，简称KNN一种监督学习算法，用于分类和回归问题。它的基本思想是通过测量不同数据点之间的距离来进行预测。KNN的工作原理可以概括为以下几个步骤：①距离度量：KNN使用距离度量（通常是欧氏距离）来衡量数据点之间的相似性。②确定邻居数量K③投票机制类似于二叉树的判断（如下例）朴素贝叶斯一种基于贝叶斯定理的简单且高效的分类算法。其核心思想是：给定一个待分类项，通过计算该项属于各个类别的概率，

Pupupi_

1099人浏览 · 2025-02-03 16:15:19

Pupupi_ · 2025-02-03 16:15:19 发布

一、机器学习与深度学习介绍，深度学习基本知识

1、机器学习简介

一般是基于数学，或者统计学的方法，具有很强的可解释性.//可解释性让我们知道模型为什么这样做，而不可解释性则意味着我们无法直观地理解模型的决策过程.

例如： KNN, 决策树，朴素贝叶斯

※算法介绍（KNN、决策树、朴素贝叶斯）

KNN：K最近邻居（K-Nearest Neighbors，简称KNN）

一种监督学习算法，用于分类和回归问题。它的基本思想是通过测量不同数据点之间的距离来进行预测。KNN的工作原理可以概括为以下几个步骤：

①距离度量： KNN使用距离度量（通常是欧氏距离）来衡量数据点之间的相似性。

②确定邻居数量K
③投票机制

决策树：

类似于二叉树的判断（如下例）

朴素贝叶斯

一种基于贝叶斯定理的简单且高效的分类算法。

其核心思想是：给定一个待分类项，通过计算该项属于各个类别的概率，然后将该待分类项归为概率最大的类别。这里的“朴素”指的是算法假设特征之间相互独立，即一个特征的出现概率不会受到其他特征的影响。尽管这个假设在实际应用中往往不成立，但朴素贝叶斯算法在很多情况下仍然表现出色，尤其是在文本分类等领域。

2、深度学习简介

深度学习是机器学习的一个分支，它使用多层人工神经网络从大量的数据中进行学习。

核心概念：深度学习旨在找到一个函数f，这个函数能够实现从输入x到输出y的映射。换句话说，给定一组输入数据x，深度学习模型（即函数f）能够自动学习并预测出对应的输出数据y。

※初识神经网络任务

①常见的神经网络输入：一般三种数据格式

[注]：1.张量(tensor)是torch框架里的名称 2.序列表示有前后联系的一数据

②常见的输出（任务类别）一般有以下几种

[注]：所有结构化输出都是分类

二、回归与神经元

1、如何开始深度学习

①定义一个函数（模型）

②定义一个合适的损失函数

③根据损失，对模型进行优化

解释：w*，b*是优化公式，超参数/learning rate是在机器学习模型中人为设定的、模型训练过程中不会通过学习算法自动调整的参数。与模型通过数据学习得到的参数（如权重w和偏置b）不同，超参数的值需要在训练开始前由用户根据经验或实验确定。设置一个超参数就可以得到一个模型，如果模型与预期不符或者差别过大可以另设超参数生成符合要求的模型。

MAE：均绝对误差

定义：MAE通过计算每个样本的预测值与真实值之间的差的绝对值，然后对这些绝对值求平均来得到。它衡量的是预测值与实际值之间的平均绝对差异。
公式：MAE = $\frac{1}{n}\cdot \sum\left |y_i-\dot{y}_i\,{}{} \right |$ 其中n为样本数量，yi为真实值，ŷi为预测值。
特点：
- 简单直观：MAE的计算过程简单明了，易于理解和应用。
- 对异常值敏感度低：由于MAE计算的是差的绝对值，因此它对异常值的敏感度相对较低，这使得它在处理具有异常值的数据集时表现更加稳健。
- 大误差不敏感：然而，MAE对大误差的惩罚力度不如MSE，因此在某些情况下可能无法准确反映模型的预测性能。

MSE：均方误差

定义：MSE通过计算模型预测值与实际观测值之间误差的平方的平均值来量化模型预测性能的优劣。它衡量的是预测值与真实值之间差异的平方的平均值。
公式：MSE = $\frac{1}{n}\cdot \sum\left |y_i-\dot{y}_i\,{}{} \right|^2$ ，其中n为样本数量，yi为真实值，ŷi为预测值。
特点：
- 敏感性高：MSE对预测误差非常敏感，即使是小的误差也会导致MSE值显著增加。这使得MSE在评估模型预测精度时具有较高的分辨率。
- 放大异常值影响：由于MSE计算的是误差的平方，因此异常值对MSE的影响会被放大。这可能导致模型在异常值较多的数据集上表现不佳。
- 优化友好：MSE是光滑的函数，因此在优化过程中更容易处理。许多机器学习算法都使用MSE作为损失函数来优化模型参数。
应用场景：MSE在统计学、数学以及机器学习领域中广泛应用。在数学与统计学中，MSE是评估回归模型性能的重要工具；在时间序列预测中，MSE可以帮助研究人员评估预测模型对未来数据点的预测精度；在假设检验中，MSE则用于衡量样本数据与假设值之间的差异。

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

替你试过了，消费级显卡可以跑的开源文生图SOTA模型，顶级渲染、高密度文本绘图

魔乐社区

量化挑战赛冠军专访：4小时啃下W4A8量化，我靠的是这些经验

魔乐社区

小参数・大码力・易部署 | Qwen3.6-27B上线魔乐社区，基于昇腾的部署教程来了

继一周前模型开源发布后，千问再度开源Qwen3.6-27B —— 一个拥有270亿参数的稠密多模态模型，也是社区呼声最高的模型规格。Qwen3.6-27B 依然支持多模态思考与非思考模式，在智能体编程方面达到了旗舰级表现，全面超越前代开源旗舰 Qwen3.5-397B-A17B（总参数397B / 激活参数17B的MoE模型）。作为稠密架构，它无需MoE路由即可部署，是开发者在实用、可广泛部署规模