河南大学机器学习与数据挖掘——第一章绪论

1、机器学习的目标是使学得的模型能很好地适用于新样本，而不是仅仅在训练样本上工作得很好，学得模型适用于新样本的能力，称为______泛化：学得模型适用于新样本的能力（具有强泛化能力的模型能很好地应用于整个样本空间）线性回归、对数几率回归、决策树、支持向量机、贝叶斯分类器、神经网络。机器学习致力于研究如何通过计算的手段，利用经验来改善系统自身的性能。：用来描述样本属性的输入数据，是模型用来“理解问题

F112514yu

331人浏览 · 2025-06-22 15:42:59

F112514yu · 2025-06-22 15:42:59 发布

机器学习的定义

机器学习致力于研究如何通过计算的手段，利用经验来改善系统自身的性能。

经验在计算机系统中通常以数据的形式存在。

机器学习研究的主要内容是关于在计算机上从数据中产生模型的算法，即学习算法。
根据训练数据是否拥有标记信息，将学习任务分为监督学习和无监督学习。
- 监督学习：分类和回归
  
  线性回归、对数几率回归、决策树、支持向量机、贝叶斯分类器、神经网络
- 无监督学习：聚类
  
  聚类算法：
  - 原型聚类：
    - k均值
    - 学习向量量化
    - 高斯混合聚类
  - 密度聚类
  - 层次聚类
  - 降维，话题分析，图分析...
术语
- 泛化：学得模型适用于新样本的能力（具有强泛化能力的模型能很好地应用于整个样本空间）
- 假设空间数量 =（种类+通配）+ 极端
应用场景

天气预报，能源勘探，环境监测。

无人驾驶技术：自动驾驶汽车、物流运输、公共交通等领域，提升效率和安全性。