监督学习（回归、分类问题）与无监督学习（聚类问题）

Gaolw1102

3017人浏览 · 2022-07-14 23:39:40

Gaolw1102 · 2022-07-14 23:39:40 发布

文章目录

在机器学习中，根据训练的样本是否具备标签Label，或者是否对样本数据进行类别标记，分为 监督学习方式和 无监督学习方式。

监督学习及分类、回归问题

监督学习（Supervised learning）

简单来说，监督学习方式需要事先准备样本数据，这些样本数据具备标签（Label即状态标注）和一定的特征（target可用向量组表示）。根据已经存在的样本数据进行训练从而得到一个最优的模型，例如身高和体重的关系、面部状态点与表情的关系等，样本数据结果一般为一个函数的集合（可想象为二次函数曲线上离散的点或者特定函数分割的区域），通过抽象或者分析设计出函数模型，模型即为最优的函数关系，之后将所有的输入样本再根据模型映射为输出结果，从而实现特定的目标。

回归问题（Regression）

回归问题通常应用于现实世界中的结果预测，如已有前几十个月的销售额样本，以监督学习方式，根据样本数据训练生成最优模型函数，从而对次月的销售额进行智能预测。常见的回归问题应用有房价预测、票房预测等。

分类问题（Classification）

分类问题也是我们在现实生活中常常遇到的一类问题，通过大量标本数据进行训练标记，生成最优模型，根据输入进行输出分类结果。例如某些网站安全验证的检测手段，判断一个图片内容是否为公交车，分类判断是否为垃圾邮件，情感的分类等，均是根据已有的模型对输入数据进行智能分类判断。

无监督学习及聚类问题

无监督学习（Unsupervised learning）

无监督学习又称为无导师学习，指的是无需提前准备标签（Label）和特征（Target），没有标签的一种学习方式，根据样本数据直接对数据进行聚类，对于具备相同特性或状态的数据会聚集为块状，为一组类别。目前在无监督学习领域取得了很多的研究成果，包括次胜者受罚竞争学习算法、K-means学习算法、密度学习算法、谱图聚类算法等。

聚类问题（K-means）

无监督学习的聚类算法通过学习训练出的模型，对样本数据进行聚类，根据相同特征的数据群体进行划分，例如Google新闻的实时热点新闻类聚，具备相同关键词或者近似实事进行推荐，给予用户良好体验，包括人体DNA图谱、关系网分析、相似用户推荐等现实的应用。

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

【计算机视觉】Pixel逐像素分类&Mask掩码分类理解摘要

魔乐社区

计算机视觉（opencv）实战三十二——CascadeClassifier 人脸微笑检测（摄像头）

本文从原理到实现，详细介绍了基于 OpenCV Haar 分类器的人脸与微笑检测：讲解了 Haar 特征和级联检测原理。对代码逐行拆解并解释参数含义。画出完整流程图，帮助理解执行过程。给出了常见问题和优化建议，甚至扩展到深度学习方法。这种方法简单、轻量、实时性好，非常适合入门和小型应用项目。但如果需要更高准确率和更强鲁棒性，建议使用深度学习检测器替代 Haar 分类器。