机器学习：无监督学习

所谓无监督学习，是指利用无标签的数据学习数据的分布或者数据之间的关系；下面通过跟监督学习的对比来理解无监督学习：监督学习是一种目的明确的训练方式，你知道得到的是什么；而无监督学习则是没有明确目的的训练方式，你无法提前知道结果是什么。监督学习需要给数据打标签；而无监督学习不需要给数据打标签。监督学习由于目标明确，所以可以衡量效果；而无监督学习几乎无法量化效果如何。

浊酒南街

1357人浏览 · 2023-05-15 20:03:54

浊酒南街 · 2023-05-15 20:03:54 发布

什么是无监督学习

所谓无监督学习，是指利用无标签的数据学习数据的分布或者数据之间的关系；

下面通过跟监督学习的对比来理解无监督学习：
监督学习是一种目的明确的训练方式，你知道得到的是什么；而无监督学习则是没有明确目的的训练方式，你无法提前知道结果是什么。
监督学习需要给数据打标签；而无监督学习不需要给数据打标签。
监督学习由于目标明确，所以可以衡量效果；而无监督学习几乎无法量化效果如何。

为什么要使用无监督学习

以下是描述无监督学习重要性的一些主要原因：

无监督学习有助于从数据中找到有用的见解。
无监督学习与人类通过自己的经验学习思考非常相似，这使得它更接近真正的人工智能。
无监督学习适用于未标记和未分类的数据，这使得无监督学习更加重要。
在现实世界中，我们并不总是有输入数据和相应的输出，因此为了解决这种情况，我们需要无监督学习。

无监督学习的工作原理

下图可以理解无监督学习的工作原理：
在这里插入图片描述
我们采用了未标记的输入数据，这些数据被输入机器学习模型以对其进行训练。它将解释原始数据以从数据中找到隐藏的模式，然后应用合适的算法，如 k-means 聚类等，该算法就会根据对象之间的相似性和差异性将数据对象分组。

无监督学习分类

常见的2类算法是：聚类、降维
聚类：简单说就是一种自动分类的方法，在监督学习中，你很清楚每一个分类是什么，但是聚类则不是，你并不清楚聚类后的几个分类每个代表什么意思。聚类常用算法：K均值，基于密度的聚类，最大期望聚类；

降维：降维看上去很像压缩。这是为了在尽可能保存相关的结构的同时降低数据的复杂度。
降维算法有潜语义模型（LSA），主成分分析（PCA）,奇异值分解（SVD）等

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

揭秘易开发核心功能：页面信息提取与无障碍服务配置详解

易开发（DeveloperHelper）是一款专为Android开发者打造的快速开发工具，核心功能包括界面分析、页面信息提取、加固脱壳等，完美支持Android 9.0系统。本文将深入解析其两大核心功能——**页面信息提取**与**无障碍服务配置**，帮助开发者快速掌握使用技巧，提升开发效率。## 一、无障碍服务：易开发的核心引擎 🚀无障碍服务是易开发实现界面分析的基础，通过系统级别的

魔乐社区

解决Rust版本管理难题：gh_mirrors/ru/rust-toolchain高级用法与实战案例

gh_mirrors/ru/rust-toolchain是一款简洁高效的GitHub Action工具，专为Rust开发者设计，能够快速安装和管理Rust工具链，解决多版本共存、环境配置复杂等常见问题，让Rust项目构建过程更加流畅。## 🚀 为什么选择gh_mirrors/ru/rust-toolchain？在Rust开发中，不同项目可能需要不同版本的Rust编译器，手动管理多个工具链

魔乐社区

如何使用IconGenerator快速创建符合Apple人机界面指南的应用图标

IconGenerator是一款专为macOS用户设计的免费应用图标生成工具，能够帮助开发者和设计师轻松创建符合Apple人机界面指南的各种尺寸应用图标。无论是iOS、macOS还是watchOS应用，只需简单几步，即可生成完整的图标套件，省去手动调整尺寸的繁琐过程。## 为什么选择IconGenerator？对于苹果生态开发者来说，制作应用图标往往是一项耗时的工作。Apple的人机界面指