监督学习(回归、分类问题)与无监督学习(聚类问题)
监督学习(回归、分类问题)与无监督学习(聚类问题)
文章目录
在机器学习中,根据训练的样本是否具备标签Label,或者是否对样本数据进行类别标记,分为 监督学习方式和 无监督学习方式。
监督学习及分类、回归问题
监督学习(Supervised learning)
简单来说,监督学习方式需要事先准备样本数据,这些样本数据具备标签(Label即状态标注)和一定的特征(target可用向量组表示)。根据已经存在的样本数据进行训练从而得到一个最优的模型,例如身高和体重的关系、面部状态点与表情的关系等,样本数据结果一般为一个函数的集合(可想象为二次函数曲线上离散的点或者特定函数分割的区域),通过抽象或者分析设计出函数模型,模型即为最优的函数关系,之后将所有的输入样本再根据模型映射为输出结果,从而实现特定的目标。
回归问题(Regression)
回归问题通常应用于现实世界中的结果预测,如已有前几十个月的销售额样本,以监督学习方式,根据样本数据训练生成最优模型函数,从而对次月的销售额进行智能预测。常见的回归问题应用有房价预测、票房预测等。
分类问题(Classification)
分类问题也是我们在现实生活中常常遇到的一类问题,通过大量标本数据进行训练标记,生成最优模型,根据输入进行输出分类结果。例如某些网站安全验证的检测手段,判断一个图片内容是否为公交车,分类判断是否为垃圾邮件,情感的分类等,均是根据已有的模型对输入数据进行智能分类判断。
无监督学习及聚类问题
无监督学习(Unsupervised learning)
无监督学习又称为无导师学习,指的是无需提前准备标签(Label)和特征(Target),没有标签的一种学习方式,根据样本数据直接对数据进行聚类,对于具备相同特性或状态的数据会聚集为块状,为一组类别。目前在无监督学习领域取得了很多的研究成果,包括次胜者受罚竞争学习算法、K-means学习算法、密度学习算法、谱图聚类算法等。
聚类问题(K-means)
无监督学习的聚类算法通过学习训练出的模型,对样本数据进行聚类,根据相同特征的数据群体进行划分,例如Google新闻的实时热点新闻类聚,具备相同关键词或者近似实事进行推荐,给予用户良好体验,包括人体DNA图谱、关系网分析、相似用户推荐等现实的应用。

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐
所有评论(0)