河南大学机器学习与数据挖掘——第一章 绪论
1、机器学习的目标是使学得的模型能很好地适用于新样本,而不是仅仅在训练样本上工作得很好,学得模型适用于新样本的能力,称为______泛化:学得模型适用于新样本的能力(具有强泛化能力的模型能很好地应用于整个样本空间)线性回归、对数几率回归、决策树、支持向量机、贝叶斯分类器、神经网络。机器学习致力于研究如何通过计算的手段,利用经验来改善系统自身的性能。:用来描述样本属性的输入数据,是模型用来“理解问题
-
机器学习的定义
机器学习致力于研究如何通过计算的手段,利用经验来改善系统自身的性能。
经验在计算机系统中通常以数据的形式存在。
机器学习研究的主要内容是关于在计算机上从数据中产生模型的算法,即学习算法。
-
根据训练数据是否拥有标记信息,将学习任务分为监督学习和无监督学习。
-
监督学习:分类和回归
线性回归、对数几率回归、决策树、支持向量机、贝叶斯分类器、神经网络
-
无监督学习:聚类
聚类算法:
-
原型聚类:
-
k均值
-
学习向量量化
-
高斯混合聚类
-
-
密度聚类
-
层次聚类
-
降维,话题分析,图分析...
-
-
-
术语
-
泛化:学得模型适用于新样本的能力(具有强泛化能力的模型能很好地应用于整个样本空间)
-
假设空间数量 =(种类+通配)+ 极端
-
-
应用场景
天气预报,能源勘探,环境监测。
无人驾驶技术:自动驾驶汽车、物流运输、公共交通等领域,提升效率和安全性。
测试题
一、填空
1、机器学习的目标是使学得的模型能很好地适用于新样本,而不是仅仅在训练样本上工作得很好,学得模型适用于新样本的能力,称为______泛化_______。
2、根据_______训练数据是否拥有标记信息________,学习任务可以大致分为监督学习和无监督学习。
二、简答
1、如何定义机器学习?
机器学习致力于研究如何通过计算的手段,利用经验来改善系统自身的性能
2、解释机器学习术语:什么是特征,什么是标签。
-
特征(Feature):用来描述样本属性的输入数据,是模型用来“理解问题”的信息。
-
标签(Label):是每个样本对应的输出结果或答案,是模型需要学习预测的目标。
3、最常见的两种监督学习任务是什么?
监督学习和无监督学习

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐
所有评论(0)