一、有关机器学习基本概念介绍

1.1 什么是机器学习

①比较老的概念:

        Arthur Samuel(1959):Machine Learning: Field of study that gives computers the ability to learn without being explicitly programmed.

        赋予计算机在没有明确设置下,使计算机具有学习能力的研究领域。

②比较新的概念:

        Tom Mitchell (1998) :Well-posed Learning Problem: A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improveswith experience E.

        计算机程序从经验E中学习,解决问题一些T,进行某一性能衡量P,P所衡量的T的性能随着经验E的增加而提高

举例1:对于一次跳棋游戏来说

E:算法 VS 我 的几万次游戏

T:跳棋游戏

P:与新对手博弈的胜率

举例2:分类邮件系统垃圾问题

1.2 机器学习分类:监督学习与无监督学习

1.2.1 监督学习(Supervised Learning)

1.定义

    给算法一个数据集,其中包含了正确答案,算法的目的是为了给出更多正确的答案

2.监督学习的分类与例子

①回归问题:预测连续值的输出,例如预测房价。

图一 回归问题举例:预测房价

     上图为不同面积房子的房价,假设你有一个750英尺的房子,他打算卖掉这个房子,他能卖多少钱?

      机器学习能做什么?用线性函数拟合数据(150)或用二次函数或多项式拟合数据(200),或用更高阶的函数拟合(?)。选择一个拟合最合适的值作为预估房价。

②分类问题:预测离散值输出,例如判断肿瘤是良性还是恶性。 

    上图为肿瘤不同大小是否为良性,假设你的对头有一块肿瘤,怎么判断肿瘤是良性还是恶性?(0/1)

1.2.2 无监督学习(Unsupervised Learning)

1.定义

      无监督学习是不知道数据具体的含义,比如给定一些数据但不知道它们具体的信息,对于分类问题无监督学习可以得到多个不同的聚类,从而实现预测的功能。

       举例:

①google中新闻的分类:将新闻分类为军事板块、娱乐板块、要闻板块.....

②社交系统分析:通过聊天记录分析熟悉的人模块

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐