最近,AI太火了,不仅连我姥姥都知道DeepSeek了,而且背后用的这两大AI秘密武器(深度学习、强化学习)也分别获了大奖。

1)AI秘密武器:深度学习

2024的诺贝尔物理学奖颁给了神经网络之父(霍普菲尔德)和深度学习之父(辛顿),以表彰他们在使用人工神经网络的机器学习方面的基础性发现和发明。

2)AI秘密武器:强化学习

2025年AI科学家的最高荣誉-图灵奖,颁给了强化学习之父萨顿和他的博导巴托。

AI技术爆炸的时代,这些术语到底是啥?

今天咱们用大家都能懂的方式,用既深入又肤浅的语言,聊聊"AI全家桶"。

AI、机器学习、强化学习、深度学习之间是什么关系呢?

通过这张图你就可以直观的理解“AI全家桶”中它们之间的关系,下面我来详细解释这张图。

一、AI

AI(Artificial Intelligence)也叫人工智能,指通过计算机实现人的头脑思维,使机器像人一样去解决问题。

那怎么实现AI呢?这就要用到机器学习了。

二、机器学习

机器学习是实现AI的一种技术,它是让计算机通过特定的算法,自己去学习知识。这样计算机就能从大量数据中发现规律,从而做出预测。

比如,我们想让计算机从这一堆图片中认出哪个是苹果?

让计算机识别图片的过程,其实和训练小孩识图是一样的。 

 我们会给计算机输入大量图片数据, 这些图片既包括苹果,也包括梨、香蕉等其他物体。  

然后,让这些数据使用机器学习算法来训练计算机。  

帮助计算机搞明白照片里有啥特征,像苹果的颜色、形状等等。  

经过这个训练过程,计算机就学习到了图片中的知识。  当你再给它一张新的图片,让它判断是苹果还是梨,它就能根据学过的知识,给出答案。

这个训练好的,学到了知识的计算机,我们把它叫做模型。

所以你看,机器学习本质上是通过大量数据,使用特定算法,训练出能够完成特定任务的模型。

为了让这个模型成为AI,也就是像人类一样思考。

现在AI模型常使用的机器学习算法是:深度学习、强化学习。  

比如Deepseek R1模型,背后就是用的深度学习、强化学习这两种机器学习算法。

三、深度学习

我们先来看什么是深度学习。

在研究AI的过程中,科学家受到人脑神经网络的启发,设计出了人工神经网络。

这个人工神经网络,就像是一个由很多“小零件”搭成的复杂系统,这些“小零件”叫神经元。 

这些神经元就像人脑神经元,它们之间一层一层连接起来处理数据。

比如,我们想让计算机从这一堆图片中认出哪个是狗?

那计算机用神经网络是怎么来识别的呢?

就像给小朋友识图一样,我们会给神经网络在输入层输入大量图片。然后,这些数据会经过好多层(隐藏层),每经过一层,计算机就会做一些复杂的计算。

这些计算,可以帮助计算机搞明白照片里有啥特征,像狗的耳朵长啥样、眼睛什么样等等。  最后,计算机在输出层会给出一个结果,告诉我们,它判断这张照片里是不是有狗。

当然,除了用神经网络判断图片中是否有狗,还可以判断是否有猴子(偷笑)。

这样计算机就可以通过神经网络,从海量的数据中学习到知识,从而完成复杂的任务。基于(深度)神经网络,从大规模的数据中学习的过程,就是深度学习。

四、强化学习

了解了AI的第一大武器深度学习以后,现在我们来看AI的第二大武器:强化学习。

什么是强化学习呢?

强化学习很像人类训狗的过程。起初,小狗会自由随意地做出各种动作。 

但是,在与训犬师不断互动的过程中,它慢慢察觉到,做出一些特定动作能得到美味的食物, 而有些动作甚至会招来惩罚。

小狗仔细观察动作和奖惩之间的关联,根据奖励或惩罚这些反馈,小狗逐渐学会做出能获得更多奖励的行为。

渐渐地,它的行为表现,越来越符合训犬师的预期 。 

知道了训狗的过程,你就大概明白了什么是强化学习。

强化学习就是让主体(如程序、机器人等)在环境中不断尝试各种行为,环境会根据主体的行为,来给出奖励或惩罚等反馈。

根据这些反馈,让主体逐渐学会做出能获得更多奖励、实现特定目标的决策 。

五、总结

回顾下,通过这张图,我们可以直观的理解AI全家桶之间的关系:

1.AI

AI(Artificial Intelligence)也叫人工智能,指通过计算机实现人的头脑思维,使机器像人一样去解决问题。

2.机器学习

机器学习本质上是通过大量数据,使用特定算法,训练出能够完成特定任务的模型。

3.深度学习

基于(深度)神经网络,从大规模的数据中学习的过程,就是深度学习。

4.强化学习  

强化学习是让主体(如程序、机器人等)在环境中不断尝试各种行为,环境会根据主体的行为,来给出奖励或惩罚等反馈。

根据这些反馈,让主体逐渐学会做出能获得更多奖励、实现特定目标的决策 。

大名鼎鼎的谷歌DeepMind的首席研究科学家(David Silver),曾说过,AI=深度学习+强化学习。

这也是为什么,深度学习之父和强化学习之父分别获得了诺贝尔奖和图灵奖。

想要训练出AI大模型,一般分为两个阶段。第一个阶段是预训练,第二个阶段是微调。

那什么是预训练?什么是微调?预知后事如何,且听下回分解。

觉得好的话,点个爱心和关注支持下我哦!


在AI智能时代,真正的铁饭碗不是某个职位,而是你快速驾驭新技术的能力!

在这个被AI重塑的世界里,Python早已不是程序员的专属,而是职场人、创业者、学生甚至跨界者的"硬通货",Python正在成为撬动高薪机会的超级杠杆,为什么这么说?

✅ AI工具再强大,不懂代码依然只能做"表面玩家"

✅ 数据分析、自动化、AI模型部署…Python是打通技术落地的核心语言

✅ 未来3年,懂Python的复合型人才薪资溢价预计超40%

我的《AI核心技术Python》视频课专为追赶时代的你设计,现在报名享早鸟价,别等被AI淘汰后才后悔

点击加入社群一起学习《AI核心技术Python》

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐