有监督的神经网络模型

有监督的神经网络：ANN、DNNRNN循环神经网络和递归神经网络CNN（卷积运算、图片）Transformer没有卷积、没有池化也没有池化无监督的预训练网络RNNCNNTransformer

远在远方_hh

1275人浏览 · 2022-03-07 09:42:57

远在远方_hh · 2022-03-07 09:42:57 发布

最近想重新回顾一下深度学习一些常用的有监督的神经网络模型及原理，仅是学习记录下。

神经网络的基础模型是感知机，多层感知机（Multi-layer Percptron）简称MLP

RNN、LSTM 、Transformer

RNN

RNN循环神经网络（Recurrent Neural Networks）递归神经网络（Recurive Neural Networks）：

处理和预测（有序）序列数据，如预测股票走势。RNN有记忆能力，可模拟数据间的依赖关系

LSTM

为了增强RNN这种“记忆能力”，LSTM应运而生，用于解决长期以及远距离依赖关系

参考：循环神经网络（RNN）原理通俗解释_多元思考力-CSDN博客_循环神经网络原理

单向循环网络着重于从过去推测未来，重点就是数据之间存在依赖关系，一般首选LSTM，如果预测对象同时取决于过去和未来，可以选择双向结构，如双向LSTM

Transformer

transformer详细讲解参考：详解Transformer （Attention Is All You Need） - 知乎

transformer解决了RNN不能并行计算的缺点，顺序计算过程中会丢失信息。

CNN

参考：卷积神经网络CNN基本原理详解_woaijssss的博客-CSDN博客_cnn原理

CNN（卷积运算、图片）cnn通过多层的卷积、池化、全连接把图片降维（压缩），最终都是把一张图片转化为一维的特征向量，这个特征向量就相当于这张图片的DNA

Transformer没有卷积、没有池化也没有循环

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

替你试过了，消费级显卡可以跑的开源文生图SOTA模型，顶级渲染、高密度文本绘图

魔乐社区

量化挑战赛冠军专访：4小时啃下W4A8量化，我靠的是这些经验

魔乐社区

小参数・大码力・易部署 | Qwen3.6-27B上线魔乐社区，基于昇腾的部署教程来了

继一周前模型开源发布后，千问再度开源Qwen3.6-27B —— 一个拥有270亿参数的稠密多模态模型，也是社区呼声最高的模型规格。Qwen3.6-27B 依然支持多模态思考与非思考模式，在智能体编程方面达到了旗舰级表现，全面超越前代开源旗舰 Qwen3.5-397B-A17B（总参数397B / 激活参数17B的MoE模型）。作为稠密架构，它无需MoE路由即可部署，是开发者在实用、可广泛部署规模