神经网络算法--文搞懂ANN(人工神经网络)

本文将从生物神经网络、人工神经网络、神经网络训练、分类与应用四个方面，带您一文搞懂人工神经网络ANN

Cc不爱吃洋葱

3024人浏览 · 2024-08-14 11:48:20

Cc不爱吃洋葱 · 2024-08-14 11:48:20 发布

本文将从生物神经网络、人工神经网络、神经网络训练、分类与应用四个方面，带您一文搞懂人工神经网络ANN。

一、生物神经网络

基本定义：

百度百科： 生物神经网络（Biological Neural Networks）一般指生物的大脑神经元，细胞，触点等组成的网络，用于产生生物的意识，帮助生物进行思考和行动。
维基百科：生物神经网络（Biological Neural Networks）是指生物体内一群由突触相互链接的特定神经元群体，其负责传递、执行一项特定功能，并与其他神经回路共同构筑大脑更高阶的神经网络，并产生个体的意识，协助生物进行思考和行动。

大脑神经元：

输入整合：神经元整合来自其他神经元和外部刺激的信号。
阈值触发：达到阈值时，神经元触发动作电位。
权重调整：连接强度可学习调整。
信息存储与传输：神经元负责存储和传输信息，支持生物的感知、思考和行为。
神经网络组成：多个神经元以特定方式连接形成神经网络。

大脑神经元结构

二、人工神经网络

基本定义：

百度百科： 人工神经网络（Artificial Neural Network，即ANN ），是20世纪80 年代以来人工智能领域兴起的研究热点。它从信息处理角度对人脑神经元网络进行抽象，建立某种简单模型，按不同的连接方式组成不同的网络。在工程与学术界也常直接简称为神经网络或类神经网络。
维基百科： 人工神经网络（artificial neural network，ANN）简称神经网络（neural network，NN）或类神经网络，在机器学习和认知科学领域，是一种模仿生物神经网络（动物的中枢神经系统，特别是大脑）的结构和功能的数学模型或计算模型，用于对函数进行估计或近似。

基本原理：

人工神经网络结构

圆形节点与人工神经元：

在人工神经网络中，每个圆形节点代表一个人工神经元。
这些神经元通过特定的连接方式相互交互，模拟生物神经网络的工作原理。

连接与信号传递：

箭头表示从一个神经元的输出到另一个神经元的输入的连接。
通过这些连接，信号可以在网络中传递，从一个人工神经元传递到另一个。

权重与激励函数：

每个节点都代表一种特定的输出函数，称为激励函数。
每两个节点间的连接都有一个与之相关的权重值，表示前一个神经元对后一个神经元的影响程度。

网络输出：

网络的输出会根据网络的连接方式、权重值以及激励函数的不同而变化。
通过调整这些参数，人工神经网络能够学习和适应不同的输入模式，产生预期的输出结果。

三、神经网络训练

训练步骤：

前向传播：

输入数据从输入层开始，逐层通过隐藏层传递。
每一层都使用激活函数进行非线性转换。
最终，输出层生成预测结果。

计算误差：

将预测结果与真实标签比较，计算误差（如均方误差或交叉熵损失）。

反向传播：

使用反向传播算法，将误差从输出层逐层反传至输入层。
在此过程中，计算每一层的梯度（误差对权重和偏置的偏导数）。

梯度下降：

根据计算得到的梯度，使用梯度下降或其他优化算法更新权重和偏置。
目标是最小化误差函数，通过逐步调整权重和偏置来改善网络性能。

迭代更新：

重复上述步骤，直到满足停止准则（如达到最大迭代次数或误差小于预设阈值）。

核心算法：

激活函数：

作用：决定神经元是否“激活”或“触发”。
常见类型：ReLU、Sigmoid、Tanh等。
重要性：增加网络的非线性，使其能学习复杂模式。

反向传播：

作用：神经网络中权重更新的核心算法。
过程：计算输出层与真实值之间的误差，并反向逐层传递误差，更新权重。
重要性：使网络能基于误差进行自我调整，逐渐逼近目标函数。

梯度下降：

作用：优化算法，用于在训练过程中最小化损失函数。
过程：计算损失函数的梯度，并沿梯度的反方向逐步更新网络参数。
重要性：使网络参数逐渐趋近于损失最小的点。

四、分类与应用

算法分类：

前馈神经网络 (Feedforward Neural Networks，FNN)

特点：数据单向流动，从输入层到输出层。多层网络结构，每层神经元只接收前一层的输出作为输入。
应用：感知器、多层感知器、逻辑回归等。

循环神经网络 (Recurrent Neural Networks，RNN)

特点：具有循环结构，能够处理序列数据和时序依赖关系。神经元的输出可以作为自身的输入，记忆先前状态的信息。
应用：文本生成、语音识别、机器翻译等。

卷积神经网络 (Convolutional Neural Networks，CNN)

特点：适用于处理图像、视频等二维或三维数据。通过卷积层捕捉局部特征，池化层进行下采样，减少参数数量。
应用：图像识别、目标检测、图像生成等。

长短期记忆网络（Long Short-Term Memory Networks，LSTM）

特点：解决长期依赖问题，通过引入记忆单元和门控机制来控制信息的流动。
应用：语音识别、文本生成、情感分析等。

生成对抗网络 (Generative Adversarial Networks，GANs)

特点：结合了生成模型和判别模型的思想，用于生成新的、与真实数据相似的数据。
应用：图像生成、视频生成和语音合成等领域有所应用。

实际应用：

图像处理与识别

图像分类：使用卷积神经网络（如VGG、ResNet）对ImageNet等大型图像数据集进行分类，达到人类级别的准确度。
图像生成：GANs（生成对抗网络）用于生成逼真的人脸、风景等图像。

语音处理与识别

语音识别：RNN和LSTM在语音到文本转换中的应用，如Google的语音识别技术。
语音合成：WaveNet等模型用于生成自然的人类语音。

自然语言处理

文本分类：使用RNN或Transformer结构对文本进行情感分析、主题分类等。
机器翻译：Google NMT（神经机器翻译）使用Transformer结构进行高质量的文本翻译。

如何系统的去学习大模型LLM ？

大模型时代，火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业？”“谁的饭碗又将不保了？”等问题热议不断。

不如成为「掌握AI工具的技术人」，毕竟AI时代，谁先尝试，谁就能占得先机！

但是LLM相关的内容很多，现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学，学习成本和门槛很高

针对所有自学遇到困难的同学们，我帮大家系统梳理大模型学习脉络，将这份 LLM大模型资料 分享出来：包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴，可以 扫描下方二维码领取🆓↓↓↓

👉[CSDN大礼包🎁：全网最全《LLM大模型入门+进阶学习资源包》免费分享（安全链接，放心点击）]()👈

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

从理论到SAS实操：医学统计学高频考点思维导图（含结果解读模板）

本文针对医学统计学学习与应用的痛点，提供了一套从理论到SAS实操的完整解决方案。通过高频考点思维导图，系统梳理了假设检验、线性回归、生存分析和诊断试验评价四大核心模块的逻辑框架与SAS代码实现，并附有可直接套用的结果解读模板，助力医学生和研究者高效掌握数据分析与报告撰写技能。

魔乐社区

解决Dbeaver连接人大金仓的常见问题：JDBC驱动配置避坑指南

本文详细解析了使用Dbeaver连接人大金仓数据库时常见的JDBC驱动配置问题。针对驱动类名、URL模板、默认端口等关键配置项，提供了精确的填写指南和验证方法，并重点阐述了如何通过Maven仓库或官方渠道正确获取驱动库文件，以彻底解决“ClassNotFoundException”等典型连接失败错误。