机器学习中为什么要用混合精度训练

EEE 754标准：FP64遵循该国际标准，用 64位（8字节）存储一个浮点数。显存（Video RAM，简称 VRAM）是显卡（GPU）专用的内存。FP32（单精度浮点）：传统深度学习默认使用32位浮点数。双精度浮点（FP64）占。

十子木

302人浏览 · 2025-06-27 23:43:11

十子木 · 2025-06-27 23:43:11 发布

FP16与显存占用关系

显存（Video RAM，简称 VRAM）是显卡（GPU）专用的内存。

FP32（单精度浮点）：传统深度学习默认使用32位浮点数

每个参数占用`4字节`

例如：1亿参数的模型 → 约400MB显存

FP16（半精度浮点）：

每个参数占用`2字节`（直接减半）

相同模型 → 约200MB显存

双精度浮点（FP64）占 8字节。
EEE 754标准：FP64遵循该国际标准，用 64位（8字节）存储一个浮点数

机器学习中一般使用混合精度训练：FP16计算 + FP32存储关键变量。

混合精度方案的解决方式：

关键部分保留FP32：

    模型权重在优化时会保留FP32副本（主权重）

    损失计算使用FP32

非关键部分使用FP16：

    前向传播的中间激活值

    反向传播的梯度

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

揭秘易开发核心功能：页面信息提取与无障碍服务配置详解

易开发（DeveloperHelper）是一款专为Android开发者打造的快速开发工具，核心功能包括界面分析、页面信息提取、加固脱壳等，完美支持Android 9.0系统。本文将深入解析其两大核心功能——**页面信息提取**与**无障碍服务配置**，帮助开发者快速掌握使用技巧，提升开发效率。## 一、无障碍服务：易开发的核心引擎 🚀无障碍服务是易开发实现界面分析的基础，通过系统级别的

魔乐社区

pry-rails源码探秘：Rails控制台增强插件的实现原理

pry-rails是一款为Rails >= 3应用提供Pry控制台支持的增强插件，它通过替换默认的IRB控制台，为开发者带来更强大的交互式编程体验。本文将深入剖析pry-rails的实现原理，帮助开发者理解其工作机制和核心功能。## Railtie：Rails集成的核心pry-rails的核心集成逻辑位于[lib/pry-rails/railtie.rb](https://link.git

魔乐社区

CameraManager性能优化：提升iOS相机应用响应速度的10个技巧

CameraManager是一款简单易用的Swift类库，专为iOS开发者打造，提供了创建自定义相机视图所需的全部配置。在移动应用开发中，相机功能的响应速度直接影响用户体验，本文将分享10个实用技巧，帮助你优化CameraManager的性能，打造流畅的相机应用。### 1. 合理设置会话预设（Session Preset）会话预设直接影响相机的分辨率和性能消耗。在`Sources/Came