深度学习分类：交叉熵

补充一个深度学习分类重要的概念：交叉熵

︶ㄣ释然

1625人浏览 · 2024-08-26 07:00:00

︶ㄣ释然 · 2024-08-26 07:00:00 发布

补充一个深度学习分类重要的概念：交叉熵
交叉熵 (Cross Entropy) 是一种衡量两个概率分布之间差异的损失函数，常用于机器学习和深度学习中的分类问题。其基本思想是衡量真实分布与预测分布之间的不一致性。

交叉熵的数学定义

如果我们有一个目标分布 $p (x)$ 和一个预测分布 $q (x)$ ，它们在同一个事件空间上定义，那么交叉熵 $H (p, q)$ 可以定义为：
$-\sum_x p(x) \log q(x)$
在机器学习中，尤其是分类任务中，目标分布 $p (x)$ 通常是一个真实的分布，即用 $i$ 代表的 one-hot 编码的分类标签，而预测分布 $q (x)$ 是模型输出的概率分布。交叉熵可以被用来衡量模型预测的概率分布和真实分布之间的距离。

二分类问题中的交叉熵

对于二分类问题，目标可以是 $\in \{0, 1\}$ ，模型输出的是预测的概率 $y^\hat{y}$ 。交叉熵损失函数可以表示为：
$Loss=−[ylog⁡(y^)+(1−y)log⁡(1−y^)]\text{Cross-Entropy Loss} = -[y \log(\hat{y}) + (1-y) \log(1-\hat{y})]$

多分类问题中的交叉熵

在多分类问题中，假设有 $C$ 个类，真实标签 $y$ 是 one-hot 编码形式，即对于正确类别 $y_i=1$ ，其他类别 $y_i=0$ 。交叉熵损失函数是一个包含 $C$ 项的和。此时交叉熵损失函数为：
$Loss=−∑i=1Cyilog⁡(yi^)\text{Cross-Entropy Loss} = -\sum_{i=1}^C y_i \log(\hat{y_i})$
其中，只有与正确类别对应的那一项会有贡献，因为其他类别的 $y_i=0$ 。

交叉熵的作用

在训练分类模型时，交叉熵损失函数用于衡量模型预测的概率分布与真实分布之间的差异。因此，交叉熵是优化模型参数的重要目标函数，其目的是最小化预测分布与真实分布之间的差异。
总结来说，交叉熵是一种用于衡量分类模型输出与真实分布之间差异的损失函数，它在机器学习中的分类任务中起着关键作用。

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

Pont - 搭建前后端之桥：高效、灵活的接口管理工具

Pont 是一款强大的数据服务层解决方案，它能够帮助开发者快速搭建前后端之间的桥梁，实现接口的高效管理和代码自动生成。无论是新手还是有经验的开发者，都能通过 Pont 轻松处理接口文档、生成类型安全的 API 代码，从而显著提升开发效率。[![Pont 工具标志](https://raw.gitcode.com/gh_mirrors/po/pont/raw/3f1b7d4bbba3fd2dda

魔乐社区

如何快速上手 hvac：HashiCorp Vault Python 客户端零基础入门指南

**hvac** 是 HashiCorp Vault 的 Python 3.X 客户端库，专为开发者提供简单高效的 Vault 交互方式。无论你是需要管理密钥、配置身份验证，还是实现安全的秘密数据存储，hvac 都能帮助你轻松搞定 Vault 的各项操作。本文将带你零基础快速入门，从安装到基础操作，让你在几分钟内即可上手使用这个强大的工具。[![hvac 客户端 Logo](https://r

魔乐社区

提升Angular2-HN性能的7个实用技巧：让新闻加载速度飞起来

Angular2-HN是一款基于Angular构建的Progressive Hacker News客户端，专为追求高效新闻浏览体验的用户设计。本文将分享7个实用技巧，帮助你优化Angular2-HN的性能，让新闻加载速度显著提升，带来更流畅的阅读体验。## 1. 启用Service Worker缓存关键资源Service Worker是提升Angular应用性能的强大工具，它可以在后台缓存