【学习笔记】机器学习模型指标之召回率(Recall)
公式:TP(真阳性):模型正确预测的正例FN(假阴性):模型漏检的正例(实际为真,但预测为假)核心意义:衡量模型“找全正例”的能力(避免漏检)。✅ 漏检成本高的场景:疾病筛查(癌症检测)安全监控(机场安检)法律文档检索(不能遗漏关键证据)权衡关系:↑召回率 → 可能 ↓精确率(模型更激进)↑精确率 → 可能 ↓召回率(模型更保守)调低分类阈值:让模型更“宽松”地标记正例。优化数据:对正例过采样,或
📝 召回率(Recall)
1. 核心定义
-
公式:
-
TP(真阳性):模型正确预测的正例
-
FN(假阴性):模型漏检的正例(实际为真,但预测为假)
-
-
核心意义:衡量模型“找全正例”的能力(避免漏检)。
2. 关键应用场景
-
✅ 漏检成本高的场景:
-
疾病筛查(癌症检测)
-
安全监控(机场安检)
-
法律文档检索(不能遗漏关键证据)
-
3. 召回率 vs. 精确率(Precision)
| 指标 | 关注点 | 公式 | 适用场景 |
|---|---|---|---|
| 召回率 | 查全(不漏检) | TP/(TP+FN) | 宁可误报,不可漏检 |
| 精确率 | 查准(不错检) | TP/(TP+FP) | 宁可漏检,不可误报 |
权衡关系:
-
↑召回率 → 可能 ↓精确率(模型更激进)
-
↑精确率 → 可能 ↓召回率(模型更保守)
4. 提高召回率的方法
-
调低分类阈值:让模型更“宽松”地标记正例。
-
优化数据:对正例过采样,或给FN更高惩罚权重。
-
增强特征:添加更多与正例相关的特征(如医学检测中的详细指标)。
-
换模型:使用对正例敏感的模型(如决策树、随机森林)。
5. 局限性
-
❌ 忽视误报(FP):高召回率可能伴随大量假阳性(如垃圾邮件检测误判正常邮件)。
-
❌ 依赖场景:需结合业务需求(法律场景重召回率,社交媒体审核重精确率)。
6. 实战案例
癌症检测模型:
| 预测患癌 | 预测健康 | |
|---|---|---|
| 实际患癌 | 80 (TP) | 20 (FN) |
| 实际健康 | 10 (FP) | 900 (TN) |
Recall=80/(20+80)*100%=80%
7. 综合技巧
-
结合F1分数:平衡召回率和精确率 →
-
绘制PR曲线:观察不同阈值下的性能变化。
-
业务对齐:与专家确认最低召回率要求(如医疗场景要求 ≥95%)。
✨ 一句话记忆:召回率是“宁可错杀一千,不可放过一个”的查全能力指标!
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐


所有评论(0)