📝 召回率(Recall)


1. 核心定义
  • 公式

                      Recall=\frac{TP}{TP+FN}
    • TP(真阳性):模型正确预测的正例

    • FN(假阴性):模型漏检的正例(实际为真,但预测为假)

  • 核心意义:衡量模型“找全正例”的能力(避免漏检)。


2. 关键应用场景
  • ✅ 漏检成本高的场景:

    • 疾病筛查(癌症检测)

    • 安全监控(机场安检)

    • 法律文档检索(不能遗漏关键证据)


3. 召回率 vs. 精确率(Precision)
指标 关注点 公式 适用场景
召回率 查全(不漏检) TP/(TP+FN)​ 宁可误报,不可漏检
精确率 查准(不错检) TP/(TP+FP)​ 宁可漏检,不可误报

权衡关系

  • ↑召回率 → 可能 ↓精确率(模型更激进)

  • ↑精确率 → 可能 ↓召回率(模型更保守)


4. 提高召回率的方法
  • 调低分类阈值:让模型更“宽松”地标记正例。

  • 优化数据:对正例过采样,或给FN更高惩罚权重。

  • 增强特征:添加更多与正例相关的特征(如医学检测中的详细指标)。

  • 换模型:使用对正例敏感的模型(如决策树、随机森林)。


5. 局限性
  • ❌ 忽视误报(FP):高召回率可能伴随大量假阳性(如垃圾邮件检测误判正常邮件)。

  • ❌ 依赖场景:需结合业务需求(法律场景重召回率,社交媒体审核重精确率)。


6. 实战案例

癌症检测模型

预测患癌 预测健康
实际患癌 80 (TP) 20 (FN)
实际健康 10 (FP) 900 (TN)

Recall=80/(20+80)​*100%=80%


7. 综合技巧
  • 结合F1分数:平衡召回率和精确率 →F1=\frac{2*P*R}{P+R}

  • 绘制PR曲线:观察不同阈值下的性能变化。

  • 业务对齐:与专家确认最低召回率要求(如医疗场景要求 ≥95%)。


✨ 一句话记忆:召回率是“宁可错杀一千,不可放过一个”的查全能力指标!

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐