2021李宏毅机器学习课程笔记——Explainable AI

I. Interpretable v.s. Powerful从某种程度来讲，可解释性与模型性能是不可兼得的。比方说，线性模型是可解释的(直接看特征的权重)，但是性能有限；深度模型不可解释，但是性能很强。从目前的现状看，大部分人还是会选择性能更强的模型，而去牺牲一些可解释性。实际上的话，大脑的工作原理我们也不清楚，但我们在许多情况下依然是可以去信任人类的决策。II. Local Explanatio

xiongxyowo

1113人浏览 · 2022-01-01 21:29:29

xiongxyowo · 2022-01-01 21:29:29 发布

注：这个是笔者用于期末复习的一个简单笔记，因此难以做到全面详细，有疑问欢迎大家在评论区讨论
https://speech.ee.ntu.edu.tw/~hylee/ml/ml2021-course-data/xai_v4.pptx

I. Interpretable v.s. Powerful

从某种程度来讲，可解释性与模型性能是不可兼得的。比方说，线性模型是可解释的(直接看特征的权重)，但是性能有限；深度模型不可解释，但是性能很强。

从目前的现状看，大部分人还是会选择性能更强的模型，而去牺牲一些可解释性。实际上的话，大脑的工作原理我们也不清楚，但我们在许多情况下依然是可以去信任人类的决策。

II. Local Explanation

通过标记出图像中模型认为"重要的"部分，从而侧面反映出模型的决策依据：
在这里插入图片描述
例如，如果模型认为图像中的耳朵，爪子，眼睛(而不是背景物件)比较重要，那么我们确实可以去相信判断这张图像是猫是有依据的。

落实到具体实现上的话，我们可以搞个滑动窗口，每次都去遮住图像中的某一块。如果遮到某个位置后对模型的决策有较大影响的话，我们就可以认为该部分是模型认为重要的部分；另一种思路类似，只不过不是遮掉某一块，而是对某一块的像素进行扰动，观察对哪些像素进行扰动会对模型结果产生较大影响，从而分析出模型认为重要的部分(注：这种思路可以得到一张Saliency Map)。

需要注意的是，对于上面我们所提到的"扰动像素"方法，存在一个比较大的问题，即"梯度并不总是能反映重要性"，由于梯度饱和的存在：
在这里插入图片描述

III. Global Explanation

这种思路更直观一些。比方说，模型能够识别一只猫，那么我们可以试图去让模型自己构造出其心目中"理想"猫的样子。具体的做法则与对抗攻击十分类似了，固定模型的参数，利用梯度反传去构造图像，唯一的一点不同在于我们这里要求构造的图像应尽可能像现实图像(不然最后生成的结果极大概率是一坨噪声)：
在这里插入图片描述

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

小参数・大码力・易部署 | Qwen3.6-27B上线魔乐社区，基于昇腾的部署教程来了

继一周前模型开源发布后，千问再度开源Qwen3.6-27B —— 一个拥有270亿参数的稠密多模态模型，也是社区呼声最高的模型规格。Qwen3.6-27B 依然支持多模态思考与非思考模式，在智能体编程方面达到了旗舰级表现，全面超越前代开源旗舰 Qwen3.5-397B-A17B（总参数397B / 激活参数17B的MoE模型）。作为稠密架构，它无需MoE路由即可部署，是开发者在实用、可广泛部署规模