对cox模型的解释(SHAP VS 列线图算法)

使用我自己摸索的列线图算法以及SHAP分析两种解释工具来解释同一个COX模型,对比一下两者的相似点和区别,或许能够让我们对模型和解释工具都有更加深刻的认识。

这是使用同一个数据集,来比较全局性解释,使用同一个个案的数据,来比较局部性解释,看两种解释方法之间有什么区别和联系。

全局性解释

  1. 列线图算法
    排名前三位的是血清钠水平、年龄和射血分数,两个是反比例关系(值增加,心衰危险程度减低),一个是正比例关系(值增加,心衰危险程度增加)。血清钠和年龄之间相差约两倍。
    在这里插入图片描述
  2. SHAP分析
    前三位是血清肌酐、射血分数和年龄。血清钠和射血分数也展现出反比例关系,年龄是正比例关系。
    在这里插入图片描述
    在这里插入图片描述

局部性解释

个案数据:

{'age':60,'anaemia':1,'creatinine_phosphokinase':40,'diabetes':1,'ejection_fraction':50,'high_blood_pressure':1,'serum_creatinine':1,'serum_sodium':120,'sex':1,'smoking':1}

1.列线图算法
对于这个个案来说,血清钠和射血分数目前的值是负向的贡献,年龄是正向的贡献?
在这里插入图片描述
2. SHAP分析
血清钠目前的值是正向贡献,射血分数、血清肌酐和年龄目前的值是负向贡献。
在这里插入图片描述

最后

对比来说,这两种解释方式得到的结果有相似的地方也有矛盾的地方,特别是局部性解释。一时间如何看待这两种解释方法,以及他们之间的矛盾,一时还没有思路,留待以后更新。

以上内容涉及的项目代码:
shap分析:https://www.heywhale.com/mw/project/62fb7e20738412246385df09/content
列线图分析:https://www.heywhale.com/mw/project/67c142b8bc2e1697195987c9

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐