b1b56bae1491c65ba193f7e9fab3d431.png

系列文章总目录:Python数据分析及可视化实例目录


1ee84fdf30a3e6c67077134767a2e966.png

1.项目背景:

银行体系对于信用可违约进行预测,原始数据集如下:

987e34d6b4947ed383ca819c5e914c42.png

2.分析步骤:

(1)数据清洗(Data Cleaning)

(2) 探索性可视化(Exploratory Visualization)

(3) 特征工程(Feature Engineering)

(4)基本建模&评估(Basic Modeling& Evaluation)

3.源码:

数据集下载:

易一网络科技 - 付费文章​www.intumu.com

加载数据

import 

年龄 教育 工龄 地址 收入 负债率 信用卡负债 其他负债 违约 0 41 3 17 12 176 9.3 11.359392 5.008608 1 1 27 1 10 6 31 17.3 1.362202 4.000798 0 2 40 1 15 14 55 5.5 0.856075 2.168925 0 3 41 1 15 14 120 2.9 2.658720 0.821280 0 4 24 2 2 0 28 17.3 1.787436 3.056564 1

是否有空值

df

目标集分类

df

训练集、目标集分割

X

特征相关性

classes 

c99385eb20c1809b7a58d918b9df2e9e.png

特征重要性

from 

5b51df32a9dab663257baaae91d3a99b.png

分类报告

训练集、测试集分割

from 

分类结果报告

from 

b9b9832492b0deb3bbea6245a3d03fd8.png

持久化保存

from 

载入训练模型

model 

老鸟可去另一专栏:Python中文社区

新手可查阅历史目录:

yeayee:Python数据分析及可视化实例目录​zhuanlan.zhihu.com
28f7d17113706eebdda22c30569ad6b6.png

0b9752166310aa3f4179f69fe6276084.png

最后,别只收藏不关注哈

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐