业务来源:职工离职、用户流失这类问题一直是一个事后现象,如何提前预测出离职员工或流失用户就显得很重要。

脑图

分为两部分:一部分为现状分析,另一部分为算法预测
在这里插入图片描述

第一部分:在离职情况分析

1.数据采集
在职人员信息:20000+
选取特征【工号 所在机构 各部门 薪资水平 职级 性别 省份 进公司时间…】
离职人员信息:8000+
选取特征增加离职原因,离职时间两项
2.数据处理
【异常值替换】:
像进公司时间比公司成立还早的,这种根据工号的一个分布情况,统一替换成2016年。
像工作年限超出公司存在的时间,这个也是脏数据,数量不多,用平均工作年限替换。
3.python数据二次处理及简单出图

**常用开头**
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False #用来正常显示负号
import seaborn as sns
%matplotlib inline

看看整体情况

df=pd.read_csv('quit1.csv')
df.info()

在这里插入图片描述
处理时不小心把学历命名成专科,改正回来

df.rename(columns={ '专科':'学历'}, inplace = True)
df.head()

简单看看前5行数据是否有问题
在这里插入图片描述
利用describe 简单看看数据情况,最大最小值、标准差、分位数等等

df.describe()

在这里插入图片描述
从上表可以简单看出

平均进公司时间是在2010年,离职时间是在2013年。
平均薪资水平是在1.13级,处在职员往专员晋升的这一年,反映出职工在第3至第4年,离职意向比较强烈。

继续看看箱线图,看看数据偏出情况

fig,ax = plt.subplots(1,5, figsize=(15, 2))
sns.boxplot(x=df['薪资水平'], data=df, ax=ax[0])
sns.boxplot(x=df['进公司时间'], data=df, ax=ax[1])
sns.boxplot(x=df['离职时间'], data=df, ax=ax[2])
sns.boxplot(x=df['工作年限'], data=df, ax=ax[3])
sns.boxplot(x=df['年龄'], data=df, ax=ax[4])

在这里插入图片描述

离职时间、薪资水平数据干净,可依据度比较高。
而离职人员工作年限普遍集中在职场生活刚开始阶段20-30岁这个年龄段,超过40岁之后基本没什么人离职。也符合实际结论。

相关性判断
当特征维度比较多时,我们很难逐一去判断,各个维度之间的关系,以下两个相关系数就显得十分重要。

皮尔逊相关系数:两个变量均是连续型且具有线性关系。
斯皮尔曼相关系数:两个变量属于离散值时使用

数据中含有薪资水平1、2、3档这种离散值,分析互相影响系数,要用斯皮尔曼相关系数。

corr=df.corr(method='spearman')
fig=plt.figure(figsize=(10,8))
sns.heatmap(corr,vmax=1,linewidths=0.01,
          square=True,annot=True, cmap='viridis',linecolor='white')
plt.title('互相影响度')
plt.show()

在这里插入图片描述
颜色越深相关度越高,其中正值表示正相关,负值表示负相关。绝对值越大越相关。

薪资水平和工作年限、年龄有一定的正相关。
进公司时间和工作年限、年龄负相关,表示着年龄越大、工作年限越长,越难进来,其实是因为我们主要招和培养自己的应届毕业生。

4.bi出图
先看完整的画报
左上角是比较重要的人均年龄、工作年限、性别占比
左下角是部门离职人数的高低排名
右上平均年龄与时间的个趋势关系
中上是公司的整体各分公司的情况
中下是离职的学历随着时间的变化情况
右下是离职人员省份分析
在这里插入图片描述
大致的分析一下,职工都是因为什么因素选择离职
在这里插入图片描述

1、92%的人是个人提出辞职的,单位辞退部分占到4.4%。
2、 其中1824的人离职因素是因为家庭因素,1140人是因为职业规划,941人是因为工作环境,835人是因为健康不佳。
3、薪酬问题相对较少,而职业规划居多,说明公司的岗位晋升这一块做的不好,也说明公司中高层的待遇还是不错的,不过离家远是大家离职的最大原因。

5.总结
1、整体离职率是在25.90%。其中分公司1离职率最高,达到49.8%。在这里插入图片描述
2、男女比例接近3:2,男性平均在35.6岁,工作第3.7年离职,女性平均在32.2岁,工作第3.4年离职在这里插入图片描述
3、发现福州分公司的人员最快离职,平均在2.89年就离职,明明很快就能晋升专员,却选择离职,反映出可能晋升人员数量受到限制,升职无望选择离职。
在这里插入图片描述
4、离职趋向年轻化

2010年开始到现在的10年间,我们职工的平均离职时间趋向年轻化,为排除疫情的干扰,2019年的年龄平均,男30.19岁、女27.13岁。
说明我们可能在青年的绩效激励的竞争度有下降了、在岗位晋升的体系等都有待改善!
在这里插入图片描述

5、5年来本科生的离职率居高不下。
2019年离职人数中本科生达到453人,接近50%,即每两个离职的人中有一个是有比较高学历的人才。
在这里插入图片描述
6、看看都是哪些省份的职工离职!
福建第一、山东、江苏、河南、四川估计也是因为行业性质,这里不方便多说。
在这里插入图片描述

保持渴求,不要沉寂

在这里插入图片描述

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐