1. 需求说明

    某公司人事工作人员为了对来聘人员信息进行分析,以聘用适合计算机岗位的人员,调用了计算机岗位来聘人员信息表(hr_job.csv),其部分数据如表1所示。数据包括来聘人员的编号、性别、相关经验、受教育水平和换工作的次数等信息。

表1  来聘人员信息表部分数据

应聘人员ID

性别

相关经验

教育水平

工作次数

11561

大学

5

33241

大学

0

21651

大学

11

28806

高中

5

402

大学

13

2. 作业要求

    经观察发现,数据存在缺失值等异常数据,因此需要对数据进行预处理,其主要步骤如下。请根据操作步骤通过Pandas函数进行实现,并返回运行结果截图

(1)读取来聘人员信息数据。

(2)将分类数据中的缺失值填补为“未知”,将数值型缺失值填补为其对应特征的均值。

(3)对所有的分类数据进行哑变量处理。

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐