kettle——实验三(对教员数据处理)
对数据进行处理
·
一、数据结构
教练员编号 driverinfoid,车辆号牌号码 hphm,教练 员性别 sex,车类型 carmodle,车颜色 carcolor,教练员生日 birth, 驾校名称 jxmc
原始数据如图:

二、实验目的
- 获得没有冗余的教练员任职信息,不考虑 createtime 字段。
- 去除含有空值的记录。
- 去除号牌号码中代表地区的汉字,仅保留车牌的字母和数字位。
- 保留车型为小型车或微型车的记录。
- 将 birth 属性保留后六位出生年月位。
三、操作步骤
3.1、步骤总览

3.2、详细步骤
3.2.1、(表输入)从MySQL导入数据
在表输入中选择新建,新建数据库连接,如下图右边:
选择所需数据后,点击预览查看导入的数据:

3.2.2、增加校验列

注意:需要修改Evaluation method,否则会添加失败,报错。
3.2.3、对数据排序(按add排序)


3.2.4、去除重复数据(按add)

3.2.5、过滤数据(去除null值)

3.2.6、按车牌分类
此处步骤如下:



3.2.7、空数据,不做处理

3.2.8、去除“贵”字



3.2.9、去除车辆类型不满足的数据

3.2.10、对新生成的hphm1改名


3.2.11、处理brith


3.2.12、移除 birth 和 all,将 birth 字改名



3.2.13、获取信息系统
不做处理


3.2.14、输出到excel


四、结果查看
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐








所有评论(0)