VectorAssemble是将给定列列表组合成单个向量列的转换器。为了训练逻辑回归和决策树等ML模型,将原始的多个特征列组合成一个特征向量是很有用的。VectorAssemble将接受一下的输入列类型:所有数值类型、布尔类型和向量类型。在每一行中,输入列的值将按照指定的顺序连接到一个向量中。

示例:

以下是我的一些项目模拟数据
原始数据集:
在这里插入图片描述
处理后的数据集:
在这里插入图片描述

VecotrAssemble代码实现:

//num_fmt为原始数据集
val va = new VectorAssembler()
.setInputCols(Array("province_id","city_id","district_id","sex","marital_status","education_id","vocation","position","compId","mslevel","reg_date","lasttime","age","user_score","logincount","buycount","pay"))
      .setOutputCol("orign_feature")
val ofdf = va.transform(num_fmt).select("cust_id","orign_feature")
ofdf.show(false)
Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐