feature_selection.SelectKBest(score_func=<function f_classif>, *, k=10)

根据k个最高的分数(根据选择算法得出的分数)来选择k个特征

一般选择与输出值相关性最大的k个特征,选择算法涉及到统计学知识
该类的作用是创建一个特征选择器,特征的选择和返回需要fit_transform()函数

主要类方法

fit_transform

拟合数据,在该过程中寻找与标签值相关性最大的k个特征并返回
fit_transform(X, y=None, **fit_params)

一般使用格式

selector=SelectKBest(k=2)	# 创建一个选择器
x_new=selector.fit_transform(x,y)	# 选择器先拟合数据,选择出与标签值相关性最大的k个特征,将这些特征的整列返回作为一个新的ndarray
Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐