数据规范化的几种方法

1. Min-Max规范化

image-20210626202001778

from sklearn import preprocessing
import numpy as np
#初始化数据,每一行表示一个样本,每一列表示为一个特征
x = np.array([
    [0.,-3.,1.],
    [3.,1.,2.],
    [0.,1.,-1.]
])
#将数据进行[0,1]规范化
min_max_scaler = preprocessing.MinMaxScaler()
minmax_x = min_max_scaler.fit_transform(x)
print(minmax_x)

2.Z-Score规范化

image-20210626202121265

from sklearn import preprocessing
import numpy as np

#初始化数据,每一行表示一个样本,每一列表示为一个特征
x = np.array([
    [0.,-3.,1.],
    [3.,1.,2.],
    [0.,1.,-1.]
])
scaled_x = preprocessing.scale(x)
print(scaled_x)

3.小数定标规范化

image-20210626202153567

from sklearn import preprocessing
import numpy as np
#初始化数据,每一行表示一个样本,每一列表示为一个特征
x = np.array([
    [0.,-3.,1.],
    [3.,1.,2.],
    [0.,1.,-1.]
])
#小数定标规范化
j = np.ceil(np.log10(np.max(abs(x))))
scaled_X = x/(10**j)
print(scaled_X)

p.max(abs(x))))
scaled_X = x/(10**j)
print(scaled_X)


Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐