数据标准化与归一化


1、(x-mean)/std为什么会改变数据的分布?
2、标准化与归一化各自的适用场景与忧缺?
3、RobustScaler 的优点?
参考答案
4、标准化的缺点——会改变数据的分布?
标准化中的均值与方差是基于所有数据计算的,包含了异常值,因此标准化后,异常值的离群特性会变得不明显;可通过RobustScaler解决;
5、为什么数据缩放后,会明显提高分类正确率?
(1) 在进行距离计算时,属性值大的那些属性会占比主导,而属性值小的属性贡献较小,因此导致各很多属性的作用被掩盖了,最终分类效果差;
6、 数据预处理方法总结

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐