Python数据分析(三)——数据预处理
写这篇文章的原因是在很多程序时都会出现数据集预处理,为什么要进行数据归一化,为什么要规约,这些困扰很久,今天就数据集预处理总结比较的好的博客文章搬过来。https://gofisher.github.io/2018/06/22/%E6%95%B0%E6%8D%AE%E9%A2%84%E5%A4%84%E7%90%86/规范化数据规范化(归一化)处理是数据挖掘的一项基础工作。...
·
写这篇文章的原因是在很多程序时都会出现数据集预处理,为什么要进行数据归一化,为什么要规约,这些困扰很久,今天就数据集预处理总结比较的好的博客文章搬过来。
https://gofisher.github.io/2018/06/22/%E6%95%B0%E6%8D%AE%E9%A2%84%E5%A4%84%E7%90%86/
规范化
数据规范化(归一化)处理是数据挖掘的一项基础工作。不同评价指标往往具有不同的量纲, 数之间的差别可能很大,不进行处理会影响到数据分析的结果。为了消除指标之间的量纲和取值范围差异的影响,需要进行标准化处理,将数据按照比例进行缩放,使之落入特定的区域,便于进行综合分析。
- 把数据映射到[0,1]的区间中。
- 把有量纲形式变成无量纲形式 。
-
常用的规范化方法


魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐
所有评论(0)