OpenRefine是一款简单好用的数据清洗工具,在这个数据化的时代下,如果你的数据是杂乱无章,尽管你多么的细心,也避免不了错误的数据出现,这款OpenRefine可以评估你的数据和信息的当前状态以及包含了多少错误的方法,还能优化数据的质量以便于在真实场景下重用它们,需要的用户赶快下载试试看。

c6b106df1461511e11128902e016e91f.png

软件特色

Data Profiling也叫做数据考古(Data Archeology),是数据集(Data Set)内部为达一致性、单值性和逻辑性而进行的数值质量的统计分析及评估。数据剖析是Olson于2003年提出的概念,使用分析技术来发现正确的、结构化的、有内容、有质量的数据。换句话说,它是评估你的数据和信息的当前状态以及包含了多少错误的方法。

Data Cleaning是尝试通过移除空的数据行或重复的数据行、过滤数据行、聚集或转换数据值、分开多值单元等,以半自动化的方式修复错误数据的过程。数据清洗是一个反复的过程,不可能在几天内完成,只有不断的发现问题,解决问题。对于是否过滤,是否修正一般要求客户确认。

安装方法

1、OpenRefine在Windows的安装

下载ZIP包

解压到某个目录;

要运行OpenRefine,双击openrefine.exe文件。

e15638e1896cf206f5f7ba71ba0fc31b.png

2、OpenRefine在Mac的安装

下载DMG文件

打开磁盘镜像,拖动OpenRefine的图标到Applications目录;

双击图标以启动OpenRefine。

3、OpenRefine在Linux的安装

下载gzipped包

解压到当前用户的home目录;

在终端命令行环境,键入./refine以启动OpenRefine。

f494c47c2212b56549da06b5c4a96264.png

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐