OpenRefine(数据清理工具)软件简介
无论是现今的大数据还是企业内部的小数据,都存在一些普遍的问题,如数据格式不对需要转换,一个单元格内包含多个含义的内容,包含重复项等等,虽然我们也可以使用excel解决,但是excel天生有诸多限制,比如其为直接对数据进行操作,容易导致误操作;数据量大会处理缓慢;透视表功能太过简单;无法进行高级的数据分类分析。而OpenRefine很好的解决了以上问题。
数据清洗DataCleaning:是尝试通过移除空的数据行或重复的数据行、过滤数据行、聚集或转换数据值、分开多值单元等,以半自动化的方式修复错误数据的过程。数据清洗是一个反复的过程,不可能在几天内完成,只有不断的发现问题,解决问题。对于是否过滤,是否修正一般要求客户确认。
IDTs:InteractiveDataTransformationtools,交互数据转换工具,它可以对大数据进行快速、廉价的操作,使用单个的集成接口。
OpenRefine就是这样的IDT工具,可以观察和操纵数据的工具。它类似于传统Excel的表格处理软件,但是工作方式更像是数据库,以列和字段的方式工作,而不是以单元格的方式工作。这意味着OpenRefine不仅适合对新的行数据进行编码,而且功能还极为强大aaa
OpenRefine(数据清理工具)软件特色
●OpenRefine前身是谷歌公司(Google)开发的数据清洗工具GoogleRefine,
随后于2012年开放源代码,改为现在的OpenRefine
●一款基于计算机浏览器的数据清洗软件
●在数据清洗、数据探索以及数据转换方面非常有效的一个格式化工具
●它是一个开源的网络应用,可以在计算机中直接运行,这样可以避开上传指
定信息到外部服务器的问题
●它类似于传统Excel处理软件,但是工作方式更像是数据库,以列和字段的
方式工作,而不是以单元格的方式工作
标题:OpenRefine(数据清理工具) v3.4.1
链接:http://www.rudekat.com/ruvod/8071/
版权:文章转载自网络,如有侵权,请联系删除!