[LCDLV] 158 Limpieza y normalización de datos con OpenRefine

Evelio nos muestra las capacidades de Open Refine, una poderosa herramienta de transformación de datos de código abierto extremadamente útil para extraer, normalizar y administrar grandes volúmenes de datos.

Open Refine puede utilizarse para normalizar y agrupar datos de texto, para detectar y corregir errores, así como agrupar términos similares mediante la función de agrupación de clústeres.

Evelio nos introduce en algunas técnicas de limpieza y análisis de datos usando Open Refine: Separar fechas en campos de día, mes y año o trabajar con grandes volúmenes de datos, a pesar de los formatos inconsistentes y valores faltantes. Vemos cómo normalizar datos, por ejemplo, por medio de la capitalización, corrección de errores y agrupación de datos para una gestión eficiente.

No cabe duda de que Open Refine es una magnífica herramienta para transformar datos, desde la extracción y normalización hasta la limpieza, manipulación y análisis de datos.

Si quieres trabajar con el mismo set de datos que utiliza Evelio durante la primera parte de la sesión, puedes descargar el archivo CSV desde la página de la Junta de Andalucía donde está el tutorial que se cita en el vídeo.

Contenido completo sólo disponible para miembros de BIMrras INSIDERS. Para ver toda la sesión puedes suscribirte o  identificarte.

Este contenido está restringido a suscriptores