Upload
socialtic
View
106
Download
4
Embed Size (px)
DESCRIPTION
Presentación: Limpieza y transformación de datos
Citation preview
Limpieza y transformación de datos - identificación de errores - criterios de limpieza - software para limpieza
@SocialTic
@Mexflow
Por
¿Cómo participar durante la sesión?
#EscuelaDeDatos
Deja tus preguntas en la sección de comentarios
¿Qué es Escuela de Datos?
Propósitos de una BD
¿Cómo usas una base de datos?
Propósitos de una BD
● Los datos pueden ser usados de maneras distintas:
● Como una colección de información para análisis y estadística.
● Como una fuente para consulta sobre diferentes temas a lo largo de un periodo de tiempo.
Al trabajar con una base
● En una BD debemos:● Tener claro el
origen de los datos
● El tipo de datos que contiene
● Y el propósito final de su uso o consulta
Limpieza de datos
La mayoría de las bases de datos tienen información “sucia”
Limpieza de datos
● Errores de escritura● Espacios en blanco● Textos equivocados
Importante
● Recomendaciones durante la limpieza de BD:● Tener la fuente de la BD● Respaldar el archivo original● Documentar y detallar los cambios hechos● Respaldar la base después de cada
modificación.
Software para limpieza de datos
● Open Refine es un proyecto para la manipulación de grandes bases de datos.
● Permite hacer modificaciones en “bloque” con sencillos pasos
● Almacena registro de cada cambio realizado
● http://openrefine.org/
Ejercicio
Origen de la base:● Directorio estadístico
nacional de unidades económicas
● http://bit.ly/1lNCAGj● Archivo de la base● http://bit.ly/1ihcQmY
Siguientes sesiones
Sigamos en contacto
Páginas informativas
● www.escueladedatos.org
Correo electrónico
● @SocialTIC ● @EscuelaDeDatos
Esta presentación está registrada bajo CC(BY.NC) por lo que se cuenta con el consentimiento de lo/as autores/as para su uso, distribución y adaptación para fines no-comerciales. Más información en: www.creativecommons.org.mx
● SocialTic● Escuela de Datos