46
Visualización Juan Elosua Tomé (@jjelosua)

Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

Embed Size (px)

DESCRIPTION

Ponencia de Juan Elosua dentro del curso de verano "Datos y gobierno Abierto" organizado por la iniciativa Aragón Open Data de la Dirección General de Nuevas Tecnologías del Gobierno de Aragón. La ponencia se celebró dentro de los cursos de verano de la Universidad de Zaragoza, en Jaca, del 10 al 12 de Julio de 2013 y se titula "Nuevos modos de visualización de datos para permitir su comprensión"

Citation preview

Page 1: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

VisualizaciónJuan Elosua Tomé (@jjelosua)

Page 2: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

Contenido

● ¿Por qué es importante la visualización?

● En mis carnes

● Herramientas básicas

● Herramientas avanzadas

● Conclusiones

Page 3: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

¿Quién soy?

Juan Elosua Tomé (Twitter: @jjelosua)

● Ingeniero de Telecomunicaciones que trabaja como desarrollador freelance con experiencia en análisis y visualizaciones de datos.

Algunos proyectos en los que he colaborado:■ El indultómetro■ España en Llamas■ Donde van mis impuestos - Parte autonómica■ Infoamazonía: Ganado vs. Deforestación

Page 4: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

Introducción (I)

● La visualización de datos es un campo en continuo crecimiento en los últimos años. Este auge se debe a dos razones principales○ Nuestro acelerado ritmo de vida.○ El aumento exponencial de los datos disponibles.

Page 5: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

Ritmo de vida (I) - Piramide info.

● La visualización es una potente herramienta para ayudar al lector a avanzar más rápido en la pirámide de la información.

Page 6: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

Ritmo de vida (II)

● Hoy en día le dedicamos 2 minutos a una cosa y si no nos resulta atractiva pasamos a la siguiente.○ smartphones, whatsup, redes sociales, etc.

● Aquí entra con fuerza la visualización ya que permite generar el interés del usuario de una manera mucho más directa que el texto

¡¡Una imagen vale más que mil palabras!!

Page 7: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

Ritmo de vida (III) - Imagen vs. Texto

Page 8: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

Ritmo de vida (IV) - Riesgos

● En ocasiones en nuestro afán de generar visualizaciones atractivas, perdemos de vista lo más importante que es ayudar al lector a entender lo que queremos transmitir.

● Una buena visualización debe entenderse de una forma fácil y no contener elementos que no aporten valor o desvíen la atención.

Data Visualization vs. Data Art

Page 9: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

Big data (I)

● Según cálculos de IBM, el ser humano generó, desde el principio de su historia hasta el año 2003, unos cinco exabytes de información, cinco mil millones de gigabytes.

● El año pasado, generamos aproximadamente ese mismo volumen de información cada dos días.

● El próximo año, lo generaremos aproximadamente cada diez minutos!!

Page 10: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

Big data (II)

● La visualización se transforma de un capricho para que quede bonito en una auténtica necesidad para poder comprender los datos que recibimos.

● Existe toda una categoría de herramientas de visualización para poder hacer análisis de la información.

Veamos un ejemplo

Page 12: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

En mis carnes (I) - EeL

VS

Page 13: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

En mis carnes (II) - EeL

● Este proyecto consistía en dar un mayor contexto al problema de los incendios en España.

● Contactamos con el ministerio para obtener información de detalle de cada uno de los incendios (EGIF) para el periodo 2001-2011

● Una vez conseguida la información se requirió de un trabajo previo de adaptación de formatos:○ Access a MySQL para análisis○ Coordenadas UTM a coordenadas geográficas.

Page 14: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

En mis carnes (III) - EeL

● Queríamos dar la información lo más precisa posible por lo que uno de los retos de este proyecto fue generar una superficie real de cada incendio dentro del mapa

Page 15: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

En mis carnes (IV) - EeL

Una buena práctica a la hora de visualizar una información es dar al lector una opción de "visita guiada" que ayude a comprender los puntos básicos de la visualización.

Page 16: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

En mis carnes (V) - EeL

Posteriormente se puede crear una opción de exploración para que sea el lector el que busque la información de su interés.

Page 17: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

En mis carnes (VI) - EeL

Lecciones aprendidas:● Es importante dar una visita guiada al lector

para paliar el shock de sentirse perdido al enfrentarse a una visualización compleja.

● Al tratar con un volumen importante de datos se debe tener en cuenta la usabilidad y el rendimiento a la hora de diseñar la visualización.

Page 19: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

En mis carnes (VIII) - Indultometro

● Este proyecto consistía en dar un mayor contexto a la controvertida medida de los indultos en España.

● En muchas ocasiones el cómo se publica la información es tan importante como los datos en si, al tener el BOE una frecuencia diaria sin profundidad histórica no se puede comprender el alcance de la medida.

Page 20: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

En mis carnes (IX) - Indultometro

● Voy a destacar en este caso una libreria llamada Timeline.js○ permite tender un puente entre las personas

técnicas y no técnicas a la hora de colaborar.

Page 21: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

● El origen de la información es un google spreadsheet por lo que si se añade una nueva fila automáticamente se publica.

En mis carnes (X) - Indultometro

Page 22: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

En mis carnes (XI) - Indultometro

Lecciones aprendidas:● Existen librerías que permiten una

colaboración entre perfiles técnicos y no técnicos para poder alimentar a una visualización.

● Si vamos a generar una gráfica auxiliar a un texto no debemos complicarla de manera excesiva, ya que necesitaremos gran parte del texto para hacerla comprensible.

Page 24: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

En mis carnes (XIII) - DVMI

● Pocas personas en España se han leído alguna vez los presupuestos generales del estado.

● De hecho muy pocas personas conocen el PIB de nuestro país o su presupuesto anual,

● Si no proveemos a los ciudadanos de formas sencillas de acceder a dicha información esto no cambiará.

Page 25: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

En mis carnes (XIV) - DVMI

● Es posible generar visualizaciones altamente interactivas que permitan al lector tener una visión global a la vez que navegar a la parte que le resulte más interesante.

Page 26: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

En mis carnes (XV) - DVMI

Lecciones aprendidas:● Las librerías interactivas permiten generar

visualizaciones coordinadas que mezclan los datos desde varios puntos de vista permitiendo un análisis más profundo.

● Es importante definir estándares y generar información consistente de cara a poder realizar comparaciones útiles.

Page 27: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

Herramientas básicas (I)

● Otro de los indicios de que la visualización es un campo en auge es la proliferación de librerías y herramientas que nos permiten generar visualizaciones de una forma rápida.

● Veamos dos herramientas sencillas:○ Google Fusion Tables para mapas○ Infogr.am para gráficas

Page 28: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

Google fusion tables (I)

● Permite visualizar los datos de una forma sencilla.● Existen varios tipos de visualizaciones:

○ Mapas: con Marcadores, de intensidad, etc.○ Gráficas básicas: Barras, Líneas, “Quesitos”.○ Gráficas interactivas: Líneas con zoom, Red.

Page 29: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

Google fusion tables (II) - Mapas

● Para crear un mapa tenemos que tener una forma de identificar la localización de nuestros datos: ○ Añadir la latitud y longitud de los datos.○ Utilizar la geocodificación que proporciona google:

Dirección, Municipio, Provincia, CCAA o País.○ Combinar nuestros datos con otros que contengan

información geográfica.

Page 30: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

● Enlaces a tablas auxiliares de perímetros de España.○ CCAAs: Comunidades Autónomas España simplificado 1Km

○ Provincias: Provincias España simplificado 500m

○ Municipios: Municipios España 2012 simplificados 200m

Google fusion tables (III) - Mapas

Tip: Extraídas de los mapas que proporciona el INE, a través de un proceso tedioso por lo que os recomiendo que las utilicéis en vez de tratar de crearlas de nuevo. ¡SON PÚBLICAS!

Page 32: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

Infogr.am (I)

● Infogr.am es un servicio que nos permite crear gráficos de una manera sencilla.

● Requiere registrarse

Page 33: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

Infogr.am (II)

● Una vez hacemos login podemos:○ Crear una nueva visualización○ Explorar nuestra librería de visualizaciones creadas.

Page 34: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

Infogr.am (III)

● Seleccionamos el gráfico deseado

Page 35: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

Infogr.am (IV)

● Infogr.am nos muestra unos datos de ejemplo con el formato que necesitamos generar para crear el gráfico deseado.

Page 36: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

Infogr.am (V)

● Una vez finalizado nuestro gráfico podemos compartirlo:○ En redes sociales, verlo en la web de infogr.am o

"Incrustarlo" en un blog u otra página web.

Page 37: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

Demo GFT (I) - EPA INE

● Veamos como podemos crear un mapa de intensidad en google fusion tables.

● Objetivo: Mostrar un mapa con los datos de la tasa de paro por provincias para la última EPA disponible 2013T1

1. Descargar la información del INE2. Limpiar la información (Excel)3. Importar los datos en fusion tables4. Combinar con los perímetros de provincias5. Dar estilo a nuestro mapa.

Page 38: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

Demo Infogr.am (I) - EPA INE

● Veamos como podemos crear una gráfica de evolucion en infogr.am

● Objetivo: Comparar los datos del último trimestre de la EPA en el periodo 2005-2012 para Andalucía y Euskadi

1. Descargar la información del INE2. Crear un gráfico de evolución en infogr.am3. Copiar y pegar los datos en infogr.am4. Incorporar textos5. Dar estilo a nuestro gráfico

Page 39: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

Herramientas avanzadas (I)

Page 40: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

Herramientas avanzadas (II)

● Para utilizar la mayoría de estas librerias se requiere conocimientos de programación:○ HTML, Javascript, CSS, ...

● D3js.org cuyo creador mike bostock es editor de gráficos actualmente en el New York Times.○ Veamos un ejemplo

● D3 es una de las librerías más usadas para crear visualizaciones interactivas hoy día.

Page 41: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

Conclusiones (I) - Visualización

● En los tiempos que vivimos de ritmo de vida y gran cantidad de información la visualización juega y jugará un papel principal para comprender nuestro mundo.

● Las visualizaciones interactivas permiten: ○ al lector casual obtener una visión global○ al lector más interesado analizar en profundidad

bajo su perspectiva para generar una opinión informada.

Page 42: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

Conclusiones (II) - Visualización

● Debemos diseñar nuestros proyectos para alcanzar los objetivos propuestos:○ Data Visualization vs. Data Art○ Exploratory Analysis vs. Data publication.

● Una buena visualización debe entenderse de una forma fácil y no contener elementos que no aporten valor o desvíen la atención.

● Herramientas sencillas de visualización:○ Mapas: Google Fusion Tables, CartoDB, etc.○ Gráficas: Infogr.am, Datawrapper, etc.

Page 43: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

Conclusiones (III) - Fusion Tables

● Una herramienta web que permite importar, visualizar, combinar, compartir y publicar tablas de datos.

● La visualización de mapas es sencilla y muy útil.

Page 44: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

Conclusiones (IV) - Infogr.am

● Ventajas○ Nos permite crear gráficos de forma sencilla.○ Nos da información sobre el formato de los datos

necesarios para generar la gráfica de forma correcta○ Cuenta con mucha variedad de tipos de gráficas○ Permite crear infografías

● Inconvenientes○ Necesitamos pagar para poder descargar el gráfico

como imagen o hacerlo de forma privada○ Los "themes" son un poco limitados.○ La documentación es muy escasa

Page 45: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

Conclusiones (V) - D3

● Ventajas de D3:○ Permite hacer cualquier tipo de visualización.○ Es una librería bien documentada.○ Cuenta con muchos ejemplos que usar de base.

● Inconvenientes de D3:○ Requiere conocimientos de programación○ La curva de aprendizaje es lenta○ Tienes que crear todos los elementos desde 0, para

un gráfico de barras creas los ejes, los ticks, el grid, las barras, las etiquetas, las leyendas...etc.■ NVD3 hace uso de los gráficos reutilizables

facilitando el proceso de generación de D3.

Page 46: Curso de Verano "Datos y Gobierno Abierto" Juan Elosua

¡¡Gracias!!

¿Dudas o preguntas?

Juan Elosua ToméTwitter: @jjelosua