Proyecto Máster BI - Metro Madrid

Preview:

DESCRIPTION

Presentación del proyecto desarrollado en el Máster en Business Intelligence 2012-2013

Citation preview

Máster en Business Intelligence 2012 - 2013

Héctor Díaz Calvo

Elección de la temática del proyecto Principales objetivos Proceso general Orígenes de datos Entidades para el análisis Métricas del negocio Modelado dimensional Proceso ETL Diseño de la BBDD multidimensional Reporting Excel 2013 como cliente OLAP Conclusiones y beneficios

2

http://blogs.elconfidencial.com/economia/grafico-de-la-semana/2013/05/17/el-metro-se-hunde-lo-que-arroja-dudas-sobre-las-cifras-de-poblacion-11300

3

Afiliaciones SS y Nº Viajeros

Análisis de la evolución del número de viajeros en la red de Metro de Madrid a lo largo del tiempo

Análisis de ventas de los distintos tipos de billetes

Determinación de la influencia de indicadores sociales, laborales y demográficos en el nº de viajes (indicadores disponibles por fecha y zona geográfica)

Categorización de las estaciones en función de los tramos horarios en los que son frecuentadas

4

5

Ficheros planos incluyendo:◦ Datos públicos por distritos

http://www.madrid.es/portales/munimadrid/es/Inicio/El-Ayuntamiento/Estadistica

◦ Ventas de billetes (tickets y abonos)

◦ Paso de viajeros por los tornos de las estaciones

BBDD Metro para la extracción de datos de:◦ Estaciones y líneas

◦ Tarifas

◦ Viajeros titulares de los abonos

6

Billetes

7

Distritos

Estaciones

Líneas

8

Tiempo Tramos horarios

Ventas de Billetes

9

Viajes

Indicadores Públicos (I)

Indicadores Públicos (II)

10

Viajes

11

Ventas

12

Indicadores

Públicos

13

SQL Server Integration Services 2012

Proyecto estructurado en varios paquetes

Utilización BBDD de Staging

Carga incremental

Limpieza de datos

Aprovechamiento de los distintos tipos de transformaciones

Aplicación de buenas prácticas

Importación de formas geométricas ESRI Shapefiles(shp) para los distritos, líneas y estaciones

14

15

SQL Server Analysis Services 2012

Data Source View (DSV)◦ Uso de Named Queries y Named Calculations

Dimensiones de BBDD◦ Definición de jerarquías

◦ Relaciones entre atributos

◦ Ajuste de propiedades (KeyColumns, NameColumns…)

16

Diseño del cubo◦ Modo de almacenamiento: MOLAP

◦ Relación entre dimensiones de cubo y grupos de medidas (Dimension Usage)

◦ Funciones de agregación

◦ Medidas calculadas y conjuntos dinámicos (MDX)

◦ Definición de KPIs

◦ Definición de particiones

◦ Diseño de agregaciones

◦ Procesamiento del cubo

17

SQL Server Reporting Services 2012

Informes con origen de datos OLAP

Datasets (MDX) construidos mediante:◦ Query Designer◦ Expresiones

Ejemplos

18

19

20

Conclusiones◦ Nº de viajes ligado al nº de afiliaciones a la Seguridad Social.

◦ Contraste claro entre distritos de la zona norte y los de la zona sur. También entre los del centro y los de la periferia para determinadas medidas como la tasa de paro, renta per cápita, precio de la vivienda o la edad promedio.

◦ Incremento de las ventas en el año 2012 a pesar del descenso del nº de viajeros motivado por el incremento de tarifas.

Beneficios◦ Control de las ventas y del nº de viajeros.

◦ Estaciones categorizadas en función de los tramos horarios en los que son frecuentadas.

◦ Visualización e interpretación rápida de resultados gracias a los mapas.

◦ Análisis a medida del usuario gracias a las tablas dinámicas de Excel conectadas al cubo OLAP.

◦ Gran rendimiento de consulta de los informes por tener como origen de datos el cubo OLAP.

24

A mis profesores:

◦ Salvador Ramos

◦ Rubén Pertusa

◦ Miguel Egea

◦ Sergio Carrillo

◦ Víctor García

◦ Paco González

◦ Javier Torrenteras

◦ Pau Sempere

◦ Daniel Seara

A mis compañeros

A todo el equipo de SolidQ

25

Recommended