67
Caracas, Abril 2016 Dirección General de Estudios de Postgrado Área de Ingeniería Programa: Maestría Sistemas de Información Integrantes: Areiza, Elvis Pérez, Dalila Rivas, Juan

Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

Embed Size (px)

Citation preview

Page 1: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

Caracas, Abril 2016

Dirección General de Estudios de Postgrado

Área de Ingeniería

Programa: Maestría Sistemas de Información

Integrantes:

Areiza, Elvis

Pérez, Dalila

Rivas, Juan

Page 2: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

Puntos a tratar:

1.- Almacén de Datos (Data Warehouse)

2.- Preparación del almacén de datos

3.- Bases de datos multidimensionales (BDM).

4.- Procesamiento y análisis en línea (OLAP).

5.- Mercados de datos (Data Mart).

6.- Minería de datos (Data mining).

Page 3: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

1. Almacén de Datos (Data Warehouse)

•Almacén:

•«Edificio o local donde se depositan géneros de cualquier especie, generalmente mercancías.»

•Datos: «Documento, testimonio, fundamento.»

•«Información dispuesta de una manera adecuada para su tratamiento por una computadora.»

Según la RAE

Page 4: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis
Page 5: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis
Page 6: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis
Page 7: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis
Page 8: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis
Page 9: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis
Page 10: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis
Page 11: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis
Page 12: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis
Page 13: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis
Page 14: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis
Page 15: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis
Page 16: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis
Page 17: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis
Page 18: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis
Page 19: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

2. Preparación del Almacén de Datos

Sistema de Ayuda Toma de Decisión

Page 20: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

A la hora de construir un Almacén de datos:

Perspectiva

SG. Colas

Distribución de Pedidos

Enfoque, Objetivo

Page 21: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

SATD: • Ordenar • Preparar datos

Arquitectura de Inteligencia de Negocios

1

2 Analítico

Data Warehousing

¿ETL?

Page 22: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

Vista Detalla Data warehousing

ETL: Extracción, Transformación y Carga.

Los Datos deben ser extraídos de diversas fuentes, Depurados, transformados y consolidados .

Page 23: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

Fase de extracción:

Fuentes de extracción:

• Producción (SBD Transacciones):

IMS, DB2, Oracle, Sap.

• Archivos Planos: Texto o binario

• Internas o Externas.

Programas en C, Cobol, Pl/Sql Gateways .

Captura de Datos Análisis de entrada y/o salidas de Datos

Técnicas de Extracción

Page 24: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

Fase de Transformación

• Involucra la división o la combinación de registros fuente • Verificación de corrección de errores • Importante al mezclar varias fuentes de datos

Los operadores o transformaciones

• Generador de Claves:

• Conversión:

• Filtrado:

• Unión:

Page 25: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

Fase de Carga

Carga de los Datos en el Almacén

Pasos para el proceso de Carga:

• Requisitos del usuario (Tareas Procesos)

• Proceso de transporte: (técnicas)

• Ventana de Carga: (Tiempo)

Para la eficiencia de las operaciones de carga considerar:

• Movimiento de datos: Carga de esquemas semejantes al destino

• Verificación de integridad: Criterios de unicidad

• Construcción de índices: Eliminación de índices.

.

Page 26: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

Caso Práctico: Análisis de Estadísticas Web

Page 27: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

Conexión BD Entorno de

Trabajo

Ventana de Consulta

Parámetros

Page 28: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis
Page 29: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

Base de datos multidimensional (MDB)

Una base de datos multidimensional (MDB) es un tipo de base de datos que almacena datos en varias dimensiones, guardan datos que adquieren valor diferente dependiendo de la dimensión que tengan con respecto a diversos atributos.

Page 30: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

En las base de datos

multidimensionales la

información se representa

como cubos y matrices, cada

uno de los cuadros se les

llama matrices y es donde

están almacenadas la

información.

Page 31: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

Versatilidad de las bases de datos multidimensionales

Las BDMD se caracterizan por una

mayor versatilidad que las bases

de datos relacionales a la hora de

realizar consultas. A menudo éstas

se crean a partir de entradas de las

bases de datos relacionales,

facilitando un tipo de análisis muy

útil para el negocio, que permite

extraer datos de forma selectiva y

realizar consultas de distinto tipo.

Son muy ventajosos en cuanto a

rapidez y procesamiento.

Page 32: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

Para hacer comparaciones

entre distintas consultas y

cuestiones similares con el fin

de resumir operaciones o

descubrir tendencias de

negocios.

Es habitual su utilización para

conocer las ventas en un

determinado contexto.

Cada atributo de los datos

se considera por separado

y, a su vez, puede dividirse

en sub atributos.

Page 33: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

Características:

Dimensiones Medidas

Simplifica consultas Datos ordenados por

jerarquía

Page 34: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

Ventajas de las bases de datos

multidimensionales

• Accesos a grandes cantidades de información.

• Analiza relaciones entre muchos tipos de elementos.

• Presenta los datos en diferentes perspectivas.

• Involucra cálculos complejos entre elementos de datos.

• Aseguran un buen tiempo de respuesta a las necesidades del usuario.

Page 35: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

Beneficios que trae a una organización la utilización de una BDMD

• Facilidad de acceso y Uso. • Flexibilidad. • Los datos organizados en

diferentes dimensiones. • Ahorro por productividad de

personas altamente profesionales.

• Permite encontrar con facilidad el historial de datos.

• Genera ventajas competitivas.

Page 36: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

OLAP(Proceso analítico en línea)

Es una solución utilizada en el campo de la llamada

inteligencia empresarial cuyo objetivo es agilizar la

consulta de grandes cantidades de datos. Para ello utiliza

estructuras multidimensionales (o cubos OLAP) que

contienen datos resumidos de grandes bases de datos.

Page 37: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

Acciones Básicas del

Proceso Analítico en Línea

Segmenta

Filtra

Profundiza Sintetiza

Rota

Page 38: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

Características:

• Visión multidimensional.

• Arquitectura cliente / servidor.

• Multiusuario.

• Permite navegar fácilmente por la información

• Ofrece filtros adecuados, fáciles y dinámicos para el acceso a la información.

• Capacidad de análisis.

• Interfaces gráficas.

• Diferencia entre valor vacío y valor cero.

Page 39: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

Ventajas de OLAP:

• Acceso a grandes cantidades de datos.

• Analizan las relaciones entre muchos tipos de elementos empresariales.

• Facilitan la toma de decisiones.

• Involucran datos agregados.

• Comparan datos agregados a través de periodos jerárquicos.

• Respuesta rápida a las consultas de usuarios.

• Presenta datos en diferentes dimensiones.

• Guarda histórico de datos.

Page 40: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

Arquitecturas para los sistemas

OLAP

• MOLAP

• ROLAP

• HOLAP

• DOLAP

Page 41: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

ROLAP ROLAP es una implementación

OLAP que almacena los datos en

un motor relacional. La

arquitectura está compuesta por

un servidor de banco de datos

relacional y el motor OLAP se

encuentra en un servidor

dedicado.

Page 42: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

MOLAP La arquitectura MOLAP usa

unas bases de datos multidimensionales para proporcionar análisis, su principal premisa es que el OLAP está mejor implantado almacenando los datos multidimensionalmente.

Page 43: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

HOLAP (Hybrid OLAP)

Almacena algunos datos en un motor relacional y otros en una base de datos multidimensional, es una combinación de varias técnicas de almacenamiento. Las agregaciones se realizan en cache, pero el drill-down a través de la base de datos relacional. Algunos fabricantes son: Microdsoft Analysis Servises, SAS OLAP, Oracle Hyperion Essbase

Page 44: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

DOLAP (Desktop OLAP). Es un OLAP orientado a equipos de escritorio (Desktop

OLAP). Trae toda la información que necesita analizar

desde la base de datos relacional y la guarda en el

escritorio. Desde ese momento, todas las consultas y

análisis son hechas contra los datos guardados en el

escritorio.

Page 45: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

5.- Mercado de Datos (Data Mart)

Data Mart

Departamentales

Línea de Negocio

Page 46: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

¿Qué razones tengo para crea un Data Mart?

Acceso a la Información

• Vista • Potencial

TR

Costo

Page 47: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

Beneficios

• Decisiones estratégicas. • Acelera consultas. • Estructura de datos. • El costo. • Perspectivas macros y micro

que ahorra Tiempo.

Desventajas

Page 48: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

Diferencias entre un Data Mart y Data Warehouse.

Aspectos Datawarehouse Datamart

Alcance Corporativo Línea de Negocio

Temas Múltiples Un único tema

Tamaño 100 GB-TB+ Menor 100 GB

Tiempo de

Implementación

De meses a años Varios meses

Motivo de la Creación Satisfacer las necesidades de una

corporación

Satisfacer las necesidades

especificas de un departamento

Tipos de Datos Datos con un nivel de detalle amplio Datos agregados y resumidos

Rol de usuarios Exploradores Recolectores

Page 49: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

Data Marts Dependientes Data Marts Independientes Data Mart Híbrida

Page 50: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

Herramientas de Base de datos que permiten trabajar con Data Marts: Microsoft SQLServer PostgreSql Oracle MySql

Arquitectura Descentralizada Arquitectura Integrada

Page 51: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis
Page 52: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis
Page 53: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis
Page 54: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis
Page 55: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis
Page 56: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis
Page 57: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis
Page 58: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis
Page 59: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis
Page 60: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis
Page 61: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis
Page 62: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis
Page 63: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis
Page 64: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

6. Minería de Datos (Data Mining)

Page 65: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

6. Minería de Datos (Data Mining)

Page 66: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

6. Minería de Datos (Data Mining)

Page 67: Presentación de PowerPoint DB2, Oracle, Sap. ... realizar consultas. A menudo éstas se crean a partir de entradas de las bases de datos relacionales, facilitando un tipo de análisis

6. Minería de Datos (Data Mining)