DATA WAREHOUSE

Preview:

DESCRIPTION

ES UN AMBIENTE ESTRUCTURADO PARA ANALISIS DE DATOS NO VOLATILES ES UNA COLECCIÓN DE DATOS ORIENTADA A SUJETOS, INTEGRADA, VARIABLE EN EL TIEMPO Y NO VOLATIL, PARA SOPORTE DE PROCESOS DE TOMA DE DECISION DE LOS EJECUTIVOS.

Citation preview

CERTIFICACIÓN EN SISTESMAS Y TECNOLOGIAS DE LA INFORMACIÓN

DATA WAREHOUSE

S.C.

Es un ambiente estructurado para análisis de datos no volatiles

Es una colección de datos orientada a sujetos, integrada, variable en el tiempo y no volatil, para soporte de procesos de toma de decisión de los ejecutivos.

Facilita la integración, para la toma de decisiones, de datos de aplicaciones operacionales no integrados.

Organiza y almacena los datos que se necesitan para el procesamiento analítico, informático sobre una amplia perspectiva de tiempo.

Bases de Datos Operacional Data Warehouse

Datos Operacionales Datos del negocio para Información

Orientado a la aplicación Orientado al sujeto

Actual Actual + histórico

Datos detallados Resumidos + más resumidos

Datos cambian continuamente Estable

El uso de DW se ha extendido debido a Hardware y software mas robustos y se esperaOrientación a la web.

META DATA

ALTAMENTERESUMIDO

LIGERAMENTERESUMIDO

DETALLEHISTORICODE DATOS

SISTEMAOPERACIONAL refrescamiento

DETALLE ACTUALDE DATOS

Detalle de datos actuales: Datos que constan en los sistemas operacionales

Detalle de datos antiguos: La datos antigüos que se almacenan sobre

alguna forma de almacenamiento masivo. No son frecuentemente accesada

y se almacena a un nivel de ligeramente resumidos, consistente con los

datos detallados actuales del momento en que se obtuvieron.

Datos ligeramente resumidos: La data ligeramente resumida es aquella que

proviene desde un bajo nivel de detalle encontrado al nivel de detalle

actual.

Datos completamente resumidos: Estos datos son compactos y fácilmente accesibles, resultan de resumir los datos ligeramente resumidos.

Meta data(datos de datos): juega un rol especial y muy importante contiene referencias y apuntadores tales como:

◦ Un directorio para ayudar al analista a ubicar los contenidos del data warehouse.

◦ Una guía para el mapping de datos, de cómo se transforma desde el ambiente operacional hacia el ambiente de data warehouse.

◦ Una guía de los algoritmos usados para la esquematización entre el detalle de datos actual, con los datos ligeramente resumidos y éstos, con los datos completamente resumidos, etc.

META DATASISTEMAOPERACIONAL

refrescamiento

Alto Nivel

Ninguno(libre)

Bajo Nivel

INDEXACIÓN

META DATASISTEMAOPERACIONAL

refrescamiento

Relativamentefácil

No permitefácilmente

RESTRUTURACiÓN

Ponga en un buscador de internet “imágenes Data Warehouse” y encontrará:

Ponga en un buscador de internet “imágenes Data Warehouse” y encontrará:

Ponga en un buscador de internet “imágenes Data Warehouse” y encontrará:

compras

ventas

rrhh

produccion

Separados de los operacionales para evitar degradación del tiempo

No son modificables

Datos guardados porPeríodos más largos

Bajos costos de almacenamiento

Datos de sistemasOperacionales

Datos de DW

Herramientas OLAP Herramientas OLAP (componente (componente clave del DW))

On Line Analitical Process (procesamiento analítico en línea)

Tecnología orientada al análisis de datos Permite el análisis de las diferentes

medidas correspondientes a las dimensiones relacionadas entre sí

DWDIMENSIONES (categoría descriptiva)

MEDIDAS ( valores cuantitativos)

LOS MODELOS DE ALMACENAMIENTO DE DATOS QUE FACILITAN EL ANÁLISIS DIFIEREN DEPENDIENDO SI ESTÁN ACTUANDO EN UN AMBIENTE TRANSACCIONAL O EN UN DW

Modelos de datos en ambientes Transaccionales (Operacionales):•OLTP: Procesamiento de Transacciones En Línea (OnLine Transaction Processing)

ROLAP

(MOLAP)=OLAPmultidimensional HOLAP

Análisis de datosAnálisis de datos

Modelos de datos en ambientes de DW :OLAP procesamiento analítico en línea (On-Line Analytical Processing).

•ROLAP : Procesamiento analítico en línea sobre base de datos relacional •MOLAP : Procesamiento analítico en línea sobre base de datos multidimensional (OnLine Transaction Processing)

•HOLAP: Procesamiento analítico en línea híbrido MOLAP+ROLAP

OLTP

Creados basados en las técnicas OLAP, para organizar los datos (ya se pueden considerar información) (cubos)

DW

Variable tiempoVariable productoVariable Ubicación geográfica

Separados para evitar degradación en el tiempo

Compras DMT

VentasDMT

RrhhDMT

ProduccionDMT

EMPRESA

Una sola área o grupos, costoso y mayor esfuerzo

Riesgos: Proliferación no planificada, Inconsistencia en los datosPérdida de rendimiento por incremento del tamaño

DMT1 + DMT2 + DMT3 + …. DMTn = Reunión de información

Compras DMT

VentasDMT

RrhhDMT

ProduccionDMT

EMPRESA

Una sola área o grupos, costoso y mayor esfuerzo

DMT1 + DMT2 + DMT3 + …. DMTn = DW

DataWarehouse

Sybase IQ (DW+ business intelligence)

Sybase, Inc. (NYSE: SAP)

IBM Netezza DW appliance Netezza Inc (IBM)

HP Enterprise DW Solutions para MsSql Server

Hewlett-Packard Co.

SAP Business Objects data Service Software

Business Objects, SAP (comprado 2007)

Oracle ( a partir de la versión 11g)

ORACLE

DATA MINING (minería de DATA MINING (minería de datos)datos)

ES LA EXTRACCIÓN DE INFORMACIÓN OCULTA DE GRANDES BASES DE DATOS

Herramienta que ayuda a predecir futuras tendencias y comportamientos

DATA MINING (minería de DATA MINING (minería de datos)datos)

Predicción automatizada de tendencias y comportamientos

Descubrimientos automatizados de modelos previamente desconocidos

Aplica técnicas tales como: redes neuronales artificiales, árboles de decisión, algoritmos genéticos, método vecino más cercano, regla de inducción.

FundamentosSoportado por tecnologías

1. Recolección masiva de datos2. Computadores potentes con

multiprocesador3. Algoritmos Data Mining

DW

Data mining

Sistema x

Sistema y

Aplicación n

Aplicación 2

Aplicación 1

informació

n

Recommended