CERTIFICACIÓN EN SISTESMAS Y TECNOLOGIAS DE LA INFORMACIÓN
DATA WAREHOUSE
S.C.
Es un ambiente estructurado para análisis de datos no volatiles
Es una colección de datos orientada a sujetos, integrada, variable en el tiempo y no volatil, para soporte de procesos de toma de decisión de los ejecutivos.
Facilita la integración, para la toma de decisiones, de datos de aplicaciones operacionales no integrados.
Organiza y almacena los datos que se necesitan para el procesamiento analítico, informático sobre una amplia perspectiva de tiempo.
Bases de Datos Operacional Data Warehouse
Datos Operacionales Datos del negocio para Información
Orientado a la aplicación Orientado al sujeto
Actual Actual + histórico
Datos detallados Resumidos + más resumidos
Datos cambian continuamente Estable
El uso de DW se ha extendido debido a Hardware y software mas robustos y se esperaOrientación a la web.
META DATA
ALTAMENTERESUMIDO
LIGERAMENTERESUMIDO
DETALLEHISTORICODE DATOS
SISTEMAOPERACIONAL refrescamiento
DETALLE ACTUALDE DATOS
Detalle de datos actuales: Datos que constan en los sistemas operacionales
Detalle de datos antiguos: La datos antigüos que se almacenan sobre
alguna forma de almacenamiento masivo. No son frecuentemente accesada
y se almacena a un nivel de ligeramente resumidos, consistente con los
datos detallados actuales del momento en que se obtuvieron.
Datos ligeramente resumidos: La data ligeramente resumida es aquella que
proviene desde un bajo nivel de detalle encontrado al nivel de detalle
actual.
Datos completamente resumidos: Estos datos son compactos y fácilmente accesibles, resultan de resumir los datos ligeramente resumidos.
Meta data(datos de datos): juega un rol especial y muy importante contiene referencias y apuntadores tales como:
◦ Un directorio para ayudar al analista a ubicar los contenidos del data warehouse.
◦ Una guía para el mapping de datos, de cómo se transforma desde el ambiente operacional hacia el ambiente de data warehouse.
◦ Una guía de los algoritmos usados para la esquematización entre el detalle de datos actual, con los datos ligeramente resumidos y éstos, con los datos completamente resumidos, etc.
META DATASISTEMAOPERACIONAL
refrescamiento
Alto Nivel
Ninguno(libre)
Bajo Nivel
INDEXACIÓN
META DATASISTEMAOPERACIONAL
refrescamiento
Relativamentefácil
No permitefácilmente
RESTRUTURACiÓN
Ponga en un buscador de internet “imágenes Data Warehouse” y encontrará:
Ponga en un buscador de internet “imágenes Data Warehouse” y encontrará:
Ponga en un buscador de internet “imágenes Data Warehouse” y encontrará:
compras
ventas
rrhh
produccion
Separados de los operacionales para evitar degradación del tiempo
No son modificables
Datos guardados porPeríodos más largos
Bajos costos de almacenamiento
Datos de sistemasOperacionales
Datos de DW
Herramientas OLAP Herramientas OLAP (componente (componente clave del DW))
On Line Analitical Process (procesamiento analítico en línea)
Tecnología orientada al análisis de datos Permite el análisis de las diferentes
medidas correspondientes a las dimensiones relacionadas entre sí
DWDIMENSIONES (categoría descriptiva)
MEDIDAS ( valores cuantitativos)
LOS MODELOS DE ALMACENAMIENTO DE DATOS QUE FACILITAN EL ANÁLISIS DIFIEREN DEPENDIENDO SI ESTÁN ACTUANDO EN UN AMBIENTE TRANSACCIONAL O EN UN DW
Modelos de datos en ambientes Transaccionales (Operacionales):•OLTP: Procesamiento de Transacciones En Línea (OnLine Transaction Processing)
ROLAP
(MOLAP)=OLAPmultidimensional HOLAP
Análisis de datosAnálisis de datos
Modelos de datos en ambientes de DW :OLAP procesamiento analítico en línea (On-Line Analytical Processing).
•ROLAP : Procesamiento analítico en línea sobre base de datos relacional •MOLAP : Procesamiento analítico en línea sobre base de datos multidimensional (OnLine Transaction Processing)
•HOLAP: Procesamiento analítico en línea híbrido MOLAP+ROLAP
OLTP
Creados basados en las técnicas OLAP, para organizar los datos (ya se pueden considerar información) (cubos)
DW
Variable tiempoVariable productoVariable Ubicación geográfica
Separados para evitar degradación en el tiempo
Compras DMT
VentasDMT
RrhhDMT
ProduccionDMT
EMPRESA
Una sola área o grupos, costoso y mayor esfuerzo
Riesgos: Proliferación no planificada, Inconsistencia en los datosPérdida de rendimiento por incremento del tamaño
DMT1 + DMT2 + DMT3 + …. DMTn = Reunión de información
Compras DMT
VentasDMT
RrhhDMT
ProduccionDMT
EMPRESA
Una sola área o grupos, costoso y mayor esfuerzo
DMT1 + DMT2 + DMT3 + …. DMTn = DW
DataWarehouse
Sybase IQ (DW+ business intelligence)
Sybase, Inc. (NYSE: SAP)
IBM Netezza DW appliance Netezza Inc (IBM)
HP Enterprise DW Solutions para MsSql Server
Hewlett-Packard Co.
SAP Business Objects data Service Software
Business Objects, SAP (comprado 2007)
Oracle ( a partir de la versión 11g)
ORACLE
DATA MINING (minería de DATA MINING (minería de datos)datos)
ES LA EXTRACCIÓN DE INFORMACIÓN OCULTA DE GRANDES BASES DE DATOS
Herramienta que ayuda a predecir futuras tendencias y comportamientos
DATA MINING (minería de DATA MINING (minería de datos)datos)
Predicción automatizada de tendencias y comportamientos
Descubrimientos automatizados de modelos previamente desconocidos
Aplica técnicas tales como: redes neuronales artificiales, árboles de decisión, algoritmos genéticos, método vecino más cercano, regla de inducción.
FundamentosSoportado por tecnologías
1. Recolección masiva de datos2. Computadores potentes con
multiprocesador3. Algoritmos Data Mining
DW
Data mining
Sistema x
Sistema y
Aplicación n
Aplicación 2
Aplicación 1
informació
n