Microsoft sql server 2008 - ETL

Preview:

DESCRIPTION

Son una parte de la integración de datos, pero es un elemento importante cuya función completa el resultado de todo el desarrollo de la cohesión de aplicaciones y sistemas. La palabra ETL corresponde a las siglas en inglés de: • Extraer: extract. • Transformar: transform. • Y Cargar: load.

Citation preview

TUTORIAL ETL

Asignatura: BASE DE DATOS AVANZADA

Autora: Fanny Pita Chapilliquen

Docente Ingeniero: Hector Zelada

BI

(Business Intelligence)

Datos

Información

Conocimientos

Toma de Decisiones

Cumple con sus objetivos

Cumple con sus objetivos

estratégicos

Logra su Visión

Analizar

ETL

Son una parte de la integración de datos, pero es un elemento importante cuya función completa el resultado de todo el desarrollo de la cohesión de aplicaciones y sistemas.

La palabra ETL corresponde a las siglas en inglés de:

• Extraer: extract. • Transformar: transform. • Y Cargar: load. Con ello, queremos decir que todo proceso ETL consta precisamente de estas tres fases: extracción, transformación y carga. Vamos a definir en qué consisten cada una de estas fases

PROCESOS ETL DEL DATAWAREHOUSE

Teniendo como primer paso para la obtención de la información hacia el ambiente del

Data WareHouse. Una vez que la información es extraída hacia el área de tráfico de

datos, hay posibles pasos de transformación.

Ejemplo limpieza de la información, que no nos sirve, seleccionar únicamente los

campos necesarios para el Data WareHouse, combinar fuentes de datos, haciéndolas

coincidir por los valores de las llaves, creando nuevas llaves para cada registro de una

dimensión.

DATAMART

Es una versión especial de almacén de datos (Data WareHouse).

Son subconjuntos de datos con el propósito de ayudar a que un área específica.

Los datos existentes en este contexto pueden ser agrupados, explorados y

transmitidos de múltiples formas para que diversos grupos de usuarios realicen la

explotación de los mismos de la forma más conveniente según sus necesidades.

El Data Mart es un sistema orientado a la consulta.

MICROSOFT SQL SERVER 2008

Primero instalamos el programa En el programa sql server 2008r2

En database se realiza un anticlick en Attach sebusca la base de datos a ser agregada

El attach Database

Seleccionamos en Add

Se selecciona las unidades lo cual elegimos la unidad donde esta nuestra carpeta con la base

de datos.

Verificamos la conexión al realizar clic en nuestra base de datos

Procedemos a trabajar el Visual Studio

Inicio

Creando un Proyecto

Elegimos el proyecto a trabajar Integration

Elegimos un nombre para el proyecto

Elegimos la unidad a guardarla Se crea una carpeta

Aceptamos

Realizamos Clic en Data Source

Nombre del archivo. , o se elige por defecto el nombre indicado

Elegimos la base de destino

Verificamos la conexión realizando el clic en Test Conection

Declaramos el nombre del origen

Ingresamos otra data para el destino

Siguiente

New(nuevo)

Seleccionamos la base de datos de destino

Verificamos la conection

Observamos la siguiente data con las dos bases:

Le damos nombre a la base

Ubicamos en la parte inferior para la coneccion: en Conection Managerscon anticlic(1)

Conectamos las bases de origen – destino(2)

2

1

Agregamos la 1ª conection de origen

Agregamos la segunda conection de destino visualizamos las conecciones

Creamos las Dimensiones

Se realizaran 3 Dimensiones de la base de destino especificada en la tabla siguiente:

Tabla a relacionarse con la de destino

DTL

Iniciamos con la tabla Proveedor – Dimension Proveedor por estar en ese orden

Con la herramienta – SQL Task

Insertamos en la opción arrastrando la herramienta SQL Task

Conectamos con la base de destino hacia donde nos dirigimos

Para realizar la limpieza de datos La tabla de Productos no se elimina datos por lo que actualiza

Las tablas siguientes tablas de destino se borraran datos

Copiamos las consultas realizadas

Trabajamos con data flow task para las 3 dimensiones

Observamos las Dimensiones a tratar

Realizamos dobleclic en dataflowProveedor

Ingresamos un OLB Source

La base de origen

Seleccionamos table por que ambas bases se relacionan con tablas sus datos

Se origina la activación

Ingresamos un data convertion lo cual homogeniza los datos ()

Doble clic mostrando este cuadro

Seleccionamos lo requerido por no ser de igual tipo dato, en este caso todos

Especificamos con un nombre para ubicarlo en el mapping con mayor facilidad

Ingresamos una herramienta de destino

Dobleclic en sourcedestino verificamos y ubicamos en el destino

Nos ubicamos en mapping

Seleccionamos lo requerido(a relacionar)

Comprobamos la conexión como alerta origina de color verde

Datos Origen

Dimensión tiempo en origen no tiene fecha, año, mes luego se completaran creando su

consulta : SELECT * FROM Compra

Agrupamos con GROUP BY Fecha

Consulta Mes

Consulta TRIMESTRE

Consulta Año

Dobleclic ingresamos

Seleccionamos Comand por lo que ingresamos las consultas:

Ingresamos la herramienta destino aquí no insertamos la herramienta data conection por

ingresar consultas

Conexión Tiempo

Relacionamos con lo correspondiente

Ejecutamos

Conectamos

Ubicamos el Producto desde valor cero

Insertamos 2 OLE DB

Un origen

Un destino

Configuramos Origen

Destino

Destino Producto

Los elementos son iguales

Modificamos para que tengan los mismos caracteres sor

Soordestino

Para unir a los sor con el main ubicamos derecha o izquierda

Clic en Mage Join

Activamos

Ingresamos un conditional

Dobleclic

NULL

Verificamos en las Columnas

Ubicamos a KEY

Al unir origina

Dobleclic

Relacionamos

Ejecutamos

Conclusiones

Indicar y señalar la importancia del proceso ETL y la necesidad

de que ésta sea planificada y modelada correctamente.

Facilitar esfuerzos de definición y redefinición de actividades.

ETL es la etapa más crítica para la calidad de la información de los almacenes de datos.

Se pretende desarrollar un modelo conceptual para procesos

ETL con su propia notación gráfica, tomando en cuenta los aspectos de seguridad.

ETL es el proceso que organiza el flujo de los datos entre diferentes

sistemas en una organización y aporta los métodos y herramientas necesarias para mover datos desde múltiples fuentes como la compra.

ETL forma parte de la Inteligencia de Negocios (Business Intelligence),

también llamado “Gestión de los Datos” (Data Management).