96
PROTOTIPO DE UNA BODEGA DE DATOS PARA LA EMPRESA SALÓN DEL AUTOMÓVIL ANDRES CAMILO PINEDA SUAVITA 066051026 WILMER HEDERT TORRES GONZALEZ 066051019 UNIVERSIDAD LIBRE FACULTAD DE INGENIERÍA PROGRAMA DE INGENIERÍA DE SISTEMAS BOGOTÁ D.C. 2011

PROTOTIPO DE UNA BODEGA DE DATOS PARA LA EMPRESA …

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

PROTOTIPO DE UNA BODEGA DE DATOS PARA LA EMPRESA SALÓN DEL AUTOMÓVIL

ANDRES CAMILO PINEDA SUAVITA 066051026

WILMER HEDERT TORRES GONZALEZ 066051019

UNIVERSIDAD LIBRE FACULTAD DE INGENIERÍA

PROGRAMA DE INGENIERÍA DE SISTEMAS BOGOTÁ D.C.

2011

PROTOTIPO DE UNA BODEGA DE DATOS PARA LA EMPRESA SALÓN DEL AUTOMÓVIL

ANDRES CAMILO PINEDA SUAVITA 066051026

WILMER HEDERT TORRES GONZALEZ 066051019

Trabajo de grado para obtener el título de Ingeniero de Sistemas

Director Gilberto Pedraza García

Ingeniero de Sistemas y Computación

UNIVERSIDAD LIBRE FACULTAD DE INGENIERÍA

PROGRAMA DE INGENIERÍA DE SISTEMAS BOGOTÁ D.C.

2011

Nota de Aceptación: _______________________________ _______________________________ _______________________________ _______________________________ _______________________________ _______________________________

_______________________________ Director del Proyecto

_______________________________ Firma del jurado

_______________________________ Firma del jurado

Bogotá (23, 09, 2011)

3

AGRADECIMIENTO Queremos manifestar nuestro agradecimiento a todas las personas que durante el proceso nos han apoyado en esta etapa de nuestras vidas, a nuestro director de proyecto Ingeniero Gilberto Pedraza García que gracias a él hemos escogido uno de los temas interesantes de la Ingeniería de Sistemas como son las Bodegas de datos, por sus continuas enseñanzas y su apoyo en el proceso de este trabajo. Quisiéramos también darle las gracias a nuestra familia que nos han brindado todo el apoyo posible, durante todo este proceso de formación desde el comienzo hasta culminación de nuestra carrera. Adicionalmente les agradecemos a todas las personas que han intervenido con este proyecto, ofreciéndonos su conocimiento y experiencia sobre el tema (Bodegas de datos).

4

CONTENIDO

Pág.

INTRODUCCIÓN 16

1. PLANTEAMIENTO DEL PROBLEMA 17 1.1 DESCRIPCIÓN DEL PROBLEMA 17 1.2 FORMULACIÓN DEL PROBLEMA 17 1.3 JUSTIFICACIÓN 17 1.4 OBJETIVOS 18 1.4.1 General 18 1.4.2 Específicos 18 1.5 ALCANCE 18 1.6 HIPÓTESIS 19

2. MARCO REFERENCIAL 20 2.1 MARCO HISTÓRICO 20 2.1.1 Visión. 20 2.1.2 Misión. 20 2.1.3 Tipo de Ventas Salón del Automóvil. 20 2.2 MARCO CONCEPTUAL 21 2.2.1 Toma de decisiones. 21 2.2.2 Bodegas De Datos. 24 2.2.3 Modelamiento Dimensional. 25 2.2.4 Modelo multidimensional. 26 2.2.5 Modelamiento en Bodegas de Datos 27 2.2.6 Arquitectura de la Bodega de Datos 27 2.2.7 Proceso ETL. 28 2.2.8 Datawarehouse Manager. 29 2.3 MARCO METODOLÓGICO 30 2.3.1 Metodología de Ralph Kimball. 30 2.4 MARCO LEGAL 41 2.5 MARCO TECNOLÓGICO 43 2.5.1 Herramienta de desarrollo 43 2.6 MARCO GEOGRÁFICO 44

3. DISEÑO METODOLÓGICO 45 3.1 TIPO DE INVESTIGACION 45

5

4. DESARROLLO METODOLÓGICO 48 4.1 PLANEACIÓN DEL PROYECTO 48 4.2 DEFINICIÓN DE REQUERIMIENTOS DE NEGOCIO 53 4.3 DISEÑO ARQUITECTURA TÉCNICA. 56 4.4 SELECCIÓN DE HERRAMIENTAS E INSTALADOR. 57 4.5 MODELAMIENTO DIMENSIONAL 57 4.6 DISEÑO CONCEPTUAL. 58 4.7 DISEÑO LÓGICO. 65 4.8 DISEÑO FÍSICO. 66 4.9 DISEÑO DE CAPAS DE DATOS INTERMEDIA Y DESARROLLO 69 4.10 CUBOS CON MICROSOFT SQL SERVER 2008 79

5. RESULTADOS 82

6. CONCLUSIONES 90

7. RECOMENDACIONES 91

BIBLIOGRAFÍA 92

ANEXOS 94 

6

LISTA DE FIGURAS Pág.

Figura 1. Los tres pilares de BI 23

Figura 2. Modelo Estrella 25

Figura 3. Arquitectura bodega de datos 27

Figura 4. Ciclo de vida para el desarrollo de la bodega de datos 31

Figura 5. Mapa por localidades Bogotá 44

Figura 6. Cronograma de actividades 51

Figura 7. Origen de Datos 54

Figura 8. Diseño Arquitectura Técnica 56

Figura 9. Diseño conceptual 64

Figura 10. Diseño Lógico 65

Figura 11. Creación de tablas Cliente y Tipo_Transaccion 66

Figura 12. Creación de tablas Departamento, Producto y Tiempo 67

Figura 13. Creacion de tabla Hechos_Ventas 68

Figura 14. Creacion de tablas Temporales 68

Figura 15. Creacion de tabla Temporal Tiempo 69

Figura 16. Dimension Cliente 70

Figura 17. Propiedades Objeto Ordenar Cliente 70

Figura 18. Dimensión Tipo Transacción 71

Figura 19. Propiedades Objeto ordenar Tipo Transacción 71

Figura 20. Dimensión Departamento 72

Figura 21. Propiedades Objeto Ordenar Departamento 72

Figura 22. Dimensión Producto 73

Figura 23. Propiedades Objeto Ordenar Producto 73

Figura 24. Dimensión Temporal Tiempo 74

Figura 25. Dimensión Tiempo 75

Figura 26. Propiedades Origen de Tiempo y consulta SQL 75

Figura 27. Tabla Temporal Nit 76

Figura 28. Propiedades Objeto Ordenar Nit 76

7

Figura 29. Tabla Temporal Valor 77

Figura 30. Propiedades Objeto Ordenar Valor 77

Figura 31. ETL Hechos Ventas 78

Figura 32. Vista en Analysis Services 79

Figura 33. Cubo Ventas Salón Automóvil 80

Figura 34. Proceso de carga de los Datos al cubo 80

Figura 35. Cubo Cargado con los Datos 81

Figura 36. Informe Clientes Mayoristas 83

Figura 37. Informe Producto Mayorista 84

Figura 38. Informe Compras Mensuales 85

Figura 39. Informe Medio de pago 86

Figura 40. Informe Promedio Clientes 87

Figura 41. Informe Promedio Ciudad 88

Figura 42. Informe Promedio Sexo 89 

8

LISTA DE TABLAS

Pág.

Tabla 1. Marco legal 41

Tabla 2. Descripción Roles 49

Tabla 3. Asignación de Roles 50

Tabla 4. Actividades de gestión de costos 51

Tabla 5. Actividades control de cronograma 52

Tabla 6. Descripción Requerimientos 55

Tabla 7. Primera Forma Normal 59

Tabla 8. Primera Forma Normal 59

Tabla 9. Descripcion Primera Forma Normal 60

Tabla 10. Segunda Forma Normal 60

Tabla 11. Segunda Forma Normal 61

Tabla 12. Segunda Forma Normal 61

Tabla 13. Segunda Forma Normal 61

Tabla 14. Tercera Forma Normal 62

Tabla 15. Tercera Forma Normal 62

Tabla 16. Tabla Conceptual 62

Tabla 17. Descripción Clientes Mayoristas 83

Tabla 18. Descripción Producto Mayorista 84

Tabla 19. Descripción Compras Mensuales 85

Tabla 20. Descripción Medio de Pago 86

Tabla 21. Descripción Promedio Clientes 87

Tabla 22. Descripción Promedio Ciudad 88

Tabla 23. Descripción Promedio Sexo 89 

9

LISTA DE ANEXOS

Anexo A. Entrevista 94

Anexo B. Posible implementación 96

10

GLOSARIO

APLICACIÓN: cualquier programa que corra en un sistema operativo y que haga una función específica para un usuario. Por ejemplo, procesadores de palabras, bases de datos, agendas electrónicas, etc. BASES DE DATOS: recopilación sistematizada y organizada de datos conexos, usualmente erigida o conformada a través de medios informáticos, estructurados de tal manera que faciliten su explotación para satisfacer los requerimientos de información. BODEGA DE DATOS: conjunto de datos integrados u orientados a una materia, que varían con el tiempo y que no son transitorios, los cuales soportan el proceso de toma de decisiones de la administración y está orientada al manejo de grandes volúmenes de datos provenientes de diversas fuentes o diversos tipos. BUSINESS INTELLIGENCE: es la habilidad para transformar los datos en información, y la información en conocimiento, de forma que se pueda optimizar el proceso de toma de decisiones en los negocios. CONOCIMIENTO: es el acervo de información utilizado en el proceso de la toma de decisiones. DATOS: hechos, conceptos, instrucciones o caracteres representados de una manera apropiada para que sea comunicado, transmitido o procesado por seres humanos o por medios automáticos y a los cuales se les asigna o se les puede asignar significado. DATAMART: base de datos departamental, especializada en el almacenamiento de los datos de un área de negocio específica. ESTRATEGIA: conjunto de acciones que se llevan a cabo para lograr un determinado fin. FLUJO DE DATOS: sirve para conectar el resto de componentes de un diagrama de flujo de datos, este concepto es muy similar a la tubería a través fluye información estructurada conocida. GESTIÓN DE CONOCIMIENTO (KNOWLEDGE MANAGEMENT): es la disciplina que busca enfocar el uso de las Tecnologías de Información en las personas, con el fin de que estas y sus organizaciones aprendan a utilizar los recursos y fuentes de información para el logro de objetivos estratégicos.

11

HARDWARE: conjunto de dispositivos físicos que componen el ordenador: la pantalla, el teclado, el ratón, etc. IDENTIFICAR LAS FUENTES: hace referencia al proceso de identificación de las fuentes y datos que harán parte de la bodega o almacén de datos. INSTALACIÓN: proceso en el cual nuevos programas son transferidos a un computador y, eventualmente, configurados, para ser usados con el fin para el cual fueron desarrollados. INFORMACIÓN: es el resultado del procesamiento de datos. Todo aquello que permite adquirir cualquier tipo de conocimientos. INNOVACIÓN: es la aplicación de nuevas ideas, conceptos, productos, servicios y prácticas, con la intención de ser útiles para el incremento de la productividad. Un elemento esencial de la innovación es su aplicación exitosa de forma comercial. No solo hay que inventar algo, sino, por ejemplo, introducirlo en el mercado para que la gente pueda disfrutar de ello. MEDIOS DE ALMACENAMIENTO: son los materiales físicos donde se almacenan datos, ejemplo de ellos discos magnéticos, discos ópticos, cintas magnéticas, tarjetas de memoria, etc. METADATO: contienen información fundamental para los usuarios, desarrolladores y administradores de la bodega de datos: información disponible, su significado y como obtenerla; Fuente de datos para cada ítem de la bodega de datos, si el ítem es tomado directamente de un sistema fuente o si es calculado, última actualización del ítem, etc. METODOLOGÍA: la rama de la metodología, dentro de la ingeniería de software, se encarga de elaborar estrategias de desarrollo de software que promuevan prácticas adoptativas en vez de predictivas; centradas en las personas o los equipos, orientadas hacia la funcionalidad y la entrega, de comunicación intensiva y que requieren implicación directa del cliente. MODELO: propuesta, normalmente de carácter teórico-práctico, que tiene una serie de características que se consideran dignas de emular. Generalmente, el modelo ilustra una situación deseable para ser analizada y puesta en práctica en un contexto educativo similar, o bien adaptarla a otras características del entorno. MOTOR DE BASE DE DATOS: es el servicio principal para almacenar, procesar y proteger datos. El Motor de base de datos proporciona acceso controlado y procesamiento de transacciones rápido para cumplir con los requisitos de las aplicaciones consumidoras de datos más exigentes de la empresa.

12

NEGOCIO: es una ocupación lucrativa que cuando tiene un cierto volumen, estabilidad y organización se llama empresa. También es la consecuencia de la correcta administración de los recursos con un resultado económicamente positivo para las partes; es importante señalar que no solamente puede ser dinero sino relaciones de poder. OLAP: las siglas OLAP significan en inglés Online Analytical Processing, una categoría de herramientas de software que provee análisis de datos almacenados en una base de datos multidimensional. Las herramientas OLAP permiten a los usuarios analizar diferentes dimensiones de datos. PLANIFICACIÓN: es el proceso de establecer metas y elegir medios para alcanzar dichas metas. PROCESO: conjunto de actividades o eventos (coordinados u organizados) que se realizan o suceden (alternativa o simultáneamente) con un fin determinado. Este término tiene significados diferentes según la rama de la ciencia o la técnica en que se utilice. RED: conjunto de medios técnicos que permiten la comunicación a distancia entre equipos autónomos (no jerárquica -master/slave-). Normalmente se trata de transmitir datos, audio y vídeo por ondas electromagnéticas a través de diversos medios (aire, vacío, cable de cobre, cable de fibra óptica, etc.). SISTEMAS: los sistemas son todos aquellos programas que se elaboran para satisfacer las posibles necesidades de información automatizada de cada área en particular. Por decir, en el área de sistemas de un Banco existen los sistemas de cheques, ahorro, remesas, tarjeta de crédito, crédito hipotecario, etc. SISTEMA DE INFORMACIÓN: se debe considerar un sistema de computación e información como el conjunto de componentes físicos (hardware), lógicos (software), de comunicación (bien redes de cualquier tipo o tipo Internet) y medios humanos, todo ello unido permite el tratamiento de la información. SISTEMA OPERATIVO: software que actúa de interfaz entre los dispositivos de hardware y los programas usados por el usuario para utilizar un computador. Es responsable de gestionar, coordinar las actividades y llevar a cabo el intercambio de los recursos y actúa como estación para las aplicaciones que se ejecutan en la máquina. SOFTWARE: conjunto de instrucciones y datos codificados para ser leídas e interpretadas por una computadora. Estas instrucciones y datos fueron concebidos para el procesamiento electrónico de datos.

13

SQL (STRUCTURED QUERY LANGUAGE): lenguaje utilizado para base de datos desarrollado en 1974 y 1975 en IBM Research. TECNOLOGÍA: es el conjunto de habilidades que permiten construir objetos y máquinas para adaptar el medio y satisfacer nuestras necesidades. Es una palabra de origen griego, formada por tekne ("arte, técnica u oficio") y logos ("conjunto de saberes"). Aunque hay muchas tecnologías muy diferentes entre sí, es frecuente usar el término en singular para referirse a una de ellas o al conjunto de todas. Cuando se lo escribe con mayúscula, tecnología puede referirse tanto a la disciplina teórica que estudia los saberes comunes a todas las tecnologías, como a educación tecnológica, la disciplina escolar abocada a la familiarización con las tecnologías más importantes. TOMA DE DECISIONES: es el proceso durante el cual la persona debe escoger entre dos o más alternativas. Todos y cada uno de nosotros pasamos los días y las horas de nuestra vida teniendo que tomar decisiones. Algunas decisiones tienen una importancia relativa en el desarrollo de nuestra vida, mientras otras son gravitantes en ella.

14

RESUMEN El uso de las Bodegas de datos como medio de información en una empresa, ha revolucionado el ambiente empresarial, principalmente en lugares donde se desea tener un conocimiento más profundo sobre la manera de poder mejorar sus estrategias de mercado. Un problema presentado en la empresa Salón del Automóvil es la poca eficiencia en el uso de la información la cual no se pueden sacar conclusiones, ya que esta información no es muy utilizada por la redundancia de los datos y no representan ninguna ayuda en el mejoramiento de la toma de decisiones y procesos internos de la empresa Salón del Automóvil, así almacenando datos año tras año sin darle un uso adecuado para beneficio de la misma empresa. Además si la organización requiere generar un informe con estos datos se demoran demasiado tiempo porque este proceso se realiza manualmente y no pueden saber con exactitud que clientes compran más durante cada año. El análisis y diseño de una bodega de datos para ayudar en la toma de decisiones en la empresa Salon del Automóvil genera los informes de los clientes mayoristas, los productos más vendidos, las fechas de las mayores compras, los medios de pago que cancelan los clientes y el promedio de compra por cliente mayorista, además lo datos son almacenados y organizados en la herramienta Microsoft SQL Server 2008. Palabras Claves: Bodega de datos, Información histórica, Toma de decisiones, Ventas, Dimensiones, ETL, Inteligencia de negocios, Clientes, Metodología de Bodega de datos, Modelamiento, Aplicativos, Plataformas.

15

INTRODUCCIÓN Empresas como el Salón del Automóvil buscan incrementar su productividad y ventajas frente a la competencia mediante nuevas estrategias de negocio. Para el cumplimiento de estas estrategias es necesario utilizar toda la información que es almacenada día a día en sus bases de datos. Al manejar esta información de las bases de datos para la toma de decisiones, se presenta un problema principal: existe demasiada información que no es utilizada por la empresa, muchas veces terminan desasiéndose de estos datos y desaprovechando la oportunidad de generar unos nuevos ingresos para la organización. Por lo tanto, se busca una unificación entre la parte de datos y la parte de los negocios, por medio de una solución basada en el almacenamiento de datos. Esta solución permite utilizar los datos operativos de la empresa para generar información que soporte la toma de decisiones. Grandes empresas como EPM, Telmex, Pichincha, TIGO e IBM han utilizado la inteligencia de negocios para estos propósitos, permitiéndoles conocer mejor a sus clientes, sus productos, ventas, costos y otros factores determinantes en sus negocios. Esta tesis se encuentra dividida en 3 capítulos, el primero de ellos corresponde al Planteamiento del Problema donde se realiza un análisis profundo de la problemática que se desea enfocar, dando la descripción y la formulación del problema que se quiere analizar y mostrar en el proyecto, así como la justificación, objetivos y alcance que se desea tener. El segundo capítulo consiste en los conceptos, el Modelamiento y el proceso en los cuales se basa esta tesis para el desarrollo del prototipo para la empresa SALÓN DEL AUTOMÓVIL, adicional la metodología que se aplicara para el desarrollo del mismo. En el tercer capítulo se explica con más profundidad la metodología que ayuda a la elaboración del prototipo de la bodega de datos para la empresa Salón del Automóvil.

16

1. PLANTEAMIENTO DEL PROBLEMA

1.1 DESCRIPCIÓN DEL PROBLEMA En la empresa SALÓN DEL AUTOMÓVIL, compañía que se dedica a la compra y venta de repuestos para automóviles, donde se desarrolla el proyecto, se encontraron los siguientes problemas: • La información que almacena la empresa cada año tienen muchos datos redundantes, la falta de organización de los mismos hacen que no sea utilizada de la mejor manera, así generando riesgos para la organización en caso que se presente fuga de información. • Al momento de generar un informe o reporte no tienen una aplicación adecuada para producirlos y así la información no es utilizada por la empresa para mejorar su estabilidad económica y no se puede tomar decisiones acertadas en caso de ser requerido. • La empresa no tiene un control optimo sobre el manejo de los clientes que mas compran durante el año y no pueden saber con exactitud los ingresos por este concepto, sino se sabe cuáles son los clientes más fieles a los productos de la empresa esto genera algunas perdidas ya que muy probablemente los clientes recomienden a la competencia.

1.2 FORMULACIÓN DEL PROBLEMA ¿Será posible que mediante la aplicación de las tecnologías de la información a través de la formulación y modelación de soluciones, se pueda apoyar la toma de decisiones de los clientes mayoristas de la empresa?

1.3 JUSTIFICACIÓN Este proyecto realiza un análisis y diseño de una bodega de datos para la empresa Salón del Automóvil. El proyecto muestra el valor agregado que genera la introducción de tecnologías de información en el desarrollo de las estrategias de la organización. Particularmente está enfocado a mejorar la toma de decisiones en las ventas realizadas por la empresa determinando el cliente que mayor compra, consolidándola mejor en el mercado de los repuestos automotrices. El prototipo permite tener una idea global de los compradores mayoristas en el transcurso del año electo, con la realización de la bodega de datos se obtiene un modelado y un diseño de la misma, evitando que la empresa se centre en objetivos que no generen mejores ingresos, proporcionando una mejor toma de decisiones para las ventas de la empresa en un futuro.

17

Se obtendrá una mejor acogida en el mercado y con ello un mayor crecimiento de las ventas de repuestos automotrices, ya que la empresa segmentara mejor sus clientes para así generar unos mejores ingresos. Los beneficios que se pueden generar en la consolidación de información es la siguiente: Generar reportes estadísticos de los clientes mayoristas en la empresa en un periodo establecido, mejora en la toma de decisiones y un aumento significativo en las ventas, para ello se va articular el uso de tecnologías de información (bodegas de datos) en cumplimiento de objetivos y estrategias organizacionales.

1.4 OBJETIVOS

1.4.1 General. Elaborar una estrategia para toma de decisiones que permita describir un comportamiento o plantear un modelo de predicción relacionado con la problemática de los clientes mayoristas de la empresa Salón del Automóvil utilizando Microsoft SQL Server 2008 y su componentes analysis services e Integration services.

1.4.2 Específicos • Establecer el perfil de los clientes y priorizar un conjunto de requerimientos para fidelización de clientes mayoristas de la empresa Salón del Automóvil. • Identificar y valorar la calidad de las fuentes de datos disponibles y requeridas para implementar el modelo • Modelar e implementar una estrategia de bodega de datos para consolidar la información necesaria. • Aplicar el modelo de análisis a la bodega para establecer las variables que determinan la fidelización de clientes y evaluar resultados.

1.5 ALCANCE Se realiza el Prototipo de una bodega de datos para la empresa SALÓN DE AUTOMÓVIL para ayudar a la toma de decisiones de la empresa. Se busca hacer un modelo de predicción relacionado con la problemática de los clientes mayoristas de la empresa, sobre el objeto de estudio de la investigación se abarca nuevas tecnologías de información en el desarrollo organizacional, mediante el cual se analizara información histórica y actual para el apoyo de la toma de decisiones Diseño y construcción de la bodega de datos aplicando una metodología reconocida. Aplicación de Software para los clientes mayoristas de la empresa.

18

1.6 HIPÓTESIS  En el momento de implementar la bodega de datos que se propone, se obtendrá como resultado la integración y consolidación de la información histórica, soportados en el análisis de las diferentes variables que permitan mejorar nuestras estrategias y ayudarnos al mejoramiento de la toma de decisiones para así tener una iteración con el usuario final (cliente).

19

2. MARCO REFERENCIAL

2.1 MARCO HISTÓRICO En el ambiente automotriz la empresa Salón del automóvil se destaca por su alta calidad en el servicio, el completo inventario de repuestos y su alta preferencia con sus clientes. Desde el inicio se propuso por brindarles a sus clientes buena calidad en la atención. La empresa dispone de un almacén en los Martires en Bogotá, con un total de 15 empleados divididas en las áreas administrativas y operativas del negocio, esto con el fin de brindar un gran apoyo a los fieles clientes de la empresa. Es una empresa fuerte, solida y con un objetivo claro, mantener el liderazgo que los apoya por más de quince años de servicio. Ahora el Salón del automóvil se proyecta hacia el futuro buscando expansión en el mercado y mejorando servicios estratégicos para mantener la preferencia de sus clientes. El interés de nuestro proyecto es poderle brindar a la empresa una herramienta que ayude a la toma de decisiones y así poder alcanzar las metas propuestas por la empresa, ya que no cuenta con un sistema que le facilite tomar las mejores decisiones para un futuro cercano. Como toda empresa tiene unos Objetivos y metas ha alcanzar como son:

2.1.1 Visión. “Ser en un futuro inmediato el principal proveedor de autopartes y productos con una mejor calidad. Seremos la mejor opción para nuestros clientes y estaremos al día con las nuevas tecnologías que nos permitan ofrecer un excelente servicio con los mejores estándares de calidad para ser reconocidas dentro del mercado de autopartes como los líderes indiscutibles en Colombia”1. 

2.1.2 Misión.   “En el Salón del Automóvil nos comprometemos a ser la mejor opción del mercado de autopartes, a través de nuestros diferentes puntos de ventas a nivel nacional, ofreciendo un excelente servicio y productos de calidad que le permita a nuestros clientes satisfacer sus necesidades y a nuestros accionistas, aliados y empleados un mejor nivel de vida para contribuir al progreso de nuestro país”2. 

2.1.3 Tipo de Ventas Salón del Automóvil. La empresa Salón del automóvil desde su creación ha manejado diferentes formas de llegar a sus clientes, ofreciendo nuevos productos y mejores precios en el mercado. Estas ventas se dividen en tres partes las cuales se adaptan a los diferentes tipos de clientes que maneja la empresa Salón del Automóvil. 1 Manual de calidad. Empresa Salón del Automóvil.2010 2 Ibid

20

• Venta de productos en el almacén. Sucede cuando un cliente se acerca directamente al almacén a realizar una compra de un repuesto o parte para su vehículo automotriz. El pago es realizado en efectivo o por medio de electrónico (tarjeta debito o crédito), luego pasa a la parte de entrega del almacén y el cliente lo recibe. • Venta de los productos por los vendedores. Sucede cuando un vendedor de la empresa realiza sus ventas en la parte exterior del almacén sin necesidad de que el cliente se acerque al almacén a realizar su compra. El pago es realizado en efectivo, si el cliente desea hacerlo por medio electrónico es necesario que se acerque al almacén, luego de hecha la venta el vendedor le toma los datos al cliente y hace llegar la mercancía al lugar indicado. En caso de que el cliente quiera llevar sus repuestos o partes de inmediato es necesario que se acerque al almacén. • Venta por teléfono. Sucede cuando el cliente se comunica directamente a la empresa a solicitar un producto en específico o realizar un pedido mayor. Por este medio es como la empresa tiene la mayor entrada de capital y de ventas. La empresa maneja la mayoría de sus clientes con una forma de pago la cual es a crédito dando un tiempo máximo de 30 días para cancelar el pedido solicitado. Para que la empresa brinde estos créditos se realiza un estudio crediticio que demuestre la solvencia económica de los clientes para poder ser entregado el producto

2.2 MARCO CONCEPTUAL

2.2.1 Toma de decisiones. La toma de decisiones se define como el análisis de acciones, donde permite a la empresa mejorar su estabilidad económica ayudando a abrir nuevos mercados. Sin embargo la toma de decisiones es una planeación de los procesos que permite el cumplimiento de los objetivos o metas de la empresa. El proceso de toma de decisiones es uno de los rangos más significativos para caracterizar una empresa, porque en él se resume su cultura y sus paradigmas administrativos. En las organizaciones Colombianas, por lo general, procede a buscar las decisiones más obvias y familiares, las empresas dedican casi todo su tiempo y sus recursos a la realización de los procesos de transformación basándose en la elaboración de sus productos dejando de lado la innovación y el perfeccionamiento, haciendo que la tomas sea rutinarias y basadas

21

La toma de decisiones abarca cuatro funciones administrativas, así los administradores cuando planean, organizan, conducen y controlan, se les denomina con frecuencia los que toman las decisiones. La separación del proceso en etapas puede ser tan resumida o tan extensa como se desee, pero poder identificar principalmente las siguientes etapas: Identificar y analizar el problema Identificar los criterios de decisión y ponderarlos Definir la prioridad para atender el problema Generar las alternativas de solución Evaluar las alternativas Elección de la mejor alternativa Aplicación de la decisión Evaluación de los resultados

• Inteligencia De Negocios (BI). A través de los años la Inteligencia de Negocios o Business Intelligence(BI) ha tenido mayor acogida en las grandes empresas por sus características para tomar información histórica y generar escenarios, pronósticos y reportes que ayudan a la toma de decisiones, lo que sirve para que la empresa obtenga una ventaja competitiva frente a las otras empresas. En la actualidad hay muchas empresas que se han beneficiado por la implementación de este sistema, buscando tener mayores ingresos. Hoy en día las organizaciones tienen la necesidad de implementar un sistema de Inteligencia de negocios por muchas razones como son: Permite reunir, normalizar y centralizar toda la información de la empresa, mediante una bodega de datos. Las plataformas de BI se diseñan para perfeccionar al máximo las consultas de alto nivel, realizando las transformaciones oportunas a cada sistema (OLTP - OLAP), y liberando los servidores operacionales. Permite articular las tecnologías de información al cumplimiento de los objetivos de cada organización. • Los Tres pilares de BI. BI representa más que sólo una aplicación. Los estudios de caso muestran que las empresas que utilizan la fuerza combinada de los tres pilares del BI - la infraestructura o las mejores herramientas, prácticas y aplicaciones - son las más propensas a implementar BI de una manera que ofrezca un valor.

22

Infraestructura y herramientas - Durante el año 2004, las empresas harán hincapié en mejorar o modificar su infraestructura de BI para proporcionar la durabilidad y la agilidad necesaria para el apoyo estratégico en aplicaciones de BI y ofrecer un valor continuo. Mejores prácticas - tecnología por sí sola no puede producir conocimiento. Las empresas también necesitan una estrategia de BI para toda la empresa y cumplir una política de gobierno de BI. Aplicaciones - En una encuesta de Gartner, el 60 por ciento de los encuestados europeos y el 30 por ciento de los EE.UU. declaró que comprar aplicaciones de BI en vez de construirlas. Además, las capacidades de los proveedores de aplicaciones empresariales "continúan ganando importancia en el mercado de BI. Sin embargo, a medida que más empresas adoptan muchas tecnologías diferentes y sin relación de BI, la fragmentación de BI en las empresas aumentará.3 Figura 1. Los tres pilares de BI

Fuente: Libro Business Intelligence: A Managerial Approach 4

• Aplicaciones de Inteligencia de negocios (BI). Hoy en día existe una gran variedad de software y herramientas enfocadas en Inteligencia de negocios (BI) que son utilizadas en las diferentes áreas de la empresa, como el área de ventas, marketing, finanzas, etc., que permiten el acceso rápido y fácil a información útil y valiosa de la empresa. Con la inteligencia de negocios se pueden crear bases de

3 TURBAN Efraim, SHARDA Ramesh, ARONSON Jay, KING David. “Business Intelligence: A Managerial Approach”. Pearson Education Canada, 2010 4 Ibid

23

datos de clientes, prever ventas y devoluciones, compartir información y mejorar el servicio al cliente. Para realizar un análisis adecuado de Inteligencia de negocios es necesario tener en cuenta las siguientes características: • Accesible a la información. Los datos que son la fuente principal deben garantizar que este tipo de herramientas tenga un uso adecuado para que los usuarios la pueden utilizar de una manera correcta, independientemente del origen de los datos. • Apoyo en toma de decisiones. La idea en la inteligencia de negocios es difundir la presentación de la información, para que todos los usuarios tengan acceso a las técnicas de análisis que les permita seleccionar y manejar los datos más notables para la organización. • Orientación al usuario final. Las soluciones en inteligencia de negocios se pueden dividir en su nivel de complejidad: informes simples, cubos OLAP (On Line Analytic Processing), minería de datos o sistemas de previsión empresarial. . Los cubos OLAP son vectores en los cuales se dispone la información, y mediante este se genera un análisis completo de los datos.

2.2.2 Bodegas De Datos. Las bodegas de datos son una colección de datos que contiene información procedente de sistemas de bases de datos o archivos de la organización y de otros sistemas relacionados al negocio, la formación de una bodega de datos se obtiene mediante procesos de extracción, transformación y Carga de datos utilizados para el soporte del proceso de toma de decisiones gerenciales. El datawarehouse es siempre un almacén de datos transformados y separados físicamente de la aplicación de donde provienen los datos.  Una bodega de datos es el resultado de las transformaciones, la mejora de la calidad y la integración de datos procedentes de bases de operaciones. Ralph Kimball define un almacén de datos como: "una copia de las transacciones de datos específicamente estructurada para la consulta y el análisis". También determino que un datawarehouse no era más que: "la unión de todos los Datamarts de una entidad". Toda bodega de datos debe tener las siguientes características: • Orientados a un tema particular. la información se clasifica en base a los aspectos que son de interés para la empresa • Integrado. La integración de datos se muestra de muchas maneras: en convenciones de nombres consistentes, en la medida uniforme de variables, en la

24

codificación de estructuras consistentes, en atributos físicos de los datos consistentes y fuentes múltiples, estos datos deben ser consistentes. • Variante en el tiempo. La información debe incluir los datos históricos para usarse en la identificación y evaluación de tendencias. • No volátil. La información no se modifica ni se elimina, la información es útil sólo cuando es estable. Hay dos únicos tipos de operaciones: la carga inicial de datos y el acceso a los mismos.

2.2.3 Modelamiento Dimensional. El modelo dimensional es una técnica de diseño lógico que busca presentar los datos de forma intuitiva y proporcionando acceso de alto desempeño. Cada modelo dimensional se compone de una tabla con múltiples llaves foráneas, llamada tabla de Hechos (fact table), y un conjunto de tablas más pequeñas, llamadas tablas de dimensión.  Existen dos modelos dimensionales que predominan en las soluciones de bodegas de datos: el modelo estrella y el modelo copo de nieve. En el modelo estrella, como se ve en la figura 2 se tiene una tabla de hechos y en ella llaves foráneas a cada una de las tablas de dimensión que tiene el modelo. Es decir, cada tabla dimensional está directamente relacionada a la tabla de hechos. 5

Figura 2. Modelo Estrella

Fuente: Libro The Data Warehouse ETL Toolkit6

Una dimensión es modelada de forma copo de nieve cuando los campos de baja cardinalidad de la dimensión han sido removidos a tablas separadas y unidas a la tabla original con llaves foráneas7. En este modelo la tabla de hechos no tendrá llaves foráneas a todas las demás tablas como en el caso de la estrella. Las

5 KIMBALL Ralph, CASERTA Joe. The Data Warehouse ETL Toolkit Practical Techniques for Extracting, Cleaning, Conforming, and Delivering Data. 6 Ibid 7 Ibid

25

nuevas tablas no estarán conectadas con la tabla de hechos sino con las dimensionales establecidas.

2.2.4 Modelo multidimensional. Las Bodegas de datos y sistemas OLAP se basan en un modelo multidimensional. Este modelo permite una mejor comprensión de los datos con fines de análisis y proporciona un mejor rendimiento para consultas complejas de análisis. Visión del modelo de datos multidimensional en un espacio n-dimensional, generalmente llamado un cubo de datos o un hipercubo. 8 Los Datamarts son subconjuntos, que debe ser consistente en la representación de los datos, para que pueda asegurar la robustez. Son subconjuntos de datos de una bodega de datos para áreas específicas, los Datamarts son pequeños datawarehouse encargados de un tema o un área de negocio específico dentro de una organización. El sistema de base de datos donde se construye el DW puede ser multidimensional o relacional. Cuando este sistema es relacional el diseño lógico puede aplicar técnicas de de los modelos multidimensionales a bases de datos relacionales. • OLTP (On-Line Transactional Processing).Los sistemas OLTP son bases de datos orientadas al procesamiento de transacciones. Cada transacción genera un proceso atómico y puede involucrar las operaciones de inserción, modificación y eliminación de datos. Este proceso es típico en las bases de datos operacionales. El acceso a los datos optimizado a las tareas de lectura y escritura, un ejemplo de ello son las transacciones que tiene que soportar una base de datos de un banco. Los datos están estructurados según su nivel de aplicación, mediante los programas de gestión ERP o CRM. Es común la falta de compatibilidad y la existencia de islas de datos El historial de datos suele limitarse a los datos actuales9 • OLAP (On-Line Analytical Processing) Los sistemas OLAP son bases de datos orientadas al procesamiento analítico. Este análisis implica generalmente la lectura de amplias cantidades de datos para poder extraer información útil: tendencias de ventas, patrones de comportamiento de los consumidores…etc. Este sistema es típico de los datamarts. El acceso a los datos suele ser de solo lectura. Su acción más común es la consulta.

8 MALINOWSKI Elzbieta - · Esteban Zim´anyi . Advanced Data Warehouse Design. 2nd corrected printing 2009. Springer 9 SINNEXUS. “Bases de datos OLTP y OLAP”, [En línea]. [30 de Septiembre de 2010]. Disponible en la Web: http://www.sinnexus.com/business_intelligence/olap_vs_oltp.aspx

26

Los datos se estructuran de acuerdo a sus áreas de negocio y los formatos de los datos están integrados de una forma uniforme en toda la organización. El historial de datos es a largo plazo, normalmente de dos a cinco años Suele alimentar información procedente de los sistemas operacionales existentes, mediante el proceso ETL (Extracción, transformación y carga). 10

2.2.5 Modelamiento en Bodegas de Datos: Dimensional Vs Relacional. En los sistemas transaccionales el objetivo del modelo es brindar la integridad de los datos, además elimina todo tipo de redundancia. Este sistema nos permite tener un mejor entorno del procesamiento transaccional.  En un entorno de bases de datos relacionales se debe básicamente a esta disciplina de modelado. Sin embargo, para el propósito de un Data Warehouse, el modelo relacional (ER) presenta los siguientes problemas: Legibilidad limitada. Los usuarios finales no son capaces de entender el modelo ER. Por tanto, no pueden “navegar” por dicho modelo en busca de información. Dificultad para las herramientas de consulta en el acceso a un modelo ER general. Las herramientas de consulta a menudo poseen prestaciones mediocres o inaceptables cuando se trabaja en entornos relacionales de grandes volúmenes de información. La utilización de la técnica de modelado ER frustra el principal atractivo del Data Warehouse. Al utilizar el modelado ER queda frustrada la recuperación de información intuitiva y con alto rendimiento.

2.2.6 Arquitectura de la Bodega de Datos Figura 3. Arquitectura bodega de datos

Fuente: Pagina Web /www.dataprix.com11

10 SINNEXUS. “Bases de datos OLTP y OLAP”, [En línea]. [30 de Septiembre de 2010]. Disponible en la Web: http://www.sinnexus.com/business_intelligence/olap_vs_oltp.aspx

27

Básicamente, la forma de operar del esquema superior se resume de la siguiente manera: Los datos son extraídos desde aplicaciones, bases de datos, archivos, etc. Esta información generalmente reside en diferentes tipos de sistemas, orígenes y arquitecturas y tienen formatos muy variados. Los datos son integrados, transformados y limpiados, para luego ser cargados en la Bodega de datos. Fundamentalmente, la información de la Bodega de datos se estructura en cubos multidimensionales, ya que estos preparan esta información para responder a consultas dinámicas con una buena performance. Pero también pueden utilizarse otros tipos de estructuras de datos para representar la información de la Bodega de datos, como por ejemplo Business Models. Los usuarios acceden a los cubos multidimensionales, Business Models (u otro tipo de estructura de datos) de la Bodega de datos utilizando diversas herramientas de consulta, exploración, análisis, reportes, etc. A continuación se detallará cada uno de los componentes de la arquitectura de la Bodega de datos, teniendo como referencia siempre el gráfico antes expuesto, pero resaltando el tema que se tratará.

2.2.7 Proceso ETL. Los procesos de extracción, transformación y carga, son muy importantes porque por medio de estos procesos los datos se cargan en una bodega de datos (o en cualquier base de datos). Implican las siguientes operaciones:  • Extracción. Obtener la información deseada a partir de los datos almacenados en fuentes externas. • Transformación. Cualquier operación realizada sobre los datos para que puedan ser cargados en la Bodega de datos se puedan migrar de éste a otra base de datos. • Carga. Consiste en almacenar los datos en la base de datos final, o en este caso la Bodega de datos final.

11 ING. BERNABEU R. DARIO. “Data Warehouse Arquitectura”, [En línea]. Publicado Enero de 2009, [17 de Septiembre de 2010]. Disponible en la web: http://www.dataprix.com/data-warehousing-y-metodologia-hefesto/arquitectura-del-data-warehouse/31-introduccion

28

Las bodegas de datos, han monopolizado la investigación sobre la parte conceptual del modelado de datos, se ha dedicado a captura de características conceptuales de esquema de estrella esquema de Datamarts y agregaciones. Los modelos conceptuales de ETL, el modelo propuesto es informal y la atención se centra en demostrar la complejidad de los esfuerzos, en lugar modelo formal de las propias actividades. En términos de enfoques de tipo industrial, el modelo que se deriva sería una documentación informal del proceso de ETL general. Para la población de la bodega de datos. Existen 2 razones fundamentales: En el modelo conceptual para el proceso de ETL, la atención se centra en documentación / formalización de las particularidades de las fuentes de datos con respecto al almacén de datos y no en proporcionar una solución técnica para la ejecución del proceso. El modelo de ETL conceptual se construye a principios de las etapas del proyecto de Bodegas de Datos durante el cual, el tiempo de las limitaciones del proyecto requieren una documentación rápida de la almacenamiento de los datos en cuestión y sus relaciones.

2.2.8 Datawarehouse Manager. Es la base de datos relacional que contienen los datos obtenidos de un servidor que es un objetivo de recogida de datos. Estos datos son utilizados para generar los informes correspondientes a los conjuntos de recopilación de datos del sistema, y también se puede utilizar para crear informes personalizados. La Datawarehouse Manager presenta las siguientes características y funciones principales: • Almacena los datos de forma multidimensional, es decir, a través de tablas de hechos y tablas de dimensiones. • Gestiona las diferentes estructuras de datos que se construyan o describan sobre la Bodega de datos, como Cubos Multidimensionales, Business Models, etc. • Gestiona y mantiene metadatos. 12 • Además, la Datawarehouse Manager se encarga de:

12 ING. BERNABEU R. Dario. “Datawarehouse manager”, [En línea]. Publicado Enero de 2009, [17 de Septiembre de 2010]. Disponible en la Web: http://www.dataprix.com/data-warehousing-y-metodologia-hefesto/arquitectura-del-data-warehouse/34-datawarehouse-manager

29

• Transformar e integrar los datos fuentes y del almacenamiento intermedio en un modelo adecuado para la toma de decisiones. • Realizar todas las funciones de definición y manipulación del depósito de datos, para poder soportar todos los procesos de gestión del mismo. • Ejecutar y definir las políticas de particionamiento. El objetivo de realizar esto, es conseguir una mayor eficiencia y performance en las consultas al no tener que manejar todo el grueso de los datos. Esta política debe aplicarse sobre la tabla de hechos que, como se explicará más adelante, es en la que se almacena toda la información que será analizada. • Realizar copias de resguardo incremental o total de los datos de la Bodega de datos.13

2.3 MARCO METODOLÓGICO

2.3.1 Metodología de Ralph Kimball. La metodología para el desarrollo del proyecto es la propuesta por Ralph Kimball, quien es uno de los padres en el campo de las bodegas de datos. Kimball se ha dedicado al desarrollo de su metodología para que este concepto sea correctamente aplicado en las empresas, y cambie la calidad de los proyectos de este tipo. Durante su carrera ha escrito varios libros y ha sido consultor en el campo de las bodegas de datos. Kimball ha establecido ciertos procesos para llevar al éxito un proyecto de Bodega de datos. Para su desarrollo se incluyen varias tareas que pueden ser realizadas en forma secuencial. El desarrollo de cada una de las fases planteadas en su metodología garantiza una bodega de calidad y un proceso bien desarrollado Existen varios escenarios posibles en los que surge un proyecto de bodega de datos para una empresa. Es importante identificar el escenario para determinar el alcance y definición del proyecto. Los escenarios, originados por una demanda del proyecto en una empresa son los siguientes: • Demanda de un sector del negocio. En este escenario, un ejecutivo del negocio tiene el propósito de obtener mejor información con un mejor acceso para tomar mejores decisiones. • Alto volumen de información. En este escenario, existen múltiples ejecutivos del negocio buscando mejor información. 13 ING. BERNABEU R. Dario. “Datawarehouse manager”, [En línea]. Publicado Enero de 2009, [17 de Septiembre de 2010]. Disponible en la Web: http://www.dataprix.com/data-warehousing-y-metodologia-hefesto/arquitectura-del-data-warehouse/34-datawarehouse-manager

30

• Exploración. En este escenario usualmente está involucrado el presidente de una empresa, quien no identifica necesidades de una bodega de datos para su negocio pero desea incorporar este sistema por razones diferentes a requerimientos o necesidades del negocio. Al identificar el escenario, es posible determinar si existe demanda para el proyecto y de donde proviene esta demanda. El primer caso se puede determinar que se requiere del proyecto. El segundo escenario es riesgoso, pues para implementar una bodega de datos que soporte varios requerimientos de diferentes áreas de la empresa, se necesita mucho tiempo, dinero y soporte de la organización que perdure a largo plazo. En el tercer escenario se deben buscar los requerimientos que puede implementar la solución y basar en ellos el proyecto. Figura 4. Ciclo de vida para el desarrollo de la bodega de datos14

Fuente: Libro The Data Warehouse Lifecycle Toolkit15 En todos los escenarios es determinante contar con sponsors o patrocinadores internos del proyecto para lograr el éxito. Si no se cuenta con un patrocinador interno de la empresa involucrado en la demanda es preferible posponer el proyecto. Luego de identificar el escenario es importante conocer si la empresa está lista para realizar este proyecto.

14 KIMBALL, Ralph.The Data Warehouse Lifecycle Toolkit. John Wiley & Sons. 1998 15 Ibid

31

Determinar la preparación de la empresa para un proyecto de bodega de datos de acuerdo a Ralph Kimball existen cinco factores que deben existir en una organización para iniciar un proyecto de bodega de datos. • Patrocinio de la gerencia del negocio. Al contar con este patrocinio se tiene una visión del impacto que tendrá la bodega de datos en la empresa. Los gerentes son líderes influyentes dentro de la organización y determinarán el apoyo y soporte al proyecto de los demás miembros de la organización. Es preferible tener varios patrocinadores que uno solo, en caso de cambios en la organización o necesidad un apoyo más fuerte. • Motivación del negocio. Al implementar una bodega de datos se busca encontrar un sentido de emergencia por parte de la organización, causado por una motivación del negocio. Un ejemplo de motivadores son la competencia y la visión competitiva. Otras organizaciones han encontrado el motivador en una crisis. Un motivador importante también es un mercado potencial. Lo importante para un proyecto de bodega de datos es alinearse con uno de estos motivadores estratégicos del negocio. • Acompañamiento del departamento de tecnología y de negocio. El éxito de un proyecto de bodega de datos se produce gracias a un esfuerzo de las áreas de tecnología y de negocio, compartiendo responsabilidades. • Presencia de cultura analítica. Es importante que las decisiones de la organización se basen en hechos, más que en simples intuiciones. Y que estas decisiones sean determinantes y recompensadas. • Factibilidad. Es preferible que la infraestructura que soporte la bodega de datos esté presente y sea robusta. La primera factibilidad debe ser la de los datos. Si estos se encuentran sucios o no cumplen con estándares, el proyecto tendrá retrasos respecto al cronograma planeado. • Desarrollo del enfoque preliminar. Luego de haber determinado la preparación de la organización para el proyecto, se debe centrar el proyecto en su enfoque, y justificarlo para recibir el apoyo y presupuesto de desarrollo. Para determinar el enfoque, se deben responder preguntas como: ¿Se busca el enfoque y presupuesto para cubrir el levantamiento de requerimientos y diseño? ¿O para una primera versión de la bodega? ¿O para el proyecto completo? Para definir este enfoque la base debe ser los requerimientos del negocio, no un cronograma. Para la definición del enfoque es importante seguir los siguientes parámetros:

32

La definición del enfoque es responsabilidad del departamento de tecnología y de negocio. El enfoque usualmente se establece para desarrollar requerimientos específicos del negocio, en un tiempo determinado. El enfoque inicial del proyecto debe ser factible y manejable. Es preferible

empezar “pequeño”. Luego continuar el proceso de forma iterativa. Lanzando pequeños y rápidos desarrollos del proyecto. Enfoque inicial en un solo requerimiento del negocio soportado por una sola

fuente de datos. Limitar el número de usuarios que tendrán acceso a la bodega de datos

inicialmente. Establecer criterios de éxito del proyecto mientras se define el enfoque. Se

refiere a entender lo que la gerencia espera del proyecto. Una vez el área de tecnología y negocios han acordado un enfoque, este se

debe documentar. • Desarrollar la justificación del negocio. Luego de haber definido el enfoque, la justificación debe ser establecida. Esto significa que se identifican anticipadamente los costos y beneficios asociados al proyecto. Una forma de hacer esto es con el factor Tasa interna de retorno (TIR), que consiste en comparar el retorno financiero esperado (beneficios del negocio) contra la inversión esperada (costos). Se deben considerar las siguientes inversiones y costos: Compras de licencias de software y hardware. Costos de mantenimiento: muchos productos de hardware y software requieren

mantenimiento. Recursos internos de desarrollo. Recursos externos requeridos. Capacitación para desarrolladores y usuarios. Soporte a usuarios. Costos de crecimiento: Por cambios en requerimientos y actualizaciones.

Se deben considerar los siguientes retornos y beneficios: Los proyectos de bodegas de datos típicamente tienen un impacto en el incremento de ingresos y ganancias, más que en reducción de costos. Incremento de ingresos por nuevas ventas a nuevos y antiguos clientes. Incremento de ganancias por aumento de respuestas a la publicidad. Incremento de niveles de servicio al cliente. Descubrimiento de nuevas oportunidades.

33

• Planeación del proyecto. El proyecto de bodega de datos debe tener un nombre. Luego, se identifican roles que pueden ser cubiertos por uno o varios integrantes del equipo y cada miembro del quipo también puede desempeñar varios roles, dependiendo de los requerimientos y del tamaño del proyecto. Los siguientes roles se identifican para el proyecto: Patrocinadores de negocio. Gerente del proyecto. Responsable de la gerencia de tareas y actividades

cotidianas. Líder de negocios del proyecto. Con el gerente del proyecto monitorea el

proyecto y lo comunica a la organización. Tiene un alto entendimiento de los requerimientos del negocio. Analista del sistema de negocios. Lidera las actividades de definición de

requerimientos. Modelador de datos. responsable del análisis de datos y el modelo

dimensional. Administrador de bases de datos de la bodega (DBA). Responsable de

determinar agregaciones, particiones y soporte a la base de datos. Diseñador de proceso ETL. Responsable del diseño de la extracción,

transformación y carga de la bodega. Desarrolladores de aplicación al usuario. Instructor de la bodega de datos.

• Desarrollo del plan del proyecto. El objetivo de la planeación es proveer el detalle suficiente para hacer seguimiento al progreso del proyecto. Se identifican actividades, recursos y tiempos para el desarrollo. También permite monitorear los procesos y tener un plan de riesgos. • Administración del proyecto. Se consideran las reuniones de equipo, monitoreo del estatus, el enfoque y estrategias de comunicación. Para las reuniones se debe seguir una agenda y mantener un ambiente de comunicación entre el equipo. El monitoreo se debe realizar periódicamente, analizando el estado del proyecto en diferentes estados del tiempo. • Análisis de requerimientos. Acercamiento a la definición de requerimientos. Para entender mejor los requerimientos se debe empezar por hablar con los usuarios del negocio. No se debe preguntar a estos usuarios, qué datos quieren que aparezcan en el datamart, sino hablar con ellos sobre sus trabajos, objetivos y retos e intentar conocer cómo toman decisiones, actualmente y en el futuro. Se debe considerar lo que requiere el negocio comparando estos requerimientos con los datos disponibles en las bases de datos que servirán como fuente, para lograr el soporte de estos requerimientos.

34

• Preparación de la entrevista. Se deben determinar roles y responsabilidades en el equipo entrevistador. Es preferible que el mismo equipo conduzca las entrevistas a usuarios del negocio y al equipo de tecnología de la empresa. Los roles que se deben manejar, comprenden a un líder, encargado de dirigir el cuestionario, debe tener habilidades en el conocimiento del negocio y comunicaciones. También debe existir un “relator” encargado de tomar notas durante las entrevistas. Se debe tomar el mayor detalle posible del contenido. Al finalizar las entrevistas, esta persona debe hacer preguntas para aclarar dudas y obtener una retroalimentación de los entrevistados. • Investigación previa a entrevistas. Antes de iniciar el proceso de levantamiento de requerimientos, se deben analizar los reportes anuales de la compañía, para determinar las decisiones y hechos estratégicos. También es útil obtener planes de negocios de la compañía. También se debe analizar la competencia de la compañía y sus principales fortalezas y debilidades. Si ha existido un intento anterior de desarrollar una bodega de datos de la compañía, este también se debe analizar. • Selección de los entrevistados. Se deben seleccionar personas representativas de cada área de la organización. Es importante observar el organigrama de la compañía para determinar los candidatos a entrevista. Los principales entrevistados deben ser los administradores ejecutivos del negocio, para comprender la estrategia en un alto nivel de la empresa. Luego es importante entrevistarse con los analistas del negocio de cada área quienes conocen el manejo de información que se lleva a cabo. • Desarrollo del cuestionario. El líder de la entrevista debe preparar el cuestionario antes de iniciar la entrevista. Se deben diseñar varios cuestionarios que serán aplicados dependiendo del rol de los entrevistados dentro de la empresa. El cuestionario debe ser de una sola página, para evitar exceso de tiempo de entrevistas. Es preferible iniciar las entrevistas en un nivel medio de jerarquía de la organización, en vez de iniciar desde la parte superior con las altas gerencias, pues en los mandos medios se maneja un mayor nivel de detalle respecto a los datos que sirven para luego definir la granularidad de la bodega. Es importante que durante la entrevista se especifique terminología, la definición exacta de esta tendrá un gran impacto en la granularidad y dimensionalidad del modelo. Es posible que una palabra signifique muchas cosas, por eso lo

35

importante es identificarlas y documentar estas inconsistencias en el vocabulario para luego confrontarlas con los entrevistados. • Inicio y desarrollo de la entrevista. La entrevista debe iniciarse con una introducción, para recordar al usuario sobre el proyecto y el equipo desarrollador. Los objetivos del proyecto y de la entrevista deben ser nombrados y los miembros del equipo presentados. Para documentar información útil se debe preguntar a los usuarios sobre sus trabajos, por qué los hacen y cómo los hacen. Se deben realizar preguntas en un alto nivel y luego irse al detalle para obtener respuestas cada vez más específicas. Al entrevistar ejecutivos, el principal objetivo es obtener una visión y entender globalmente el negocio. Al entrevistar administradores y analistas de la empresa, se buscan los objetivos y visión de cada departamento. En el área de auditoría y administración de datos se busca saber si existen los datos para poder dar soporte a los requerimientos encontrados en las entrevistas previas. Se debe entender las definiciones de los campos de las bases de datos, granularidad, volúmenes de datos, y otros detalles de estas fuentes de información. Al cierre de las entrevistas se debe preguntar por los criterios de éxito del proyecto, de esta forma se entienden las actitudes y expectativas frente al proyecto. Estos criterios deben ser medibles y cuantificables. • Análisis de las entrevistas. Si algún miembro del equipo conoce los sistemas operativos fuente de la empresa, debe explicarlos al resto del equipo para determinar la factibilidad de implementar los requerimientos encontrados. Se deben resaltar los descubrimientos y requerimientos clave para el proyecto. Se deben analizar y repasar los reportes y análisis reunidos en las entrevistas, lo cual comúnmente conlleva a una aproximación del descubrimiento de dimensiones para el modelo. Para finalizar, es importante documentar los requerimientos obtenidos y comunicarlos a los usuarios para adquirir su aprobación y compromiso. • Diseño técnico de la arquitectura. En los sistemas de información la definición de una arquitectura permite hacer un desarrollo más confiable y eficiente. Con la definición de la arquitectura se mejora la comunicación entre las diferentes áreas del proyecto, el planeamiento del proyecto, la flexibilidad y el mantenimiento del mismo.

36

• Aspectos de arquitectura. Para hacer el diseño de la arquitectura se debe comenzar analizando los sistemas legacy actuales, estos deben ser consistentes y manejar de forma correcta sus transacciones, pues en la metodología del desarrollo del DWH (Datawarehouse) se toma como hecho que estos sistemas son confiables. Para hacer el diseño de la arquitectura se debe comenzar analizando los sistemas legacy actuales, estos deben ser consistentes y manejar de forma correcta sus transacciones, pues en la metodología del desarrollo del DWH se toma como hecho que estos sistemas son confiables. • Procesos de extracción, transformación y carga. Este proceso comprende varios aspectos determinantes para la bodega de datos. Por lo tanto se debe seguir un plan para su correcto desarrollo. Se establecen varios pasos que conducen al desarrollo del proceso y se describen a continuación. • Paso 1. Plan de alto nivel. El proceso de diseño se inicia con un esquema simple de los componentes del plan que son conocidos: Las fuentes y los destinos de los datos. Se identifica de donde provienen los datos y las características y problemas con dichas fuentes. Con este esquema es posible comunicar la complejidad del proyecto a la gerencia y miembros del equipo de desarrollo del proyecto. Las aplicaciones de ETL realizan tres pasos: extracción, transformación y carga a la bodega de datos. Estos pasos se deben ver en un esquema de alto nivel: Tomar los datos de las fuentes, transformarlos y cargarlos en los destinos. • Paso 2. Herramientas ETL. Las extracciones típicamente se escriben en el lenguaje de la fuente de los datos. Existen herramientas que realizan todo el proceso de extracción, transformación y carga que buscan minimizar el tiempo requerido para estas tareas. Estas herramientas implican un costo por licencias y posibles incompatibilidades o dificultades con transformaciones complejas que fuesen requeridas para el proceso. Ya se haga el proceso con código desarrollado, o herramientas existentes, es determinante realizar prácticas que mejoren el rendimiento del proceso, como ordenar los datos o cargarlos de forma rápida para cargas masivas en las bases de datos. • Paso 3. Plan detallado. El plan se inicia seleccionando las tablas en las que se va a trabajar, en cual orden y secuenciar las transformaciones para cada conjunto de datos. Se debe graficar un diagrama con estas estructuras. Todas las tablas de dimensión deben ser cargadas antes que las tablas de hechos. Se debe iniciar el desarrollo de la aplicación ETL con la dimensión más simple y continuar con las demás hasta llegar la tabla de hechos.

37

• Extracción. La primera parte del proceso ETL consiste en extraer los datos desde los sistemas de origen. Cada sistema separado puede usar una organización diferente de los datos o formatos distintos. Los formatos de las fuentes normalmente se encuentran en bases de datos relacionales o archivos planos, pero pueden incluir bases de datos no relacionales u otras estructuras diferentes. La extracción convierte los datos a un formato preparado para iniciar el proceso de transformación. Una parte intrínseca del proceso de extracción es la de analizar los datos extraídos, de lo que resulta un chequeo que verifica si los datos cumplen la pauta o estructura que se esperaba. De no ser así los datos son rechazados. Un requerimiento importante que se debe exigir a la tarea de extracción es que ésta cause un impacto mínimo en el sistema origen. Si los datos a extraer son muchos, el sistema de origen se podría ralentizar e incluso colapsar, provocando que éste no pueda utilizarse con normalidad para su uso cotidiano. Por esta razón, en sistemas grandes las operaciones de extracción suelen programarse en horarios o días donde este impacto sea nulo o mínimo. • Transformación. La fase de transformación aplica una serie de reglas de negocio o funciones sobre los datos extraídos para convertirlos en datos que serán cargados. Algunas fuentes de datos requerirán alguna pequeña manipulación de los datos. No obstante en otros casos pueden ser necesarias aplicar algunas de las siguientes transformaciones: Seleccionar sólo ciertas columnas para su carga (por ejemplo, que las

columnas con valores nulos no se carguen). Traducir códigos (por ejemplo, si la fuente almacena una "H" para Hombre y "M"

para Mujer pero el destino tiene que guardar "1" para Hombre y "2" para Mujer). Codificar valores libres (por ejemplo, convertir "Hombre" en "H" o "Sr" en "1"). Obtener nuevos valores calculados (por ejemplo, total_venta = cantidad *

precio). Unir datos de múltiples fuentes (por ejemplo, búsquedas, combinaciones, etc.). Calcular totales de múltiples filas de datos (por ejemplo, ventas totales de cada

región). Generación de campos clave en el destino. Transponer o pivotar (girando múltiples columnas en filas o viceversa). Dividir una columna en varias (por ejemplo, columna "Nombre: García, Miguel";

pasar a dos columnas "Nombre: Miguel" y "Apellido: García"). La aplicación de cualquier forma, simple o compleja, de validación de datos, y la consiguiente aplicación de la acción que en cada caso se requiere:

38

Datos OK: Entregar datos a la siguiente etapa (Carga). Datos erróneos: Ejecutar políticas de tratamiento de excepciones (por ejemplo,

rechazar el registro completo, dar al campo erróneo un valor nulo o un valor centinela). • Carga. La fase de carga es el momento en el cual los datos de la fase anterior (transformación) son cargados en el sistema de destino. Dependiendo de los requerimientos de la organización, este proceso puede abarcar una amplia variedad de acciones diferentes. Existen dos formas básicas de desarrollar el proceso de carga: Incremental: Se utiliza cuando únicamente se carga información nueva o

información que necesita ser actualizada. AL (Trunc and Load): Limpia el repositorio de datos y carga la información de

nueva cuenta. • Características de aplicaciones para usuarios finales. En los pasos explicados anteriormente, se ha analizado el diseño e implementación; ahora se profundizará más en el front room. El objetivo del front room es proporcionar la interfaz que mostrará al usuario reportes y análisis multidimensionales que tomará como base en la toma de decisiones. Una aplicación de usuario final, provee un diseño y estructura a los reportes tomando como base los datos del DWH. • Minería de datos en las Bodegas de datos. Es una categoría de herramientas de análisis Open-end. En vez de hacer preguntas, se toma estas herramientas y se pregunta por algo “interesante” una agrupación peculiar, por ejemplo. El proceso de minería de datos extrae los conocimientos guardados o información de la Bodega de datos sin requerir preguntas especificas. Las herramientas de minería usan algunas de las técnicas de computación más avanzadas para generar modelos y asociaciones de redes neuronales, detección de desviación entre otros. Las técnicas utilizadas anteriormente se definen de la siguiente forma: Redes Neuronales: este paradigma de aprendizaje está inspirado en la forma

en que funciona el sistema nervioso de los animales. Y consiste en un sistema de interconexión de neuronas de una red que producen un estimulo de salida.

39

Regresión Lineal: es la más rápida, eficaz y utilizada para formar relaciones entre datos. Arboles de decisión: es un modelo de predicción utilizado en la Inteligencia

Artificial, de donde una base de datos se pueden construir diagramas de construcción lógicos Modelos estadísticos: es una expresión simbólica en forma de igualdad o

ecuación que se emplean en los diseños experimentales y en la regresión para identificar los factores que modifican la variable de respuesta.16 • Toma de decisiones en las Bodegas de datos. Las bodegas de datos están orientadas a la toma de decisiones. Ya que almacena datos de acuerdo a clases de forma que puedan favorecer el análisis de los datos, el análisis histórico, está listo para ser utilizado mediante herramientas especificas que permiten hacer una extracción de información adecuada y diferentes patrones de comportamiento que están ocultos en un gran repositorio de datos. • Base de datos multidimensional – OLAP. Las primeras soluciones OLAP (On Line Analytical Processing), estaban basadas en bases de datos multidimensionales. Un cubo estructural almacena los datos para que se puedan manipular automáticamente y ver las asociaciones a través de dimensiones múltiples pero está limitado de la siguiente manera: Las nuevas estructuras de almacenamiento de datos requieren bases de datos

propietarias. La segunda limitación se encuentra en el desarrollo de una estructura de datos.

Las compañías almacenan los datos de la empresa en bases de datos relacionales, lo que significa que se debe realizar una extracción, transformación y carga de los datos en un hipercubo

• Especificación de aplicaciones para usuario finales. Hay algunos pasos importantes en el proceso de especificación de las aplicaciones de usuario final: Determinar el conjunto inicial de plantillas de reportes Determinar la navegación en los reportes. Determinar el estándar de plantillas de reportes. Determinar la especificación de estas plantillas.

16 WIKIPEDIA. “Mineria de datos”, [En línea].Modificado en Noviembre de 2010, [24 de Noviembre de 2010].Disponible en la Web: http://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos#T.C3.A9cnicas_de_miner.C3.ADa_de_datos

40

• Mantenimiento y crecimiento de un data warehouse. Administración del entorno de Data Warehouse. Cuando una empresa adquiere sus sistemas de información el cambio que tendrán estos sistemas es muy poco, sin embargo cuando se desarrolla un proyecto de DWH se debe pensar en el mantenimiento posterior a la implementación, pues estas aplicaciones tienen gran tendencia a crecer a medida que crece la información de la organización. La inversión en el mantenimiento del DWH es bastante importante, sin embargo estas aplicaciones retornan la inversión que se les hace.

2.4 MARCO LEGAL Las bodegas de datos manejan información histórica de una empresa y la mayoría de ellas contienen datos sensibles y confidenciales en los que se pueden encontrar registros de proveedores y clientes, estos datos pueden ser utilizados para fines delictivos o también para realizar diferentes daños equipos de computo de una empresa, por tal motivo se hace necesario tener en cuenta las siguientes leyes y artículos. Tabla 1. Marco legal

LEY O ARTICULO DESCRIPCIÓN Ley 1273 El 5 de enero de 2009, el Congreso de

la República de Colombia promulgó la Ley 1273 “Por medio del cual se modifica el Código Penal, se crea un nuevo bien Ley 1273 jurídico tutelado – denominado “De la Protección de la información y de los datos”- y se preservan integralmente los sistemas que utilicen las tecnologías de la información y las comunicaciones, entre otras disposiciones”.

Artículo 269A: ACCESO ABUSIVO A UN SISTEMA INFORMÁTICO

El que, sin autorización o por fuera de lo acordado, acceda en todo o en parte a un sistema informático protegido o no con una medida de seguridad, o se mantenga dentro del mismo en contra de la voluntad de quien tenga el legítimo derecho a excluirlo, incurrirá en pena de prisión de cuarenta y ocho (48) a noventa y seis (96) meses y en multa de 100 a 1000 salarios mínimos legales

41

mensuales vigentes.

Artículo 269C: INTERCEPTACIÓN DE DATOS INFORMÁTICOS

El que, sin orden judicial previa intercepte datos informáticos en su origen, destino o en el interior de un sistema informático, o las emisiones electromagnéticas provenientes de un sistema informático que los trasporte incurrirá en pena de prisión de treinta y seis (36) a setenta y dos (72) meses.

Artículo 269D: DAÑO INFORMÁTICO

El que, sin estar facultado para ello, destruya, dañe, borre, deteriore, altere o suprima datos informáticos, o un sistema de tratamiento de información o sus partes o componentes lógicos, incurrirá en pena de prisión de cuarenta y ocho (48) a noventa y seis (96) meses y en multa de 100 a 1000 salarios mínimos legales mensuales vigentes.

Artículo 269F: VIOLACIÓN DE DATOS PERSONALES.

El que, sin estar facultado para ello, con provecho propio o de un tercero, obtenga, compile, sustraiga, ofrezca, venda, intercambie, envíe, compre, intercepte, divulgue, modifique o emplee códigos personales, datos personales contenidos en ficheros, archivos, bases de datos o medios semejantes, incurrirá en pena de prisión de cuarenta y ocho (48) a noventa y seis (96) meses y en multa de 100 a 1000 salarios mínimos legales mensuales vigentes.

Artículo 269I: HURTO POR MEDIOS INFORMÁTICOS Y SEMEJANTES

El que, superando medidas de seguridad Informática, realice la conducta señalada en el artículo 239[3] manipulando un sistema informático, una red de sistema electrónico, telemático u otro medio semejante, o suplantando a un usuario ante los sistemas de autenticación y de

42

autorización establecidos, incurrirá en las penas señaladas en el artículo 240 del Código Penal [4], es decir, penas de prisión de tres (3) a ocho (8) años.

Fuente: Pagina Web www.informatica-juridica.com 17

2.5 MARCO TECNOLÓGICO En el siguiente marco tecnológico se identifican las herramientas para el diseño y desarrollo de la bodega de datos de la empresa Salón del Automóvil, que es la utilizada en algunas empresas por traer todo integrado en un único programa como es SQL Server 2008.

2.5.1 Herramienta de desarrollo • Microsoft SQL server 2008. Una plataforma que permite el análisis y la administración de datos empresariales con herramientas de Inteligencia de Negocios, análisis, reporteo, integración y notificación integradas. Provee de mayor escalabilidad, disponibilidad y seguridad al tiempo que simplifica la creación, implementación y gestión de aplicaciones altamente disponibles y de buen desempeño. Microsoft SQL Server 2008 es un sistema para la gestión de bases de datos producido por Microsoft basado en el modelo relacional. Sus lenguajes para consultas son T-SQL y ANSI SQL. Microsoft SQL Server constituye la alternativa de Microsoft a otros potentes sistemas gestores de bases de datos como son Oracle o MySQL. • Soluciones de Inteligencia de Negocios. SQL ofrece funcionalidades de Inteligencia de Negocios (Business Intelligence) con altos estándares, permitiendo que pueda obtener mayor ventaja de los datos almacenados en la organización. Características

Soporte de transacciones. Escalabilidad, estabilidad y seguridad. Soporta procedimientos almacenados. Incluye también un potente entorno gráfico de administración, que permite el

uso de comandos DDL y DML gráficamente.

17 INFORMATICA JURIDICA. “Republica de Colombia”, [En Línea].[18 Septiembre de 2010]. Disponible en: http://www.informatica-juridica.com/legislacion/colombia.asp

43

Permite trabajar en modo cliente-servidor, donde la información y datos se alojan en el servidor y los terminales o clientes de la red sólo acceden a la información. Además permite administrar información de otros servidores de datos.18

2.6 MARCO GEOGRÁFICO La empresa Salón del Automóvil se encuentra ubicada en la dirección Cra 15 N° 8 - 73 en el barrio La Estanzuela en la Localidad Los Martires de la ciudad de Bogotá (Colombia). Figura 5. Mapa por localidades Bogotá

Fuente: Pagina Web www.bogotamiciudad.com 19

18 WIKIPEDIA. “Microsoft SQL Server”, [En línea].Modificado en Septiembre de 2010, [18 de Septiembre de 2010].Disponible en la Web: http://es.wikipedia.org/wiki/Microsoft_SQL_Serve 19 BOGOTÁ MI CIUDAD. “Imagen de Bogotá”. [18 Septiembre de 2010]. Disponible en la Web: http://www.bogotamiciudad.com/Directorio/Detalles.aspx

44

3. DISEÑO METODOLÓGICO

3.1 TIPO DE INVESTIGACION • Cualitativo. Realizar una investigación a la empresa que se podrá hacer con entrevistas realizadas al personal encargado de ventas. Por otra parte otra investigación estará basada en los tipos de tecnologías asociadas a Bodegas de datos buscando las mejores alternativas para la aplicabilidad de la empresa, sabiendo la necesidad más importante por parte de la misma, ya que esta requiere avances siendo este un punto de partida para poder encontrarnos en un campo de búsqueda muy detallado como en este caso. En el proyecto se utilizara la metodología de Ralph Kimball y a continuación se describe el ciclo de vida de desarrollo para bodegas de datos. • Planeación del Proyecto. Es el comienzo del ciclo de vida para el desarrollo del proyecto aquí es donde se le asigna un nombre a la bodega de datos. Luego se identifican los roles que pueden ser cubiertos por los integrantes del grupo y cada uno de ellos puede desempeñar uno o varios roles, dependiendo del tamaño del proyecto. Se pueden identificar diferentes roles como por ejemplo: Patrocinador del negocio, Gerente del proyecto, líder del proyecto, analista de sistemas, Modelador de datos, entre otros. • Definición de Requerimientos del Negocio. Los requerimientos del Negocio son la guía para que al equipo de desarrollo tome las mejores decisiones estratégicas para el proyecto, también en esta etapa se describe los temas sobre la aplicación, el diseño de la bodega de datos y la forma de presentar los indicadores claves de rendimiento en las pantallas de los usuarios. Se describe el proceso de entrevistar a los representantes empresariales y del área de Tecnología, se categorizan las necesidades del negocio y el trabajo con la alta dirección para dar prioridad en el proyecto. • Modelamiento Dimensional. Esta etapa se realiza el modelado dimensional mediante el proceso de diseñar un modelo de negocio de dimensiones. Esta fila central de la sección del ciclo de vida se centra en los datos, de ahí se le asigna el nombre de Pista de datos. El objetivo principal de la pista de datos es asegurarse que los usuarios puedan obtener los datos que necesitan para satisfacer las necesidades actuales de negocio. También se puede encontrar en esta etapa la descripción de los hechos, las dimensiones y otros conceptos básicos.

45

• Diseño Arquitectura Técnica y Selección de Herramientas e instalador. En los sistemas de información la definición de una arquitectura permite hacer un desarrollo más confiable y eficiente. Después de realizar esta definición se mejora la comunicación entre varias áreas del proyecto. En estas etapas, se describe la arquitectura y la selección de productos para la bodega de datos de datos de Microsoft / Business Intelligence del sistema. Ya que Microsoft SQL Server 2008 ofrece suficientes componentes de software para escoger en el desarrollo de la bodega de datos. • Diseño Físico. Lo más importante del diseño físico de la base de datos relacional de almacenamiento es tener la posibilidad de que la tabla de hechos pueda ser particionada. En la herramienta de Microsoft se pueden realizar particiones de tablas a gran escala para la bodega de datos. En esta etapa se plantea los problemas de diseño físico agregado, la puesta en escena y las tablas de metadatos. También es conocido como etapa de construcción y consiste en formar los diseños lógicos de la fase anterior. • Diseño de Capa de datos intermedia y desarrollo. En esta etapa se empieza a manejar la herramienta Integration Services de Microsoft SQL Server, en donde se realiza todo el proceso de ETL (Extracción, Transformación y Carga) de los datos. Se empieza con la planificación de alto nivel, se toman algunas decisiones en todo el sistema acerca de cómo abordar diversos asuntos y luego se realiza un análisis exhaustivo de los datos de origen. Después de realizar todo esto se empieza a configurar el sistema ETL, reuniendo suficiente información y tomando decisiones adecuadas para la hacer un sistema detallado de ETL. • Desarrollo aplicación usuario final. Cada usuario de la bodega de datos tendrá acceso a las aplicaciones y los informes estándar. Después de trabajar a través del diseño de base de datos, los requisitos de sistema de ETL, OLAP y diseño de bases de datos, generan una creación de informes más fácil. Mediante el Reporting Services de Microsoft se puede generar dichos informes y con mayor detalle. Aquí es donde se empiezan a generar los primeros informes estándar, según los requerimientos del negocio propuestos y ya planeados al comienzo de la bodega de datos. • Administración del Proyecto – Aseguramiento de la Calidad. En esta etapa se realiza un proceso de sistema está llevando un control adecuado y que se cumplió con los requisitos acciones planificados y sistematizados, para poder demostrar a la empresa que el del negocio. Además aquí es donde se demuestra que las necesidades expuestas por el cliente o empresa están siendo satisfechas adecuadamente.

46

• Montaje y Puesta en marcha. Esta es la etapa en la que se hace la implementación de la bodega de datos, aquí es donde se hace la revelación a la empresa sobre todo el proceso que se llevo para la construcción y desarrollo de la Bodega de datos. Es fundamental cumplir a cabalidad los requerimientos del negocio para que ha primera impresión influya fuertemente en la aceptación del sistema. Como cualquier gran evento, hay un montón de detalles que hay que tener presentes para que el programa tenga éxito. • Mantenimiento y evolución. Esta etapa se puede realizar después de que se ha implementado el sistema en la empresa, aquí es donde se empiezan hacer las correcciones a los errores que presenta el sistema, se realiza mantenimiento del mismo y se verifica como ha sido su proceso después de la puesta en marcha o implementación.

47

4. DESARROLLO METODOLÓGICO

4.1 PLANEACIÓN DEL PROYECTO • Planeación y Administración del proyecto. El proyecto está dirigido a las empresas Salón del Automóvil la cual su objeto social es la venta de repuestos automotrices. Para este caso se ha escogido el escenario de demasiada demanda de información, porque la empresa a través de los años ha guardado sus datos pero sin darle un uso adecuado para el mejoramiento de la toma de decisiones. Estos datos que se van a manejar dentro del proyecto fueron suministrados por el gerente General de la compañía, el cual nos brindo su apoyo para la realización de este. De acuerdo a Ralph Kimball existen cinco factores que deben existir en una organización para iniciar un proyecto de bodega de datos: Patrocinio de la gerencia del negocio. Contamos con el aval del Gerente

General de la compañía el cual tiene una visión del mejoramiento de su empresa con el modelamiento de una bodega de datos. Motivación del negocio. La empresa Salón del Automóvil es consciente que al

tener un modelo de una bodega de datos como parte de la organización esta le brindara una gran ayuda a la hora de tomar decisiones que le permitan tener un mayor crecimiento en el mercado. Acompañamiento del departamento de Tecnología. La empresa Salón del

Automóvil cuenta con una persona encargada del área de tecnología la cual nos brindara su apoyo en caso de ser necesitado. Presencia de cultura analítica. Por medio de la bodega de datos la empresa

tendrá una gran ayuda que le permitirá que las decisiones tomadas sean determinantes y recompensadas para el negocio. Factibilidad. La empresa Salón del Automóvil cuenta con la información

detallada para la realización de la Bodega de datos. Luego de haber determinado la factibilidad en la empresa Salón del Automóvil en la elaboración de una bodega datos, se mirara el enfoque que esta tendrá: El enfoque inicial del proyecto, será determinar cuáles son los clientes

mayoristas de la empresa. Manejaremos inicialmente una sola fuente de datos la cual nos suministro la

empresa Salón del Automóvil.

48

En la bodega de datos tendrá acceso completo el Gerente General de la empresa Salón del Automóvil • Planeación del Proyecto. El proyecto se le dio como nombre “PROTOTIPO DE UNA BODEGA DE DATOS PARA LA EMPRESA SALÓN DEL AUTOMÓVIL”. Los roles que se identificaron en el proyecto son:

Tabla 2. Descripción Roles

Rol Responsabilidad Patrocinador del Proyecto

Proporcionar las diferentes herramientas y conceptos de organización, que se requieran durante el desarrollo del proyecto partiendo de una base teórica.

Gerente del proyecto

Velar por las actividades y cumplimiento óptimo del cronograma establecido, involucrando al equipo de trabajo y las diferentes tareas proporcionados al hito de cada entrega de las fases y metodología propuesta.

Responsable de área (Administrador del proyecto)

Coordinar de forma precisa cada actividad correspondiente al cronograma, proporcionando las posibles herramientas logísticas requeridas para el éxito de la etapa y sus actividades.

Líder técnico

Coordinar cada recurso técnico, e incorporarlo con las etapas de la metodología establecida, cumpliendo con las entregas de carácter funcional del Datamart y su arquitectura

Líder usuario

Evaluar de forma continua la solución presentada por el líder técnico, para el tener un producto de alta calidad, estando en constante comunicación con el cliente final

Área desarrollo

Desarrollo total del proyecto en constante comunicación con el líder funcional. Actividades como Administrador de Bases de Datos y arquitectura del Datamart.

Área usuaria

Comunicación con el cliente final y manejo de la herramienta, para presentación de reportes financieros.

Fuente: Autores

49

Los responsables del los roles expuestos anteriormente están asignados de la siguiente manera: Tabla 3. Asignación de Roles

Rol Asignado a Patrocinador del Proyecto Salón del Automóvil Gerente del proyecto Andrés Pineda Savita Responsable de área (Administrador del proyecto)

Wilmer Torres González

Líder técnico Andrés Pineda Savita - Wilmer Torres González

Líder usuario Andrés Pineda Área desarrollo Andrés Pineda Savita - Wilmer Torres

González Área usuaria Wilmer Torres

Fuente: Autores

• Desarrollo Cronograma de actividades. Se analizara el orden de las actividades, su duración, los requisitos de recursos y las restricciones, la incorporación de actividades genera un cronograma con fechas planificadas para completar las actividades del proyecto, donde se determinaran las fechas de inicio y finalización planificadas y los hitos. Para generar el cronograma implementaremos el método de la Cadena Critica, que es una técnica de análisis de la red del cronograma que permite modificar el cronograma para adaptarlo a los recursos limitados, inicialmente el diagrama del cronograma se elaborara mediante los estimados de la duración del proyecto. Se utilizan los diagramas de barras para representar la duración de las actividades, estos determinaran las fechas de inicio y finalización de las actividades, se implementa este tipo de diagramas porque son fáciles de leer y de interpretar.

50

Figura 6. Cronograma de actividades

Fuente: Autores • Controlar el cronograma. Se realizara el seguimiento del estado del proyecto para actualizar el avance y realizar cambios a la línea base del cronograma. Se requiere gestionar los cambios reales a medida que estos se van presentando. Tabla 4. Actividades de gestión de costos

Actividad frecuencia responsable Determinar el estado actual del cronograma

semanal Andres Pineda

Realizar un análisis de los factores que generaran cambios en el cronograma

semanal Andres Pineda

Realizar control integrado de cambios: revisión de informes de avance, solicitudes de cambio, revisión y tratamiento de estas solicitudes.

Cuando se requiera

Andres Pineda

51

Reunión de seguimiento, informe del avance del proyecto, actividades iniciadas, su avance y actividades terminadas

diario Wilmer Torres

Revisar el desempeño del cronograma: fechas reales de inicio y finalización, porcentaje completado, duración, estado de cronograma, acciones preventivas o correctivas, etc.

Semanal Andres Pineda

Fuente: Autores • Plan de gestión de costos. Se estimara una aproximación de los recursos monetarios necesarios para completar las actividades del proyecto. Esta estimación se refinara durante el transcurso del proyecto para reflejar los detalles de costo a medida que se presentan en cada fase del ciclo de vida del proyecto. Los costos se estiman por cada recurso que se asigna al proyecto, recursos

como el trabajo, los materiales, el equipo, los servicios y las instalaciones. Para la estimación de costos se realiza una evaluación cuantitativa de los

costos probables de los recursos necesarios para completar cada una de las actividades descritas en el cronograma de actividades. Se determinara la disponibilidad y cantidades necesarias de personal y material

requeridos. Se determinaran los recursos humanos, atributos como salarios,

compensaciones o reconocimientos correspondientes. Se determinaran los costos de mitigación de riesgos, cuando se presenta un

evento negativo, se incrementa el costo a corto plazo. Estimación de costos por analogía, se realiza una estimación teniendo en

cuenta el costo del alcance, el presupuesto disponible para el proyecto y la duración. Tabla 5. Actividades control de cronograma

Actividad frecuencia responsable El equipo de trabajo y los interesados en el proyecto acordar reuniones para evaluar de forma cuantitativa los costos de cada fase del proyecto, teniendo en cuenta la especificación de actividades y requisitos.

semanal Andres Pineda

52

Realizar documentación de los fundamentos de las estimaciones: Supuestos, restricciones.

semanal Wilmer Torres

Realizar la suma del costo estimado para cada actividad dentro de una fase del proyecto para realizar una aproximación por cada etapa del proyecto

Cuando se requiera

Wilmer Torres

Entrevista con el patrocinador del proyecto la Señora Ibon para determinar el presupuesto del proyecto, teniendo la suma total de costos por fase.

Cuando se requiera

Andres Pineda

Revisar el registro de riesgos para tener presente el estimado de costos de litigación de riesgos

semanal Wilmer Torres

Actualización del cronograma del proyecto, información de los recursos asignados a cada fase.

Semanal Andres Pineda

Realizar control integrado de cambios: revisión de informes de avance, solicitudes de cambio en costo y presupuesto, revisión y tratamiento de estas solicitudes.

semanal Andres Pineda

Fuente: Autores

4.2 DEFINICIÓN DE REQUERIMIENTOS DE NEGOCIO • Análisis de requerimientos. Para el levantamiento de requerimientos se realizaron entrevistas a personas del área técnica y de negocio de la empresa, se identificaron los requerimientos que este proyecto iban abarcar y lo que se podría hacer con el análisis y el diseño de la bodega de datos para la empresa Salón del Automóvil • Levantamiento de información. Para el levantamiento de información es importante conocer que la empresa Salón del Automóvil pertenece al área automotriz, como primera instancia se realizo una entrevista con la Gerente General la Sra. Verna Ivonn Vera Monroy, la cual nos manifestó la necesidad de poder darle una mejor utilidad a la información almacenada por la empresa, ya que actualmente esta no posee ninguna aplicación o herramienta que le brinde apoyo para el mejoramiento de la toma de decisiones. Una vez analizada la información dada, la empresa Salón del Automóvil nos brindo un archivo en Excel donde encontrábamos datos históricos del año 2009 con la fecha, tipo de pago, cliente y ciudad (ver Figura 7), para así empezar a realizar un

53

estudio de cómo poder ayudar a ese mejoramiento que desea la empresa Salón del Automóvil. Esta información fue complementada con las facturas físicas de cada uno de los meses del año 2009, que nos permitió obtener los productos vendidos a cada uno de los clientes. Figura 7. Origen de Datos

Fuente: Autores En la figura 7 se encuentra la información relacionada a las ventas de la empresa salón del automóvil. Los requerimientos del negocio se describen a continuación: Ver ventas por cliente Ver ventas por productos Ver ventas por tiempos Ver ventas de productos por cliente Ver ventas por cliente en el tiempo Ver ventas por ciudad Ver ventas por tipo de cliente

Estos requerimientos fueron acordados con la empresa para su análisis y diseño de la bodega de datos, todos estos soportados con datos encontrados en la base de datos facilitada por la empresa Salón del Automóvil (ver Tabla 6.Descripción de Requerimientos).

54

A continuación se presenta la descripción de los requerimientos definidos conjuntamente con la empresa

Tabla 6. Descripción Requerimientos

Nombre del requerimiento

Descripción Fuente de datos

Ventas por cliente

Esta consulta permite explorar el valor de las ventas del Salón del Automóvil, discriminando estas ventas por sus sectores de clientes. Al hacer drill down se exploran las ventas por clientes individuales.

Base de datos Salondelautomovil

Ventas por productos

Esta consulta permite explorar el valor de las ventas del Salón del Automóvil, discriminando estas ventas por sus líneas de productos. Al hacer drill down se exploran las ventas por productos individuales

Ventas por tiempos

Esta consulta permite explorar el valor de las ventas del Salón del Automóvil, discriminando estas ventas por las fechas de venta. Al hacer drill down se limita más el criterio del reporte, permitiendo analizar las ventas por año, semestre, trimestre y día.

Ventas de productos por cliente

Se muestran las ventas que se han hecho a los clientes con sus respectivos productos.

Ventas por cliente en el tiempo

Permite visualizar las ventas hechas a clientes en períodos de tiempos.

Ventas por ciudad

Se muestran las ventas que se han realizada en las diferentes ciudad que la empresa vende sus productos

Ventas por tipo de clientes

Permite observar que tipo de género compra mas los productos de la compañía

Fuente: Autores

55

4.3 DISEÑO ARQUITECTURA TÉCNICA Esta es la arquitectura propuesta para la bodega de datos Salón del Automóvil, donde se utilizan las herramientas de Microsoft SQL Server 2008 Figura 8. Diseño Arquitectura Técnica

Fuente: Autores Archivo Excel. Este es el documento origen de los datos proporcionados por la

empresa Salón del Automóvil, donde se encuentra la fecha, Nit de la empresa, nombre de la empresa, referencia producto, nombre del producto, valor, medio de pago, departamento y ciudad. Integration Services. Esta herramienta realiza todo el proceso ETL (extracción,

Transformación y carga) de los datos para las diferentes dimensiones de la bodega de datos. Analysis Services. Esta herramienta almacena los datos de forma

multidimensional, a través de tabla de hechos y tablas dimensionales, transforma e integra los datos fuente en un modelo adecuado para la toma de decisiones. Reporting Services. Este recopila la información almacenada generando

informes y reportes que muestran los resultados esperados por la empresa Salón del Automóvil.

56

Usuarios: Son los encargados de tomar las decisiones y planificar las actividades del negocio, a través de las herramientas de consulta y análisis las cuales exploran los datos en búsqueda de mejores resultados.

4.4 SELECCIÓN DE HERRAMIENTAS E INSTALADOR Se escoge la herramienta de Microsoft SQL Server 2008 por varias razones como son: • Integridad. Desde el sistema operativo los motores de base de datos y entorno de desarrollo para el escritorio de Office y Excel, se pueden crear Bodegas de datos completas con solo utilizar el software de Microsoft. • Bajo costo de licenciamiento. Los costos de licenciamiento son muy bajos a comparación de otros aplicativos porque en un solo paquete incluye todos los componentes y herramientas necesarias para el desarrollo de una bodega de datos • Alto rendimiento. Mayor estabilidad y capacidad para los cambios que se deseen realizar en los datos almacenados, cambio de hardware que se vayan a realizar.

4.5 MODELAMIENTO DIMENSIONAL Para el proyecto que actualmente se está desarrollando el modelo que se va a utilizar va a ser el modelo de estrella, ya que es uno de los más simple y utilizado en las bodegas de datos. Este modelo consiste en una tabla de hechos rodeada por dimensiones y forman una estructura que permite implementar mecanismos básicos para poder utilizar una herramienta de consulta OLAP. Este Modelamiento será desarrollado según los requerimientos del negocio expuestos anteriormente, mediante mutuo acuerdo con la empresa Salón del Automóvil y consiste en realizar una bodega de datos para los clientes mayoristas de la empresa. Preguntas de Negocio • ¿Cuáles son los diez clientes mayoristas de la empresa?

• ¿Cuáles son los productos más comprados por los clientes mayoristas? • ¿En qué fecha los clientes realizan mayores compras?

57

• ¿Cuál es el monto promedio de compra de los clientes mayoristas?

• ¿Cuál es la ciudad que tiene más demanda con los productos de la compañía?

• ¿Cuál es la opción más escogida por los clientes para pagar los productos adquiridos?

• ¿Dentro de los clientes mayoristas cuál es el tipo de género que mas compra los productos?

4.6 DISEÑO CONCEPTUAL Los datos relacionados a continuación son tomados del archivo de Excel proporcionado por la empresa. Se empieza con la forma no normalizada de los datos como se muestran en los siguientes pasos. • Forma No normalizada. En esta forma se describen los datos básicos tomados de la factura de compra y el archivo de Excel. • Fecha. Fecha en la que se realizo la venta • Nit. Nit del Proveedor al que se realizo la venta • Nombre Empresa. Nombre del cliente • Referencia. Numero asignado al producto • Producto. Nombre del Producto • Tipo. Nombre del tipo del producto • Marca. Nombre de la marca del producto • Medio de pago. Medio en el que pago el cliente • Departamento. Departamento en la que se realizo la venta • Ciudad. Ciudad en la que se realizo la venta • Localidad. Localidad en la que se realizo la venta • Código de la Localidad. Valor numérico para la localidad • Valor. Valor total de la compra del cliente • Sexo. Sexo de la persona que realiza la compra • Edad. Valor que indica la edad • Nivel Económico. Nivel que se encuentra el comprador • Primera Forma Normal. Se separa el grupo repetitivo

58

Tabla 7. Grupo Repetitivo

Grupo NO repetitivo Grupo Repetitivo IDProducto Nit Valor Nivel_Economico Fecha Nombre Empresa Medio de Pago Departamento Ciudad Localidad Cod_Localidad Sexo Edad

Producto Tipo Marca Referencia

Fuente: Autores El Producto, Tipo, Marca y Referencia, pueden aparecer en la misma factura varias veces por tal motivo es separa del primer grupo obteniendo la primera forma normal así: Tabla 8. Primera Forma Normal

Grupo 1 Grupo 2 IDProducto Nit Valor Nivel_Economico Referencia Fecha Nombre_Empresa Medio de Pago Departamento Ciudad Localidad Cod_Localidad Sexo Edad

IDProducto Producto Tipo Marca

Fuente: Autores

59

• Segunda Forma Normal. Separar dependencias de las llaves compuestas. Se analizan los grupos de datos con llaves combinadas, así formando la segunda forma normal de la siguiente manera. Tabla 9. Segunda Forma Normal

Grupo 1 Grupo 2 Grupo 3 Grupo 4 Grupo 5 Grupo 6 IDProducto Nit Valor Nivel_Economico

IDProducto Producto Referencia Tipo Marca

IDTiempoFecha

IDCliente Nombre_Empresa Sexo Edad

IDTransaccion Medio de Pago

IDDepartamento Departamento Ciudad Localidad Cod_Localidad

Fuente: Autores Esto se realiza para que en caso de que se requiera incluir un dato por ejemplo que un producto se repita 50 veces en diferentes facturas solo se tendría que incluir en la tabla del Grupo 2 un solo registro. Hasta aquí ya se pueden ver la estructura de las Dimensiones (Dim.) de la Bodega de datos Tabla 10. Segunda Forma Normal

Grupo 1 Dim. 1 Dim. 2 Dim. 3 Dim. 4 Dim. 5

IDProducto Nit Valor Nivel_Economico

IDProducto Producto Referencia Tipo Marca

IDTiempo Fecha

IDCliente Nombre Empresa Sexo Edad

IDTransaccion Medio de Pago

IDDepartamentoDepartamento Ciudad Localidad Cod_Localidad

Fuente: Autores De las dimensiones que se crearon se pueden crear otras tablas como son las siguientes:

60

Tabla 11. Segunda Forma Normal

Dim. 1 Dim. 6 Dim. 7

IDProducto Nombre Referencia IDTipoProducto

IDTipoProducto Tipo

IDMarca Nombre

Fuente: Autores Tabla 12. Segunda Forma Normal

Dim. 3 Dim 8 Dim 9

IDCliente Nombre_Empresa IDSexo IDEdad

IDSexo Sexo

IDEdad Edad

Fuente: Autores Tabla 13. Segunda Forma Normal

Dim. 5 Dim 10 Dim 11

IDDepartamento Nombre IDCiudad

IDCiudad Nombre IDLocalidad

IDLocalidad Nombre Codigo

Fuente: Autores • Tercera Forma Normal. Examinar las interdependencias entre los campos. Luego de analizar todas las tablas se encuentra que la tabla de Hechos es dependiente de las demás por tal motivo se hace necesario crear las llaves

61

foráneas en dicha tabla. Así quedan las tablas al finalizar la normalización de datos Tabla 14. Tercera Forma Normal

Hechos_Ventas Dim_Producto Dim_Tiempo Dim_Cliente

IDProducto IDTiempo IDCliente IDTransaccion IDDepartamento Nit Valor Nivel_Economico

IDProducto Nombre Referencia IDTipoProducto

IDTiempo Fecha

IDCliente Nombre_Empresa IDSexo IDEdad

Fuente: Autores Tabla 15. Tercera Forma Normal

Fuente: Autores • Tabla conceptual. Una vez analizadas las diferentes fuentes de entrada (figura 8) y revisando cada campo del archivo se genero la siguiente tabla conceptual en la que se crean cinco dimensiones. Tabla 16. Tabla Conceptual

TABLA CONCEPTUAL DIMENSION JERARQUIA EJEMPLOS Tiempo Fecha

Año Mes Día

14/08/09, 10/01/09… 2007, 2008, 2009 Enero, Febrero, Marzo... 1, 2, 3, 4, 5, 6, 7...

Dim_Tipo_Transaccion Dim_Departamento

IDTransaccion Medio de Pago

IDDepartamento Nombre IDCiudad

62

Cliente Nombre

Multiservicios Tecnicar, Talleres Intercambios..

Sexo Sexo Masculino, Femenino Edad Edad 18,19,20,21,22 ….. Departamento Nombre Cundinamarca, Antioquia, Bolivar……

Ciudad Nombre Bogota, Medellin, Cali… Localidad Nombre

Codigo Suba, Bosa, Kennedy, Engativa… 11, 15, 18, 20….

Producto Nombre Referencia

Pistones, Discos, Mangueras… 3001, 3002, 3003….

Tipo Tipo Exportado, Importado Marca Nombre Federal Nogul, Brigestone, Ingersoll Rand Tipo Transacción

Medio de Pago Contado, Crédito

Fuente: Autores Dim_Producto. Esta tabla es creada con el fin de almacenar los datos que se

encuentran en el archivo Origen como son: Referencia y Nombre del Producto ya son datos que se encuentran en el Archivo de Excel de la empresa. Dim_Tipo. Esta tabla es creada para la almacenar los datos del tipo de

producto (Ej: Exportado o Importado) Dim_Marca. Se creo con el fin de guardar datos de las diferentes empresas

que crean repuestos automotrices y poder alimentarla a diario Dim_Tiempo. Se crea esta tabla con el fin de almacenar las fechas que

contiene el archivo del Salón del Automóvil, además toda bodega de datos debe manejar un tiempo en el cual transcurren los eventos en este caso las Ventas de la empresa. Dim_Cliente. Esta tabla es creada según análisis realizado al archivo en Excel

y almacenara todos los datos relacionados con los clientes de la empresa. Dim_Sexo. Esta tabla almacena solo los valores relacionados al sexo de la

persona que realiza la compra Dim_Edad. Esta tabla almacena todos los valores que puedan generar cierta

edad de un cliente

63

Dim_Tipo_Transaccion. En el Archivo se encuentra un campo con el nombre de Medio de pago y analizando los datos se crea esta tabla para almacenar el tipo de transacción de cada cliente. Dim_Departamento. Se crea esta tabla con el fin de almacenar las principales

Departamentos en las que la empresa está presente, aunque solo por el momento realice ventas en la capital ya que esta tabla puede servir a futuro en caso de expansión de la empresa y se requieran ingresar otras ciudades. Dim_Ciudad. Se crea esta tabla con el fin de almacenar las principales

Ciudades en las que la empresa está presente. Dim_Localidad. Se crea esta tabla con el fin de almacenar las principales

Localidades de las ciudades y poder segmentar el mercado para futuros compradores Con las especificaciones anteriores se estableció para la empresa Salon del Automóvil el siguiente diseño conceptual: Figura 9. Diseño conceptual

Fuente: Autores

64

Como se observa en la Figura 9, el esquema de copo de nieve es la arquitectura de bodega de datos utilizada para búsqueda de datos. Este diseño implementa un esquema lógico relacional de base datos que resulta en que la tabla de hechos representa la Tercera Forma Normal (3FN) y las dimensiones representan la Segunda Forma Normal (2FN). En el esquema no se utilizan las tablas en el modelo relacional todo lo contrario se debe permitir el almacenamiento de información redundante, para optimizar el tiempo de respuesta y dar información a un cliente en menos tiempo posible, La llave primaria de una tabla de hechos está formada por todas las columnas que corresponden a las dimensiones.

4.7 DISEÑO LÓGICO. Validando archivos de datos de fuente, se presenta el siguiente diseño final para el prototipo de bodega de datos para la empresa Salón del Automóvil. Dentro del modelo se encuentran las dimensiones Cliente, Departamento, Producto, Tiempo y Tipo de Transacción.

Figura 10. Diseño Lógico

Fuente: Autores

65

4.8 DISEÑO FÍSICO. En el siguiente Script se encuentra la creación de las dimensiones y la tabla hechos de la Bodega de datos Figura 11. Creación de tablas Cliente y Tipo_Transaccion

Fuente: Autores

66

Figura 12. Creación de tablas Departamento, Producto y Tiempo

Fuente: Autores

67

Figura 13. Creacion de tabla Hechos_Ventas

Fuente: Autores Se crean las siguientes tablas temporales para poder almacenar los datos de Nit y Valor y llevarlos a la tabla hechos al momento de hacer el proceso de ETL Figura 14. Creacion de tablas Temporales

Fuente: Autores

68

Se crea la tabla Temporal de tiempo para que almacene la fecha del archivo de Excel y poder extraerlo en la dimensión tiempo por día, mes y año Figura 15. Creacion de tabla Temporal Tiempo

Fuente: Autores

4.9 DISEÑO DE CAPAS DE DATOS INTERMEDIA Y DESARROLLO Se utilizo la herramienta SQL Server Business Intelligencie Development Studio, esta herramienta cubre muy amplias necesidades de Análisis de los Datos y de los Informes empresariales. El entorno principal que se utilizará para desarrollar soluciones empresariales que incluyan proyectos de Analysis Services, Integration Services y Reporting Services. Cada tipo de proyecto proporciona plantillas para crear los objetos necesarios para las soluciones de Business Intelligence y ofrece varios diseñadores, herramientas y asistentes para trabajar con los objetos. • Construcción ETL. Las herramientas de ETL son piezas de software responsables de la extracción de datos de varias fuentes, de la limpieza, la personalización y la inserción de los datos en una bodega de datos. La construcción del ETL se realizara con una plataforma como es Microsoft SQL Integration Services que permite generar soluciones de integración de datos que se incluyen paquetes de extracción, transformación y carga (ETL) para el almacenamiento de datos

69

• Proceso ETL para la Dimensión Cliente

Figura 16. Dimension Cliente

Fuente: Autores Extracción. La fuente para la Dimensión Cliente se toma de un archivo Excel

localizado en la siguiente ruta: C:\Salon del automóvil\ETL\Salón del automóvil.xls. Este archivo tiene 10 atributos en los cuales se encuentra uno de ellos Nombre del cliente. Transformación. Se realiza la transformación de eliminar datos duplicados y se

ordena por nombre de cliente en forma ascendente. Figura 17. Propiedades Objeto Ordenar Cliente

Fuente: Autores Carga. Después de realizado los procesos de extracción y transformación se

carga los datos a la dimensión Cliente (Dim_Cliente).

70

• Proceso ETL para la Dimensión Tipo Transacción

Figura 18. Dimensión Tipo Transacción

Fuente: Autores Extracción. La fuente para la Dimensión Tipo de Transacción se toma de un

archivo Excel localizado en la siguiente ruta: C:\Salon del automóvil\ETL\Salón del automóvil.xls. Este archivo tiene 10 atributos en los cuales se encuentra uno de ellos Medio de pago. Transformación. Se realiza la transformación de eliminar datos duplicados y se

ordena por Medio de pago en forma ascendente. Figura 19. Propiedades Objeto ordenar Tipo Transacción

Fuente: Autores

71

Carga. Después de realizado los procesos de extracción y transformación se carga los datos a la dimensión Tipo de transacción (Dim_Tipo_Transaccion). • Proceso ETL para la Dimensión Departamento

Figura 20. Dimensión Departamento

Fuente: Autores Extracción. La fuente para la Dimensión Departamento se toma de un archivo

Excel localizado en la siguiente ruta: C:\Salon del automóvil\ETL\Salón del automóvil.xls. Este archivo tiene 10 atributos en los cuales se encuentra dos de ellos y son: Departamento y Ciudad. Transformación. Se realiza la transformación de eliminar datos duplicados y se

ordena por Departamento y Ciudad. Figura 21. Propiedades Objeto Ordenar Departamento

Fuente: Autores

72

Carga. Después de realizado los procesos de extracción y transformación se carga los datos a la dimensión Departamento (Dim_Departamento). • Proceso ETL para la Dimensión Producto

Figura 22. Dimensión Producto

Fuente: Autores Extracción. La fuente para la Dimensión Producto se toma de un archivo Excel

localizado en la siguiente ruta: C:\Salon del automóvil\ETL\Salón del automóvil.xls. Este archivo tiene 10 atributos en los cuales se encuentra dos de ellos y son: Referencia y Producto Transformación. Se realiza una conversión de datos para que se puedan

asignar a la tabla del valor Referencia, luego se hace la transformación de eliminar datos duplicados y se ordena por Referencia y Producto. Figura 23. Propiedades Objeto Ordenar Producto

Fuente: Autores

73

Carga. Después de haber realizado los procesos de extracción y transformación se cargan los datos a la dimensión Producto (Dim_Producto). • Proceso ETL para la tabla temporal Tiempo

Figura 24. Dimensión Temporal Tiempo

Fuente: Autores Extracción. La fuente para la tabla Tiempo se toma de un archivo Excel

localizado en la siguiente ruta: C:\Salon del automóvil\ETL\Salón del automóvil.xls. Este archivo tiene 10 atributos en los cuales se encuentra uno que es Fecha Transformación. Se ordenan los datos de fecha y se realiza una conversión de

datos para la tabla temporal Tiempo (Temp_Tiempo) Carga. Después de haber realizado los procesos de extracción y

transformación se cargan los datos en la tabla temporal de tiempo (Temp_Tiempo)

74

• Proceso ETL para la Dimensión Tiempo

Figura 25. Dimensión Tiempo

Fuente: Autores Extracción. La fuente para la Dimensión Tiempo se toma de la tabla

Temp_Tiempo localizada en la Base de datos Ventas_Salon_Automovil. Esta tabla contiene un atributo con el nombre de Fecha Transformación. Se realiza una consulta a la tabla Temp_Tiempo para eliminar

los datos repetidos, para convertir la fecha en día, mes y año y se organizan por Fecha. Figura 26. Propiedades Origen de Tiempo y consulta SQL

Fuente: Autores

75

Carga. Después de haber realizado los procesos de extracción y transformación se cargan los datos en la Dimensión de Tiempo (Dim_Tiempo) • Proceso ETL para la tabla Temp_Nit

Figura 27. Tabla Temporal Nit

Fuente: Autores Extracción. La fuente para la tabla Temp_Nit se toma de un archivo Excel

localizado en la siguiente ruta: C:\Salon del automóvil\ETL\Salón del automóvil.xls. Este archivo tiene 10 atributos en los cuales se encuentra uno con el nombre de NIT Transformación. Se realiza una conversión de datos para que se puedan

asignar a la tabla el valor, luego se hace la transformación de eliminar datos duplicados y se ordena por NIT.

Figura 28. Propiedades Objeto Ordenar Nit

Fuente: Autores

76

Carga. Después de haber realizado los procesos de extracción y transformación se cargan los datos en la tabla temporal Nit (Temp_Nit). • Proceso ETL para la tabla Temp_Valor

Figura 29. Tabla Temporal Valor

Fuente: Autores

Extracción. La fuente para la tabla Valor se toma de un archivo Excel

localizado en la siguiente ruta: C:\Salon del automóvil\ETL\Salón del automóvil.xls. Este archivo tiene 10 atributos en los cuales se encuentra uno con el nombre de Valor. Transformación. Se realiza una transformación de datos ordenándolos y

eliminando los registros duplicados. Figura 30. Propiedades Objeto Ordenar Valor

Fuente: Autores

77

Carga. Después de haber realizado los procesos de extracción y transformación se cargan los datos en la tabla temporal Valor (Temp_Valor). • Proceso ETL para la tabla Hechos_Ventas

Figura 31. ETL Hechos Ventas

Fuente: Autores

78

Para poblar la tabla Hechos_Ventas se toma como base el archivo ubicado en C:\Salon del automóvil\ETL\Salón del automóvil.xls. Se realizan las siguientes transformaciones Ordenar los atributos en la dimensión tiempo por periodo, día, mes y año.

Se toman los atributos IDCliente, IDDepartamento, IDTiempo,

IDTransaccion,IDProducto de las dimensiones Cliente, Departamento, Tiempo, Tipo Transacción respectivamente. Se ordena la tabla temporal Nit en forma ascendente.

Se realizan la validación necesaria para agregar nuevos registros en caso de

que se hagan cambios en el archivo de Excel. Por último se realiza la carga de datos a Hechos_Ventas.

4.10 CUBOS CON MICROSOFT SQL SERVER 2008 Microsoft SQL Server 2008 permite desarrollar soluciones de forma rápida con el nuevo diseñador y el fácil uso del cubo. Adicionalmente se pueden crear diferentes vistas según la necesidad de la empresa. La plataforma de Analysis services que tiene incluido Microsoft SQL Server 2008 permite realizar tareas sencillas desde Business Intelligence Development Studio durante todo el proceso de desarrollo, además esta herramienta detecta posibles problemas de diseño que puedan surgir con notificaciones automáticas proporcionadas por mejor diseño de la práctica alertas. • El siguiente es la vista generada en el Proyecto de Analysis Services

Figura 32. Vista en Analysis Services

Fuente: Autores

79

Cubo Ventas Figura 33. Cubo Ventas Salón Automóvil

Fuente: Autores Y por último se realiza el proceso de carga de los datos al cubo Figura 34. Proceso de carga de los Datos al cubo

Fuente: Autores

80

Se pueden organizar los datos de cualquier forma la más adecuada para la Bodega de datos Figura 35. Cubo Cargado con los Datos

Fuente: Autores

81

5. RESULTADOS Microsoft SQL Server Reporting Services 2008 es una plataforma que está basada en un servidor diseñado para solucionar una variedad de necesidades para las empresas y generar diferentes informes o reportes según sus necesidades. Esta Herramienta ofrece un entorno grafico familiar, con herramientas de fácil uso y estructuras para informes bien detallados para generar reportes que se adapten totalmente al gusto y la necesidad de la empresa • Solución de las preguntas de negocio. El análisis de las siguientes preguntas de negocio, fue acordado con el cliente en nuestro caso el área de las ventas de la empresa Salón del Automóvil, como entrega final del Prototipo realizado. • ¿Cuáles son los diez clientes mayoristas de la empresa? • ¿Cuáles son los productos más comprados por los clientes mayoristas? • ¿En qué fecha los clientes realizan mayores compras? • ¿Por qué medio es cancelado los productos de los clientes mayoristas? • ¿Cuál es el monto promedio de compra de los clientes mayoristas? • ¿Cuál es la ciudad que tiene más demanda con los productos de la compañía? • ¿Dentro de los clientes mayoristas cuál es el tipo de género que mas compra los productos? De acuerdo a las anteriores preguntas de negocio, se realiza un análisis tomando una muestra de los datos del movimiento de la empresa y se presentan los siguientes Reportes: • ¿Cuáles son los diez clientes mayoristas de la empresa? En el siguiente grafico se muestra los diez clientes que mas adquieren productos de la empresa Salon del Automovil y según estos resultados el Cliente Multive LTDA es el principal mayorista de la empresa como se puede observar en la Figura 36.

82

Figura 36. Informe Clientes Mayoristas

Fuente: Autores Tabla 17. Descripción Clientes Mayoristas

MEDIDAS Valor Tiempo

CLIENTES Año 2009 MULTIVE LTDA 16.222.766 GATE GOURMET COLOMBIA 14.998.390 CORPACERO LTDA 13.700.976 BUSES ARMENIA S.A. 13.532.120 MINCIVIL S.A. 12.803.284 GRAVILLERA ALBANIA 12.347.700 MULTISERVICIOS TECNICARS 12.054.820 ALEGRA ACTIVITY AMERICA 11.722.534 IRAUTOS LTDA 10.880.786 SERVIFORD 9.449.430

Fuente: Autores

83

• ¿Cuáles son los productos más comprados por los clientes mayoristas? En el siguiente grafico se muestra el producto que mas adquieren los clientes de la empresa Salon del Automovil y según estos resultados el producto Compresor de Aire Volvo es el mas vendido como se puede observar en la Figura 37. Figura 37. Informe Producto Mayorista

Fuente: Autores Tabla 18. Descripción Producto Mayorista

MEDIDAS Valor Clientes

PRODUCTOS Año 2009 COMPRESOR DE AIRE VOLVO 25 C

12.500.000

EJE TRASERO KODIAK 2.655.200 COMPRESOR DE AIRE MOTOR 1.800.000 SUAVIZADOR TOYOTA 1.500.000 CRUCETAS MIXTAS TEREX 1.320.000

Fuente: Autores

84

• ¿En qué mes del año los clientes realizan mayores compras? En el siguiente grafico se muestra el mes en que los clientes de la empresa Salon del Automovil realizan sus mayores compras y según estos resultados el mes de Septiembre es el mas ofertado a la empresa como se observa en la tabla 19. Figura 38. Informe Compras Mensuales

Fuente: Autores Tabla 19. Descripción Compras Mensuales

MEDIDAS Valor Tiempo

CLIENTES Mes 1 - 12 VALOR RODAMIENTOS Y BALINERAS LTDA

SEPTIEMBRE 6.171.500

GATE GOURMET COLOMBIA DICIEMBRE 6.134.486 ALEGRA ACTIVITY AMERICA JULIO 3.803.750 DISTRIBUIDOR A.J.E.M DICIEMBRE 3.800.600 IRAUTOS LTDA AGOSTO 3.552.800 BUSES ARMENIA S.A. NOVIEMBRE 3.485.534 J.E FILTROS LTDA MAYO 3.420.000 IMPORTADORA SOMOS FORD COLO

AGOSTO 3.420.000

REPUESTOS RIMAR CIA LTDA

JUNIO 3.098.000

GRAVILLERA ALBANIA NOVIEMBRE 3.096.500

Fuente: Autores

85

• ¿Cuál es la opción más escogida por los clientes para pagar los productos adquiridos? En el siguiente grafico se muestra el medio de pago mas utilizado por los clientes de la empresa Salon del automóvil para realizar el pago de sus compras y según estos resultados los clientes tienen como preferencia el pago a Credito como se muestra en la Figura 39. Figura 39. Informe Medio de pago

Fuente: Autores Tabla 20. Descripción Medio de Pago

MEDIDAS Valor Tiempo Medio de

pago CLIENTES Año 2009 MULTIVE LTDA 16.222.766 CREDITO GATE GOURMET COLOMBIA 14.998.390 CREDITO CORPACERO LTDA 13.700.976 CREDITO BUSES ARMENIA S.A. 13.532.120 CREDITO MINCIVIL S.A. 12.803.284 CREDITO GRAVILLERA ALBANIA 12.347.700 CREDITO MULTISERVICIOS TECNICARS 12.054.820 CONTADO ALEGRA ACTIVITY AMERICA 11.722.534 CREDITO IRAUTOS LTDA 10.880.786 CREDITO SERVIFORD 9.449.430 CREDITO

Fuente: Autores

86

• ¿Cuál es el monto promedio de compra de los clientes mayoristas? En el siguiente grafico se muestra el promedio de compra que realiza los clientes mayoristas al año como se puede observar en la figura 40. Figura 40. Informe Promedio Clientes

Fuente: Autores Tabla 21. Descripción Promedio Clientes

MEDIDAS Valor Promedio

CLIENTES Año 2009 MULTIVE LTDA 103.329,7197 GATE GOURMET COLOMBIA 142.841,8095 CORPACERO LTDA 80.122,6666 BUSES ARMENIA S.A. 111.835,7024 MINCIVIL S.A. 82.601,8322 GRAVILLERA ALBANIA 107.371,3043 MULTISERVICIOS TECNICARS 98.006,6666 ALEGRA ACTIVITY AMERICA 101.056,3275 IRAUTOS LTDA 109.906,9292 SERVIFORD 119.613,0379

Fuente: Autores

87

• ¿Cuál es la ciudad que tiene más demanda con los productos de la compañía? En el siguiente grafico se muestra cual es la ciudad que mas adquiere los productos de la empresa y según estos resultados seria posible a futuro vender mas en la ciudad de Cali como se puede observar en la figura 41. Figura 41. Informe Promedio Ciudad

0 200000000 400000000 600000000

CIUDADES

Promedio Ciudad

CARTAGENA

PASTO

BOYACA

BUCARAMANGA

BARRANQUILLA

BOGOTA

CALI

Fuente: Autores Tabla 22. Descripción Promedio Ciudad

MEDIDAS Valor Promedio

CIUDADES Año 2009 MEDELLIN 40,103,838

CALI 436,064,429

BOGOTA 307,226,068

BARRANQUILLA 251,941,980

BUCARAMANGA 265,565,068

BOYACA 311,244,268

PASTO 335,547,744

CARTAGENA 418,372,151

Fuente: Autores

88

• ¿Dentro de los clientes mayoristas cuál es el tipo de género que mas compra los productos? Como se muestra en la figura 42 el género que mas compra productos de la empresa Salon del Automovil es el Masculino. Figura 42. Informe Promedio Sexo

‐ 50  100 

SEXO

Promedio Sexo

MASCULINOFEMENINO

Fuente: Autores Tabla 23. Descripción Promedio Sexo

MEDIDAS Valor Promedio

SEXO Año 2009 FEMENINO 23

MASCULINO 87

Fuente: Autores

89

6. CONCLUSIONES • Para establecer el perfil de los clientes de la empresa Salón del Automóvil se generaron unas preguntas de negocio las cuales identifican las necesidades primarias que tiene la empresa para el mejoramiento de las tomas de decisiones. • Una vez realizado el análisis de la información y la verificación de la calidad de esta, permitió realizar un estudio detallado de las necesidades expuesta por la empresa Salón del Automóvil. Obteniendo los resultados esperados, que le ayudaran en un futuro a tomar diferentes decisiones internas como externas. • Se creó un adecuado diccionario de datos, para luego realizar el modelamiento de las tablas que son necesarias y así poder consolidar la información de una manera ordenada y fácil de manejar, esto con el fin de obtener los resultados propuestos por la empresa Salón del Automóvil. • El prototipo le brindara a la empresa una manera ágil de saber diferentes entornos por medio de sus datos históricos dándole la información necesaria que le ayudara a ver el comportamiento interno y así tener un mejor control y argumentación en las decisiones que serán tomadas en un futuro. • Una bodega de datos es mucho más que un repositorio de información histórica, es una serie de datos relacionados por procesos bien definidos que llegan a producir la información más adecuada para una correcta toma de decisiones. • Este trabajo de grado se realizo con el fin de explorar otras tecnologías no utilizadas frecuentemente en la universidad Libre, mostrando la viabilidad de una propuesta metodológica como es la de Ralp Kimball. • Una bodega de datos es un insumo para soportar objetivamente procesos de toma de decisiones porque permite analizar y modelar información histórica y actual para proponer modelos predictivos.

90

7. RECOMENDACIONES

• En las bodegas de datos siempre se debe tener en cuenta que los requerimientos de negocio se puedan confrontar con el área técnica, para así poder ofrecer al final reportes que si se puedan generar. • Una bodega de datos debe tener información confiable y fácil de acceder en una empresa y si hay datos en diversas fuentes se debe extraer de la fuente que sea más confiable. • Es necesario encontrar una justificación correcta para el negocio en el momento de iniciar con el proyecto para poderlo justificar desde un punto de vista financiero y generar un retorno sobre la inversión. Así la empresa estará totalmente de acuerdo con el Proyecto. • Se debe identificar los roles del proyecto de acuerdo a las capacidades de cada integrante para llegar a un proyecto exitoso y realizarlo en un menor tiempo posible. • Para que la bodega de datos funcione correctamente es necesario que el equipo de computo tengan instalados los aplicativos Microsoft SQL Server 2008 con sus herramientas Analysis Services, integration services y reporting services y Visual Studio 2008. • Es necesario que el usuario que vaya a administrar la herramienta tenga conocimientos básicos de bases de datos y manejo de información a gran escala. • Para la implementación del diseño conceptual propuesto es necesario que la empresa Salón del automóvil lleve un control más detallado sobre la información de sus clientes (Ej: Nivel económico, genero, ciudades, etc.).

91

BIBLIOGRAFÍA ALFONSO LUQUE Romero. “Bodegas de datos: Consideraciones de implementación, Seguridad y Control”, [En línea]. Publicado Noviembre de 2006, [17 de Septiembre de 2010]. Disponible en la Web: http://www.acis.org.co/fileadmin/Conferencias/ConfAlfonsoLuqueNov30-06.pdf. BOGOTÁ MI CIUDAD. “Imagen de Bogotá”. [18 Septiembre de 2010]. Disponible en la Web: http://www.bogotamiciudad.com/Directorio/Detalles.aspx EQUIPO 3. “Bodega de datos en las Empresas”, [En Línea]. Publicado Noviembre de 2008, Modificado en Noviembre de 2008, [17 de Septiembre de 2010]. Disponible en la Web: http://bodegadedatos.blogspot.com/2008/11/memo.html. INFORMATICA JURIDICA. “Republica de Colombia”, [En Línea].[18 Septiembre de 2010]. Disponible en: http://www.informatica-juridica.com/legislacion/colombia.asp ING. BERNABEU R. Dario. “Data Warehouse Arquitectura”, [En línea]. Publicado Enero de 2009, [17 de Septiembre de 2010]. Disponible en la web: http://www.dataprix.com/data-warehousing-y-metodologia-hefesto/arquitectura-del-data-warehouse/31-introduccion ING. BERNABEU R. Dario. “Load manager”, [En línea]. Publicado Enero de 2009, [17 de Septiembre de 2010]. Disponible en la Web: http://www.dataprix.com/33-load-manager ING. BERNABEU R. DARIO. “Datawarehouse manager”, [En línea]. Publicado Enero de 2009, [17 de Septiembre de 2010]. Disponible en la Web: http://www.dataprix.com/data-warehousing-y-metodologia-hefesto/arquitectura-del-data-warehouse/34-datawarehouse-manager KIMBALL, Ralph. The Data Warehouse ETL Toolkit Practical Techniques for Extracting, Cleaning, Conforming, and Delivering Data, Wiley, Canada, 2004 KIMBALL, Ralph. Two Powerful Ideas. The foundations for modern Data Warehouse, Wiley, Canada, 2004 KIMBALL, Ralph, Ross, Margy. Building the Data Warehouse, Wiley, New York, 2005 KIMBALL, Ralph. The Keyword Dimension. Using keywords in a Data Warehouse of historical letters, Wiley, Canada, 2010

92

KIMBALL, Ralph. Surrogate Keys. Keep control over record identifiers by generating new keys for the Data Warehouse, Wiley, Canada, 2004 KOONTZ y Weihrich, Harold y Heinz. “Administración una Perspectiva Global”. McGRAW- HILL Interamericana De Editores, S.A,1998 NEVADO CABELLO, Maria Victoria. Introducción a las bases de datos relacionales, Vision libros, Madrid, 2002 RSM. “Inteligencia de Negocios (BI)”, [En línea]. Modificado Septiembre de 2010, [23 de Septiembre de 2010]. Disponible en la Web: http://www.monografias.com/trabajos14/bi/bi.shtml#QUEES SINNEXUS. “Razones por las que invertir en Business Intelligence”, [En línea]. [30 de Septiembre de 2010]. Disponible en la Web: http://www.sinnexus.com/business_intelligence/inversion.aspx SINNEXUS. “Bases de datos OLTP y OLAP”, [En línea]. [30 de Septiembre de 2010]. Disponible en la Web: http://www.sinnexus.com/business_intelligence/olap_vs_oltp.aspx SQLMAX CONNECTIONS. “Data Warehouse”, [En línea]. [17 de Septiembre de 2010]. Disponible en la Web: http://www.sqlmax.com/dataw1.asp TURBAN, Efraim, SHARDA, Ramesh, ARONSON, Jay, KING, David. “Business Intelligence: A Managerial Approach”, Pearson Education, Canada, 2010 UNIVERSIDAD DE JAEN. “La toma de decisiones de la empresa”, [En línea]. Modificado Noviembre de 2005, [22 de Septiembre de 2010]. Disponible en la Web: http://www4.ujaen.es/~cruiz/diplot-5.pdf. WIKIPEDIA. “Toma de decisiones”, [En línea]. Modificado Septiembre de 2010, [23 de Septiembre de 2010]. Disponible en la Web: http://es.wikipedia.org/wiki/Toma_de_decisiones. WIKIPEDIA. “Microsoft SQL Server”, [En línea].Modificado en Septiembre de 2010, [18 de Septiembre de 2010].Disponible en la Web: http://es.wikipedia.org/wiki/Microsoft_SQL_Serve

93

ANEXOS Anexo A. Entrevista

Preguntas:

1. ¿Actualmente manejan archivos de Excel que contengan gran información?

- Si - No

2. ¿Cree usted que con la información que contienen los archivos de Excel se

puede generar diferentes reportes que beneficien su empresa?

- Si - No

3. ¿Conoce usted que es una Bodega de Datos y para qué sirve?

- Si - No

Si la respuesta es Si pasar a la pregunta 5.

4. ¿Le gustaría obtener información acerca de que es una bodega de datos y para qué sirve?

- Si - No

5. ¿Cree usted que una bodega de datos le ayudara a los procesos internos

de la empresa Salón del Automóvil?

- Si - No - ¿Por qué?

____________________________________________________________________________________________________________________________________________________________________

94

6. ¿Le gustaría poder acceder más fácilmente a la información almacenada en su empresa Salón del Automóvil?

- Si - No - ¿Por qué?

____________________________________________________________________________________________________________________________________________________________________

7. Con la Bodega de datos se podrá realizar diferentes informes y reportes ¿cree usted que estos informes le ayudaran para la toma de decisiones y así recibir mejores ingresos?

- Si - No - ¿Por qué?

____________________________________________________________________________________________________________________________________________________________________

8. Desea usted que se realice un Prototipo de una bodega de datos para su empresa

- Si - No - ¿Por qué?

____________________________________________________________________________________________________________________________________________________________________

95

96

Anexo B. Posible implementación Dentro de las diferentes actividades y etapas que conforman el proyecto, existen varios roles y recursos tecnológicos que son necesarios a continuación se enuncian los roles y herramientas para su implementación:

Descripción Valor Salarios $ 12.350.000 1 Líder de proyecto $ 4.500.000 1 Administrador de bases de datos (DBA) $ 3.000.000 1 Desarrollador ETL $ 1.850.000 1 Ingeniero de Soporte Técnico $ 1.500.000 1 Ingeniero de calidad $ 1.500.000

Hardware (Servidor Dell)

Características Valor* Procesador Intel Xeon X3430

$ 2.800.030

Sistema Operativo Windows Server 2008 R2 SP1 Chassis PowerEdge T110 Memoria RAM de 4GB Disco duro de 250GB 7.2K RPM SATA 3.5" DVD-ROM (Interno)

Licencia

Nombre Valor* SQL Server 2008 R2 Enterprise $ 2.133.069,96

Sumando todo lo anterior para la elaboración del proyecto se hace necesario para la implementación un valor de $ 17.283.099,96 * Los valores generados en las tablas anteriores son aproximados según el precio del dólar.