5
Edgar Pedraza Flores 07/03/11 FUNDAMENTOS DE LA INTELIGENCIA DE NEGOCIOS ORGANIZACIÓN DE DATOS EN UN ENTORNO TRADICIONAL DE ARCHIVOS Este capítulo esta principalmente enfocado a analizar la forma en que las empresas utilizan las bases de datos para alcanzar sus objetivos. Los datos de los que disponga la empresa deben ser aprovechados para crecer y desarrollar nuevas estrategias y tomar mejores decisiones. Nos interesa a los ingenieros industriales debido a que trabajaremos con grandes bases de datos que contienen información sobre productos terminados, materia prima en inventario, proveedores, componentes de los productos, calidad del producto, y artículos en tránsito que se pueden utilizar para la administración de la cadena de suministro. La información debe ser exacta, es decir, libre de errores; oportuna, cuando está disponible en todo momento; relevante, cuando es útil y adecuada para los tipos de trabajo y decisiones que la necesitan. Muchas empresas no cuentan con esta información debido a que sus sistemas de información están mal organizados y con un mantenimiento deficiente. Conceptos de organización de archivos. El sistema de cómputo organiza los datos en una jerarquía que empieza con el bit, el cual representa ya sea un o un de la siguiente forma: bits, bytes, campos, registros y archivo. Los bits se pueden agrupar para formar un byte para representar un carácter, número o símbolo. Los bytes se pueden agrupar para formar un campo y los campos relacionados se pueden agrupar para formar un registro. Los registros relacionados se conjuntan para formar un archivo y los archivos relacionados se pueden organizar en una base de datos Problemas con el entorno tradicional de archivos. Usar esta metodología, alienta a cada área a desarrollar aplicaciones especializadas de archivos. Cada aplicación necesita un archivo de datos el que quizás es parte de algún subconjunto del archivo maestro, lo que nos lleva nuevamente a la inconsistencia de datos, inflexibilidad en el procesamiento de datos, inflexibilidad en el procesamiento y recursos de almacenamiento. Redundancia e inconsistencia de datos, es decir, presencia de datos guardados múltiples ocasiones, de manera que se actualiza solo cierta información y otras no. Lo que produce una mala interpretación de los datos y confusión. Dependencia entre programas y datos, la estrecha relación entre ambos provoca que al realizar algún cambio en el programa sea necesario modificar también los datos. Implementar estos cambios podría costar mucho dinero para la organización. Carencia de flexibilidad, seguridad escasa debido al poco control que se puede tener sobre los datos, no se sabe quién tiene acceso y quien incluso está modificándolos. La información está fragmentada, de manera que es casi imposible compartirla acceder a ella de manera oportuna. Carencia de compartición y disponibilidad de datos debido a que la información está fragmentada en diferentes archivos y en distintas partes de la organización y no se pueden relacionar entre sí. La información no fluye libremente por las áreas funcionales ni en forma ni en tiempo.

ORGANIZACIÓN DE DATOS EN UN ENTORNO TRADICIONAL DE ARCHIVOS

Embed Size (px)

Citation preview

Page 1: ORGANIZACIÓN DE DATOS EN UN ENTORNO TRADICIONAL DE ARCHIVOS

Edgar Pedraza Flores 07/03/11

FUNDAMENTOS DE LA INTELIGENCIA DE NEGOCIOS

ORGANIZACIÓN DE DATOS EN UN ENTORNO TRADICIONAL DE ARCHIVOS

Este capítulo esta principalmente enfocado a analizar la forma en que las empresas utilizan las bases de datos para alcanzar sus objetivos. Los datos de los que disponga la empresa deben ser aprovechados para crecer y desarrollar nuevas estrategias y tomar mejores decisiones. Nos interesa a los ingenieros industriales debido a que trabajaremos con grandes bases de datos que contienen información sobre productos terminados, materia prima en inventario, proveedores, componentes de los productos, calidad del producto, y artículos en tránsito que se pueden utilizar para la administración de la cadena de suministro.

La información debe ser exacta, es decir, libre de errores; oportuna, cuando está disponible en todo momento; relevante, cuando es útil y adecuada para los tipos de trabajo y decisiones que la necesitan. Muchas empresas no cuentan con esta información debido a que sus sistemas de información están mal organizados y con un mantenimiento deficiente.

Conceptos de organización de archivos.

El sistema de cómputo organiza los datos en una jerarquía que empieza con el bit, el cual representa ya sea un o un de la siguiente forma: bits, bytes, campos, registros y archivo. Los bits se pueden agrupar para formar un byte para representar un carácter, número o símbolo. Los bytes se pueden agrupar para formar un campo y los campos relacionados se pueden agrupar para formar un registro. Los registros relacionados se conjuntan para formar un archivo y los archivos relacionados se pueden organizar en una base de datos

Problemas con el entorno tradicional de archivos.

Usar esta metodología, alienta a cada área a desarrollar aplicaciones especializadas de archivos. Cada aplicación necesita un archivo de datos el que quizás es parte de algún subconjunto del archivo maestro, lo que nos lleva nuevamente a la inconsistencia de datos, inflexibilidad en el procesamiento de datos, inflexibilidad en el procesamiento y recursos de almacenamiento.

Redundancia e inconsistencia de datos, es decir, presencia de datos guardados múltiples ocasiones, de manera que se actualiza solo cierta información y otras no. Lo que produce una mala interpretación de los datos y confusión.

Dependencia entre programas y datos, la estrecha relación entre ambos provoca que al realizar algún cambio en el programa sea necesario modificar también los datos. Implementar estos cambios podría costar mucho dinero para la organización.

Carencia de flexibilidad, seguridad escasa debido al poco control que se puede tener sobre los datos, no se sabe quién tiene acceso y quien incluso está modificándolos. La información está fragmentada, de manera que es casi imposible compartirla acceder a ella de manera oportuna.

Carencia de compartición y disponibilidad de datos debido a que la información está fragmentada en diferentes archivos y en distintas partes de la organización y no se pueden relacionar entre sí. La información no fluye libremente por las áreas funcionales ni en forma ni en tiempo.

Page 2: ORGANIZACIÓN DE DATOS EN UN ENTORNO TRADICIONAL DE ARCHIVOS

Edgar Pedraza Flores 07/03/11

ENFOQUE DE LAS BASES DE DATOS PARA LA ADMINISTRACIÓN DE DATOS

Las bases de datos se definen como un conjunto de datos organizados para servir eficientemente a muchas aplicaciones al centralizar los datos y controlar su redundancia. Una sola base de datos da servicio y soporte a varias aplicaciones.

Un sistema de administración de bases de datos (DBMS) es un software que centraliza los datos de la organización, administrarlos y proporcionar el acceso a los datos. Es la interfaz entre los programas de aplicación y los archivos de datos físicos. La vista lógica presenta los datos de manera cómo los percibirían los usuarios finales y la vista física presenta el orden y la estructura física del orden de los datos en un medio físico.

Estos sistemas reducen la redundancia y la inconsistencia de datos al minimizar la cantidad de archivos aislados en los que se repiten los datos. Quizás no lo elimine totalmente, pero los reduce al máximo. Elimina la dependencia entre programas y los datos, permitiendo a los últimos ser autosuficientes. El acceso y la disponibilidad de la información se incrementaran, mientras que los costos de desarrollo y el mantenimiento de los programas se reducirán. Posibilita centralizar la administración de datos, su uso y seguridad.

DBMS relacional.

Estos sistemas representan los datos como tablas bidimensionales (llamadas relaciones). Microsoft Access es un DBMS relacional. Las tablas de estas bases de datos se pueden combinar fácilmente para entregar los datos requeridos por los usuarios, siempre y cuando dos tablas compartan un elemento de datos en común. Se utilizan 3 operaciones básicas para generar conjuntos de datos útiles: seleccionar, proyectar y unir. La operación seleccionar crea un subconjunto que consta de todos los registros (filas) de la tabla que cumplen los criterios establecidos. La operación unir combina tablas relacionales para dar al usuario más información de la que está disponible en las tablas individuales. La operación proyectar crea un subconjunto que consiste en las columnas de una tabla, lo cual permite al usuario crear nuevas tablas que contengan exclusivamente la información que se requiere.

DBMS jerárquico y de red.

Un DBMS jerárquico modela relaciones uno a muchos, en tanto que uno de red modela relaciones muchos a muchos Estos sistemas ya no se utilizan para crear nuevas aplicaciones.

DBMS orientados a objetos.

Las aplicaciones requieren bases de datos que puedan almacenar y recuperar registros que contengan dibujos, imágenes, fotografías, voz y video. Las DBMS orientadas a objetos están especialmente dedicadas a estos requerimientos. Estos sistemas almacenarlos datos y los procedimientos que realizan operaciones sobre estos datos como objetos que se pueden recuperar y compartir de manera automática.

Page 3: ORGANIZACIÓN DE DATOS EN UN ENTORNO TRADICIONAL DE ARCHIVOS

Edgar Pedraza Flores 07/03/11

CAPACIDADES DE LOS SISTEMAS DE ADMINISTRACION DE BASES DE DATOS

Un DBMS incluye capacidades y herramientas para organizar, manejar, acceder a la información de una base de datos. Las más importantes son su capacidad de definición de datos, su diccionario de datos y su lenguaje de manipulación de datos Esta capacidad de definición de datos se podría utilizar para especificar la estructura del contenido de la base de datos y para definir las características de los campos de cada tabla.

Elaboración de consultas e informes.

Los DBMS tienen un lenguaje especializado llamado lenguaje de manipulación de datos, este se utiliza para agregar, cambiar, eliminar y recuperar la información de la base de daos. Permite extraer la información necesaria. El lenguaje actual más sobresaliente es Lenguaje de Consultas Estructurado o SQL.

DISEÑO DE BASES DE DATOS

Primero se deben entender las relaciones entre los datos, el tipo de datos, como se utilizaran y como tendrá que cambiar la organización para manejar estos datos. Requiere un diseño conceptual: un modelo abstracto de la base de datos desde una perspectiva de negocios. Y un diseño físico, que muestra la manera real en que la base de datos está organizada en dispositivos de almacenamiento.

Normalización y diagramas entidad – relación

El diseño conceptual de la base de datos describe la manera en que se agruparan los elementos en la base de datos. El proceso de diseño identifica las relaciones entre los elementos de datos y la manera más eficiente de agruparlos para que cumplan los requerimientos de información de la empresa. Los grupos de datos se organizan, refinan y simplifican hasta que surge una vista lógica general de las relaciones entre todos los elementos de datos en la base de datos.

El proceso para crear estructuras de datos pequeñas, estables, aunque flexibles y adaptables a partir de grupos complejos de datos de denomina normalización. Los diseñadores de bases de datos documentan sus modelos de datos con un diagrama entidad-relación que a continuación se representa.

DISTRIBUCION DE BASES DE DATOS

Se pueden diseñar sistemas de información con una base de datos centralizada que sea utilizada por un procesador central único o por múltiples procesadores en una red cliente/servidor. Alternativamente, la base de datos puede ser distribuida. Una base de datos distribuida es aquella que se almacena en más de un lugar fijo. En una base de datos particionada unas partes de la base se almacenan y mantienen físicamente en un lugar y otras partes se almacenan en más otros lugares. Los sistemas distribuidos reducen la vulnerabilidad de un solo sitio central masivo. Incrementan el servicio y el nivel de respuesta para los usuarios locales y con frecuencia pueden correr en computadoras más pequeñas y menos caras. Las bases de datos locales en ocasiones pueden desviarse de los estándares y definiciones centrales de

PEDIDO PROVEEDOR PARTE ARTICULO

LINEA

Page 4: ORGANIZACIÓN DE DATOS EN UN ENTORNO TRADICIONAL DE ARCHIVOS

Edgar Pedraza Flores 07/03/11

datos delicados. Los diseñadores necesitan ponderar factores en sus decisiones.

ALMACENES DE DATOS

Almacena datos actuales e históricos de potencial interés para los encargados de la toma de decisiones de toda la empresa. El almacén de datos consolida y estandariza información de diferentes bases de datos operativas con el propósito de que la información se pueda utilizar a través de la empresa para el análisis y la toma de decisiones por parte de la administración.

Mercados de datos

Es un subconjunto de un almacén de datos en el que una parte resumida o altamente enfocada de los daos de la organización se coloca en una base de datos separada para una población especifica de usuarios.

INTELIGENCIA DE NEGOCIOS, ANALISIS DE DATOS MULTIDIMENSIONALES Y MINERIA DE DATOS

Herramientas para consolidar, analizar y dar acceso a extensas cantidades de datos para ayudar a los usuarios a tomas mejores decisiones de negocios. Incluyen software para consultas e informes de bases de datos, herramientas para análisis de datos multidimensionales (procesado analítico en línea) y minería de datos.

El procesamiento analítico en línea (OLAP) soporta el análisis de datos multidimensionales, el cual permite a los usuarios ver los mismos datos en diferentes formas utilizando múltiples dimensiones.

Extraen y transforman

Datos operativos

Datos de clientes

Datos de manufactura

Datos historicos

Datos externos

Acceso y análisis de datos

Directorio de

información

Almacén de datos

Page 5: ORGANIZACIÓN DE DATOS EN UN ENTORNO TRADICIONAL DE ARCHIVOS

Edgar Pedraza Flores 07/03/11

Minería de datos

Proporciona conocimientos acerca de los datos corporativos que no se podrían obtener con OLAP, al

encontrar patrones y relaciones ocultas en robustas bases de datos infiriendo reglas a partir de ellos para

predecir el comportamiento futuro. Realizan análisis de alto nivel sobre patrones o tendencias, pero

también es pueden profundizar para ofrecer más detalles cuando sea necesario.

Ha permitido a la administración determinar el perfil demográfico de nuevos clientes y relacionarlo con los

equipos que hayan comprado.

El análisis predictivo utiliza técnicas de minería de datos, datos históricos y suposiciones sobre condiciones

futuras para predecir resultados de eventos como la probabilidad de que un cliente responderá a una

oferta o comparara un producto específico.

BASES DE DATOS Y LA WEB

Muchas empresas emplean ahora la web para poner parte de la información de sus bases de datos internas

a disposición de sus clientes y socios de negocios. Las ventajas de acceder a la web, un navegador es más

sencillo de utilizar. La interfaz requiere pocos o ningún cambio a la base de datos interna. Cuesta mucho

menos agregar una interfaz web a un sistema heredado que rediseñar y volver a construir el sistema para

mejorar el acceso de los usuarios.

•Bases de datos

•Almacen de datos

•Mineria de datos OLAP

•Elaboracion de consultas e informes

• Inteligencia de negocios

Seguimiento de las transacciones Búsqueda de patrones y

conocimientos profundos

Decisión para responder a los

datos y los patrones