42
ADMINISTRACION DE RECURSOS DE DATOS

Administracion de recursos de datos

  • Upload
    moteo85

  • View
    2.090

  • Download
    2

Embed Size (px)

DESCRIPTION

Importancia de la administracion de daots en un empresa

Citation preview

Page 1: Administracion de recursos de datos

ADMINISTRACION DE RECURSOS DE DATOS

Page 2: Administracion de recursos de datos

Índice

ÍNDICE..................................................................................................................................................... 2

OBJETIVOS DEL TRABAJO................................................................................................................. 4

INTRODUCCIÓN.................................................................................................................................... 5

CONCEPTOS FUNDAMENTALES DE LOS DATOS..........................................................................6

1.1. CARÁCTER........................................................................................................................................61.2. CAMPO.............................................................................................................................................61.3. REGISTRO........................................................................................................................................61.4. ARCHIVO...........................................................................................................................................61.5. BASE DE DATOS...............................................................................................................................7

1. TIPOS DE BASE DE DATOS........................................................................................................ 7

2.1. BASE DE DATOS OPERATIVAS..........................................................................................................72.2. BASE DE DATOS DISTRIBUIDOS........................................................................................................7

2.2.1. Diseño de la base de datos distribuida..............................................................................72.2.2. Procesamiento de consultas...............................................................................................82.2.3. Control de concurrencia.......................................................................................................82.2.4. Confiabilidad..........................................................................................................................9

2.3. BASE DE DATOS EXTERNAS.............................................................................................................92.4. BASE DE DATOS HIPERMEDIAS........................................................................................................9

2. ALMACENES DE DATOS Y MINERÍA DE DATOS.....................................................................9

3.1. Data Warehousing...................................................................................................................103.2. Características del Almacén de Datos.................................................................................103.3. Arquitectura Data Warehouse...............................................................................................113.4. Estructura lógica del Almacén de Datos..............................................................................113.5. 1.7 Estructura física del Almacén de Datos........................................................................123.6. Software Data Warehouse.....................................................................................................13

3. PROCESAMIENTO TRADICIONAL DE ARCHIVOS.................................................................13

4.1. PROBLEMAS DEL PROCESAMIENTO DE ARCHIVOS.........................................................................13

4. ENFOQUE DE ADMINISTRACIÓN DE BASE DE DATOS.......................................................13

5. SOFTWARE DE ADMINISTRACIÓN DE DATOS......................................................................14

6. CONSULTA DE BASE DE DATOS.............................................................................................14

7. MANTENIMIENTO DE BASE DE DATOS..................................................................................14

8. DESARROLLO DE APLICACIONES..........................................................................................15

9. ADMINISTRADOR DE BASE DE DATOS..................................................................................15

10.1. EL ADMINISTRADOR DE BASES DE DATOS ES RESPONSABLE PRIMORDIALMENTE DE:...........16

Page 3: Administracion de recursos de datos

10.1.1. Administrar la estructura de la Base de Datos................................................................1610.1.2. Administrar la actividad de los datos................................................................................1610.1.3. Administrar el Sistema Manejador de Base de Datos....................................................1710.1.4. Establecer el Diccionario de Datos...................................................................................1710.1.5. Asegurar la confiabilidad de la Base de Datos...............................................................1710.1.6. Confirmar la seguridad de la Base de Datos...................................................................18

10. ESTRUCTURA DE BASE DE DATOS....................................................................................19

11.1. ESTRUCTURA JERÁRQUICA........................................................................................................1911.2. ESTRUCTURA DE RED................................................................................................................2011.3. ESTRUCTURA RELACIONAL........................................................................................................2011.4. ESTRUCTURA MULTIDIMENSIONAL.............................................................................................2111.5. ESTRUCTURA ORIENTADA A OBJETOS.......................................................................................21

11. EVALUACIÓN DE LAS ESTRUCTURA DE BASE DE DATOS............................................22

12. DESARROLLO DE BASE DE DATOS...................................................................................22

13. PLANEACIÓN DE DATOS Y DISEÑO DE BASE DE DATOS..............................................23

14.1. RECOPILAR LA INFORMACIÓN....................................................................................................2414.2. IDENTIFICAR LOS OBJETOS........................................................................................................2414.3. CREAR UN MODELO DE LOS OBJETOS.......................................................................................2514.4. IDENTIFICAR LOS TIPOS DE INFORMACIÓN PARA CADA OBJETO...............................................2514.5. IDENTIFICAR LA RELACIÓN ENTRE OBJETOS..............................................................................26

CONCLUSIÓN...................................................................................................................................... 28

CASO PRÁCTICO I............................................................................................................................. 29

CASO DE PRACTICÓ II....................................................................................................................... 30

Page 4: Administracion de recursos de datos

Objetivos del trabajo

Explicar el valor de negocio de implementar procesos y tecnología de

administración de recursos de datos en una organización

Destacar las ventajas de un enfoque de administración de base de datos

para administrar los recursos de datos de un negocio, comparado con un

enfoque de procesamiento de archivos

Explicar como el software de administración de base de datos ayuda a los

profesionales de negocios, y da soporte a las operaciones y a la

administración de un negocio

Dar ejemplos para ilustrar cada uno de los siguientes conceptos:

a. Tipos principales de base de datos

b. Almacenas de datos y minería de datos

c. Elementos lógicos de datos

d. Estructuras fundamentales de base de datos

e. Desarrollo de base de datos

Page 5: Administracion de recursos de datos

Introducción

La información es un recurso vital de las organizaciones, que tiene que administrar como cualquier otro activo importante de un negocio. En la actualidad, las empresas no pueden sobrevivir o tener éxito sin información de calidad acerca de sus operaciones internas y de su ambiente externo

Page 6: Administracion de recursos de datos

Conceptos fundamentales de los datos

1.1. Carácter

Es el elemento más básico de los datos lógicos es el carácter, que consiste en un símbolo único alfabético, numérico u otro tipo.

1.2. Campo

En las bases de datos un campo es la mínima unidad de almacenamiento de información accesible.

O puede considerar en una agrupación de caracteres relacionados.

1.3. Registro

Un registro (también llamado fila) representa un objeto único de datos implícitamente estructurados en una tabla. En términos simples, una tabla de una base de datos puede imaginarse formada de filas y columnas o campos. Cada fila de una tabla representa un conjunto de datos relacionados, y todas las filas de la misma tabla tienen la misma estructura.

1.4. Archivo

Un archivo es un elemento de información conformado por un conjunto de registros. Estos registros a su vez están compuestos por una serie de caracteres o bytes. Los archivos, alojados en dispositivos de almacenamiento conocidos como memoria secundaria, pueden almacenarse de dos formas diferentes: archivos convencionales o bases de datos.

Page 7: Administracion de recursos de datos

1.5. Base de datos

Una base de datos es una recopilación de información relativa a un asunto o propósito particular, como el seguimiento de pedidos de clientes o el mantenimiento de una colección de música. Si la base de datos no está almacenada en un equipo, o sólo están instaladas partes de la misma, puede que deba hacer un seguimiento de información procedente de varias fuentes en orden a coordinar y organizar la base de datos.

1. Tipos de base de datos

2.1. Base de datos operativas

Las bases de datos operativas almacenan datos detallados necesarios para apoyar los procesos y operaciones de negocios de unas empresas.

2.2. Base de datos distribuidos

Una base de datos distribuida (BDD) es un conjunto de múltiples bases de datos lógicamente relacionadas las cuales se encuentran distribuidas entre diferentes sitios interconectados por una red de comunicaciones.

2.2.1. Diseño de la base de datos distribuida

En el diseño de bases de datos distribuidas se debe considerar el problema de cómo distribuir la información entre diferentes sitios. Existen razones organizacionales las cuales determinan en gran medida lo anterior. Sin embargo, cuando se busca eficiencia en el acceso a la información, se deben abordar dos problemas relacionados. Primero, como fragmentar la información. Segundo, como asignar cada fragmento entre los diferentes sitios de la red. En el diseño de la BDD también es importante considerar si la información está replicada, es decir, si existen copias múltiples del mismo dato y, en este caso,

Page 8: Administracion de recursos de datos

como mantener la consistencia de la información. Finalmente, una parte importante en el diseño de una BDD se refiere al manejo del directorio. Si existen únicamente usuarios globales, se debe manejar un solo directorio global. Sin embargo, si existen también usuarios locales, el directorio combina información local con información global.

2.2.2. Procesamiento de consultas

El procesamiento de consultas es de suma importancia en bases de datos centralizadas. Sin embargo, en BDD éste adquiere una relevancia mayor. El objetivo es convertir transacciones de usuario en instrucciones para manipulación de datos. No obstante, el orden en que se realizan las transacciones afecta grandemente la velocidad de respuesta del sistema. Así, el procesamiento de consultas presenta un problema de optimización en el cual se determina el orden en el cual se hace la menor cantidad de operaciones. Este problema de optimización es NP-difícil, por lo que en tiempos razonables solo se pueden obtener soluciones aproximadas. En BDD se tiene que considerar el procesamiento local de una consulta junto con el costo de transmisión de información al lugar en donde se solicitó la consulta.

2.2.3. Control de concurrencia

El control de concurrencia es la actividad de coordinar accesos concurrentes a la base de datos. El control de concurrencia permite a los usuarios accesar la base de datos en una forma multiprogramada mientras se preserva la ilusión de que cada usuario está utilizándola solo en un sistema dedicado. El control de concurrencia asegura que transacciones múltiples sometidas por usuarios diferentes no interfieran unas con otras de forma que se produzcan resultados incorrectos. En BDD el control de concurrencia es aún más complejo que en sistemas centralizados. Los algoritmos más utilizados son variaciones de aquellos usados en sistemas centralizados: candados de dos fases, ordenamiento por estampas de tiempo, ordenamiento por estampas de tiempo múltiples y control de concurrencia optimista. Un aspecto interesante del control de concurrencia es el manejo de interbloqueos. El sistema no debe permitir que dos o más transacciones se bloqueen entre ellas.

Page 9: Administracion de recursos de datos

2.2.4. Confiabilidad

En cualquier sistema de bases de datos, centralizado o distribuido, se debe ofrecer garantías de que la información es confiable. Así cada consulta o actualización de la información se realiza mediante transacciones, las cuales tienen un inicio y fin. En sistemas distribuidos, el manejo de la atomicidad y durabilidad de las transacciones es aún más complejo, ya que una sola transacción puede involucrar dos o más sitios de la red. Así, el control de recuperación en sistemas distribuidos debe asegurar que el conjunto de agentes que participan en una transacción realicen todo un compromiso (commit) al unísono o todos al mismo tiempo restablezcan la información anterior (roll-back).

2.3. Base de datos externas

Una base de datos externa es una base de datos que no sea la activa. Aunque para mejorar los rendimientos es mejor adjuntarlas a la base de datos actual y trabajar con ellas.

2.4. Base de datos hipermedias

Son las bases de datos que usan en página web multimedia.

2. Almacenes de datos y minería de datos

Un Almacén de Datos (o Data Warehouse) es una gran colección de datos que recoge información de múltiples sistemas fuentes u operacionales dispersos, y cuya actividad se centra en la Toma de Decisiones -es decir, en el análisis de la información- en vez de en su captura. Una vez reunidos los datos de los sistemas fuentes se guardan durante mucho tiempo, lo que permite el acceso a datos históricos; así los almacenes de datos proporcionan al usuario una interfaz consolidada única para los datos, lo que hace más fácil escribir las consultas para la toma de decisiones.

Page 10: Administracion de recursos de datos

3.1. Data Warehousing

Data Warehousing es el proceso que facilita la creación y explotación de un Almacén de Datos.

Los Sistemas de Data Warehousing incluyen funcionalidades como:

Integración de bases de datos heterogéneas (relacionales, documentales, geográficas, archivos, etc.)

Ejecución de consultas complejas no predefinidas visualizando el resultado en forma gráfica y en diferentes niveles de agrupamiento y totalización de datos.

Agrupamiento y des agrupamiento de datos en forma interactiva.

Análisis del problema en términos de dimensiones.

Control de calidad de datos.

3.2. Características del Almacén de Datos

Organizado en torno a temas. La información se clasifica en base a los aspectos que son de interés para la empresa.

Integrado. Es el aspecto más importante. La integración de datos consiste en convenciones de nombres, codificaciones consistentes, medida uniforme de variables, etc.

Dependiente del tiempo. Esta dependencia aparece de tres formas:

La información representa los datos sobre un horizonte largo de tiempo.

Cada estructura clave contiene (implícita o explícitamente) un elemento de tiempo (día, semana, mes, etc.).

La información, una vez registrada correctamente, no puede ser actualizada.

No volátil. El Almacén de Datos sólo permite cargar nuevos datos y acceder a los ya almacenados, pero no permite ni borrar ni modificar los datos.

Page 11: Administracion de recursos de datos

3.3. Arquitectura Data Warehouse

La estructura básica de la arquitectura Data Warehouse incluye:

Datos operacionales. Origen de datos para el componente de almacenamiento físico del Almacén de Datos.

Extracción de datos. Selección sistemática de datos operacionales usados para formar parte del Almacén de Datos.

Transformación de datos. Procesos para sumarizar y realizar cambios en los datos operacionales.

Carga de datos. Inserción de datos en el Almacén.

Almacén. Almacenamiento físico de datos de al arquitectura Data Warehouse.

Herramienta de acceso. Herramientas que proveen acceso a los datos.

3.4. Estructura lógica del Almacén de Datos

La estructura lógica de un Almacén de Datos está compuesta por los siguientes niveles:

Metadatos. Describen la estructura de los datos contenidos en el almacén.

Están en una dimensión distinta al resto de niveles.

Datos detallados actuales. Obtenidos directamente del procesado de los datos.

Forman el nivel más bajo de detalle.

Ocupan mucho espacio.

Se almacenan en disco, para facilitar el acceso.

Page 12: Administracion de recursos de datos

Datos detallados históricos. Igual que los anteriores, pero con datos correspondientes al pasado.

Se suelen almacenar en un medio externo, ya que su acceso es poco frecuente.

Datos ligeramente resumidos. Primer nivel de agregación de los datos detallados actuales.

Corresponden a consultas habituales.

Se almacenan en disco.

Datos muy resumidos. Son el nivel más alto de agregación.

Corresponden a consultas que se realizan muy a menudo y que se deben obtener muy rápidamente.

Suelen estar separados del Almacén de datos, formando Supermercados de Datos (Data Marts).

3.5. 1.7 Estructura física del Almacén de Datos

La estructura física puede presentar cualquiera de las siguientes configuraciones:

Arquitectura centralizada. Todo el Almacén de datos se encuentra en un único servidor.

Arquitectura distribuida. Los datos del Almacén se reparten entre varios servidores. Asignando cada servidor a uno o varios temas lógicos.

Arquitectura distribuida por niveles. Refleja la estructura lógica del Almacén, asignando los servidores en función del nivel de agregación de los datos que contienen. Un servidor está dedicado para los datos de detalle, otro para los resumidos y otro para los muy resumidos.

Cuando los datos muy resumidos se duplican en varios servidores para agilizar el acceso se habla de Supermercados de datos (Data Marts).

Page 13: Administracion de recursos de datos

3.6. Software Data Warehouse

Red Brick Warehouse

Essbase

Pilot Decission Support Suite

Microsoft SQL Server

3. Procesamiento tradicional de archivos

Proceso en los cuales los datos se organizan, almacenan y procesasen en archivos independientes de registros de datos

4.1. Problemas del procesamiento de archivos

Redundancia no controlada, ingreso repetido del dato para actualizar los archivos donde este. Inconsistencia de datos, el dato esta en varias partes y no se modifica en todas cuando se actualiza.

4. Enfoque de administración de base de datos

El enfoque de procesamiento de archivos fue reemplazado por el enfoque de administración de base de datos, como la base de los métodos modernos de administrar datos organizativos. El enfoque de administración de base de datos consolida de manera formal los registros de datos en archivos separados dentro de base de datos, que pueden ser asesadas por muchos programas de aplicación diferentes.

Page 14: Administracion de recursos de datos

5. Software de administración de datos

El DBMS es un conjunto de programas que se encargan de manejar la creación y todos los accesos a las bases de datos. Se compone de un Lenguaje de Definición de Datos (DDL: Data Definition Languaje), de un Lenguaje de Manipulación de Datos (DML: Data Manipulation Languaje), y de un Lenguaje de Consulta (SQL: Structured Query Languaje).

6. Consulta de base de datos

En bases de datos, una consulta es el método para acceder a los datos en las bases de datos. Con las consultas se puede modificar, borrar, mostrar y agregar datos en una base de datos. Para esto se utiliza un lenguaje de consultas. El lenguaje de consultas a base de datos más utilizado es el SQL.

7. Mantenimiento de base de datos

Dentro de las tareas habituales de Mantenimiento de las Bases de Datos se encuentran aquellas destinadas al control y respaldo de las mismas como ser: Control de Integridad, Chequeo de Consistencia, Copias de Seguridad o Compactación de las bases. Pero también es necesario ejecutar trabajos de mantenimiento cuyos objetivos sean el de mantener la performance de las bases de datos y evitar su degradación. Esos trabajos son la Reorganización de Índices y la Actualización de Estadísticas. Estos trabajos son independientes del estado de la base de datos. Puede ocurrir que a la base le falten estudios de optimización pero, al menos, mantendremos la performance actual. Si la base se encuentra optimizada, entonces más aún, son necesarios para evitar la degradación producto del uso continuo. Cualquiera de estos trabajos deben realizarse fuera de línea por motivos de: alto consumo de recurso y bloqueo de las tablas en el momento de ejecución. Por lo tanto debemos agentarlos en horarios, en donde las bases de datos se encuentren libres de cualquier actividad de producción. La frecuencia de ejecución de estos trabajos depende básicamente de dos factores: tamaño de la base y tiempo libre para ejecutarlos. La frecuencia ideal sería reorganizar todos los índices de todas las tablas una vez por semana y, de aquellas tablas más

Page 15: Administracion de recursos de datos

accedidas, una vez entre semana. La misma frecuencia sería deseable para la actualización de las estadísticas.

8. Desarrollo de aplicaciones

Los paquetes de sistemas de administración de base de datos también desempeñan una función primordial en el desarrollo de aplicaciones. Los usuarios finales, analistas de sistemas y los desarrolladores de otras aplicaciones pueden utilizar el lenguaje de programación 4GL y herramientas de desarrollo de software integradas proporcionadas por muchos paquetes de sistemas de administración de base de datos, para desarrollar programas de aplicación a la medida

9. Administrador de base de datos

Es la persona encargada de definir y controlar las bases de datos corporativas, además proporciona asesoría a los desarrolladores, usuarios y ejecutivos que la requieran. Es la persona o equipo de personas profesionales responsables del control y manejo del sistema de base de datos, generalmente tiene(n) experiencia en DBMS, diseño de bases de datos, Sistemas operativos, comunicación de datos, hardware y programación.

Un Administrador de Base de Datos de tiempo completo normalmente tiene aptitudes técnicas para el manejo del sistema en cuestión a demás, son cualidades deseables nociones de administración, manejo de personal e incluso un cierto grado de diplomacia. La característica más importante que debe poseer es un conocimiento profundo de las políticas y normas de la empresa, así como el criterio de la empresa para aplicarlas en un momento dado. La responsabilidad general del DBA es facilitar el desarrollo y el uso de la Base de Datos dentro de las guías de acción definidas por la administración de los datos.

Page 16: Administracion de recursos de datos

10.1. El Administrador de Bases de Datos es responsable primordialmente de:

10.1.1. Administrar la estructura de la Base de Datos.

Esta responsabilidad incluye participar en el diseño inicial de la base de datos y su puesta en práctica así como controlar, y administrar sus requerimientos, ayudando a evaluar alternativas, incluyendo los DBMS a utilizar y ayudando en el diseño general de la bases de datos. En los casos de grandes aplicaciones de tipo organizacional, el DBA es un gerente que supervisa el trabajo del personal de diseño de la BD.

Una vez diseñada las bases de datos, es puesta en práctica utilizando productos del DBMS, procediéndose entonces a la creación de los datos (captura inicial). El DBA participa en el desarrollo de procedimientos y controles para asegurar la calidad y la alta integridad de la BD.

Los requerimientos de los usuarios van modificándose, estos encuentran nuevas formas o métodos para lograr sus objetivos; la tecnología de la BD se va modificando y los fabricantes del DBMS actualizan sus productos. Todas las modificaciones en las estructuras o procedimientos de BD requieren de una cuidadosa administración.

10.1.2. Administrar la actividad de los datos.

El DBA no es usuario del sistema, no administra valores de datos; sino la actividad de datos; protege los datos, no los procesa. Dado que la base de datos es un recurso compartido, el DBA debe proporcionar estándares, guías de acción, procedimientos de control y la documentación necesaria para garantizar que los usuarios trabajen en forma cooperativa y complementaria al procesar datos en la bases de datos.

Page 17: Administracion de recursos de datos

10.1.3. Administrar el Sistema Manejador de Base de Datos.

Existe una gran actividad al interior de un DBMS. La concurrencia de múltiples usuarios requiere la estandarización de los procesos de operación; el DBA es responsable de estas especificaciones y de asegurarse que estas lleguen a quienes concierne. Todo el ámbito de la base de datos se rige por estándares, desde la forma de como se captura la información (tipo de dato, longitud, formato), como es procesada y presentada. El nivel de estandarización alcanza hasta los aspectos más internos de la base de datos; como sé acceso a un archivo, como se determinan los índices primarios y auxiliares, registros, etc.

El DBA debe procurar siempre que los estándares que serán aplicados beneficien también a los usuarios, privilegiando siempre la optimización en la operación del DBMS y el apego de las políticas de la empresa. Entre las funciones del DBA se encuentra la de revisar los estándares periódicamente para determinar su operatividad, ajustarlos, ampliarlos o cancelarlos y hacer que éstos se cumplan.

10.1.4. Establecer el Diccionario de Datos.

Cuando se definen estándares sobre la estructura de la base de datos, se deben de registrarse en una sección del diccionario de datos a la que todos aquellos usuarios relacionados con ese tipo de proceso pueden acceder. Este metadato debe precisar información que nos indique con claridad el tipo de datos que serán utilizados, sus ámbitos de influencia y sus limitantes de seguridad.

10.1.5. Asegurar la confiabilidad de la Base de Datos.

Se trata de realizar un sistema de bases de datos lo suficientemente robusto para que sea capaz de recuperarse frente a errores o usos inadecuados. Se deben utilizar gestores con las herramientas necesarias para la reparación de los posibles errores que las bases de datos pueden sufrir, por ejemplo tras un corte inesperado de luz.

Page 18: Administracion de recursos de datos

10.1.6. Confirmar la seguridad de la Base de Datos.

Coordinar las nuevas propuestas para realizar ajustes en los derechos de acceso a datos compartidos y aplicaciones específicamente propuestas serían analizados en conjunto con los supervisores o directivos de las áreas involucradas para determinar si procede pudieran aparecer problemas cuando dos o más grupos de usuarios quedan autorizados para notificar los mismos datos. Uno de tales conflictos es el de la actualización perdida; este ocurre cuando el trabajo de un usuario queda sobrescrito sobre por el de un segundo usuario. El DBA queda responsabilizado para identificar la posible ocurrencia de dichos problemas así como de crear normas y procedimientos para su eliminación. Se obtendrán este tipo de garantías cuando el DBMS sea capaz de implementar las restricciones aplicables al acceso concurrente, y este sea utilizado adecuadamente por programadores y usuarios; para borrar lo anterior, se hace indispensable el apego a los estándares el seguimiento de instructivos y manuales y las reglas establecidas para los diversos procesamientos y procedimientos que se llevan a cabo.

Entre las alternativas más utilizadas por el DBA para tratar de resolver o minimizar este problema se encuentran las siguientes:

Restringir el acceso a los procedimientos para ciertos usuarios.

Restringir al acceso a los datos para ciertos usuarios procedimientos y/o datos.

Evitar la coincidencia de horarios para usuarios que comparten.

Las técnicas de recuperación son otra función esencial del DBA al administrar la actividad de datos. A pesar de que el DBMS lleva a cabo una parte del proceso de recuperación, los usuarios determinan en forma critica la operatividad de esos sistemas de protección. El DBA debe anticipar fallas y definir procedimientos estándares de operación; los usuarios deben saber qué hacer cuando el sistema este caído y que es lo primero que debe realizarse cuando el sistema este puesto en marcha nuevamente. El personal de operación deberá saber cómo iniciar el proceso de recuperación de la BD que copias de seguridad utilizar; como programar la re ejecución del tiempo perdido

Page 19: Administracion de recursos de datos

y de las tareas pendientes; es importante también establecer un calendario para llevar a cabo estas actividades sin afectar a otros sistemas dentro de la organización que hagan uso de los mismos recursos de computo. Destacan por su importancia en el proceso de recuperación y a su vez en la atención que prestan a otros sectores de la organización. Los dispositivos de comunicación remota, los sistemas de interconexión y otros accesorios de uso compartido.

El DBA es el responsable de la publicación y mantenimiento de la documentación en relación con la actividad de los datos, incluyendo los estándares de la BD, los derechos de recuperación y de acceso a la BD, los estándares para la recuperación de caídas y el cumplimiento de las políticas establecidas. Los productos DBMS más populares que se encuentran en el mercado proporcionan servicios de utilerías para ayudar al DBA en la administración de los datos y su actividad. Algunos sistemas registran en forma automática los nombres de los usuarios y de las aplicaciones a las que tienen acceso así como a otros objetos de la BD. Incorpora también utilerías que permitan definir en el diccionario de datos las restricciones para que determinadas aplicaciones o módulos de ellas solo tengan acceso a segmentos específicos de la BD.

10. Estructura de base de datos

La estructura de una base de datos hace referencia a los tipos de datos, los vínculos o relaciones y las restricciones que deben cumplir esos datos (integridad de datos y redundancia de datos). La estructura de una base de datos es diseñada o descripta empleando algún tipo de modelo de datos.

11.1. Estructura jerárquica

Una Base de datos jerárquica es un tipo de Sistema Gestor de Bases de Datos que, como su nombre indica, almacenan la información en una estructura jerárquica que enlaza los registros en forma de estructura de árbol (similar a un árbol visto al revés), en donde un nodo padre de información puede tener varios nodos hijo.

Page 20: Administracion de recursos de datos

Esta relación jerárquica no es estrictamente obligatoria, de manera que pueden establecerse relaciones entre nodos hermanos. En este caso la estructura en forma de árbol se convierte en una estructura en forma de grafo dirigido.

11.2. Estructura de red

Una base de datos de red es una base de datos conformada por una colección o set de registros, los cuales están conectados entre sí por medio de enlaces en una red. El registro es similar al de una entidad como las empleadas en el modelo relacional.

Un registro es una colección o conjunto de campos (atributos), donde cada uno de los que contiene solamente un único valor almacenado, exclusivamente el enlace es la asociación entre dos registros, así que podemos verla como una relación estrictamente binaria.

Una estructura de base de datos de red, llamada algunas veces estructura de plex, abarca más que la estructura de árbol, porque un nodo hijo en la estructura red puede tener más de un nodo padre. En otras palabras, la restricción de que en un árbol jerárquico cada hijo puede tener sólo un padre, se hace menos severa.

Así, la estructura de árbol se puede considerar como un caso especial de la estructura de red.

11.3. Estructura relacional

Una base de datos relacional es una base de datos que cumple con el modelo relacional, el cual es el modelo más utilizado en la actualidad para implementar bases de datos ya planificadas. Permiten establecer interconexiones (relaciones) entre los datos (que están guardados en tablas), y a traves de dichas conexiones relacionar los datos de ambas tablas, de ahí proviene su nombre: "Modelo Relacional". Tras ser postuladas sus bases en 1970 por

Page 21: Administracion de recursos de datos

Edgar Frank Codd, de los laboratorios IBM en San José (California), no tardó en consolidarse como un nuevo paradigma en los modelos de base de datos.

11.4. Estructura multidimensionalLas bases de datos multidimensionales se utilizan principalmente para crear aplicaciones OLAP y pueden verse como bases de datos de una sola tabla, su peculiaridad es que por cada dimensión tienen un campo (o columna), y otro campo por cada métrica o hecho, es decir estas tablas almacenan registros cuyos campos son de la forma:

(d1,d2,d3,...,f1,f2,f3,...)

Donde los campos 'di' hacen referencia a las dimensiones de la tabla, y los campos 'fi' a las métricas o hechos que se quiere almacenar, estudiar o analizar.

11.5. Estructura orientada a objetos

Una base de datos o banco de datos (en ocasiones abreviada BB.DD.) es un conjunto de datos pertenecientes a un mismo contexto y almacenados sistemáticamente para su posterior uso. En este sentido, una biblioteca puede considerarse una base de datos compuesta en su mayoría por documentos y textos impresos en papel e indexados para su consulta. En la actualidad, y debido al desarrollo tecnológico de campos como la informática y la electrónica, la mayoría de las bases de datos están en formato digital (electrónico), que ofrece un amplio rango de soluciones al problema de almacenar datos.

Existen programas denominados sistemas gestores de bases de datos, abreviados SGBD, que permiten almacenar y posteriormente acceder a los datos de forma rápida y estructurada. Las propiedades de estos SGBD, así como su utilización y administración, se estudian dentro del ámbito de la informática.

Las aplicaciones más usuales son para la gestión de empresas e instituciones públicas. También son ampliamente utilizadas en entornos científicos con el objeto de almacenar la información experimental.

Page 22: Administracion de recursos de datos

11. Evaluación de las estructura de base de datos

12. Desarrollo de base de datos

Las BDOO se desarrollan al describir en primer lugar los tipos de objetos importantes del dominio de aquellos tipos de objetos. Estos tipos de objetos determinan las clases que conformarán la definición de la BDOO.

Tres Enfoques de Construcción de Bases de Datos OO

Las BDOO se pueden construir mediante alguno de los tres enfoques siguientes:

El Primero.- se puede utilizar el código actual altamente complejo de los sistemas de administración de las bases de datos, de modo que una BDOO se implante más rápido sin tener que iniciar de cero. Las técnicas orientadas a objetos se pueden utilizar como medios para el diseño sencillo de sistemas complejos. Los sistemas se construyen a partir de componentes ya probados con un formato definido para las solicitudes de las operaciones del componente.

El Segundo: considera a la BDOO como una extensión de la tecnología de las bases de datos por relación. De este modo, las herramientas, técnicas, y vasta experiencia de la tecnología por relación se utilizan para construir un nuevo SABD. Se pueden añadir apuntadores a las tablas de relación para ligarlas con objetos binarios de gran tamaño (BLOB). La base de datos también debe proporcionar a las aplicaciones clientes un acceso aleatorio y por partes a grandes objetos, con el fin de que sólo sea necesario recuperar a través de la red la parte solicitada de los datos.

El Tercero: reflexiona sobre la arquitectura de los sistemas de bases de datos y produce una nueva arquitectura optimizada, que cumple las necesidades de la tecnología OO. Las compañías como Versant, Objectivity, Itasca, etc. Utilizan esté enfoque y afirman que la tecnología de relación es un subconjunto de una capacidad más general. Además que las BDOO no de relación son aproximadamente dos veces más rápidas que las bases de datos por relación para almacenar y recuperar la información compleja. Por lo tanto, son esenciales en aplicaciones como CAD y permitirían que un depósito CASE fuera una facilidad de tiempo real en vez de una facilidad por lotes.

Page 23: Administracion de recursos de datos

La Arquitectura de Versant está designada al soporte Cliente/Servidor con acercamiento a la computación distribuida; cualquier aplicación de Cliente el servidor la procesa, usa las EDT y las máquinas servidoras que pueden cooperar en una BD distribuida de Versant. Las BD pueden estar levantadas como un sistema m-Cliente/n-Servidor.

Un servidor en el medioambiente de Versant es una máquina que está corriendo los procesos del servidor, esta soporta accesos concurrentes por usuarios múltiples de una o más BD. Un cliente es un proceso de aplicación este tiene acceso a espacios de trabajo de BD persistentes privadas y en adición puede accesar diversas BD sobre servidores concurrentes con otras aplicaciones de cliente.

13. Planeación de datos y diseño de base de datos

El primer paso al crear una base de datos consiste en elaborar un plan que sirva de guía para la implementación de la base de datos y, al mismo tiempo, como especificación funcional después de su implementación. La complejidad y los detalles de diseño de una base de datos dependen de la complejidad y el tamaño de la aplicación de bases de datos, así como de los usuarios.

La naturaleza y complejidad de una aplicación de bases de datos, así como el proceso de diseño, pueden variar significativamente. Una base de datos puede ser relativamente sencilla y estar diseñada para que la utilice una sola persona, o bien ser grande y compleja, y estar diseñada para procesar, por ejemplo, las transacciones bancarias de miles de clientes. En el primer caso, el diseño de la base de datos puede consistir en poco más que unas anotaciones en un papel. En el segundo caso, el diseño puede ser un documento formal de cientos de páginas que contenga todos y cada uno de los posibles detalles relacionados con la base de datos.

Page 24: Administracion de recursos de datos

Al diseñar la base de datos, independientemente de su tamaño y complejidad, lleve a cabo los siguientes pasos básicos:

Recopile la información.

Identifique los objetos.

Cree modelos de los objetos.

Identifique los tipos de información para cada objeto.

Identifique las relaciones entre los objetos.

14.1. Recopilar la información

Antes de crear una base de datos, debe conocer con detalle el cometido previsto de la base de datos. Si la base de datos va a reemplazar a un sistema de información manual o en papel, dicho sistema le proporcionará la mayor parte de la información que necesita. Debería consultar a todas las personas involucradas en el sistema para determinar lo que hacen y qué necesitan de la base de datos. También es importante identificar qué es lo que desean que haga el nuevo sistema, así como los problemas, las limitaciones y los cuellos de botella del sistema existente. Recopile copias de las instrucciones del cliente, listas de inventarios, informes de administración y, en general, de todos aquellos documentos que formen parte del sistema existente, porque le servirán para diseñar la base de datos y las interfaces.

14.2. Identificar los objetos

Durante el proceso de recopilación de información, deberá identificar los objetos o las entidades más importantes que vayan a ser administrados por la base de datos. El objeto puede ser tangible (una persona o un producto, por ejemplo) o bien intangible (como una transacción empresarial, un departamento de una compañía o un período de liquidación de nóminas). Normalmente hay unos cuantos objetos principales; una vez identificados, se evidencian los elementos relacionados. Cada elemento diferenciado de la base de datos debe tener su tabla correspondiente.

Page 25: Administracion de recursos de datos

El objeto principal de la base de datos de ejemplo AdventureWorks2008R2 que se incluye con SQL Server es una bicicleta. Los objetos relacionados con la bicicleta en las operaciones empresariales de esta compañía son los empleados que fabrican la bicicleta, los proveedores que venden los componentes utilizados para fabricar la bicicleta, los clientes que los compran y las transacciones comerciales realizadas con los clientes. Cada uno de estos objetos es una tabla de la base de datos.

14.3. Crear un modelo de los objetos

Cuando se identifican los objetos del sistema, debería registrarlos de una manera que represente visualmente el sistema. Puede utilizar su modelo de base de datos como referencia durante la implementación de la misma.

Con este propósito, los programadores de bases de datos utilizan herramientas que varían en complejidad técnica: desde papel y bolígrafo hasta procesadores de texto y hojas de cálculo e, incluso, programas de software creados específicamente para la elaboración de modelos de datos destinados al diseño de bases de datos. Sea cual sea la herramienta que decida utilizar, es importante que la mantenga actualizada.

14.4. Identificar los tipos de información para cada objeto

Una vez identificados los objetos principales de la base de datos como candidatos para las tablas, el siguiente paso es identificar los tipos de información que deben almacenarse para cada objeto. Estos tipos son las columnas de la tabla del objeto. Las columnas de una tabla de base de datos contienen algunos tipos de información comunes:

Columnas de datos sin procesar

Estas columnas almacenan información tangible, como por ejemplo nombres, determinada por un origen externo a la base de datos.

Columnas de categorías

Page 26: Administracion de recursos de datos

Estas columnas clasifican o agrupan los datos y almacenan una selección limitada de datos, tales como verdadero o falso; casado o soltero; presidente, director o responsable de equipo; etc.

Columnas de identificadores

Estas columnas proporcionan un mecanismo para identificar cada elemento almacenado en la tabla. Estas columnas suelen incluir un Id. o un número en el nombre (por ejemplo, IdDeEmpleado, númeroDeFactura y IdDeEditor. La columna del identificador es el componente principal para los usuarios y las funciones internas de proceso de la base de datos para el acceso a una fila de datos de la tabla. Algunas veces el objeto tiene una forma tangible de Id. utilizada en la tabla (por ejemplo, un número de la seguridad social), aunque en la mayoría de los casos se puede definir la tabla para poder crear un Id. confiable y artificial para la fila.

Columnas relacionales o diferenciales

Estas columnas establecen un vínculo entre la información de una tabla y la información relacionada que se encuentra en otra tabla. Por ejemplo, una tabla que realiza el seguimiento de transacciones comerciales puede tener un vínculo con una tabla clientes, de modo que pueda asociarse toda la información del cliente a la transacción comercial.

14.5. Identificar la relación entre objetos

Uno de los puntos fuertes de una base de datos relacional es la posibilidad de relacionar o asociar información acerca de varios elementos de la base de datos. Pueden almacenarse por separado tipos aislados de información, pero el motor de base de datos puede combinar los datos cuando sea necesario. Para identificar la relación entre los objetos durante el proceso de diseño se necesita llevar a cabo un examen de las tablas con el fin de determinar sus relaciones lógicas y agregar columnas relacionales que establezcan un vínculo entre las tablas.

Por ejemplo, el diseñador de la base de datos AdventureWorks2008R2 ha creado tablas para los productos y modelos de producto de la base de datos. La tabla Production.Product contiene información de cada producto que incluye una columna de identificador denominada ProductID, así como columnas de datos para el nombre, el precio, el color, el tamaño y el peso del producto. La tabla contiene columnas de categorías, como Class o Style, que permiten

Page 27: Administracion de recursos de datos

agrupar los productos por estos tipos. Cada producto tiene también un modelo del producto, pero esa información se almacena en otra tabla. Por lo tanto, la tabla Production.Product tiene la columna ProductModelID solo para almacenar el Id. Del modelo del producto. Cuando se agrega una fila de datos para un producto, el valor de ProductModelID debe existir en la tabla Production.ProductModel.

Page 28: Administracion de recursos de datos

Conclusión

Destacamos que el manejo de información en una empresa es vital sin ella la empresa no lograra tener un éxito o no tendrá la capacidad de competir en el mercado, por ello se hace la utilización de la base de datos para administrar y llevar un orden en el manejo de las información.

Page 29: Administracion de recursos de datos

Caso práctico I

Argosy Gaming Co: Retos en la construcción de un almacén de datos

Preguntas del practicó de estudio

1. ¿Cuál es el valor de negocio de un almacén de datos? Utilice a Argosy Gaming

como ejemplo.

El valor de una almacén de datos es muy importante en la toma de decisiones,

por ende es muy crucial administra de manera ordenada y segura. En el caso

de Argosy Gaming su valor fue un elemento clave para realizar los proceso de

automatización y el ETL (extracción, transformación y carga)

2. ¿Por qué Argosy Gaming utilizo una herramienta de software de extracción,

transformación y carga? ¿Qué beneficio y problemas surgieron? ¿Cómo los

resolvieron?

Argosy Gaming tenía las informaciones divididas y los juegos tenían reglas

diferentes por eso los especialistas usa un sistema de ETL. Los beneficios son

reunir los datos en un solo sistema, satifacer los crecientes flujos de datos y las

futuras demandas de información. Los problemas que surgieron son: La

extracción de las informaciones en fuentes diferentes, transformar las

informaciones extraídas, y cargar las informaciones. Para resolver los

problemas se proceden a reordenar los campos desde un registro desde el

sistema origen.

3. ¿Cuáles son algunas de las principales responsabilidades que los

profesionales y los administradores de negocio tienen en el desarrollo de

almacén de datos? a Argosy Gaming como ejemplo.

Manejar las información de manera ordenada y segura

Page 30: Administracion de recursos de datos

Buscar soluciones alternativas en la resolución de problemas

Administrar los datos por el buen manejo de los datos

Caso de practicó II

Harrah’s entertainmente y otras: La protección de las joyas de la información

Preguntas.

1. ¿Por qué los desarrolladores de TI han ayudado a incrementar el valor de los recursos de datos de muchas empresas?

En primer lugar, con el uso de una base de datos de clientes y unas

herramientas analíticas de soporte a la toma de decisiones con lo que lograron

ampliar aún más el espacio que les separa de las empresas

Operadoras de casinos cuya estrategia de incentivo se basa más en la

intuición que en la evidencia. En segundo lugar, ofrecen la excelencia de

servicio que todo cliente exige. En pocas palabras, lo que les ha llevado al

liderazgo ha sido el uso exhaustivo de la extracción de datos de su base de

datos de clientes

Junto con la puesta en marcha de experimentos de mercado y la aplicación

final de los resultados obtenidos, que a su vez han sido aprovechados para

crear e implantar estrategias de marketing y oferta de servicios

Consistía en un programa de tarjetas destinadas a cada jugador que se basaba

en el diseño de

Las iniciativas emprendidas por las compañías aéreas para premiar la

frecuencia de uso de los clientes. “Total Gold” fue lanzado en 1997, y su

intención era la de incentivar a los clientes habituales para que visitasen los

Page 31: Administracion de recursos de datos

establecimientos de Harrah’s diseminados por todo el país. La idea era que los

clientes insertaban la tarjeta en las máquinas tragaperras y de esta forma

acumulaban puntos cada vez que jugaban. Finalmente recibían un premio, que

era el paquete habitual en la oferta de cualquier casino: habitaciones de hotel,

comidas, entradas para espectáculos y vales de regalo, todo ello gratis. Sin

embargo, el programa tenía 3 inconvenientes:

• No se diferenciaba de la competencia

• El programa carecía de uniformidad

• Los clientes interesados en el juego no se encontraban con alicientes que los

incitarán a elegir a Harrah’s como establecimiento habitual

2. Como han incrementar estas capacidades los retos de seguridad asociados con la protección de los recursos de datos de una empresa

Los retos de seguridad siempre han sido un reto para las empresas debido a que las personas que laboran en los departamento de TI suelen llevar información importante, para eso se utilizar software diseñado para eso como Opsware Inc y servicio de escaneo de correo electrónico que permite analizar los mensajes que sospeche que podría tener archivo de propiedad.

3. ¿Cómo pueden las empresas utilizar la TI para satisfacer los retos de seguridad de los recursos de datos

Utilizan software de seguridad

Utilizan firewall

U hacer uso de escaneo de correo electrónica saliente de la empresa.