21
Universidad Laica “Eloy Alfaro” de Manabí Facultad De Ciencias Informáti cas SECCIÓN I Administración de Recursos de Datos La información es un recurso vital de las organizaciones, que tiene que administrarse como cualquier otro activo importante de una empresa. En la actualidad, la empresa no puede sobrevivir o tener éxito sin información de calidad acerca de sus operaciones internas y de su ambiente externo. Ésa es la razón por la cual las organizaciones y sus administradores tienes que practicar la administración de recurso de datos, una actividad administrativa que aplica tecnologías de sistemas de información (como administración de base de datos, almacenes de datos, y otras herramientas de administración de datos) a la tarea de administrar los recurso de datos de una organización, con el fin de satisfacer las necesidades de información de sus participantes de negocio. Conceptos fundamentales de los datos 1

Bases de datos

Embed Size (px)

Citation preview

Page 1: Bases de datos

Universidad Laica “Eloy Alfaro” de Manabí Facultad De Ciencias Informáticas

SECCIÓN I

Administración de Recursos de Datos

La información es un recurso vital de las organizaciones, que tiene que administrarse como cualquier otro activo importante de una empresa. En la actualidad, la empresa no puede sobrevivir o tener éxito sin información de calidad acerca de sus operaciones internas y de su ambiente externo.

Ésa es la razón por la cual las organizaciones y sus administradores tienes que practicar la administración de recurso de datos, una actividad administrativa que aplica tecnologías de sistemas de información (como administración de base de datos, almacenes de datos, y otras herramientas de administración de datos) a la tarea de administrar los recurso de datos de una organización, con el fin de satisfacer las necesidades de información de sus participantes de negocio.

Conceptos fundamentales de los datos

Se ha desarrollado un esquema conceptual de varios niveles de datos, que identifica las diferencias entre diversas agrupaciones, o elementos de datos. De este modo, los datos pueden organizarse de forma lógica en caracteres, campos registros, archivos, y base de datos, del mismo modo como la escritura puede organizarse en letras, palabras, oraciones, párrafos y documentos.

1

Page 2: Bases de datos

Universidad Laica “Eloy Alfaro” de Manabí Facultad De Ciencias Informáticas

Carácter:

El elemento más básico de los datos lógicos es el carácter, que consiste en un símbolo único alfabético, numérico o de otro tipo. Uno podría argumentar que el bit o byte es un elemento de dato más básico, pero recuerde que estos términos se refieren a los elementos de almacenamiento físico, proporcionados por el hardware de cómputo.

Campo:

El siguiente nivel de datos es el campo o elementos de dato. Este consiste en una agrupación de caracteres relacionados. Por ejemplo la agrupación de los caracteres alfabéticos del nombre de una persona puede formar el campo de nombre. En específico un campo de información representa un atributo (una característica o cualidad) de alguna entidad (objeto, persona, lugar, o evento.

Registro:

Los campos relacionados de información se agrupan para formar un registro. Por eso, un registro representa una colección de atributos que describen una entidad.

Archivo:

Un grupo de registros relacionados es un archivo de datos, o tabla. Así, un archivo de empleados contendría los registros de los empleados de una empresa. A menudo, los archivos se clasifican según la aplicación para la cual se utilizan principalmente, como por ejemplo un archivo de nómina o un archivo de inventario, o por el tipo de datos que contienen, como un archivo de documento o un archivo de imágenes gráficas.

Base de Datos:

Una Base de Datos e una colección integrada de elementos de datos relacionados de manera lógica, esta consolida los registros almacenados de antemano en archivos separados dentro un grupo común de elementos de datos, el cual proporciona información para muchas aplicaciones. Los datos almacenados en una base de datos son independientemente de los programas de aplicación que los utilizan, y del tipo de dispositivo de almacenamientos en los que están almacenados.

2

Page 3: Bases de datos

Universidad Laica “Eloy Alfaro” de Manabí Facultad De Ciencias Informáticas

TIPOS DE BASE DE DATOS

Los continuos desarrollos de tecnologías de información y en sus aplicaciones de negocio han dado como resultado la evolución de diversos tipos importantes de bases de datos.

Ejemplos de algunos de los principales tipos de bases de datos utilizados por organizaciones y usuarios finales

Base de Datos Operativas.

Almacenan datos detallados necesarios para apoyar los procesos y operaciones de negocio de una empresa. También se les llama base de datos de áreas temáticas, base de datos transaccionales o base de datos de producción. Como ejemplo de tenemos una base de datos de clientes, de recursos humanos y otras base de datos que contienen información general por las operaciones de negocio.

Base de datos distribuida.

Pueden residir en servidores de red en Internet o en redes de la empresa. Se realizan para mejorar el desempeño de la base de datos en las estaciones de trabajo de los usuarios finales.

3

Page 4: Bases de datos

Universidad Laica “Eloy Alfaro” de Manabí Facultad De Ciencias Informáticas

Este tipo de base pueden ser copias de base de datos operativas o analíticas, de base de datos de hipermedios de discusión, o cualquier otro tipo de base de datos.

Base de Datos Externas.

Están disponibles por una tarifa para servicios comerciales en línea, y con o sin cargo desde muchas fuentes en Internet. Los datos están disponibles en forma de estadísticas referentes a actividades económicas y demográficas a partir de banco de datos estadísticos.

Base de Datos de Hipermedios.

El rápido crecimiento de sitios web en internet y redes corporativas ha incrementado de manera radical el uso de base de datos de documentos de hipertexto e hipermedios. Este tipo de base consiste en páginas de medios hipervínculadas (texto gráfico, imagen, audio, video, etc.), es decir, desde el punto de vista de la administración de base de datos, el conjunto de multimedia interconectadas en un sitio Web.

ALMACENES DE DATOS Y MINERÍA DE DATOS

Almacenes de datos

Un almacén de datos Guarda datos que se han extraído desde diversas bases de datos operativas, externas y de otro tipo de una organización. Es una fuente central de datos que han sido limpiados, transformados y catalogados, de tal manera que los administradores y otros profesionales de negocio puedan utilizarlos para la minería de datos, el procesamiento analítico en línea y otras

4

Page 5: Bases de datos

Universidad Laica “Eloy Alfaro” de Manabí Facultad De Ciencias Informáticas

formas de análisis de negocio, investigación de mercados y apoyo a la toma de decisiones.

Los almacenes de datos pueden subdividirse en mercados de datos, que contienen subconjuntos de datos del almacén y que se enfocan en aspectos específicos de una empresa, tales como un departamento o un proceso de negocio.

Mineria de datos

Es una aplicación principal de las base de datos delos almacenes de datos. En la minería de datos, los datos de un almacén de datos se analizan para revelar patrones y tendencias ocultos en la actividad histórica del negocio. Esto puede

utilizarse para ayudar a los

5

Page 6: Bases de datos

Universidad Laica “Eloy Alfaro” de Manabí Facultad De Ciencias Informáticas

administradores a tomar decisiones, con el fin de lograr ventajas competitivas en el mercado.

El software de minería de datos utiliza algoritmos avanzados de reconocimiento de patrones, así como una variedad de técnicas matemáticas y estadísticas para filtrar grandes volúmenes de datos y extraer información estratégica de negocio antes ignorada. Muchas empresas utilizan la minería de datos para:

Desempeñar “analisis de canasta de mercado” con el fin de identificar nuevos grupos de productos.

Descubrir la causa de origen de los problemas de calidad o de manufactura.

Prevenir el agotamiento de los clientes y adquirir otros nuevos. Vender de forma cruzada a clientes existentes. Realizar la generación de perfiles de los clientes con mas

precisión.

Procedinmiento tradicional de archivos

¿Cómo se sentiria si ud. Fuera ejecutivo de una empresa y ledijeran que la informacion que usted requiere acerca de sus empleados es demaciado dificil y costosa de obtener? Suponga qe el vicepresidente de servicios de informacionle diera la siguientes razones:

La información requerida esta en diversos archivos, cada uno organizado de manera diferente

Cada archivo ha sido organizado para utilizarse con un programa diferente, ninguno produce la información que se desea en la forma que se necesita

No hay disponible ningún programa de aplicación que ayude a obtener la información que se requiere de esos archivos

Asi es como los usuario finales pueden verse frustados cuando una organización depende de sistemas de procesamiento de archivos, en los cuales los datos se organizan, almacenan y procesan en archivos independientes de registros de datos. En el enfoque tradicional del procesamiento de archivos que se utilizaba en el procesamiento de informacion de negocio durante muchos años, cada aplicación de negocio se diseñaba para utilizar uno o mas archivos especializados de datos que sólo contenian tipos especificos de registros de datos. Asi es como los usuario finales pueden verse frustados cuando una organización depende de sistemas de procesamiento de archivos, en los cuales los datos se organizan, almacenan y procesan en archivos independientes de

6

Page 7: Bases de datos

Universidad Laica “Eloy Alfaro” de Manabí Facultad De Ciencias Informáticas

registros de datos. En el enfoque tradicional del procesamiento de archivos que se utilizaba en el procesamiento de informacion de negocio durante muchos años, cada aplicación de negocio se diseñaba para utilizar uno o mas archivos especializados de datos que sólo contenian tipos especificos de registros de datos.

Problemas de procesamiento de archivos

El enfoque de procesamiento de archivos en definitiva llego a ser demasiado engorroso, costoso e inflexible para proporcionar la información necesaria a fin de administrar el negocio moderno. Los sistemas de procesamiento de archivos presentaban los siguientes problemas:

• Redundancia de datos: la misma información se registraba y almacenaba en diversos archivos, esto causaba problemas cuando debían actualizarse, tenían que desarrollarse programas separados de mantenimiento de archivos. Se presentaban muchas inconsistencias entre los datos almacenados en archivos separados.

• Falta de integración de datos: tenían que desarrollarse programas especiales para recuperar datos de cada archivo independiente. Esto consumía tanto tiempo y era tan costoso para algunas organizaciones. Los usuarios finales tenían que extraer de forma manual la información requerida a partir de diversos reportes producidos por cada aplicación separada.

7

Page 8: Bases de datos

Universidad Laica “Eloy Alfaro” de Manabí Facultad De Ciencias Informáticas

• Dependencia de datos: los componentes principales de un sistema, la organización de los archivos, sus ubicaciones físicas en el hardware de almacenamiento, y el software de aplicación utilizado para acceder a esos archivos, dependían uno de otros de manera importante.

• Otros problemas: la carencia de estándares provocó importantes problemas en el desarrollo y el mantenimiento de programas de aplicación, y en la seguridad e integridad de los archivos de datos.

El enfoque de la administración de base de datos

El enfoque de procesamiento de archivos fue reemplazado por el enfoque de administración de bases de datos, como la base de los métodos modernos de administrar datos organizativos. El enfoque de administración de base de datos consolida de manera formal los registros de datos en archivos separados dentro de base de datos, que pueden ser accesadas por muchos programas de aplicación diferentes.

Un sistema de administración de base de datos DBMS actúa como una interface de software entre los usuarios y las bases de datos. Esto ayuda a los usuarios a acceder con facilidad a la información de una base de datos.

La administración de bases de datos implica el uso del software de administración de base de datos para controlar la forma en que se crean, consultan y se da mantenimiento a las base de datos y para proporcionar la información necesaria a los usuarios finales.

8

Page 9: Bases de datos

Universidad Laica “Eloy Alfaro” de Manabí Facultad De Ciencias Informáticas

Ejemplo de enfoque de administración de base de datos en un sistema de información bancario

Software de administración de base de datos

Un DBMS, es la herramienta principal de software del enfoque de la administración de base de datos, controla la creación, el mantenimiento y el uso de las base de datos de una organización y de sus usuarios finales

En sistemas informáticos de grandes sistemas centrales (mainframe) o de servidores, el DBMS es un importante paquete de software que controla el desarrollo, uso y mantenimiento de las bases de datos de las organizaciones que utilizan computadoras.

Las tres principales funciones de un DBMS son:

Crear nuevas base de datos y aplicaciones para ella. Mantener la calidad de la información de las base de datos de una

organización Utilizar las bases de datos de una organización para proporcionar la

información necesaria a sus usuarios finales.

El desarrollo de una base de datos implica definir y organizar el contenido, las relaciones y estructura de los datos necesarios para construir una base de datos. El desarrollo de la aplicación de base de datos implica utilizar un sistema de administración de base de datos para desarrollar prototipos de consultas, formularios, reportes y páginas web para una aplicación de negocio

9

Page 10: Bases de datos

Universidad Laica “Eloy Alfaro” de Manabí Facultad De Ciencias Informáticas

propuesta. El mantenimiento de base de datos implicar utilizar sistemas de procesamiento de transacciones y otras herramientas para añadir, borrar, actualizar y corregir la información de una base de datos. El uso principal de una BD por parte de los usuarios finales implica emplear las capacidades de consulta de BD de un sistema para acceder a la información de una BD, con el fin de recuperar y desplegar la información y producir reportes, formularios y otros documentos de manera selectiva.

Componentes comunes de software de administración de base de datos

Definición de bases de datosLenguaje y herramientas gráficas para

definir entidades, relaciones, restricciones de integridad y derechos

no autorizados Acceso no procedural Lenguaje y herramientas gráficas para

acceder a los datos sin una codificación complicada

Desarrollo de Aplicaciones Herramientas gráficas para desarrollar menús, formas de captura

de datos y reportes

Interface de lenguaje procedural

Lenguaje que combina acceso no procedural con las capacidades

totales de un lenguaje de programación

Proceso de transaccionesMecanismos de control para prevenir

interferencias de usuarios simultáneos y recuperar información

perdida después de una falla Afinación de base de datos Herramientas para monitorear y

mejorar el desempeño de las bases de datos

Componentes y funciones comunes de software de un sistema de administración de bases de datos

Consulta de base de datos

La capacidad de consulta de una BD es un beneficio importante del enfoque

de la administración de BD. Los usuarios finales pueden solicitar información

desde una base de datos mediante el uso de una característica de consulta o un generador de reportes.

• Lenguaje de consulta.- permite obtener con facilidad respuestas inmediatas a solicitudes específicas de datos.

10

Page 11: Bases de datos

Universidad Laica “Eloy Alfaro” de Manabí Facultad De Ciencias Informáticas

• Generador de reportes.- permite especificar de manera expedita un formato de reporte para la información que se quiera presentar como un reporte.

• Consultas SQL.-Lenguaje internacional estándar de consulta, que se encuentra en muchos paquetes de sistemas de administración de base de datos. SELECT… FROM... WHERE…

• Consultas Graficas y Naturales.-Muchos usuarios finales tienen dificultades para formular de manera correcta estatutos SQL y consultas de otros lenguajes de bases de datos, de modo que la mayoría de los paquetes de administración de base de datos ofrecen métodos de interfaces grafica de usuario de apuntar y pulsar, más fáciles de usar y son traducidos por el software en comandos SQL

Mantenimiento de una base de datos

El proceso se logra mediante sistemas de procesamiento de transacciones y otras aplicaciones de usuario final, con el apoyo del sistema de administración de bases de datos. Los usuarios finales y los especialistas en información también pueden emplear varias utilerías proporcionadas por un sistema de información de BD para el mantenimiento.

Las bases de datos de una organización necesitan ser actualizadas de continuo para reflejar nuevas transacciones de negocios y otros eventos.

Otros cambios diversos también deben actualizarse y los datos corregirse para asegurar la precisión de los datos en la bases de datos

Desarrollo de aplicaciones

Los usuarios finales, analistas de sistemas y los desarrolladores de otras aplicaciones pueden utilizar el lenguaje de programación 4GL y herramientas de desarrollo de software integradas proporcionadas por muchos paquetes de

11

Page 12: Bases de datos

Universidad Laica “Eloy Alfaro” de Manabí Facultad De Ciencias Informáticas

sistemas de administración de base de datos, para desarrollar programas de aplicación a la medida.

Un DBMS facilita el trabajo de los desarrolladores de software de aplicación, porque no tienen que desarrollar procedimientos detallados de manejo de datos mediante el uso de lenguajes de programación convencionales cada vez que escriben un programa.

En lugar de eso pueden incluir características tales como estatutos de lenguaje de manipulación de datos (DML) en su software que llaman al sistema de administración de bases de datos para realizar las actividades necesarias del manejo de datos.

SECCIÓN II

Principios técnicos de la administración de la base de datos

Administración de base de datos

En todos los sistemas de información, los recursos de datos tienen que organizarse y estructurarse de alguna manera lógica, de forma que puedan ser accesados con facilidad, procesados de manera eficiente, recuperados con rapidez y administrado eficazmente. Por eso, se han inventado estructuras y métodos de acceso a los datos, que desde simples a complejos, para organizar y tener acceso a la información almacenada `por los sistemas de información de manera eficaz.

Estructura de Base de datos

Las relaciones entre los muchos elementos de datos individuales almacenados en las BD se basan en una de diversas estructuras lógicas de datos, o modelos. Los paquetes de DBMS se diseñan para utilizar una estructura específica de datos con el fin de proporcionar a los usuarios finales un acceso rápido y fácil a la información almacenada en la BD.

12

Page 13: Bases de datos

Universidad Laica “Eloy Alfaro” de Manabí Facultad De Ciencias Informáticas

Las cinco estructuras fundamentales de la base de datos son:

Estructura jerárquica.- los primeros paquetes de DBMS para los grandes sistemas centrales (mainframe) utilizaban la estructura jerárquica, en la cual las relaciones entre los registros forman una jerarquía o estructura de árbol. En el modelo estructura de multiniveles, que consisten en un registro raíz y un numero de niveles subordinados, así todas las relaciones entre los registros son de uno a muchos, dado que cada elemento de dato se relaciona con un solo elemento sobre él

Estructura de red.- Puede presentar relaciones lógicas más complejas, y todavía se utiliza en algunos paquetes de un DBMS para grandes sistemas. Permite relaciones de muchos a muchos entre los registros; es decir, el modelo de red puede accesar un elemento de dato al seguir uno de diversos caminos, porque se puede relacionar cualquier elemento de datos o registro con cualquier número de otros elementos de datos.

Estructura relacional.- Es el más utilizado de las tres estructura de base de datos. La mayoría de los paquetes de un DBMS para microcomputadoras lo utilizan, así como a mayoría de los sistemas de rango medio y grandes sistemas. En el modelo relacional, todos los elementos de datos se visualizan como almacenados en forma de tablas simples.

Estructura multidimensional.- Es una variación del modelo relacional, que utiliza estructura multidimensionales para organizar datos y expresar las relaciones entre ellos. Se pueden visualizar las estructuras multidimensionales como cubo de datos y como cubos dentro de los cubos de datos. Cada lado del cubo se considera una dimensión de la información.

Estructura orientada a objetos.- Se considera como una de las tecnologías clave de una nueva generación de aplicaciones multimedia basadas en web. Un objeto consiste en valores de datos que describen los atributos de una entidad, más las operaciones que pueden realizarse sobre los datos. Esta capacidad de encapsulación permite al modelo orientado a objetos manejar con más facilidad tipos complejo de datos (graficas, dibujos, voz, texto) que otras estructurara de base de datos. Este modelo también soporta la herencia.

13

Page 14: Bases de datos

Universidad Laica “Eloy Alfaro” de Manabí Facultad De Ciencias Informáticas

La tecnología de objetos permite a los diseñadores desarrollar diseños de productos, almacenarlos como objetos en una BD orientado a objetos, replicarlos y modificarlos para crear nuevos diseños de productos.

Ejemplo de tres estructuras básicas de bases de datos. Representan tres maneras básicas de desarrollar y expresar las relaciones de datos de una base

de datos

Evaluación de la estructura de base de datos

La estructura jerárquica de la información fue un modelo natural para las bases de datos sutilizadas para tipo estructurados y de rutina de procesamiento de transacciones, lo cual caracterizó a muchas operaciones de negocio Una estructura de datos en red podría manejar con facilidad una relación de muchos a muchos. Eso se debe a que es más flexible que la estructura jerárquica para apoyar las bases de datos en muchos tipos de operaciones de negocio. Sin embargo al igual que la estructura jerárquica

14

Page 15: Bases de datos

Universidad Laica “Eloy Alfaro” de Manabí Facultad De Ciencias Informáticas

debido a que sus relaciones deben especificarse con anticipación, el modelo de red no puede manejar de forma sencilla solicitudes específicas de información.

Las bases de datos relacionales, por otra parte, permite a un usuario final recibir con facilidad información en respuesta a requisiciones específicas. Esto se debe a que no tienen que especificarse todas las relaciones entre los elementos de datos en una base de datos organizada de manera racional que cuando se crea la base de datos. El software de administración de bases de datos (Oracle, DB2, Access) crea nuevas tablas de relaciones de datos mediante el uso de parte de los datos de diversas tablas.

La limitación principal del modelo relacional es que los sistemas de administración de bases de datos relacionales no pueden procesar grandes cantidades de transacciones de negocio con rapidez y eficiencia como aquellos basados en los modelos jerárquicos y de red, o aplicaciones complejas y de alto volumen también como el modelo orientado a objetos.

Desarrollo de base de datos

Los paquetes de administración de bases de datos como Microsoft Access o Lotus Approach permiten a los usuarios finales desarrollar con facilidad las bases de daos que necesitan. Sin embargo las grandes organizaciones por lo general depositan el control del desarrollo empresarial de las bases de datos en las manos de los administradores de bases de datos (DBA) y de otros especialistas de bases de datos.

Esto mejora la integridad y seguridad de las bases de datos organizacionales. Lo desarrolladores de bases de datos utilizan el Lenguaje de Definición de Datos (DDL) en los sistemas de administración de bases de datos como el Oracle 9i o BD2 de IBM, para desarrollar y especificar los contenidos, relaciones y estructura de datos de cada base de datos, y para modificar estas especificaciones de bases de datos cuando sea necesario.

Diccionario de datos: Es un catálogo o directorio de administración de bases de datos que contienen metadatos, es decir, datos acerca de los datos. Un diccionario de datos depende de un componente de software del sistema de administración de bases de datos para administrar una base de datos de definiciones de datos, es decir, metadatos acerca de la estructura, elementos de datos y otras características de las bases de datos de una organización.

Los administradores de la base de datos puede consultar los diccionarios de datos para reportar el status de cualquier aspecto delos metadatos de una empresa.

15

Page 16: Bases de datos

Universidad Laica “Eloy Alfaro” de Manabí Facultad De Ciencias Informáticas

Planeación de datos y diseño de bases de datos

El desarrollo de bases de datos puede comenzar con un proceso de planeación de datos de arriba abajo. Los administradores y diseñadores de bases de datos trabajan con la administración corporativa y los usuarios finales para desarrollar un modelo empresarial que defina el proceso básico de negocio de la empresa. Luego, definen las necesidades de información de los usuarios finales dentro de un proceso de negocio, tales como el proceso de compra/recepción que todos los tienen. A continuación, los usuarios finales deben identificar los elementos clave de datos que se necesitan para desempeñar sus actividades específicas de negocio. Esto implica con frecuencia desarrollar diagramas de entidad relación que modelen las relaciones entre las muchas entidades implicadas en los procesos de negocios.

16

El desarrollo de bases de datos implica actividades de planeación de datos y de diseño de bases de datos

Este diagrama de entidad relación ilustra algunas de las relaciones entre entidades (producto, proveedor, almacén, etc.) datos en un proceso de negocio de compra/recepción.