37
Bases de datos I Universidad Nacional de Colombia 1 BASES DE DATOS Clase 2 Conceptos Básicos Gloria Lucía Giraldo Gómez Universidad Nacional de Colombia [email protected] Bloque anexo al M8 Oficina 313

BASES DE DATOS Clase 2 Conceptos B á sicos

  • Upload
    myra

  • View
    28

  • Download
    2

Embed Size (px)

DESCRIPTION

BASES DE DATOS Clase 2 Conceptos B á sicos. Gloria Lucía Giraldo Gómez Universidad Nacional de Colombia [email protected] Bloque anexo al M8 Oficina 313. Un poco de historia …. Sistemas de archivos: - PowerPoint PPT Presentation

Citation preview

Page 1: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 1

BASES DE DATOSClase 2Conceptos Básicos Gloria Lucía Giraldo GómezUniversidad Nacional de [email protected] anexo al M8Oficina 313

Page 2: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 2

Un poco de historia …Sistemas de archivos:Sistemas de archivos: Surgieron a raíz de la necesidad de almacenamiento de la

información para su correspondiente reutilización (persistenciapersistencia)

Desventajas:Desventajas: Redundancia de los datos Los archivos están separados unos de otros

(no se pueden “combinar” fácilmente) Alto costo para la propagación de cambios Inconsistencia debido a actualizaciones simultáneas

Page 3: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 3

Procesamiento Procesamiento

dede

ClientesClientes

Archivode

Clientes

Procesamiento Procesamiento

dede

PréstamosPréstamos

Archivode

Préstamos

UsuarioUsuario del Archivo de Clientes

UsuarioUsuario del Archivo de Préstamos

Por cada préstamo se guarda la informacióndel cliente correspondiente: Redundancia

Un poco de historia …

Page 4: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 4

Un poco de historia …

¿Por qué surgieron los sistemas de Bases de Datos?

Necesidad de solucionar las debilidades de los sistemas de archivos

Capacidades: Manejo de persistenciapersistencia Soporte por lo menos de un modelo de datosmodelo de datos Soporte de un lenguaje de alto nivellenguaje de alto nivel que permita

manipular y definir la estructura de la información Control de accesoControl de acceso Evitar inconsistenciasEvitar inconsistencias al compartircompartir la información

Page 5: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 5

… Antes

EmpleadosClientes

Inventario

Ventas Cuentas

SGBDEmpleados

ClientesVentas

InventarioCuentas

Dpto. Personal Dpto. VentasDpto. Contabilidad

BASE DE DATOS… AhoraPersonal

Ventas

Contabilidad

Page 6: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 6

Definición

Una base de datos es un conjunto estructurado de datos coherentes

Colección disponible de información

Page 7: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 7

Definición

Una base de datos es un conjunto estructurado de datos coherentes

Colección organizada en subconjuntos, en función de ligas y de relaciones entre las diferentes informaciones (estructura lógica)

Page 8: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 8

Definición

Una base de datos es un conjunto estructurado de datos coherentes

No hay contradicción entre los datos ligados, no hay pérdida de información, aun sabiendo que hay una utilización compartida de los datos entre varios usuarios

Page 9: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 9

Definición

Un Sistema de Gestión de Bases de Datos (SGBD) es un software que permite manipular las bases de datos

•Construir•Utilizar •Mantener •Reorganizar

Page 10: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 10

Sistema de Gestión de Bases de Datos Propiedades fundamentales

Independencia de los datos (OJO es muy importante) Acceso eficiente a los datos Integridad y seguridad de los datos Administración de los datos Acceso concurrente y recuperación en caso de « crash »

Los SGBD deben cumplir con las propiedades ACID para las transacciones:Atomicity (Atomicidad: las transacciones son atómicas)Consistency (Consistencia: una transacción transforma un estado consistente de la BD en otro)Isolation (Aislamiento: las transacciones están aisladas entre si)Durability (Durabilidad: después que una transacción ha sido confirmada ella persiste)

Page 11: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 11

Algunas definiciones

Esquema de una Base de DatosEsquema de una Base de Datos: Cuando una base de Datos es diseñada interesa definir una estructura para ésta. Esta estructura permanece “estática” durante un gran período de tiempo, aunque puede sufrir modificaciones ocasionales

InstanciaInstancia: Es la información que en un determinado instante del tiempo posee la base de datos y que cambia permanentemente (excepto en algunos tipos de bases de BD particulares)

Page 12: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 12

Usuario final: El que interactúa con la base de datos, por lo general a través de aplicaciones e interfaces

Usuario especialista: El que diseña y programa aplicaciones para usuarios finales.

DBA (Database Administrator): El que administra la base de datos. ¿Qué hace?

Algunas definiciones

Page 13: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 13

Funciones y componentes principales de un SGBD

DDL: lenguaje de definición de datosDML: lenguaje de manipulación de datos

Fuente: “Introducción a los sistemas de bases de datos” C.J. Date

Procesador DDL

Procesador DML

Procesador Lenguaje Consulta

Esquemasexternos

Datosy

Metadatos

Base de datos

PeticionesDML planeadas

Peticionescompiladas

Peticionesoptimizadas

Optimizador

PeticionesDML No planeadas

Esquemas ytransformaciones

Manejador de transacciones

Manejador de almacenamiento

Page 14: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 14

Componentes funcionales de un SGBD Metadatos o Diccionario de Datos (D.D): Contiene el esquema

de la B.D, los usuarios, los permisos de acceso, etc. Son datos sobre los datos. Almacena la información que permite la traducción entre los 3 niveles de la Arquitectura ANSI/SPARC*

Optimizador de consultas: Define el plan de ejecución de operaciones solicitadas por los usuarios, de tal manera que se lleven a cabo de la manera más eficiente posible

Manejador de transacciones: Controla el acceso y la concurrencia de operaciones

*Se verá mas adelante en el curso

Page 15: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 15

Componentes funcionales de un SGBD Manejador de almacenamiento tiene dos

componentes:

-Manejador de archivos anejador de archivos recupera desde disco los bloques que contienen la información solicitada por una transacción.

-Manejador de buffer anejador de buffer mantiene en memoria principal la información más usadamás usada y decide cuando llevar a disco alguno de sus bloques.

Page 16: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 16

SGBD - Funciones

Soporta DML: Lenguaje para actualización, almacenamiento y recuperación de datos

Ofrece optimización en la búsqueda de la información

Soporta DDL : Lenguaje para definir los datos

Metadatos (DD): Catálogo autodescriptivo, información sobre los objetos existentes en el sistema Datos sobre los datos

Page 17: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 17

Ventajas de un SGBD

1. Reutilización de datos y programas

2. Control de redundancia

3. Estandarización ¿En qué sentido?

4. Consistencia (No hay redundancia)

5. Es posible equilibrar las cargas de los requerimientos (establecer prioridades)

Page 18: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 18

Ventajas de un SGBD

6. Integridad (Se cumplen las reglas establecidas ¿Por quién?)

7. Seguridad

8. Rapidez de desarrollo

9. Mantenimiento y reingeniería: cambios en la estructura de datos sin cambiar los programas que los usan (hasta cierto punto)

Page 19: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 19

Desventajas de un SGBD

1. Tamaño

2. Susceptibilidad a fallas (Discutible)

3. Complejidad en la recuperación a fallas (Discutible)

4. Puede llegar a trabajar en forma “lenta” debido a la cantidad de verificaciones que debe hacer

Page 20: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 20

Niveles de abstracción (ANSI/SPARC)

Nivel interno gestión de acceso

Nivel conceptual integridad-coherencia

Nivel externo confidencialidad

Esquema físico

Esquema lógico, resultado de un proceso

de modelamiento

Vista usuario 1

Vista usuario 2

Vista usuario n

n esquemas externos

Page 21: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 21

Nivel de Visión

Externo El más cercano a los usuarios finales Percepción de la base de datos por parte de

los usuarios finales Tantas visiones como tipos de usuarios Cada visión de usuario final se puede

caracterizar como un subesquema

Page 22: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 22

Nivel de Visión

Cada visión puede proporcionar diferentes representaciones de los mismos datos

Visión VendedorVisión Vendedor Fechas con formato:

(dd-mm-yy)

Visión Contador

Fechas con formato:

(yyyy-dd-mm)BD

Page 23: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 23

Nivel de Visión

Algunas visiones de usuario pueden incluir: Datos AgrupadosAgrupados: Totales por Dpto. Datos DerivadosDerivados:

Sueldo total = básico + comisión Datos CalculadosCalculados:

Edad de una persona (inferida a partir de su fecha de Nacimiento)

Page 24: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 24

Nivel de Visión

Los conceptos de dato derivado y calculado podrían usarse indistintamente para significar, en general, que un dato se genera a partir de otro(s)

Pueden haber a su vez datos agregados derivados, datos agregados calculados etc.

Page 25: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 25

Nivel Conceptual

Mediador entre los otros 2 niveles Interesante para el usuario especialista Se ocupa de los datos almacenados en la base de

datos física y las relaciones entre ellos Descripción semántica de los datos que conforman

la base de datos Soporta a cada visión de usuario externa

Page 26: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 26

Nivel Conceptual

Es una visión completa de todos los requerimientos y elementos de interés para la organización

Debe incluir restricciones sobre los datos La descripción del nivel conceptual no debe tener

detalles dependientes del almacenamiento* Tiene asociado un lenguaje de alto nivel

* Sin embargo en algunos SGBD esto no se logra expresar de esta manera…

Page 27: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 27

Nivel Físico Interno Más cercano a la máquina Interesa al Administrador y al usuario

Especialista Esquema físico: Descripción y tipos de

datos: tamaño y precisión, tipos de índices y de estructuras de almacenamiento concretas que se manejan, de acuerdo con un SGBD particular

Page 28: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 28

Nivel Físico

Describe cómo los datos son almacenados en términos de estructuras de datos particulares

Se encarga de:

- Reservar espacio para datos e índices

- Compresión de datos

- Técnicas de encriptamiento de datos

Page 29: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 29

Independencia de los datos

Es uno de los objetivos de la arquitectura ANSI/SPARC

Permite modificar la definición de un nivel sin afectarafectar (en lo posible) el nivel inmediatamente superior

Sin independencia de datos se requeriría mucho esfuerzo para cambiar las aplicaciones de tal forma que se adaptasen a la nueva estructura de la base de datos.

Hay dos tipos: física y lógica

Page 30: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 30

Independencia de los datos

Física: inmunidad que tienen los usuarios y las aplicaciones ante los cambios en la forma de almacenar físicamente los datos.

Conceptual o lógica: inmunidad que poseen los usuarios y las aplicaciones ante los cambios en la estructura lógica de la base de datos

Page 31: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 31

Independencia Física

Se presenta entre el nivel conceptual y el nivel físico Un cambio en el esquema físico (usar otras

estructuras de almacenamiento) no conduce a cambios en el esquema conceptualEj. Cambio en la forma de almacenar un índice: B+ por Hashing, ¿con qué propósito se hace un cambio de este tipo?

Inmunidad del esquema conceptual ante cambios del esquema físico

Page 32: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 32

Independencia Lógica

Se presenta entre el nivel de visión y el nivel conceptual

Significa que un cambio en el nivel conceptual no debe conllevar a un cambio en el nivel de visión

Es más difícil de lograr. ¿Por qué?

Page 33: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 33

Independencia Lógica

Algunos de los posibles cambios en el nivel conceptual:

Adición de nuevos elementos (atributos, entidades etc.)

Eliminación de elementos Puede afectar a los subesquemas externos

Page 34: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 34

Tendencias de los SGBD

Sistemas para el soporte para toma de decisiones (Data Warehouse) y/o con capacidades deductivas y bases de datos temporales

Manejar información multimedial: Imágenes, audio, videos

Bases de datos orientadas a objetos y objeto-relacionales

Manejar información georeferenciada: Sistemas de Información Geográficos (SIG)

Manejo de información documental: Motores de búsqueda, sistemas para el manejo de documentos.

Bases de datos nativas para XML

Page 35: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 35

La descripción completa de una base de datos se denomina esquema

Cada visión de usuario tiene su esquema (subesquema), existe un esquema conceptual y uno interno

Existen correspondencias (“mappings”) - Entre cada subesquema externo y el

conceptual - Entre el esquema conceptual y el interno Estas correspondencias le permiten al SGBD por

ejemplo saber un registro conceptual con qué registro(s) del nivel físico se corresponde

RESUMEN

Page 36: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 36

En teoría debería existir un lenguaje de descripción para cada nivel*

En la práctica sin embargo en muchos SGBD el esquema conceptual queda fusionado con la especificación del esquema interno.

* No siempre sucede así en los SGBD actuales…

RESUMEN

Page 37: BASES DE DATOS Clase 2 Conceptos B á sicos

Bases de datos I Universidad Nacional de Colombia 37

Próximas clases

Modelos: Modelo conceptual: el diseño de un modelo conceptual

parte de la especificación de requisitos Ingeniería de requisitos Modelos conceptuales: E/A, semántico Modelos Lógicos: Relacional Modelos físicos: dependientes del SGBD