26
UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS Sandra Cecilia Romero Chávez Adriana de Luna Santillán Luis Jesús López Cervantes Luis Eduardo Sánchez de Loera Base de datos Distribuidas Profesor : Mario Alberto Vargas Moreno

UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS

Embed Size (px)

Citation preview

Page 1: UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS

UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS

Sandra Cecilia Romero Chávez

Adriana de Luna Santillán

Luis Jesús López Cervantes

Luis Eduardo Sánchez de Loera

Base de datos Distribuidas

Profesor : Mario Alberto Vargas Moreno

Page 2: UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS

2

Considerar:1 Autonomía local

• Los nodos o localidades deben ser independiente entre ellos.

• Características de cada nodo– Tienen su propio Sistema de gestión de bases

de datos– DBMS controla todos los aspectos ligados a él– Las operaciones de acceso a datos locales

utilizan solo recursos locales– Hay cooperación entre los nodos para el

acceso distribuido de datos.

2.1 Consideraciones de diseño de bases de datos distribuidas.

Page 3: UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS

3

Bases de Datos Distribuidas

2 No es necesario un sitio central• Todos los sitios/nodos deben ser tratados como

iguales • De existir un sitio central, sería cuello de

botella• De existir un sitio central, el sistema sería

vulnerable, porque una falla haría fallar todo el sistema

Page 4: UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS

4

Bases de Datos Distribuidas

3 Operación continua• Un sistema BDD no requiere estar nunca fuera

de servicio• Debe proporcionar mayor confiabilidad y mayor

disponibilidad• Se requiere

– Soporte para backups on line, total o incremental– Soporte para recuperaciones rápidas de BD– Soporte de DBMS tolerante a fallos (con hardware

acorde)

Page 5: UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS

5

Bases de Datos Distribuidas4 Independencia de ubicación

de datos

• Los usuarios y las aplicaciones no tienen que conocer la ubicación física de los datos. Actúan como si fuesen locales a ellos.

• Sin transparencia local deberían distinguirse los datos locales de los remotos.

• Simplifica los programas de usuario

Page 6: UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS

6

Bases de Datos Distribuidas5 Independencia de Fragmentación de datos

– Fragmentación

– La fragmentación es necesaria por razones de rendimiento. – Los usuarios deben comportarse como si los datos no

estuvieran fragmentados– Los datos pueden estar almacenados en la ubicación donde

son usados más frecuentemente para que la mayoría de las operaciones sean locales y se reduzca el tráfico de la Red

Page 7: UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS

7

Bases de Datos Distribuidas

6 Independencia de la Replicación de datos

Replicación– Mejor rendimiento: las aplicaciones operan

sobre copias locales en vez de comunicarse con sitios remotos

– Mejor disponibilidad: un objeto replicado esta disponible mientras haya al menos una copia

– Desventaja: propagar las actualizaciones– El usuario debe comportarse como si los

datos no estuvieran replicados

Page 8: UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS

8

Bases de Datos Distribuidas

7 Procesamiento de consultas distribuidas

– El rendimiento de una consulta debe ser independiente del sitio donde se realiza la consulta

– Se debe maximizar la optimización de consultas

Page 9: UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS

9

Bases de Datos Distribuidas

8 Administración de transacciones distribuidas– Debe mantenerse la atomicidad de

las transacciones– Control de recuperación de

información– Control de concurrencia– Protocolos utilizado para preservar

la atomicidad: dos fases o tres fases más conocidos.

Page 10: UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS

10

Bases de Datos Distribuidas

9 Independencia de hardware– Es necesario tener la posibilidad de

ejecutar el mismo DBMS en diferentes plataformas de Hardware

Page 11: UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS

11

Bases de Datos Distribuidas

10 Independencia del SO Es necesario tener la posibilidad de ejecutar el

mismo DBMS en diferentes SO

11 Independencia del DBMS Todos los DBMS en sitios distintos deben soportar la

misma interface

Page 12: UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS

12

Bases de Datos Distribuidas

12 Denominación de elementos– Como asegurar nombre únicos entre

localidades

• Asignador de nombres central

• Cada localidad agrega como prefijo su nombre

Page 13: UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS

13

Bases de Datos Distribuidas13 Procesamiento de consultas

– Aspectos • Costos de transmisión de datos por la red• Ganancia potencial ante la posibilidad de utilizar

paralelismo en la consulta• Existen diversas posibilidades para el desarrollo de las

consultas en BDD, el desarrollo de las mismas depende de la ubicación de los datos y del tipo de consulta.

Page 14: UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS

14

Bases de Datos Distribuidas

14 Transacciones distribuidas– El coordinador actúa como centro durante la vida de la

transacción.– Deben preservar ACID

• Autonomía• Consistencia• Isolation (aislamiento)• Durabilidad

– Se complica con transacciones globales, el fallo puede estar en varios lugares

– Cuando una transacción se genera y se determina que es global se subdivide y cada copia es gestionada en cada localidad. ESTO PRESERVA LA AUTONOMÍA

Page 15: UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS

15

Bases de Datos Distribuidas15 Arquitectura del sistema

– Gestor de transacciones: encargado local de la transacción.• El gestor de transacciones preserva la

autonomía de cada localidad, (una transacción es gestionada en cada localidad por el gestor de la misma).

– Coordinador de transacciones: coordina la ejecución de la transacción generada localmente.Actua como centro durante la vida de la transacción.

Page 16: UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS

16

2.2. Diccionario de Datos

El diccionario de datos es un conjunto de tablas de solo lectura y vistas que registra, verifican y proveen información.

El diccionario de datos describe la base de datos y sus objetos.

Page 17: UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS

17

Bases de Datos Distribuidas

Un diccionario de datos es un conjunto de metadatos que contiene las características lógicas de los datos que se van a utilizar en el sistema que se programa, incluyendo nombre, descripción, alias, contenido y organización.

Page 18: UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS

18

Bases de Datos Distribuidas

Estos diccionarios se desarrollan durante el análisis de flujo de datos y ayuda a los analistas que participan en la determinación de los requerimientos del sistema, su contenido también se emplea durante el diseño del proyecto.

Page 19: UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS

19

Bases de Datos Distribuidas Los elementos más importantes son flujos de datos, almacenes de datos y procesos. El diccionario de datos guarda los detalles y descripción de todos estos elementos.

Page 20: UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS

20

Bases de Datos Distribuidas

Ejemplo:

Nombre = Título + Primer_nombre + Apellido_paterno + Apellido_materno

Título = [ Sr | Sra | Dr | Ing]Primer_nombre = {carácter}Apellido_paterno = {carácter} Apellido_materno = {carácter}

Carácter = [A-Z|a-z| |’] a

Page 21: UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS

21

Bases de Datos DistribuidasRazones para su utilización:

1. Para manejar los detalles en sistemas muy grandes, ya que tienen enormes cantidades de datos, aun en los sistemas más chicos hay gran cantidad de datos. Los sistemas al sufrir cambios continuos, es muy difícil manejar todos los detalles.

Page 22: UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS

22

Bases de Datos Distribuidas

2. Para asignarle un solo significado a cada uno de los elementos y actividades del sistema.

Page 23: UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS

23

Bases de Datos Distribuidas

3. Para documentar las características del sistema, incluyendo partes o componentes así como los aspectos que los distinguen.

También es necesario saber bajo que circunstancias se lleva a cabo cada proceso y con que frecuencia ocurren.

Page 24: UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS

24

Bases de Datos Distribuidas

4. Para facilitar el análisis de los detalles con la finalidad de evaluar las características y determinar donde efectuar cambios en el sistema.

5. Determina si son necesarias nuevas características o si están en orden los cambios de cualquier tipo. Se abordan las características:

Page 25: UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS

25

Bases de Datos Distribuidas

5. Localizar errores y omisiones en el sistema, detectan dificultades, y las presentan en uniforme. Aun en los manuales, se revelan errores.

Page 26: UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS

26

Conclusión

El diccionario de datos, se aplica para la examinación de los diagramas de flujos de datos y a su vez registra detalles adicionales dentro del flujo de un sistema.