9
CUESTIONARIO LOTZY 1.- Calcule la capacidad del siguiente disco: 10 pistas, 64 sectores, 614 cilindros 512*64=32768 eso 32768*10=327680 eso 327680*614 201,195,520 bytes 2.- Indica el número de registros lógicos que contiene un bloque. Factor de bloque 3.- Es el tipo requerido para mover el brazo de acceso hasta el cilindro correcto de una unidad de disco: Tiempo de desplazamiento 4.- Cuando un archivo es sometido a inserciones y eliminaciones frecuentes y se usa en un ambiente de tiempo real es: Volátil 5.- Es la búsqueda que localiza una llave en una lista ordenada seleccionada repetidamente el elemento medio de la lista, dividiéndolo a la mitad y formando una lista nueva y más pequeña: Búsqueda binaria 6.- Si tenemos un archivo de clientes y elegimos el campo (ZONA) como llave, que tipo de llave será: Secundaria 7.- Menciona el tipo de fragmentación que genera con la estrategia del mejor ajuste. Externa 8.- Forma estándar para una llave que puede derivarse con la aplicación de reglas bien definidas. Forma canónica 9.- Unidad de información lógicamente significativa más pequeña en un archivo. Campo 10.- Cuando un índice simple es demasiado grande para almacenarse en memoria debe considerarse el uso de: Acceso directo 11.- Expresión derivada de uno o más campos: Llave 12.- Archivo secuencial que contiene una secuencia de caracteres ASCII: Archivo de texto 13.- Es un conjunto de campos almacenados, relacionados entre sí, que cuentan con su propio nombre. Registro 14.- Ocurre cuando se crean espacios sin utilizar entre registros, normalmente debido a eliminaciones. Fragmentación interna 15.- Estrategia de colocación que acomoda la lista en orden ascendente, entonces la entrada más pequeña esta al principio. Mejor ajuste

Glosario Archivos

Embed Size (px)

Citation preview

Page 1: Glosario Archivos

CUESTIONARIO LOTZY 1.- Calcule la capacidad del siguiente disco: 10 pistas, 64 sectores, 614 cilindros 512*64=32768 eso 32768*10=327680 eso 327680*614 201,195,520 bytes 2.- Indica el número de registros lógicos que contiene un bloque. Factor de bloque 3.- Es el tipo requerido para mover el brazo de acceso hasta el cilindro correcto de una unidad de disco: Tiempo de desplazamiento 4.- Cuando un archivo es sometido a inserciones y eliminaciones frecuentes y se usa en un ambiente de tiempo real es: Volátil 5.- Es la búsqueda que localiza una llave en una lista ordenada seleccionada repetidamente el elemento medio de la lista, dividiéndolo a la mitad y formando una lista nueva y más pequeña: Búsqueda binaria 6.- Si tenemos un archivo de clientes y elegimos el campo (ZONA) como llave, que tipo de llave será: Secundaria 7.- Menciona el tipo de fragmentación que genera con la estrategia del mejor ajuste. Externa 8.- Forma estándar para una llave que puede derivarse con la aplicación de reglas bien definidas. Forma canónica 9.- Unidad de información lógicamente significativa más pequeña en un archivo. Campo 10.- Cuando un índice simple es demasiado grande para almacenarse en memoria debe considerarse el uso de: Acceso directo 11.- Expresión derivada de uno o más campos: Llave 12.- Archivo secuencial que contiene una secuencia de caracteres ASCII: Archivo de texto 13.- Es un conjunto de campos almacenados, relacionados entre sí, que cuentan con su propio nombre. Registro 14.- Ocurre cuando se crean espacios sin utilizar entre registros, normalmente debido a eliminaciones. Fragmentación interna 15.- Estrategia de colocación que acomoda la lista en orden ascendente, entonces la entrada más pequeña esta al principio. Mejor ajuste

Page 2: Glosario Archivos

GLOSARIO FOLK Capítulo 1 – Introducción: Archivos y Estructuras de Archivos Archivo. Colección de bytes que representan información y que normalmente se guardan en almacenamiento secundario. Estructuras de archivos. Organización impuesta a un archivo para facilitar su procesamiento. RAM. Memoria de acceso aleatorio también llamada memoria primaria. Capítulo 2 – Operaciones fundamentales para el procesamiento de archivos Archivo físico. Archivo que en realidad existe en el almacenamiento secundario. Es el archivo tal como lo conoce el sistema operativo y que aparece en su directorio de archivos. Archivo lógico. Es el archivo, visto por el programa. El uso de archivos lógicos permite a un programa describir las operaciones que van a efectuarse en un archivo sin saber cuál archivo físico real se usará. El programa puede entonces usarse para procesar cualquiera de diversos archivos que comparten la misma estructura. CLOSE(). Función o llamada al sistema que rompe el enlace entre el nombre lógico de archivo y el nombre del archivo físico correspondiente. CREATE(). Función o llamada al sistema para crear un archivo en almacenamiento secundario, que también puede unir un nombre lógico al nombre físico del archivo. Es utilizada por el sistema para administrar el archivo, tal como la fecha de creación, la localización física y los privilegios de acceso a los usuarios previstos del archivo. Distancia en bytes. Distancia, medida en bytes, a partir del principio del archivo. El primer byte del archivo tiene una distancia de 0, el segundo byte tiene un desplazamiento de 1, y así sucesivamente. Manejo de buffers. Cuando la entrada y la salida se guardan, en lugar de enviarse de inmediato a su destino, se dice que se hace un manejo de buffers. Modo de acceso. Tipo de acceso permitido al archivo. Varia de un SO a otro. OPEN(). Función o llamada al sistema para lograr que un archivo esté listo para usarse. También puede enlazar un nombre lógico de archivo con un nombre físico. Sus argumentos incluyen el nombre del archivo lógico y físico e información de cómo realizar el acceso al archivo. READ(). Función o llamada al sistema que se usa para obtener datos de un archivo o dispositivo. Requiere tres argumentos: nombre lógico de archivo_fuente abierto, dirección de destino de los bytes que se leerán y el tamaño o cantidad de datos que se van a leer. SEEK(). Función o llamada al sistema que coloca el apuntador de lectura y escritura en una posición específica en el archivo. En lugar de leer todo el archivo desde el principio (en forma secuencial) cada vez que se desea un elemento específico. WRITE(). Función o llamada al sistema usada para proporcionar capacidades de salida.

Page 3: Glosario Archivos

Capítulo 3 – Dispositivos de Almacenamiento Secundario y Software de Sistemas: Consideraciones de desempeño. Acceso directo a memoria (DMA). Transferencia directa de datos entre memoria RAM y dispositivos periféricos, sin intervención significativa de la CPU. Administrador de archivos. Parte del SO que incluye un conjunto de programas cuyas responsabilidades van desde seguirle la pista a los archivos hasta llamar a los procesos de E/S que transmiten la información entre los almacenamientos primario y secundario. Almacenamiento caché para disco. Segmento de memoria RAM configurado para contener páginas de datos de un disco. Bloque. Unidad de organización de datos que corresponde a la cantidad de datos transferidos en un solo acceso. También es el conjunto de registros o sectores cuyo tamaño no tiene correspondencia con la organización de los datos. Algunas veces, a un bloque se le llama registro físico. Otras veces, a un sector se le llama bloque. Bpi. Bits por pulgada en una pista. En un disco, los datos se graban en forma serial en pistas. Cilindro. Conjunto de pistas en un disco que se encuentran directamente una sobre la otra. Se puede acceder a todas las pistas de un cilindro sin tener que mover el brazo de acceso, lo que significa que se puede tener acceso a ellas sin gasto de tiempo de desplazamiento. Controlador. Dispositivo que controla directamente la operación de uno o más dispositivos de almacenamiento secundario, como unidades de disco y de cinta magnética. Cúmulo. Unidad mínima de asignación de espacio en un disco organizado por sectores, que consiste en uno o más sectores contiguos. Dar formato. Es el proceso de reparar un disco para el almacenamiento de datos, que implica funciones como definir sectores, preparar la tabla de asignación de archivos del disco FAT y determinar daños en el medio magnético. Disco en memoria RAM. Bloque de memoria RAM configurado para simular el comportamiento de un disco. Disco fijo. Unidad de disco con platos que no pueden removerse. Dispositivo de acceso secuencial. Dispositivo, unidad de cinta magnética o lectora de tarjetas, en donde se debe tener acceso al medio (ej. La cinta) desde su inicio. Algunas veces se le llama dispositivo serial. Dispositivo de almacenamiento de acceso directo (DAAD). Disco, u otro dispositivo de almacenamiento secundario, que permite el acceso a un sector o bloque de datos específico sin requerir primero la lectura de los bloques que le preceden. Extensión. Uno o más cúmulos adyacentes asignados como parte (o total de un archivo). Factor de Bloque. Número de registros almacenados en un bloque. Fragmentación. Espacio que se vuelve inútil dentro de un cúmulo, bloque, pista u otra unidad de almacenamiento físico. Paquete de discos. Empalme de discos magnéticos montados en el mismo eje.

Page 4: Glosario Archivos

Paridad. Técnica de revisión de errores en la que un bit adicional de paridad acompaña a cada byte, y se activa de tal forma que el número total de bits en 1 sea par (paridad par) o impar (paridad impar). Pista. Conjunto de bytes en la superficie de un disco al cual puede accederse sin mover el brazo de acceso. Plato. Disco de la pila en una unidad de disco. Procesador de E/S. Dispositivo interno de la CPU que lleva a cabo tareas de E/S. Sector. Bloques de datos de tamaño fijo que componen en conjunto las pistas, en ciertas unidades de disco. Sistema de almacenamiento masivo. Unidad de almacenamiento secundario de gran capacidad. Sub-bloque de conteo. En unidades de disco organizadas por bloques, es un pequeño bloque que precede a cada bloque de datos y contiene información acerca de él como su tamaño en bytes y su dirección. Sub-bloque de llave. Es un bloque que contiene la llave del último registro en el bloque de datos que le sigue. Tabla de asignación de archivos FAT. Tabla que contiene un esquema de las posiciones físicas de todos los cúmulos de todos los archivos que contiene el almacenamiento en disco. Tiempo de desplazamiento. Tiempo requerido para mover el brazo de acceso al cilindro correcto en una unidad de disco. Tiempo de transferencia. Es la suma del tiempo requerido por la cabeza de lectura y escritura mientras los datos van pasando debajo de ésta. Capítulo 4 – Conceptos Fundamentales de Estructuras de Archivos Acceso directo. Modo de acceder a un archivo que implica saltar al lugar preciso de un registro. El acceso directo a un registro de longitud fija por lo regular se lleva a cabo mediante su número relativo de registro NRR, después calculando su distancia en bytes y, por último, colocándose en el primer byte del registro. Acceso secuencial. Es cuando se lee el archivo desde el principio y se continua hasta que se haya leído todo lo que se necesita. Bloque. Conjunto de registros almacenados como una unidad físicamente contigua en el almacenamiento secundario. Búsqueda secuencial. Método de búsqueda en un archivo, que implica leer el archivo desde el principio y continuar haciéndolo hasta que se haya encontrado el registro deseado. Campo. Unidad más pequeña lógicamente significativa de un archivo. Campo de conteo de bytes. Campo al inicio de un registro de longitud variable que indica el número de bytes usados para almacenar el registro. Delimitador. Uno o más caracteres usados para separar campos y registros en un archivo. Forma canónica. Forma estándar para una llave que puede derivarse, con la aplicación de reglas bien definidas, a partir de la forma no estándar particular de los datos encontrados

Page 5: Glosario Archivos

en un campo de llave del registro, o que puede ser proporcionada en una solicitud de búsqueda por parte del usuario. Llave. Expresión derivada de uno o más campos dentro de un registro, que puede usarse para ubicar e identificar a ese registro. Llave primaria. Llave que identifica unívocamente cada registro y que se usa como el método primario de acceso a los registros. Método de acceso a un archivo. El enfoque proporcionado para localizar información en un archivo. (Secuencial y directo). Métodos de organización de archivos. Es la combinación de estructuras conceptuales y físicas empleadas para distinguir un registro de otro. Por, ej. Un tipo de organización de archivos son los registros de longitud fija, que contienen varios campos delimitados de longitud variable. Número relativo de registro (NRR). Índice que da la posición de un registro en relación con el inicio de su archivo. Si un archivo tiene registros de longitud fija, el NRR puede usarse para calcular la distancia en bytes a un registro de tal forma que se pueda acceder directamente a él. Registro. Conjunto de campos relacionados. Por ejemplo, el nombre, la dirección, y demás datos de una persona. Registro de encabezado. Registro colocado al inicio de un archivo, que se usa para guardar información acerca de su contenido y organización. Registros de longitud fija. Organización de archivos en la que todos los registros tienen la misma longitud. Los registros se completan con espacios, nulos u otros caracteres, de tal forma que se extiendan a la longitud fijada. Puesto que todos los registros tienen la misma longitud, es posible calcular la posición de inicio de cada registro, haciendo posible el acceso directo. Registros de longitud variable. Organización de archivos en donde los registros no tienen una longitud predeterminada; son tan largos como sea necesario y, por tanto, permiten un mejor uso del espacio que los registros de longitud fija. Desafortunadamente no es posible calcular la distancia en bytes a un registro de longitud variable únicamente con su número relativo de registro. Capítulo 5 – Mantenimiento de Archivos y Eliminación de Registros Compactación. Forma de liberarse por completo de la fragmentación externa, recorriendo todos los registros para juntarlos de modo que no existan segmentos desperdiciados entre ellos. Estrategia de colocación. Mecanismo de selección del espacio en la lista de disponibles, a fin de usarlo para almacenar un nuevo registro que se agregue al archivo. Fragmentación externa. Tipo de fragmentación que ocurre en un archivo cuando el espacio que no se usa está fuera del archivo o entre registros individuales. Fragmentación interna. Ocurre cuando se desperdicia el espacio en un archivo porque está encerrado, sin utilizar, dentro de los registros. Es común en estructuras de registros de longitud fija.

Page 6: Glosario Archivos

Lista de disponibles. Lista de los espacios liberados al eliminar registros, los cuales quedan disponibles para almacenar registros nuevos. Mejor ajuste. Estrategia de colocación para seleccionar el espacio de las lista de disponibles y almacenar un registro nuevo. Encuentra la entrada disponible cuyo tamaño se aproxime más al que se necesita para almacenar el nuevo registro. Peor ajuste. Tipo de estrategia de colocación para seleccionar un espacio de la lista de disponibles y almacenar un registro nuevo. La colocación de mejor ajuste encuentra la entrada disponible cuyo tamaño se aproxime más al que se necesita para almacenar el nuevo registro. Pila. Tipo de lista donde todas las inserciones y eliminaciones tienen lugar en el mismo extremo. Primer ajuste. Estrategia de colocación para la selección de un espacio de la lista de disponibles. Selecciona la primera entrada disponible que se lo suficientemente grande para almacenar el nuevo registro. Unión de huecos. Si dos registros eliminados dejan espacios disponibles que son físicamente adyacentes, pueden juntarse para formar un solo espacio mayor. Esta es una manera de contrarrestar el problema de la fragmentación externa. Capítulo 6 – Localización Rápida de Datos en un Archivo: Introducción a la Clasificación y a la Búsqueda Binaria Búsqueda binaria. Éste algoritmo localiza una lave en una lista ordenada seleccionando repetidamente el elemento medio de la lista dividiéndola a la mitad, y formando una lista nueva y más pequeña a partir de la mitad que contiene la llave. Este proceso continua hasta que el elemento seleccionado sea la llave que se buscaba. Clasificación por llave. Método de clasificación de un archivo que no requiere almacenarlo por completo en la memoria. Sólo las llaves se mantienen en memoria, junto con apuntadores que las asocian con los registros del archivo que tiene los registros ya ordenados. La ventaja principal de la clasificación por llave es que requiere menos memoria que la clasificación en memoria RAM. La desventaja es que el proceso de construcción de un archivo nuevo requiere bastantes desplazamientos. Clasificación Shell. Algoritmo interno de clasificación relativamente rápido, que clasifica una lista ordenando primero elementos muy separados para después, mediante recorridos sucesivos por la lista, ordenar elementos separados por intervalos cada vez más pequeños. Indirección. Término que describe el proceso de referir información de manera indirecta, mediante el uso de una serie de apuntadores u otros tipos de localizadores. Registro fijo. Se dice que un registro está fijo cuando existen otros registros o estructuras de archivos referidas a él mediante su posición física. Está fijo en el sentido de que no se tiene la libertad de alterar la posición física del registro, ya que al hacerlo se destruiría la validez de las referencias físicas al registro. Estas referencias se convierten en apuntadores suspendidos inútiles.

Page 7: Glosario Archivos

Capítulo 7 – Indización Archivo de entradas secuenciales. Archivo en el que los registros curren en el orden en que se introdujeron. Campo de referencia. Es la porción de un registro de índice que contiene información acerca de dónde encontrar el registro de datos que contiene la información listada en el campo de llave asociado del índice. Campo llave. Es la porción de un registro de índice que contiene la forma canónica de la llave que se busca. Enlace. Se realiza cuando una llave se asocia con un determinado registro físico del archivo de datos; en general puede tener lugar ya sea durante la preparación del archivo de datos e índices o durante la ejecución del programa. Índice. Herramienta para encontrar registros en un archivo. Consiste en un campo de llave mediante el cual se busca el índice, y un campo de referencia que indica dónde encontrar el registro del archivo de datos asociado con una llave en particular. Índice selectivo. Contiene llaves solo para una porción de los registros del archivo de datos. Dicho índice permite al usuario ver un subconjunto específico de los registros del archivo. Lista invertida. Se refiere a los índices en donde una llave puede asociarse con una lista de campos de referencia que apuntan a objetos que contienen la llave. Localidad. Existe en un archivo cuando los registros a los cuales se accederá en una secuencia temporal dada, se encuentran en proximidad física uno con otro en el disco. Incrementar la localidad por lo regular mejor la eficiencia, ya que los registros que están en la misma área física con frecuencia pueden llevare a la memoria con una solicitud read al disco. Capítulo 8 – Procesamiento Secuencial Coordinado y Clasificación de Archivos Grandes Árbol de selección. Arbol binario donde cada nodo de nivel superior representa al ganador en la comparación entre las dos llaves descendientes. Correspondencia. Proceso de formar un archivo de salida clasificado compuesto por todos los elementos comunes en dos o más archivos de entrada clasificados. Intercalación. Proceso de formar un archivo de salida clasificado compuesto por una unión de los elementos de dos o más archivos de entrada clasificados. Intercalación balanceada. Técnica de intercalación de varios pasos que usa el mismo número de dispositivos de entrada que de salida. Es adecuada para la clasificación por intercalación de cintas, aunque no es el mejor método. Porción. Subconjunto clasificado de un archivo, que resulta de un paso de clasificación. Selección por reemplazo. Método de creación de porciones iniciales basado en la idea de seleccionar siempre de la memoria el registro cuya llave tenga el valor más bajo, enviándolo a la salida y después reemplazándolo en memoria con un nuevo registro de la lista ordenada.

Page 8: Glosario Archivos

Capítulo 9 – Arboles B y otras Organizaciones de Archivos Estructuradas en Forma de Árbol Árboles AVL. Árbol binario balanceado en el que las inserciones y eliminaciones pueden efectuarse con un mínimo de accesos a nodos locales. Evitan que las ramas sean demasiado largas luego de muchas inserciones aleatorias. Árboles B*. Árbol B especial en el que cada nodo está lleno por lo menos en 2/3 partes. Por lo general proporcionan mejor utilización de almacenamiento que los árboles B. Árboles B virtuales. Es el índice de un árbol donde se guardan varias páginas en memoria RAM anticipando la posibilidad de un acceso posterior a una o más de ellas. Concatenación. Es la combinación de un nodo con otro nodo adyacente. Ocurre cuando un nodo del árbol B tiene insuficiencia (está lleno a menos del 50%). División. Creación de dos nodos a partir de uno, debido a que el nodo original se saturo. Está acción crea la necesidad de promover una llave a un nodo de nivel superior para tener un índice que separe los dos nodos nuevos. Hoja de un árbol B. Página en el nivel más bajo en un árbol B. Todas están en el mismo nivel. Índice paginado. Índice dividido en bloques, o páginas, cada una de las cuales almacena muchas llaves. Permite almacenar muchas llaves con solo unos cuantos accesos a disco. Orden de un árbol B. Número máximo de descendientes que puede tener un nodo en el árbol. Promoción de una llave. Traslado de una llave de un nodo a otro de nivel más alto (creándose el nodo de nivel más alto si es necesario), cuando el nodo original se satura y debe eliminarse. Redistribución. Ocurre cuando un nodo del árbol B cae en insuficiencia (lleno al 50%) y se le trasladan llaves desde un nodo adyacente con el mismo padre. Capítulo 10 – La Familia de los Árboles B+ y el Acceso a los Archivos Secuenciales Indizados. Conjunto Índice. Consiste en separadores que proporcionan información acerca de los límites entre bloques en el conjunto de secuencias de un árbol B+. Separador. Se derivan de las llaves de los registros en cualquiera de los lados que limitan un bloque en el conjunto de secuencias. Separador más cortó. Consiste en aquellos que ocupan el espacio mínimo para una estrategia de compresión que consiste en eliminar tantas letras como sea posible del final de los separadores, formando el prefijo simple más corto que pueda seguir sirviendo como separador. Capítulo 11 – Dispersión (Hashing) Aleatorización. Producir un número que parezca ser aleatorio. Colisión. Situación en la que un registro es asignado a una dirección que no tiene suficiente lugar para almacenarlo.

Page 9: Glosario Archivos

Compartimiento. Área de espacio en el archivo que se trata como un registro físico para propósitos de almacenamiento y extracción, pero que puede almacenar varios registros lógicos. Mejora considerablemente los tiempos de acceso. Densidad de empaquetamiento. Proporción de espacio del archivo asignado que en realidad almacena registros. (Se conoce también como factor de carga). Si un archivo está medio lleno, su densidad de empaquetamiento es de 50%. Ayuda probabilísticamente a determinar si ocurrirá una colisión o no. Desglosar y sumar. Método de dispersión en el que codificaciones de las partes de tamaño fijo de una llave se extraen y se suman. La suma resultante puede usarse para producir una dirección. Dispersión. Técnica para generar una dirección base única para una llave dada. La dispersión se usa cuando se requiere acceso rápido a una llave. Saturación (desbordamiento). Situación que ocurre cuando un registro no puede almacenarse en su dirección base. Sinónimos. Dos o más llaves diferentes que se asignan a la misma dirección base. Cuando cada dirección del archivo puede almacenar un solo registro, los sinónimos siempre ocasionan colisiones.