35
UNIDAD I. PRINCIPIOS FUNDAMENTALES SOBRE ARCHIVOS DE DATOS CONTENIDO 1. Conceptos básicos: Campo, Registro, Archivo, Longitud y tipo de Dato de los Campos, Longitud de un Registro, Longitud de un Archivo, Organización de Archivos, Mantenimiento y Procesamiento de Archivo 2. Archivos según su acceso (secuencial e indexado) y según su contenido (Maestro, Transacciones, Tabla, Histórico, Respaldo y Reporte) 3. Conceptos de: Base de datos y Banco de Datos http://www.rena.edu.ve/cuartaEtapa/Informatica/Tema9.html 1

Principios Fundamentales Sobre Archivos de Datos

  • Upload
    ralcala

  • View
    269

  • Download
    3

Embed Size (px)

Citation preview

Page 1: Principios Fundamentales Sobre Archivos de Datos

UNIDAD I. PRINCIPIOS FUNDAMENTALES SOBRE ARCHIVOS DE DATOS

CONTENIDO

1. Conceptos básicos: Campo, Registro, Archivo, Longitud y tipo de Dato de los Campos, Longitud de un Registro, Longitud de un Archivo, Organización de Archivos, Mantenimiento y Procesamiento de Archivo

2. Archivos según su acceso (secuencial e indexado) y según su contenido (Maestro, Transacciones, Tabla, Histórico, Respaldo y Reporte)

3. Conceptos de: Base de datos y Banco de Datos

http://www.rena.edu.ve/cuartaEtapa/Informatica/Tema9.html

1

Page 2: Principios Fundamentales Sobre Archivos de Datos

CONTENIDO

INTRODUCCIÓN. 3

1. ARCHIVOS DE DATOS. 4

1.1. Conceptos Básicos. 4

1.2. Características de los archivos de datos. 7

1.3 Operaciones sobre Archivos de Datos. 81.3.1. Crear un archivo. 81.3.2. Abrir un archivo. 91.3.3. Ampliación de un archivo. 91.3.4. Cerrar archivos. 101.3.5. Borrar archivos. 101.3.6. Mantenimiento de archivos. 10

2. ESTRUCTURA DE LOS REGISTROS QUE CONFORMAN EL ARCHIVO DE DATOS. 13

3. TIPOS DE ARCHIVOS DE DATOS. 13

Archivos Convencionales. 13

Bases de Datos. 14

4. Organización de archivos. 15

4.1. Organización secuencial. 15

4.2. Organización directa o aleatoria. 16

4.3. Modos de acceso. 17

4.4. Procesamiento de Archivos Secuenciales. 18

4.5. Procesamiento de Archivos Aleatorios. 19

2

Page 3: Principios Fundamentales Sobre Archivos de Datos

INTRODUCCIÓN.

En la actualidad, para poder cumplir con sus objetivos, cualquier empresa u organización necesita almacenar y manejar grandes cantidades de datos. Por ejemplo, se necesitan los datos de los empleados, de los clientes, de los proveedores, de los productos almacenados, etc.

Años atrás, la gestión de estos datos se realizaba manualmente. Se organizaban en forma de fichas, informes o expedientes, colocándolos en carpetas y almacenando éstas en un archivador. Por ejemplo, un archivo de clientes en el que cada ficha contiene todos los datos correspondientes a un cliente ó un archivo de alumnos donde en cada ficha tendremos todos los datos de cada alumno.

La utilización de las computadoras en la administración de las empresas ha cambiado el concepto de almacenamiento y gestión de sus datos, dando lugar al uso de los denominados archivos informáticos y bases de datos. En consecuencia, el almacenamiento y recuperación de datos es importante en el diseño y operación de los sistemas de información. Una organización debe, por lo tanto, determinar que datos estarán en los archivos y bases de datos. Los datos elementales no son almacenados de una manera aleatoria o arbitraria; ellos se organizan y almacenan para una recuperación eficiente. La organización del almacenamiento debe también tener en cuenta las características del medio de almacenamiento y de los dispositivos que se usan para tal efecto.

La creación y mantenimiento de datos ordenados es una parte importante de la carga de trabajo de un sistema de procesamiento de información. En el procesamiento de datos tradicional anterior al período de la tecnología de las bases de datos, el énfasis se ponía en los archivos y en las relaciones entre archivos.

En el contexto informático, un archivo es cualquier información permanente que se almacena de cualquier forma en algún dispositivo de almacenamiento secundario, que es tratado como una unidad por el sistema operativo. Normalmente a cada archivo se le asocia un nombre y una extensión (depende del sistema operativo. Los nombres de archivo DOS pueden tener de 1 a 8 caracteres para el nombre y 0 a 3 para la extensión) que lo identifica y diferencia del resto. 

nombre.ext

La mayoría de los programas tienen una extensión de norma (por defecto) las que serán asignadas a los archivos que guardan, a menos que específicamente se desee escribir algo diferente. Otros datos importantes asociados al archivo son su fecha y hora de creación y actualización, el tamaño, permisos de acceso, etc.De forma muy general, los archivos pueden clasificarse en dos grandes grupos: archivos de programas y archivo de datos.Nuestro interés en este tema son los archivos de datos o conjunto de información en memoria secundaria relativas a un mismo tema.Nota:

Caracteres ilegales en un nombre de archivo son: . , / \ : ; [ ] " | = Son extensiones ilegales  CON, AUC, COM1, COM2, COM3, COM4,

LPT1, LPT2, LPT3, PRN, o NUL

3

Page 4: Principios Fundamentales Sobre Archivos de Datos

1. ARCHIVOS DE DATOS.

1.1. Conceptos Básicos.

La jerarquía en la organización de datos.

Cada sistema de información cuenta con una jerarquía en la organización de datos en la que cada nivel subsiguiente es resultado de la combinación de los elementos del nivel anterior. Así, la información se combina en forma lógica hasta que se obtenga una base de datos. Los bits (el primer nivel) se manejan de manera automática, sin que exista ninguna acción por parte del programador ni del usuario final. Los otros cinco niveles son consideraciones de diseño importantes para cualquier procesamiento de información.

Los bits se configuran para representar

Caracteres (bytes) que se combinan para formar

Campos que se agrupan de manera lógica para formar

Registros que contienen los elementos relacionados con la información y se expresan en

Archivos que se reorganizan y se integran de manera lógica para obtener una

Base de datos

Bits y caracteres.

4

0,1

11000001 = A

María Pérez

María Pérez, Vereda 21, Maturín, etc.

María Pérez, José García, …, Luis Marín, etc.

Archivo maestro de empleados; archivo maestro de inventarios, Archivo maestro de clientes; archivo maestro de proveedores, etc.

Page 5: Principios Fundamentales Sobre Archivos de Datos

Un carácter está representado por un grupo de bits, que se configuran de acuerdo con un sistema de codificación, como el ASCII. En tanto que el bit es la unidad básica de almacenamiento primario y secundario, el carácter es la unidad básica para la percepción humana. En términos de almacenamiento de datos, por lo general, un carácter es lo mismo que un byte.

Campo.

Es una agrupación de caracteres que representa una característica del objeto o entidad cuya información se almacena. Por ejemplo, el campo nombre de un empleado. En un campo se deben establecer tres características:

Nombre del campo: permite rotular el mismo.Tipo de campo: permite establecer qué tipo de dato contiene el campo (alfabéticos, numéricos, alfanuméricos, binarios, lógicos, etc.)Tamaño del campo: cantidad de caracteres que pueden almacenarse.

Campo clave.

Es un campo de datos cuyo valor sirve para identificar de forma única el registro y lo diferencia de otros; por tanto, dicho valor no puede aparecer repetido en otro registro diferente. Puede suceder que un archivo no tenga campo clave en sus registros o, por el contrario, que tenga varios, denominándose a la principal clave primaria y a las demás secundarias. Una clave simple está formada por el valor de un solo campo, ejemplo, nro. empleado y una clave compuesta, por el valor de más de un campo, por ejemplo, código de localidad y nro. empleado.Si un archivo contiene la información de un conjunto de individuos u objetos, sus registros contienen la información de cada uno de ellos y los campos los diferentes datos que la componen. Por ejemplo, en el archivo de personal de una empresa cada registro contiene la información de un empleado y los campos contienen su número de DNI, nombre, dirección, fecha de ingreso, etc. La calle en que vive será un subcampo y el campo clave puede ser el número de DNI.

Registro.

Es un conjunto de campos interrelacionados, que pueden ser de diferentes tipos y que a su vez pueden estar compuestos por subcampos. Por ejemplo, el registro nómina de un empleado podría estar compuesto del campo nombre, el campo cédula de identidad, el campo departamento y el campo sueldo.Cuando el número y tamaño de los datos en un registro son constantes para cada registro, a éstos se le denomina de longitud fija, sin embargo los registros de este tipo no siempre hacen uso eficiente del espacio asignado. Por ejemplo; el campo fecha es un campo de

5

Page 6: Principios Fundamentales Sobre Archivos de Datos

longitud fija el cual hace uso adecuado del espacio asignado, ya que siempre ocupara los ocho caracteres especificados; dos para el día, dos para el mes y cuatro para el año. Sin embargo, los campos Nombres y Apellidos teniendo longitud fija, puede perder espacio valioso ya que no siempre el nombre y apellido del alumno pueden estar especificados por una cadena de cincuenta (50) caracteres.Los registros de longitud variable son menos comunes en la mayoría de las aplicaciones de las empresas que los diseños de longitud fija, debido a que estos últimos son más fáciles de manejar y cubren las necesidades de la mayoría de las aplicaciones.

1.4.1.- Organización lógica de archivos. (http://boards4.melodysoft.com/2005AAV0102/-organizacion-de-archivos-15.html)

Los registros pueden ser de longitud fija o variable.Los archivos de registros de longitud fija: son elementos del mismo tamaño y almacenan la información en los archivos mediante un encabezado y luego se introducen uno a uno los registros ubicados en posiciones consecutivas. En el tamaño del campo produce un desperdicio de espacio pero facilita la dirección y extracción de la información del campo.

Los registros de longitud variable: almacenan registros de varios tipos en un archivo y permite uno o más campos de longitudes variables y dichos campos pueden ser repetidos. La longitud de los registros debe estar definida correctamente para poder leer y escribir de forma efectiva. Aquí hay un aprovechamiento del espacio pero se complica la localización y extracción de la información.Si el registro contiene un número fijo de campos y cada uno de ellos tiene longitud fíja, sera de longitud fija. Si el registro contiene un número fijo de campos en donde alguno de ellos sea de longitud variable, será de longitud variable.Si el registro contiene un número variable de campos y cada uno de ellos tiene longitud fija, será de longitud fija.Si el registro contiene un número variable de campos en que alguno de ellos sea de longitud variable, será de longitud variable.

Bloque (registro físico).

Un registro físico o bloque corresponde a la cantidad de información que se transfiere físicamente en cada operación de acceso (lectura o escritura) sobre el exterior. Ejemplos de registros físicos son: una tarjeta perforada, una línea de impresión, un sector de un disco magnético, etc.Conviene separar claramente los conceptos de registro lógico y registro físico, diferenciándose en que el tamaño y formato del registro lógico los define el programador mientras que el tamaño del registro físico viene dado por las características físicas de la computadora utilizada. En general, un bloque tendrá capacidad para contener uno o más registros, pero también puede ocurrir que un registro ocupe más de un bloque. En el primer caso se habla de registros bloqueados, denominándose factor de bloqueo al número de registros lógicos que contiene cada registro físico, y se denominan registros expandidos a aquellos que ocupan más de un bloque.Una lectura de un archivo con registros bloqueados transfiere a la memoria central varios registros a la vez, pero para leer un registro expandido será necesario realizar más de un acceso.

Archivos de Datos.

6

Page 7: Principios Fundamentales Sobre Archivos de Datos

Un archivo o fichero es un elemento de almacenamiento de información, que reside en memoria secundaria y está conformado por un conjunto de registros, todos del mismo tipo y en número indeterminado.

Desde el punto de vista lógico, los archivos de datos suelen dividirse en unidades lógicas llamadas registros, que a su vez se dividen en campos. Entonces, podemos decir que, por ejemplo, un archivo nómina podría estar compuesto de los registros nómina de todos los empleados de una empresa.

Base de datos.

Es la fuente de datos para cada sistema de información basado en la computadora. Podemos definir una base de datos como un conjunto integrado de datos interrelacionados, junto con una serie de aplicaciones para su manejo, accesibles simultáneamente por diferentes usuarios y programas. Por ejemplo, la base de datos personal de una empresa podría incluir archivos de nómina, de conductas de personal y de habilidades de los empleados.

Sus principales características son:Control centralizado de los datos.Integridad de los datosMinimización de las redundancias.Independencia de los datos y las aplicaciones.Acceso concurrente a los datos.Costo mínimo de almacenamiento y mantenimiento.Versatilidad para la representación de relaciones.Establecimiento de medidas de seguridad.Facilidad para el cambio (hardware y software).

Los programas que permiten gestionar las bases de datos se denominan SGBD ó Sistemas de Gestión de Base de Datos. Una característica fundamental de un SGBD es que puede trabajar con diferentes bases de datos, por ejemplo, Almacén, Biblioteca, Agenda, etc. Ejemplo: Oracle, Access, etc.

Entidad.

Una entidad es cualquier persona, lugar, cosa o evento de interés para la organización y acerca del cual se capturan, almacenan o procesan datos. En una universidad los alumnos y empleados son entidades propias del sistema.

7

Campo NombreJuan Pérez

Registro Nómina

Juan Pérez5.123.889Bs. 350.000,00 etc

Archivo Nómina

Base de datos del Personal

Page 8: Principios Fundamentales Sobre Archivos de Datos

8

Page 9: Principios Fundamentales Sobre Archivos de Datos

Procesamiento de Datos.

Existen dos maneras tradicionales para procesar datos. El procesamiento por lotes y el procesamiento en tiempo real.

Procesamiento por lotes: En este procesamiento, los datos se reúnen por un periodo de tiempo        (horas, días o hasta semanas) al final del cual, se procesan en una sola operación o lote.

Procesamiento en tiempo real: Este ocurre cuando los datos se procesan en el mismo momento  en que son generados.

Al principio, tan sólo se disponía de almacenamiento en cintas magnéticas que únicamente permiten almacenamiento secuencial. Esto obligaba a realizar todo el procesamiento por lotes. Con la aparición de los dispositivos de acceso directo (discos duros), fue posible el almacenamiento de acceso directo, que permite localizar velozmente el registro de interés. Esto posibilitó el procesamiento en tiempo real, que es muy apreciado en operaciones, como las de empresas comerciales. El procesamiento en tiempo real permite, por ejemplo, saber al instante cuántos productos han sido vendidos y con cuántos se cuenta en inventario, en tanto se van haciendo las ventas.

Aún cuando el procesamiento por lotes precedió al procesamiento en tiempo real, motivado a factores como la disponibilidad de la tecnología, no es correcto pensar en el procesamiento por lotes como algo caduco. Existen procesos que por su naturaleza deben hacerse por lotes, como por ejemplo el cálculo de la nómina de una compañía cada mes.

1.2. Características de los archivos de datos.

Las principales características que diferencian esta estructura de datos de las restantes son las siguientes:

- Residencia en soportes de información externos, también denominados memorias secundarias o auxiliares, como son las cintas y discos.

- Independencia respecto de los programas. Significa que la vida del archivo no está limitada por la vida del programa que lo creó, y también que el archivo puede ser utilizado por diferentes programas.

- Permanencia de la información almacenada. Es decir, toda la información almacenada en la memoria central desaparece cuando se termina la ejecución del programa que la maneja, pero para hacer desaparecer un archivo será necesario realizar explícitamente una operación de borrado.

- Gran capacidad de almacenamiento. Teóricamente esta capacidad es ilimitada, está en función del soporte de almacenamiento. Por el contrario, las estructuras de datos que residen en la memoria central tienen limitado su tamaño por la capacidad de ésta.

9

Page 10: Principios Fundamentales Sobre Archivos de Datos

1.3 Operaciones sobre Archivos de Datos.

Las operaciones generales que se realizan sobre un archivo son:

Crear archivos (crear) Abrir o arrancar (open) un archivo que fue creado con anterioridad a la ejecución de

este programa Incrementar o ampliar el tamaño del archivo (append, extend) Cerrar el archivo después que el programa ha terminado de utilizarlo (close) Borrar (delete) un archivo que ya existe Transferir datos desde (leer) o a (escribir) el dispositivo, diseñado por el programa

Con anterioridad a la creación de un archivo se requiere diseñar la estructura del mismo mediante los campos del registro, longitud y tipo de los mismos.Para poder gestionar un archivo mediante un programa es preciso declarar el archivo, su nombre y la estructura de sus registros. La declaración se realiza con las siguientes instrucciones:

archivo nombreregistro campo 1 = tipo campo 2 = tipo campo 3 = tipo

1.3.1. Crear un archivo.

Es la operación mediante la cual se introduce la información correspondiente al archivo en un soporte de almacenamiento de datos. La creación corresponde a la escritura de todos sus registros.

Para crear un nuevo archivo dentro de un sistema de computadora se necesitan los siguientes datos: nombre dispositivo/usuario: indica el lugar donde se situará el archivo cuando se cree; nombre del archivo: identifica el archivo entre los restantes archivos de una

computadora; tamaño del archivo: indica el espacio necesario para la creación del archivo; organización del archivo: tipo de organización del archivo; tamaño del bloque o registro físico: cantidad de datos que se leen o escriben en cada

operación de entrada/salida

El proceso de creación de un archivo se suele incluir como un subprograma dentro de un programa principal. Al ejecutar el programa de creación de un archivo se pueden generar una serie de errores entre los que se pueden destacar los siguientes:

Otro archivo con el mismo nombre ya existía en el soporte

10

DATOS CREACION de un archivo

en disco

MAESTRO (desordenado

Page 11: Principios Fundamentales Sobre Archivos de Datos

El dispositivo no tiene espacio disponible para crear otro nuevo archivo El dispositivo no está operacional Existe un problema de hardware que hace abortar el proceso Uno ó más de los parámetros de entrada en la instrucción son erróneos.

1.3.2. Abrir un archivo.

La acción de abrir (open) un archivo es permitir al usuario localizar y acceder a los archivos que fueron creados anteriormente.La diferencia esencial entre una instrucción de abrir un archivo y una instrucción de crear un archivo reside en que el archivo no existe antes de utilizar crear y se supone que debe existir antes de utilizar abrir.La información que un sistema de tratamiento de archivos requiere para abrir un archivo es diferente de las listas de información requerida para crear un archivo. La razón para ello reside en el hecho que toda la información que realmente describe el archivo se escribió en éste durante el proceso de creación del archivo. Por consiguiente, la operación abrir-archivo sólo necesita localizar y leer esta información conocida como atributos del archivo.La instrucción de abrir un archivo consiste en la creación de un canal que comunica a un usuario a través de un programa con el archivo correspondiente situado en un soporte.Los parámetros que se deben incluir en una instrucción de apertura (abrir) son:

Nombre del dispositivo; Nombre del usuario o canal de comunicación; Nombre del archivo.

Al ejecutar la instrucción abrir-archivo se pueden encontrar los siguientes errores:

Archivo no encontrado en el dispositivo especificado (nombre de archivo o identificador de dispositivo erróneo);

Archivo ya está en uso para alguna otra aplicación del usuario; Errores hardware

El formato de la instrucción es:

abrir nombrearchivo

La operación de abrir archivos se puede aplicar para operaciones de entrada, salida o bien entrada/salida;

abrir nombrearchivo para entrada

1.3.3. Ampliación de un archivo.

El propósito de la instrucción añadir-archivo (extend-file, append-file) es permitir al usuario incrementar el tamaño de un archivo.

La información que necesita el sistema de gestión de archivos para incrementar el tamaño de un archivo es:

Nombre del dispositivo y directorio donde está localizado el archivo

Nombre del archivo

11

Page 12: Principios Fundamentales Sobre Archivos de Datos

Tamaño en que se incrementará el archivo

Antes de poder realizar con éxito la operación de ampliación de un archivo se necesita comprobar previamente si existe espacio suficiente en el soporte para alojar el tamaño de la ampliación prevista.

Los errores más típicos que se pueden cometer en la operación de ampliación son:

El dispositivo no tiene espacio disponible para ampliar el archivo

El archivo no se abrió previamente

La mayoría de los lenguajes de programación no posee en su sintaxis la instrucción para ampliar un archivo. Sin embargo, se puede diseñar una rutina específica que realice dicha tarea.

1.3.4. Cerrar archivos.

El propósito de esta operación es permitir al usuario cortar el acceso o detener el uso del archivo, permitiendo a otros usuarios acceder al archivo. Para ejecutar esta función, el sistema de tratamiento de archivos sólo necesita conocer el nombre del archivo que se debe cerrar, y que previamente debe estar abierto. El formato de la instrucción es:

cerrar nombrearchivo

1.3.5. Borrar archivos.

La instrucción de borrar-archivos tiene como objetivo la supresión de un archivo del soporte o dispositivo. El espacio utilizado por un archivo borrado puede ser utilizado para otros archivos. La información necesaria para eliminar un archivo es:

Nombre del dispositivo y número de canal de comunicación;

Nombre del archivo

Los errores que se pueden producir son:

El archivo no se pudo encontrar bien porque el nombre no es válido o porque nunca existió

Otros usuarios estaban actuando sobre el archivo y estaba activo

Se detectó un problema de hardware

1.3.6. Mantenimiento de archivos.

Esta operación incluye todas las operaciones que sufre un archivo durante su vida y desde su creación hasta su eliminación o borrado. El mantenimiento de un archivo consta de dos operaciones diferentes:

Actualización

Consulta

La actualización es la operación de eliminar o modificar los datos ya existentes, o bien introducir nuevos datos. En esencia, es la puesta al día de los datos del archivo. Las operaciones de actualización son: altas, bajas y modificaciones.

12

Page 13: Principios Fundamentales Sobre Archivos de Datos

Las operaciones de consulta tienen como finalidad obtener información total o parcial de los datos almacenados y presentados en dispositivos de salida: pantalla o impresora, bien como resultados o como listados en un archivo

Todas las operaciones de mantenimiento de archivos suelen constituir módulos independientes del programa principal y su diseño se realiza con subrutinas o procedimientos específicos. Así las subrutinas de mantenimiento de un archivo constan de:

Altas.

13

Proceso de consulta

Proceso de actualización

Programa principal

Actualización Consulta

Altas Bajas Modificaciones

Page 14: Principios Fundamentales Sobre Archivos de Datos

Consiste en la adición de un nuevo registro. Para situar correctamente un alta, se deberá conocer la posición donde se desea almacenar el registro correspondiente: al principio, en el interior o al final de un archivo.

Bajas.

Es la acción de eliminar un registro de un archivo. La baja de un registro se puede presentar de do formas distintas: indicación del registro específico que se desea dar de baja o bien visualizar los registros del archivo para que el usuario elija el registro a borrar.

La baja de un registro puede ser lógica o física. Una baja lógica supone el no borrado del registro en el archivo. Esta baja lógica se manifiesta en un determinado campo del registro con una bandera o “flan”, carácter, etc, o bien con la escritura o rellenado de espacios en blanco en el registro específico. Una baja física implica el borrado y desaparición del registro, de modo que se crea un nuevo archivo que no incluye al registro dado de baja.

Modificaciones.

Consiste en la operación de cambiar total o parcialmente el contenido de uno de sus registros.

Esta fase es típica cuando cambia el contenido de un determinado campo de un archivo; por ejemplo, la dirección o la edad de un empleado.

La forma práctica de modificar un registro es la visualización del contenido de sus campos; para ello se debe elegir el registro o registros a modificar. El proceso consiste en la lectura del registro, modificación de su contenido y escritura, total o parcial del número.

Consulta.

Tiene como fin visualizar la información contenida en el archivo, bien de un modo completo, bien de modo parcial, examen de uno ó más de sus registros. Las operaciones de consulta de archivo deben contemplar diversos aspectos que faciliten la posibilidad de conservación de datos. Los aspectos más interesantes a tener en cuenta son:

Opción de visualización en pantalla o listado en impresora.

Detención de la consulta a voluntad del usuario.

Listado por registros o campos individuales o bien listado total del archivo (en este caso deberá existir la posibilidad de impresión de listados, con opciones de saltos de página correctos)

Operaciones sobre registros.

Las operaciones de transferencia de datos a/o desde un dispositivo a la memoria central se realizan mediante las instrucciones:

Leer nombrearchivo, lista de entrada de datosEscribir nombrearchivo, lista de salida de datos

Las operaciones de acceso a un reegistro y de paso de un registro a otro se realiza con las acciones leer y escribir.

14

Page 15: Principios Fundamentales Sobre Archivos de Datos

2. ESTRUCTURA DE LOS REGISTROS QUE CONFORMAN EL ARCHIVO DE DATOS.

La base de datos se subdivide y organiza en archivos de acuerdo con la naturaleza general de los datos y el uso que se pretende hacer con ellos. Cada archivo se compone de un conjunto de registros relacionados, cada uno de los cuales se descompone a su vez en campos individuales que corresponden a cada uno de los valores de datos que se ha de procesar, estos a su vez se subdividen en subcampos. Los conceptos carácter, campo, registro, archivo y base de datos son conceptos lógicos que se refieren al medio en que el usuario de computadoras ve los datos y se organizan.

BLOQUE (Factor de bloqueo = 3)

Registro 1 Registro 2 Registro 3

ARCHIVO CAMPO 1 CAMPO 2 CAMPO 3 SUBCAMPOS

3. TIPOS DE ARCHIVOS DE DATOS.

Los archivos alojados en dispositivos de almacenamiento conocidos como memoria secundaria, pueden almacenarse de dos formas diferentes: archivos convencionales o bases de datos.

Archivos Convencionales.

Están asociados a una filosofía de lenguaje más artesanal, son los que tienen una relación directa con los programas. Se clasifican en:

Archivos Maestros: También denominados archivos de situación, contienen la información que refleja el estado o situación de una empresa o entidad, o algún aspecto de ella en un determinado momento. Estos archivos se actualizan periódicamente para adaptarlos a cada nueva situación. Los archivos maestros son útiles sólo mientras se mantengan exactos y

15

CAMPO 2

Page 16: Principios Fundamentales Sobre Archivos de Datos

actualizados. Un ejemplo es el archivo de personal en una empresa, o también el archivo de existencias en almacén.

Archivo de Transacciones. Es un archivo temporal con dos propósitos: acumular datos acerca de los eventos al momento que ocurran y actualizar los archivos maestros para reflejar los resultados de las transacciones actuales. El término transacción se refiere a cualquier evento que afecte la organización y sobre el cual se calculan datos.

En nuestro caso de estudio, las transacciones pueden hacer referencia a la asignación de docentes a la carga académica, asignación de grupos de alumnos por facultad, semestre y carga académica, transferencias de alumnos, contratación de personal, etc. Los archivos de transacciones se utilizan para actualizar los archivos maestros; los archivos maestros son permanentes y duran mientras exista el sistema; sin embargo, los contenidos de los archivos cambian como resultado del procesamiento y actualización. Los archivos de transacciones son temporales, en algún momento dejan de ser necesarios y se borran o destruyen, dependiendo del método utilizado para almacenar los datos. Estos archivos de transacciones pueden guardarse por meses, a veces incluso años después de que han sido creados, dependiendo de las disposiciones legales y de la organización.

Archivo de Tablas. Contienen datos de referencias utilizados en el procesamiento de transacciones o actualización de los archivos maestros. Por lo general, los archivos de tabla se utilizan para almacenar datos que de otra forma se incluirían en los archivos maestros. Por ejemplo, si se ajusta el costo de la matricula para el siguiente ciclo de acuerdo a las perspectivas del gobierno y de la organización, el cálculo y los resultados se almacenarían sobre registros tablas y serán utilizados en los diferentes procesos o transacciones que se requieran.

Archivos históricos: Se obtienen de los archivos maestros cuando se dejan fuera de uso para futuros estudios estadísticos o consultas .Será un archivo histórico el que contiene la información de libros adquiridos por una biblioteca en la década de los ochenta o un archivo con los pagos realizados en los últimos 5 años ó el detalle de comprobantes considerados en un ejercicio contable ya cerrado.

Archivo de Respaldo. Cuando los archivos informáticos contienen información que es extremadamente importante, se usa un proceso de respaldo (back-up) para protegerse contra desastres que podrían destruir los archivos. Hacer copias de respaldo de archivos significa simplemente hacer copias de los archivos en una ubicación separada de modo que se puedan restaurar si le pasara algo a la computadora, o si fueran borrados accidentalmente.

Archivos de Reportes. Son archivos temporales que se utilizan cuando el tiempo de impresión no está disponible para todos los reportes producidos. La computadora escribe el reporte a un archivo en disco o cinta magnética, en donde puede permanecer hasta que pueda imprimirse.

Bases de Datos.

Se originan de los convencionales, pero tienen una estructura más completa y hacen uso de la tecnología. Se define una base de datos como una serie de datos organizados y relacionados entre sí, los cuales son recolectados y explotados por los sistemas de información de una empresa o negocio en particular.

16

Page 17: Principios Fundamentales Sobre Archivos de Datos

La administración de bases de datos consiste en la planeación, organización y control de las bases de datos de una empresa u organismo. Las bases de datos se distinguen de los archivos maestros comunes y de transacciones en cuatro formas: Un archivo está destinado al almacenamiento. Los registros que contienen un archivo se

almacenan juntos y son recabados por medio de un método de accesso (secuencial o aleatorio)

Agregar registros a un archivo para agrandarlo no lo convierte en una base de datos. La existencia de una base de datos no está determinada por el número de registros almacenados.

Los registros referentes a distintas entidades de interés pueden almacenarse dentro de una base de datos.

Las bases de datos ofrecen múltiples beneficios tanto a las organizaciones como a los individuos:

Uniformidad: Si se tienen diversos archivos con la información relacionada dentro de la organización, es probable que cada uno tenga un formato diferente, lo cual dificulta su comparación. El uso de bases de datos permite información en un formato común.

Seguridad: Los usuarios de la información tienen niveles de acceso a los archivos y al tipo de información que deban manejar, gestionado mediante el uso de contraseñas que establecen sus derechos de usuario.

Evitar la inconsistencia y redundancia de datos: Una base de datos permite el uso de archivos compartidos accedidos mediante la red, evitando que cada usuario tenga su propia copia de datos. De este modo se evita la duplicación de la información, es decir, que se almacene en más de un dispositivo de almacenamiento. Esto disminuye los costos de almacenamiento y evita la inconsistencia de los datos, es decir, diversas copias de un mismo dato que no concuerdan entre sí.

Integridad de datos: Los valores de los datos almacenados deben satisfacer ciertas restricciones de consistencia. Las restricciones son evaluadas mediante programas que determinan si un campo es adecuado; por ejemplo, evitar que en una fecha se coloque el nombre de una ciudad.

Base de datos propietarias o Bancos de datos

Se trata en general de bases de datos de gran tamaño, desarrollada por una organización y que contiene temas especializados o de carácter particular. El público general puede tener acceso a esta base a veces de forma gratuita y otras mediante el pago de una cuota. Pueden ofrecer información que va desde   negocios, economía, inversión, técnica y científica hasta servicios de entretenimiento. Permiten encontrar en minutos lo que tardaría horas ojeando revistas.

Organización de sistema de gestión de bases de datos.

17

Page 18: Principios Fundamentales Sobre Archivos de Datos

Base de datos relacional

Esta organización ofrece la mayor flexibilidad ya que los datos se almacenan en tablas diferentes, conformadas así mismo por filas y columnas. Una tabla se denomina relación. En una tabla las filas contienen los registros. Las columnas representan los campos. Las tablas relacionadas poseen un campo común, el campo clave, mediante el cual la información almacenada en una tabla puede enlazarse con la información almacenada en otra. El acceso a los datos se realiza mediante consultas escritas en SQL. La organización de bases de datos relacional es la más difundida en la actualidad motivada a su sencillez para realizar operaciones de adición, eliminación y modificación en contraste con la mayor rigidez de las organizaciones jerárquicas y de red. Por ejemplo en un modelo relacional para un pequeño negocio, se puede contar con una tabla de clientes y otra de órdenes. Las órdenes que pertenecen a un determinado cliente son identificadas colocando el campo de identificación del cliente en la orden (campo clave de la tabla de clientes), lo cual permite enlazar las dos tablas.

4. Organización de archivos.

La organización de un archivo define la forma en la que los registros se disponen sobre el soporte de almacenamiento, o también se define la organización como la forma en que se estructuran los datos en un archivo. Según las características del soporte empleado y el modo en que se han organizado los registros, se consideran dos tipos de archivos:

4.1. Organización secuencial.

Es aquella en la cual los registros ocupan posiciones consecutivas de memoria y que sólo se puede acceder a ellos de uno en uno a partir del primero.En un archivo secuencial, no se pueden hacer operaciones de escritura cuando se está leyendo, ni operaciones de lectura cuando se está escribiendo.Por otro lado, para actualizarlos es preciso crear nuevos archivos donde se copien los antiguos junto con las actualizaciones.

18

Page 19: Principios Fundamentales Sobre Archivos de Datos

En un archivo secuencial, los registros se insertan en el archivo en orden cronológico de llegada al soporte, es decir, un registro de datos se almacena inmediatamente a continuación del registro anterior.

Los archivos secuenciales, que se usan para el procesamiento secuencial, contienen registros ordenados de acuerdo con un campo clave. Un archivo secuencial se procesa de principio a fin. Todo el archivo se debe procesar, aun cuando se actualice sólo un registro. El principal medio de almacenamiento para los archivos secuenciales es la cinta magnética. También se pueden usar los discos magnéticos.

Características:

-. Terminan con una marca de fin de archivo (EOF o bien FF). Cuando se tengan que añadir registros se añadirán en las marcas fin de archivo.

-. Ocupan menos memoria y son útiles cuando se desconoce a priori el tamaño de los datos y se requieren registros de longitud variable. También son muy empleados para el almacenamiento de información., cuyos contenidos sufran pocas modificaciones en el transcurso de su vida útil.

-. El inconveniente que presentan es la dificultad para alcanzar registros cerca de la mitad o al final de un archivo de gran tamaño, cuando los registros del principio no interesan.

-. No permiten hacer operaciones de escritura cuando se está leyendo, ni operaciones de lectura cuando se está escribiendo.

-. Para actualizarlos es preciso crear nuevos archivos donde se copien los antiguos junto con las actualizaciones.

4.2. Organización directa o aleatoria.

Los datos se colocan y se acceden aleatoriamente mediante su posición, es decir, indicando el lugar relativo que ocupan dentro del conjunto de posiciones posibles. En esta organización se pueden leer y escribir registros, en cualquier orden y en cualquier lugar.En un archivo de acceso directo cada registro se identifica con un único número, con el que se puede acceder al mismo. Cada registro individual puede ser leído, escrito o actualizado. Cada registro está definido con una longitud fija así como cada campo dentro del registro. Presenta el inconveniente de que es tarea del programador establecer la relación entre la posición que ocupa un registro y su contenido; además puede desaprovecharse parte del espacio destinado al archivo, ya que pueden quedar huecos libres entre unos registros y otros.

19

Page 20: Principios Fundamentales Sobre Archivos de Datos

Su principal ventaja es la rapidez de acceso a un registro cualquiera, puesto que no es preciso pasar por los registros anteriores.Son muy rápidos de acceso a la información que contienen.

Un archivo de acceso directo, o archivo aleatorio, es un conjunto de registros que se pueden procesar en forma aleatoria (en cualquier orden). En el procesamiento aleatorio, sólo se necesita el valor del campo clave del registro para recuperar o actualizar un registro. Con mucha frecuencia, los discos magnéticos constituyen el medio de almacenamiento para el procesamiento aleatorio.

Las condiciones para que un archivo sea de organización directa son:

-. Almacenado en un soporte direccionable-. Los registros deben contener un campo específico denominado clave que identifica cada registro de modo único; es decir, dos registros distintos no pueden tener un mismo valor de clave.-. Existencia de una correspondencia entre los posibles valores de la clave y las direcciones disponibles sobre el soporte.

Un soporte direccionable es, normalmente, un disco o paquete de discos. Cada posición se localiza por su dirección absoluta, que en el caso del disco suele venir definida por dos parámetros: número de pista y número de sector; o bien por tres parámetros: pista, sector y número de cilindro; un cilindro i es el conjunto de pistas de número i de cada superficie de almacenamiento de la pila.En la práctica el programador no gestiona directamente direcciones absolutas, sino direcciones relativas respecto al principio del archivo. La manipulación de direcciones relativas permite diseñar el programa con independencia de la posición absoluta del archivo en el soporte.El programador crea una relación perfectamente definida entre la clave indicativa de cada registro y su posición física dentro del dispositivo de almacenamiento.

4.3. Organización secuencial de índice.

Es una combinación de las dos organizaciones  presentadas, que busca aprovechar las ventajas de ambas. Los registros se van almacenando en orden secuencial, pero este archivo cuenta con un índice. El archivo índice enlista las claves de    cada grupo de registros almacenados y sus direcciones de disco correspondientes. Cuando se   desea buscar un

20

Page 21: Principios Fundamentales Sobre Archivos de Datos

registro particular, la computadora inicia la búsqueda secuencialmente, identificando el principio del grupo de registros. Esta organización es más rápida que la secuencial, pero no lo es tanto como el acceso directo. Es especialmente útil cuado se requiere   actualizar ocasionalmente grandes lotes de transacciones y se necesita disponer de acceso rápido y frecuente a los datos.

Ventajas y desventajas de los tipos de organización de archivos

Organización de Archivos

Tipo Ventajas Desventajas

SecuencialAcceso eficiente a todos o gran parte de los datos. Menor uso de espacio de almacenamiento.

Acceso lento a registros específicos.

Directa Acceso rápido a registros específicos.

Ineficiente acceso a la totalidad o gran parte de los registros. Mayor uso de espacio de almacenamiento.

Secuencial de índice

Más veloz que la secuencial, más eficiente que la directa.

Menos eficiente que la secuencial, menos rápida que la directa.

4.3. Modos de acceso.

Consideremos un soporte de información que contiene un archivo. Se denomina modo de acceso a la forma en que el dispositivo que maneja el soporte se posiciona en un determinado lugar del mismo para realizar una operación de lectura o escritura de un registro.Los dispositivos de disco magnético con frecuencia reciben el nombre de dispositivos de almacenamiento de acceso directo. Por otra parte, medios como las cintas magnéticas se conocen como dispositivos de acceso secuencial.El acceso secuencial a un registro supone acceder inicialmente al primer registro del archivo y después, consecutivamente, a todos los sucesivos hasta llegar al registro deseado. Los medios de almacenamiento secuencial, como la cinta magnética, no tienen direcciones de almacenamiento únicas que puedan dirigirse directamente. En cambio, los registros

21

Page 22: Principios Fundamentales Sobre Archivos de Datos

deben almacenarse y recuperarse utilizando u proceso secuencial. Los registros se graban uno tras otro en una secuencia predeterminada (en orden numérico, por ejemplo).El acceso directo, consiste en el posicionamiento sobre cualquier registro sin necesidad de haber accedido antes a los anteriores.En los archivos de organización directa este acceso se consigue proporcionando al dispositivo la posición del registro que se desea acceder. En ocasiones es conveniente programar una función de aleatorización o hashing1, la cual permite calcular la posición de cualquier registro a partir del valor de su clave.

4.4. Procesamiento de Archivos Secuenciales.

Las operaciones básicas que se permiten en un archivo secuencial son: escribir su contenido, añadir un registro al final del archivo y consultar sus registros.

Creación.

La creación de un archivo secuencial es un proceso secuencial, ya que los registros se almacenan consecutivamente en el mismo orden en que se introducen en el archivo. El método de creación de un archivo consiste en la ejecución de un programa adecuado que permite la entrada de datos del archivo desde el terminal. El sistema usual es interactivo en el que el programa solicita los datos al usuario que los introduce por teclado, hasta que se introduce una marca de fin de archivo (EOF o FF) que supone el final físico del archivo.En los archivos secuenciales, EOF o FF es una función lógica que toma el valor cierto si se ha alcanzado el final de archivo y falso en caso contrario. La operación de crear un archivo tiene dos variantes:-. Crear el archivo original-. Añadir datos al archivo ya creado y a continuación del último registro del mismo

La creación del archivo requerirá los siguientes pasos:

- Abrir el archivo- Leer datos del registro- Grabar registro- Cerrar archivo

Consulta.

El proceso de búsqueda o consulta de una información se debe efectuar obligatoriamente en modo secuencial. Así, para el caso de un archivo de n registros, el número de lecturas de registros efectuadas son:

-. Mínimo 1, si el registro buscado es el primero del archivo

-. Máximo n, si el registro buscado es el último o no existe dentro del archivo

Por término medio, el número de lecturas necesarias para encontrar un determinado registro es:

Actualización.

22

Page 23: Principios Fundamentales Sobre Archivos de Datos

La actualización de un archivo supone:

-. Añadir nuevos registros (altas)

-. Modificar registros ya existentes (modificaciones)

-. Borrar registros (bajas)

Altas.

La operación de altas supone la creación nueva del archivo, ya que un archivo secuencial no admite la incorporación de nuevos registros.

Bajas.

Existen dos métodos para dar de baja a un registro:

-. Se utiliza un archivo transitorio

-. Almacenar en un arreglo todos los registros del archivo, señalando con un indicador o bandera (flag) el registro que se desea dar de baja.

Método 1.

Se crea un segundo archivo auxiliar, también secuencial, copia del que se trata de actualizar. Se lee el archivo completo registro a registro y en función de su lectura se decide si el registro se debe dar de baja o no.

Si el registro se va a dar de baja, se omite la escritura en el archivo auxiliar o transitorio. Si el registro no se va a dar de baja, este registro se escribe en el archivo auxiliar.

Tras terminar la lectura del archivo original, se tendrán dos archivos: original (o maestro) y auxiliar.

El proceso de bajas del archivo concluye cambiando el nombre del archivo auxiliar por el de maestro y borrando previamente el archivo maestro original.

Método 2.

Este procedimiento consiste en señalar los registros que se desean dar de baja con un indicador o bandera; estos registros no se graban en el nuevo archivo secuencial que se crea sin los registros dados de baja.

Modificaciones.

Consiste en localizar este registro, efectuar dicha modificación y a continuación reescribir el nuevo registro en el archivo. El proceso es similar al de bajas.

4.5. Procesamiento de Archivos Aleatorios.

Creación

23

ARCHIVO ORIGINAL

ACTUALIZACIÓN ARCHIVO AUXILIAR

Page 24: Principios Fundamentales Sobre Archivos de Datos

El proceso de creación de un archivo directo o aleatorio consiste en ir introduciendo los sucesivos registros en el soporte que los va a contener y en la dirección obtenida resultante del algoritmo de conversión.

Altas

Para dar de alta un registro, se debe introducir su número de orden y contenido

Consulta

Debe comenzar con la entrada del número o números de registros a consultar. Las operaciones a realizar son:

Bajas

Se toma un campo indicador en el que su valor sea 0, y cuando exista, se pone a 1. Este tipo de baja es una baja lógica, que significa que, pese a usar un registro dado de baja, sigue ocupando el mismo espacio que si estuviera presente.

Modificaciones

Se localiza el registro que se desea modificar – número de registro - ; se modifica el contenido y se reescribe

Resumen

En la actualidad, la gestión de archivos se ha demostrado insuficiente para cubrir las necesidades de almacenamiento y proceso de datos. Los sistemas de información de las empresas son cada vez más grandes y complejos, y su gestión mediante el uso de archivos presenta algunos inconvenientes, como el hecho de que los datos estén repartidos por distintos departamentos de la empresa, lo que supone tener que desplazarse o solicitarlos cada vez que se necesitan en un lugar diferente de donde se generan; además, pueden estar repetidos varias veces, con el inconveniente de que su actualización dará lugar a inconsistencias si no se realiza en todos los lugares en que se ubican. Las aplicaciones que se creen deberán tener en cuenta las distintas estructuraciones de los datos, y los cambios que se realicen tanto en hardware como en software presentarán numerosas complicaciones. Otro problema derivado de la dispersión de los datos radica en la dificultad para establecer sistemas de control y seguridad en los mismos.

Los sistemas de bases de datos pretenden dar solución a los problemas expuestos mediante la integración de los archivos de datos, de su estructura y de las aplicaciones que los manejan.

BIBLIOGRAFIA

1. Senn, James A. Análisis y Diseño de Sistemas de Información, Segunda Edición, Mc Graw-Hill. México, 2002

24

Page 25: Principios Fundamentales Sobre Archivos de Datos

2. Cohen, Daniel y Asin, Enrique. Sistemas de Información para los Negocios. Un Enfoque de Decisiones, Mc Graw-Hill. México,2000

3. Joyanes A., Luis. Fundamentos de Programación. Algoritmos y Estructura de Datos. McGraw-Hill. México, 1992

4. Ceballos, Francisco J. Manual para QuickBASIC 4.5. Guía del Programador. Macrobit. México, 1990

25