39
DISEÑO DE ARCHIVOS Universidad del Quindío, facultad de ciencias humanas y bellas artes Ciencias de la Informacion , y la Documentación Bibliotecologia y Archivistica. Análisis y Diseño de Sistemas de Información II Grupo 4 Noviembre 2012

Diseño de archivos, grupo 4

Embed Size (px)

Citation preview

Page 1: Diseño de archivos, grupo 4

DISEÑO DE ARCHIVOS

Universidad del Quindío, facultad de ciencias humanas y

bellas artes

Ciencias de la Informacion , y la Documentación

Bibliotecologia y Archivistica.

Análisis y Diseño de Sistemas de Información II

Grupo 4

Noviembre 2012

Page 2: Diseño de archivos, grupo 4

• Norman Mendivelso Sua

• Paola Andrea Vargas Valdez

• Paula Andrea Fino Toro

• Ricardo Javier Ruiz Moreno

• Rocio Avila Sanchez

Docente:

Doris Amanda Zuluaga Serna

Page 3: Diseño de archivos, grupo 4

Introducción

Terminología Básica de archivos

Diagrama de estructura de datos

Tipos de Archivos

Métodos de organización de archivos

Cinta Magnética

Discos Magnéticos

Conclusiones

Bibliografía

Page 4: Diseño de archivos, grupo 4

En el desarrollo de nuestra profesión como

bibliotecólogos, la archivística es parte fundamental,

por está razón es indispensable conocer sino todo,

gran parte sobre Diseño de Archivos.

los archivos seguirán siendo una forma práctica para

guardar datos para algunas aplicaciones. Un archivo

puede ser diseñado y construido muy rápidamente, y

las preocupaciones sobre disponibilidad y seguridad

de los datos son minimizados.

Page 5: Diseño de archivos, grupo 4

TERMINOLOGÍA BÁSICA DE ARCHIVOS

Archivo: (Fichero, file). grupo de datos estructurados que son

almacenados en algún medio y pueden ser usados por las

aplicaciones.

Acceso de datos - métodos: capacidades que el subsistema de

archivos provee para accesar datos dentro de los directorios y

medios de almacenamiento en general. Se ubican tres formas

generales: acceso secuencial, acceso directo y acceso directo

indexado.

Acceso secuencial: Es el método más lento y consiste en recorrer

los componentes de un archivo uno en uno hasta llegar al registro

deseado. Se necesita que el orden lógico de los registros sea igual

al orden físico en el medio de almacenamiento. Este tipo de acceso

se usa comúnmente en cintas y cartuchos.

Acceso directo: Permite accesar cualquier sector o registro

inmediatamente, por medio de llamadas al sistema como la de seek.

Este tipo de acceso es rápido y se usa comúnmente en discos duros

y discos o archivos manejados en memoria de acceso aleatorio.

Page 6: Diseño de archivos, grupo 4

Acceso directo indexado: Este tipo de acceso es útil para grandes volúmenes de

información o datos. Consiste en que cada archivo tiene una tabla de

apuntadores, donde cada apuntador va a la dirección de un bloque de índices, lo

cual permite que el archivo se expanda a través de un espacio enorme. Consume

una cantidad importante de recursos en las tablas de índices pero es muy rápido.

Criptografía: Disciplina que se ocupa de la seguridad de la transmisión y el

almacenamiento de la información.

Cifrado: Codificación de datos mediante diversas técnicas matemáticas que

garantizan su confidencialidad en la transmisión

CLUSTER Bloque de disco. Un clúster es la unidad de almacenamiento en un

disco (ZIP, rígido o flexible) con una determinada cantidad fija de bytes. Un disco

está dividido en miles de clústeres de igual tamaño y los archivos son repartidos y

almacenados en distintos clústeres. El tamaño se determina en el formateo del

disco y suele ser de 512 bytes, pero la cifra puede ascender a 4.096 bytes.

DERECHOS DE ACCESO A ARCHIVOS

Tipo de derechos de acceso que permite asignar determinados permisos a

determinados usuarios o grupos, para acceder a ciertos archivos y/o directorios.

La mayoría de los sistemas de archivos modernos soportan la administración de

los permisos de acceso, permitiendo o no ver o cambiar el contenido del sistema

de archivos.

Page 7: Diseño de archivos, grupo 4

DIRECTORIO RAIZ

En el sistema de archivos FAT: Tipo especial de fichero que almacena en

forma de índice las subcarpetas y ficheros que componen cada carpeta.

El directorio raíz ocupa una posición única y concreta en el sistema de

ficheros (la región del directorio raíz), pero los índices de otras carpetas

ocupan la zona de datos como cualquier fichero. Cada entrada en este

índice contiene el nombre del fichero o carpeta, su extensión, sus

atributos, la fecha y hora de creación, la dirección del primer clúster

donde están los datos y el tamaño que ocupa.

DESFRAGMENTACION:

Es el proceso mediante el cual se acomodan los archivos de un disco de

tal manera que cada uno quede en un área continua y sin espacios sin

usar entre ellos. Al irse escribiendo y borrando archivos continuamente

en el disco duro, éstos tienden a no quedar en áreas contiguas, así, un

archivo puede quedar "partido" en muchos pedazos a lo largo del disco,

se dice entonces que el archivo está "fragmentado". Al tener los archivos

esparcidos por el disco, se vuelve ineficiente el acceso a ellos.

Page 8: Diseño de archivos, grupo 4

TERMINOLOGÍA BÁSICA DE ARCHIVOS

Extensión de archivo

O extensión de fichero, es una cadena de caracteres anexada al nombre

de un archivo, usualmente precedida por un punto. Su función principal

es diferenciar el contenido del archivo de modo que el sistema

operativo disponga el procedimiento necesario para ejecutarlo o

interpretarlo, sin embargo, la extensión es solamente parte del nombre

del archivo y no representa ningún tipo de obligación respecto a su

contenido.

FAT

(File Allocation Table - Tabla de Ubicación de Ficheros). Sistema de

archivos que utilizan las ediciones no empresariales de Microsoft

Windows hasta Windows ME. Además es un sistema admitido casi por

todos los sistemas operativos.

FORMATO DE ARCHIVO

Es una forma particular de codificar información para ser

almacenamiento. Existen diferentes tipos de formatos para diferentes

tipos de información. Por esto existen formatos de gráficos, formatos de

audio, formatos de animación, formato de documentos, etc

Page 9: Diseño de archivos, grupo 4

SISTEMA DE ARCHIVOS: Forma en que una computadora organiza, da nombre,

almacena y manipula los archivos, suele depender del sistema operativo y del medio

de almacenamiento (disco duro, disco óptico, etc).

El software del sistema de archivos se encarga de organizar los archivos (que

suelen estar segmentados físicamente en pequeños bloques de pocos bytes) y

directorios, manteniendo un registro de qué bloques pertenecen a qué archivos, qué

bloques no se han utilizado y las direcciones físicas de cada bloque.

Los sistemas de archivos pueden ser clasificados en tres categorías: sistemas de

archivo de disco, sistemas de archivos de red y sistemas de archivos de propósito

especial.

Ejemplos de sistemas de archivos son: FAT, UMSDOS, NTFS, UDF, ext2, ext3, ext4,

ReiserFS, XFS, etc.

SISTEMA DE ARCHIVOS CIFRADO

(Encrypting File System o EFS en inglés). El sistema de archivos encriptado o

cifrado es un sistema de archivos NTFS que permite la encriptación o cifrado de los

archivos. Esta tecnología permite proteger los datos almacenados en archivos en en

particiones NTFS de un disco duro.

Un usuario necesita autentificarse para poder acceder a los ficheros encriptados

empleando el sistema operativo. Puede encriptar los archivos fácilmente y

necesitará una clave para poder desencriptarlos. De todas maneras el sistema es

capaz de ser vulnerado por fuerza bruta, especialmente con claves débiles.

Page 10: Diseño de archivos, grupo 4

SISTEMAS DE ARCHIVOS AISLADOS: son aquellos que residen en una

sola computadora y no existe la posibilidad de que, aún estando en una

red, otros sistemas puedan usar sus directorios y archivos. Por ejemplo,

los archivos en discos duros en el sistema MS-DOS clásico se puede ver

en esta categoría

SISTEMAS DE ARCHIVOS COMPARTIDOS O DE RED

Estos sistemas de archivos es factible accesarlos y usarlos desde otros

nodos en una red. Generalmente existe un `servidor' que es la

computadora en donde reside el sistema de archivos físicamente, y por

otro lado están los `clientes', que se valen del servidor para ver sus

archivos y directorios de manera como si estuvieran localmente en el

cliente. Algunos autores les llaman a estos sistemas de archivos

`sistemas de archivos distribuídos' lo cual no se va a discutir en este

trabajo.

TAMAÑO DE ARCHIVO: mide el tamaño de un archivo de ordenador.

Normalmente se mide en bytes con un prefijo. La cantidad real

de espacio en disco consumida por el archivo depende del sistema de

archivar ligeramente dependiendo de la capacidad exacta del disco y el

sistema de archivos utilizado. Esto sucede porque Windows reporta

realmente el tamaño en GiB y 186 GiB es aproximadamente igual a

200GB.

Page 11: Diseño de archivos, grupo 4

DIAGRAMA DE ESTRUCTURA DE

DATOS

El diagrama de estructura de datos, es

una técnica necesaria para la

modelización de datos, la cual representa

un conjunto de datos relacionados entre

si y describen en forma colectiva un

componente del sistema. Este diagrama

es útil para representar gráficamente las

relaciones o asociaciones entre pares de

entidades. Para la construcción del

diagrama de estructura de datos, se

necesitan los siguientes elementos:

Page 12: Diseño de archivos, grupo 4

ELEMENTOS PARA LA CONSTRUCCIÓN DEL

DIAGRAMA DE ESTRUCTURA DE DATOS

ENTIDAD: es un objeto (persona, lugar o cosa)

sobre la cual la organización captura, almacena

o procesa datos. Su representación gráfica es un

rectángulo.

RELACIÓN: es la conexión que va a existir

(entre tipos de entidades). Su representación

gráfica es una recta.

Page 13: Diseño de archivos, grupo 4

Las fases para la construcción de la

estructura de datos son similares a las

fases utilizadas para el diseño del

modelo Entidad-Relación, las cuales

son:

• Identificar las entidades dentro del Sistema, teniendo previo

conocimiento del funcionamiento del sistema.

• Determinar las claves o identificadores de las entidades.

• Establecer las relaciones entre las entidades.

• Dibujar el modelo de datos.

• Identificar y describir los atributos de cada entidad,

teniendo en cuenta todas las propiedades de cada entidad

en las que el sistema tenga interés.

• Verificaciones, se realizaran sobre el diagrama, eliminando

las relaciones redundantes. Una relación o asociación

puede ser redundante si puede expresarse exactamente

por medio de una combinación de varias asociaciones

Page 14: Diseño de archivos, grupo 4

TIPOS DE ARCHIVOS

Los archivos se pueden dividir en dos grandes grupos:

los ejecutables y los no ejecutables o archivos de datos.

La diferencia fundamental entre ellos es que los

primeros funcionan por si mismos y los segundos

almacenan información para ser utilizada con ayuda de

algún programa.

Dentro de los archivos de datos se pueden crear

grupos, especialmente por la temática o clase de

información que almacenen. Por ejemplo: texto, vídeo,

audio, gráficos, información comprimida entre otros.

Page 15: Diseño de archivos, grupo 4

AUDIO

Los archivos de audio son todos los que

contienen sonidos (no solo música). Las

diferentes extensiones atienden al formato de

compresión utilizado para convertir el sonido real

en digital.

Podcast: archivos de sonido (.ogg o .mp3)

Page 16: Diseño de archivos, grupo 4

VIDEOLos formatos de video no sólo

contienen imágenes sino también el

sonido que las acompaña. Es

bastante habitual que al intentar

visualizar un vídeo no podamos ver

la imagen aunque sí oigamos el

sonido. Esto es debido al formato

de compresión utilizado en ellos

que puede no ser reconocido por

nuestro ordenador, por ello siempre

se ha de tener actualizados los

codecs de cada uno de los

formatos.

Videos: formatos para archivos de

video (.avi, .mpg, .mov, .ra, .rm).

Page 17: Diseño de archivos, grupo 4

COMPRIMIDOS

Los formatos de compresión

son de gran utilidad a la hora

del almacenamiento de

información ya que hacen que

esta ocupe el menor espacio

posible y que se puedan reunir

muchos ficheros en uno sólo.

WinZip: archivos comprimidos

con el programa WinZip (.zip).

WinRAR: archivos

comprimidos (.rar).

Page 18: Diseño de archivos, grupo 4

IMÁGENES

Poco hay que decir de las imágenes y de sus

formatos salvo que cada uno de ellos utiliza un

método de representación y que algunos

ofrecen mayor calidad que otros. También cabe

destacar que muchos programas de edición

gráfica utilizan sus propios formatos de trabajo

con imágenes

Portable Network Graphics: gráficos

portables de red (.png).

GIF: imágenes (.gif).

Tagged Image File Format: formato de

archivo de imágenes etiquetadas (.tiff)

JPG o JPEG: formato de imágenes (.jpeg).

Page 19: Diseño de archivos, grupo 4

TEXTO

Dentro de los documentos de texto hemos de

diferenciar entre el texto plano y el enriquecido. Es

decir, entre los formatos que sencillamente

guardan las letras (txt, log...) y los que podemos

asignarles un tamaño, fuente, color, etc. (doc)

Los tipos de archivos más utilizados para los

sistemas de información son:

Word: Documentos de texto (.doc).

Excel: Hojas de cálculo (.xls).

Power Point: Presentaciones (.ppt).

TXT: archivos de texto plano (.txt).

Page 20: Diseño de archivos, grupo 4

METODOS DE ORGANIZACIÓN DE

ARCHIVOS

Todos los registros se almacenan enarchivos a través de la herramienta dela ORGANIZACIÓN que nos indicacomo se almacena, localizan yrecuperan.

A continuación describiremos los trestipos existentes que son:

1) Organización secuencial2) Organización de acceso directo3) Organización indexada

Page 21: Diseño de archivos, grupo 4

ORGANIZACIÓN SECUENCIAL

Este es el método mas simple de almacenar yrecuperar registros en un archivo, en este sealmacenan los registros uno tras otro sinimportar el valor real de los datos en losregistros.

Este orden nunca cambia y una de suscaracterísticas es que los registros sealmacena por posición: primer registro,segundo, etc., no existen direcciones niasignaciones de lugar en los archivossecuénciales.

Page 22: Diseño de archivos, grupo 4

ORGANIZACIÓN DE ACCESO

DIRECTO

Con este método de organización el

programa pide al sistema donde

almacenar un registro antes de poderlo

accesar.

Estos registros si poseen llaves

registro físico y se almacenan según

estas y no por posición de ingreso.

Page 23: Diseño de archivos, grupo 4

DIRECCIONAMIENTO DIRECTO

Este método de almacenamiento utiliza las

llaves de registro para su almacenamiento, el

sistema tiene un lugar reservado para cada uno

de ellos y utiliza la llave de direccionamiento

para dirigirse al lugar asignado.

Lo atractivo de método es que la recuperación

de información es mas rápida

Page 24: Diseño de archivos, grupo 4

DIRECCIONAMIENTO DIRECTO UTILIZANDO LA

LLAVE DE REGISTRO

Page 25: Diseño de archivos, grupo 4

DIRECCIONAMIENTO DIRECTO

Este procedimiento debe tener un conjunto de datos con

las siguientes características:

El conjunto de llaves tiene un ascendente con pocos

valores no utilizados (los valores no utilizados son

espacio de almacenamiento desperdiciado). Por lo

tanto, se desean pocos espacios abiertos entre los

valores de las llaves.

Page 26: Diseño de archivos, grupo 4

DIRECCIONAMIENTO POR HASHING

Cuando no es posible el direccionamiento

directo, pero es necesario el acceso directo

se utiliza el método de acceso Hashing

(transformación de llaves o aleatorizacion),

para obtener una dirección de

almacenamiento a partir de un campo llave

Page 27: Diseño de archivos, grupo 4

ORGANIZACIÓN INDEXADA

La tercera forma de acceder a los registros es

por medio de un índice. La forma básica del

índice incluye llave de registro y dirección de

almacenamiento de registro.

La búsqueda es mas fácil gracias al índice ya

que es mas sencillo que buscarlo directamente

en el archivo

Page 28: Diseño de archivos, grupo 4

CARACTERÍSTICAS DE UN INDICE

Cada registro en el índice contiene

únicamente dos datos; una llave de

registro y una dirección de

almacenamiento.

Para encontrar un registro se busca

en el índice la llave de registro

deseado, se ingresa la información al

programa y se dirige al registro

directamente.

Page 29: Diseño de archivos, grupo 4

LA ORGANIZACIÓN INDEXADA PUEDE

SER:

Secuencial: Que van en orden

ascendente divido por bloques de

almacenamiento con cantidades

especificas

No secuencial: El índice no posee un

orden especifico pero muestra la

información de la ubicación del registro

en el mismo índice

Page 30: Diseño de archivos, grupo 4

CINTA MAGNÉTICA

Page 31: Diseño de archivos, grupo 4

CINTA MAGNÉTICA

Page 32: Diseño de archivos, grupo 4

CINTA MAGNÉTICA

Page 33: Diseño de archivos, grupo 4

CINTA MAGNÉTICA

Page 34: Diseño de archivos, grupo 4

DISCOS MAGNÉTICOS

Page 35: Diseño de archivos, grupo 4

DISCOS MAGNÉTICOS

Page 36: Diseño de archivos, grupo 4

DISCOS MAGNÉTICOS

Page 37: Diseño de archivos, grupo 4

DISCOS MAGNÉTICOS

Page 38: Diseño de archivos, grupo 4

CONCLUSIONES

Después de realizar este trabajo nos hemos dado cuenta

de la gran importancia y del papel tan importante que

representan los archivos. La correcta organización y

almacenamiento de la información nos permite ahorrar

espacio, tiempo, dinero, personal, de igual forma agiliza y

permita que tanto la recuperación y consulta de la

información sea mas fácil y rápido.

Page 39: Diseño de archivos, grupo 4

BIBLIOGRAFÍA

Diagrama de estructura de datos, disponible en:

http://www.oocities.org/es/avrrinf/tabd/T3/T3.htm

Teoría y administración de bases de datos, disponible en:

http://www.geocities.ws/acrmpos/tabd/t1/t3.html

Terminología Básica de Archivos

http://www.alegsa.com.ar/Diccionario/Cat/51.php

http://es.wikipedia.org/wiki

es.kioskea.net/contents/repar/filesys.php3

Tipos de archivos, disponible en:

http://aprendeenlinea.udea.edu.co/lms/moodle/file.php/464/Modulo1/TiposAr

chivos.pdf

Amaya Amaya, Jairo. Sistemas de información gerenciales: hardware,

software, redes, internet, diseño (2a. Ed.).

Colombia: Ecoe Ediciones, 2010. p 21.

http://site.ebrary.com/lib/bibliojaverianasp/Doc?id=10472672&ppg=39

Copyright © 2010. Ecoe Ediciones. All rights reserved.