DISEÑO DE ARCHIVOS
Universidad del Quindío, facultad de ciencias humanas y
bellas artes
Ciencias de la Informacion , y la Documentación
Bibliotecologia y Archivistica.
Análisis y Diseño de Sistemas de Información II
Grupo 4
Noviembre 2012
• Norman Mendivelso Sua
• Paola Andrea Vargas Valdez
• Paula Andrea Fino Toro
• Ricardo Javier Ruiz Moreno
• Rocio Avila Sanchez
Docente:
Doris Amanda Zuluaga Serna
Introducción
Terminología Básica de archivos
Diagrama de estructura de datos
Tipos de Archivos
Métodos de organización de archivos
Cinta Magnética
Discos Magnéticos
Conclusiones
Bibliografía
En el desarrollo de nuestra profesión como
bibliotecólogos, la archivística es parte fundamental,
por está razón es indispensable conocer sino todo,
gran parte sobre Diseño de Archivos.
los archivos seguirán siendo una forma práctica para
guardar datos para algunas aplicaciones. Un archivo
puede ser diseñado y construido muy rápidamente, y
las preocupaciones sobre disponibilidad y seguridad
de los datos son minimizados.
TERMINOLOGÍA BÁSICA DE ARCHIVOS
Archivo: (Fichero, file). grupo de datos estructurados que son
almacenados en algún medio y pueden ser usados por las
aplicaciones.
Acceso de datos - métodos: capacidades que el subsistema de
archivos provee para accesar datos dentro de los directorios y
medios de almacenamiento en general. Se ubican tres formas
generales: acceso secuencial, acceso directo y acceso directo
indexado.
Acceso secuencial: Es el método más lento y consiste en recorrer
los componentes de un archivo uno en uno hasta llegar al registro
deseado. Se necesita que el orden lógico de los registros sea igual
al orden físico en el medio de almacenamiento. Este tipo de acceso
se usa comúnmente en cintas y cartuchos.
Acceso directo: Permite accesar cualquier sector o registro
inmediatamente, por medio de llamadas al sistema como la de seek.
Este tipo de acceso es rápido y se usa comúnmente en discos duros
y discos o archivos manejados en memoria de acceso aleatorio.
Acceso directo indexado: Este tipo de acceso es útil para grandes volúmenes de
información o datos. Consiste en que cada archivo tiene una tabla de
apuntadores, donde cada apuntador va a la dirección de un bloque de índices, lo
cual permite que el archivo se expanda a través de un espacio enorme. Consume
una cantidad importante de recursos en las tablas de índices pero es muy rápido.
Criptografía: Disciplina que se ocupa de la seguridad de la transmisión y el
almacenamiento de la información.
Cifrado: Codificación de datos mediante diversas técnicas matemáticas que
garantizan su confidencialidad en la transmisión
CLUSTER Bloque de disco. Un clúster es la unidad de almacenamiento en un
disco (ZIP, rígido o flexible) con una determinada cantidad fija de bytes. Un disco
está dividido en miles de clústeres de igual tamaño y los archivos son repartidos y
almacenados en distintos clústeres. El tamaño se determina en el formateo del
disco y suele ser de 512 bytes, pero la cifra puede ascender a 4.096 bytes.
DERECHOS DE ACCESO A ARCHIVOS
Tipo de derechos de acceso que permite asignar determinados permisos a
determinados usuarios o grupos, para acceder a ciertos archivos y/o directorios.
La mayoría de los sistemas de archivos modernos soportan la administración de
los permisos de acceso, permitiendo o no ver o cambiar el contenido del sistema
de archivos.
DIRECTORIO RAIZ
En el sistema de archivos FAT: Tipo especial de fichero que almacena en
forma de índice las subcarpetas y ficheros que componen cada carpeta.
El directorio raíz ocupa una posición única y concreta en el sistema de
ficheros (la región del directorio raíz), pero los índices de otras carpetas
ocupan la zona de datos como cualquier fichero. Cada entrada en este
índice contiene el nombre del fichero o carpeta, su extensión, sus
atributos, la fecha y hora de creación, la dirección del primer clúster
donde están los datos y el tamaño que ocupa.
DESFRAGMENTACION:
Es el proceso mediante el cual se acomodan los archivos de un disco de
tal manera que cada uno quede en un área continua y sin espacios sin
usar entre ellos. Al irse escribiendo y borrando archivos continuamente
en el disco duro, éstos tienden a no quedar en áreas contiguas, así, un
archivo puede quedar "partido" en muchos pedazos a lo largo del disco,
se dice entonces que el archivo está "fragmentado". Al tener los archivos
esparcidos por el disco, se vuelve ineficiente el acceso a ellos.
TERMINOLOGÍA BÁSICA DE ARCHIVOS
Extensión de archivo
O extensión de fichero, es una cadena de caracteres anexada al nombre
de un archivo, usualmente precedida por un punto. Su función principal
es diferenciar el contenido del archivo de modo que el sistema
operativo disponga el procedimiento necesario para ejecutarlo o
interpretarlo, sin embargo, la extensión es solamente parte del nombre
del archivo y no representa ningún tipo de obligación respecto a su
contenido.
FAT
(File Allocation Table - Tabla de Ubicación de Ficheros). Sistema de
archivos que utilizan las ediciones no empresariales de Microsoft
Windows hasta Windows ME. Además es un sistema admitido casi por
todos los sistemas operativos.
FORMATO DE ARCHIVO
Es una forma particular de codificar información para ser
almacenamiento. Existen diferentes tipos de formatos para diferentes
tipos de información. Por esto existen formatos de gráficos, formatos de
audio, formatos de animación, formato de documentos, etc
SISTEMA DE ARCHIVOS: Forma en que una computadora organiza, da nombre,
almacena y manipula los archivos, suele depender del sistema operativo y del medio
de almacenamiento (disco duro, disco óptico, etc).
El software del sistema de archivos se encarga de organizar los archivos (que
suelen estar segmentados físicamente en pequeños bloques de pocos bytes) y
directorios, manteniendo un registro de qué bloques pertenecen a qué archivos, qué
bloques no se han utilizado y las direcciones físicas de cada bloque.
Los sistemas de archivos pueden ser clasificados en tres categorías: sistemas de
archivo de disco, sistemas de archivos de red y sistemas de archivos de propósito
especial.
Ejemplos de sistemas de archivos son: FAT, UMSDOS, NTFS, UDF, ext2, ext3, ext4,
ReiserFS, XFS, etc.
SISTEMA DE ARCHIVOS CIFRADO
(Encrypting File System o EFS en inglés). El sistema de archivos encriptado o
cifrado es un sistema de archivos NTFS que permite la encriptación o cifrado de los
archivos. Esta tecnología permite proteger los datos almacenados en archivos en en
particiones NTFS de un disco duro.
Un usuario necesita autentificarse para poder acceder a los ficheros encriptados
empleando el sistema operativo. Puede encriptar los archivos fácilmente y
necesitará una clave para poder desencriptarlos. De todas maneras el sistema es
capaz de ser vulnerado por fuerza bruta, especialmente con claves débiles.
SISTEMAS DE ARCHIVOS AISLADOS: son aquellos que residen en una
sola computadora y no existe la posibilidad de que, aún estando en una
red, otros sistemas puedan usar sus directorios y archivos. Por ejemplo,
los archivos en discos duros en el sistema MS-DOS clásico se puede ver
en esta categoría
SISTEMAS DE ARCHIVOS COMPARTIDOS O DE RED
Estos sistemas de archivos es factible accesarlos y usarlos desde otros
nodos en una red. Generalmente existe un `servidor' que es la
computadora en donde reside el sistema de archivos físicamente, y por
otro lado están los `clientes', que se valen del servidor para ver sus
archivos y directorios de manera como si estuvieran localmente en el
cliente. Algunos autores les llaman a estos sistemas de archivos
`sistemas de archivos distribuídos' lo cual no se va a discutir en este
trabajo.
TAMAÑO DE ARCHIVO: mide el tamaño de un archivo de ordenador.
Normalmente se mide en bytes con un prefijo. La cantidad real
de espacio en disco consumida por el archivo depende del sistema de
archivar ligeramente dependiendo de la capacidad exacta del disco y el
sistema de archivos utilizado. Esto sucede porque Windows reporta
realmente el tamaño en GiB y 186 GiB es aproximadamente igual a
200GB.
DIAGRAMA DE ESTRUCTURA DE
DATOS
El diagrama de estructura de datos, es
una técnica necesaria para la
modelización de datos, la cual representa
un conjunto de datos relacionados entre
si y describen en forma colectiva un
componente del sistema. Este diagrama
es útil para representar gráficamente las
relaciones o asociaciones entre pares de
entidades. Para la construcción del
diagrama de estructura de datos, se
necesitan los siguientes elementos:
ELEMENTOS PARA LA CONSTRUCCIÓN DEL
DIAGRAMA DE ESTRUCTURA DE DATOS
ENTIDAD: es un objeto (persona, lugar o cosa)
sobre la cual la organización captura, almacena
o procesa datos. Su representación gráfica es un
rectángulo.
RELACIÓN: es la conexión que va a existir
(entre tipos de entidades). Su representación
gráfica es una recta.
Las fases para la construcción de la
estructura de datos son similares a las
fases utilizadas para el diseño del
modelo Entidad-Relación, las cuales
son:
• Identificar las entidades dentro del Sistema, teniendo previo
conocimiento del funcionamiento del sistema.
• Determinar las claves o identificadores de las entidades.
• Establecer las relaciones entre las entidades.
• Dibujar el modelo de datos.
• Identificar y describir los atributos de cada entidad,
teniendo en cuenta todas las propiedades de cada entidad
en las que el sistema tenga interés.
• Verificaciones, se realizaran sobre el diagrama, eliminando
las relaciones redundantes. Una relación o asociación
puede ser redundante si puede expresarse exactamente
por medio de una combinación de varias asociaciones
TIPOS DE ARCHIVOS
Los archivos se pueden dividir en dos grandes grupos:
los ejecutables y los no ejecutables o archivos de datos.
La diferencia fundamental entre ellos es que los
primeros funcionan por si mismos y los segundos
almacenan información para ser utilizada con ayuda de
algún programa.
Dentro de los archivos de datos se pueden crear
grupos, especialmente por la temática o clase de
información que almacenen. Por ejemplo: texto, vídeo,
audio, gráficos, información comprimida entre otros.
AUDIO
Los archivos de audio son todos los que
contienen sonidos (no solo música). Las
diferentes extensiones atienden al formato de
compresión utilizado para convertir el sonido real
en digital.
Podcast: archivos de sonido (.ogg o .mp3)
VIDEOLos formatos de video no sólo
contienen imágenes sino también el
sonido que las acompaña. Es
bastante habitual que al intentar
visualizar un vídeo no podamos ver
la imagen aunque sí oigamos el
sonido. Esto es debido al formato
de compresión utilizado en ellos
que puede no ser reconocido por
nuestro ordenador, por ello siempre
se ha de tener actualizados los
codecs de cada uno de los
formatos.
Videos: formatos para archivos de
video (.avi, .mpg, .mov, .ra, .rm).
COMPRIMIDOS
Los formatos de compresión
son de gran utilidad a la hora
del almacenamiento de
información ya que hacen que
esta ocupe el menor espacio
posible y que se puedan reunir
muchos ficheros en uno sólo.
WinZip: archivos comprimidos
con el programa WinZip (.zip).
WinRAR: archivos
comprimidos (.rar).
IMÁGENES
Poco hay que decir de las imágenes y de sus
formatos salvo que cada uno de ellos utiliza un
método de representación y que algunos
ofrecen mayor calidad que otros. También cabe
destacar que muchos programas de edición
gráfica utilizan sus propios formatos de trabajo
con imágenes
Portable Network Graphics: gráficos
portables de red (.png).
GIF: imágenes (.gif).
Tagged Image File Format: formato de
archivo de imágenes etiquetadas (.tiff)
JPG o JPEG: formato de imágenes (.jpeg).
TEXTO
Dentro de los documentos de texto hemos de
diferenciar entre el texto plano y el enriquecido. Es
decir, entre los formatos que sencillamente
guardan las letras (txt, log...) y los que podemos
asignarles un tamaño, fuente, color, etc. (doc)
Los tipos de archivos más utilizados para los
sistemas de información son:
Word: Documentos de texto (.doc).
Excel: Hojas de cálculo (.xls).
Power Point: Presentaciones (.ppt).
TXT: archivos de texto plano (.txt).
METODOS DE ORGANIZACIÓN DE
ARCHIVOS
Todos los registros se almacenan enarchivos a través de la herramienta dela ORGANIZACIÓN que nos indicacomo se almacena, localizan yrecuperan.
A continuación describiremos los trestipos existentes que son:
1) Organización secuencial2) Organización de acceso directo3) Organización indexada
ORGANIZACIÓN SECUENCIAL
Este es el método mas simple de almacenar yrecuperar registros en un archivo, en este sealmacenan los registros uno tras otro sinimportar el valor real de los datos en losregistros.
Este orden nunca cambia y una de suscaracterísticas es que los registros sealmacena por posición: primer registro,segundo, etc., no existen direcciones niasignaciones de lugar en los archivossecuénciales.
ORGANIZACIÓN DE ACCESO
DIRECTO
Con este método de organización el
programa pide al sistema donde
almacenar un registro antes de poderlo
accesar.
Estos registros si poseen llaves
registro físico y se almacenan según
estas y no por posición de ingreso.
DIRECCIONAMIENTO DIRECTO
Este método de almacenamiento utiliza las
llaves de registro para su almacenamiento, el
sistema tiene un lugar reservado para cada uno
de ellos y utiliza la llave de direccionamiento
para dirigirse al lugar asignado.
Lo atractivo de método es que la recuperación
de información es mas rápida
DIRECCIONAMIENTO DIRECTO UTILIZANDO LA
LLAVE DE REGISTRO
DIRECCIONAMIENTO DIRECTO
Este procedimiento debe tener un conjunto de datos con
las siguientes características:
El conjunto de llaves tiene un ascendente con pocos
valores no utilizados (los valores no utilizados son
espacio de almacenamiento desperdiciado). Por lo
tanto, se desean pocos espacios abiertos entre los
valores de las llaves.
DIRECCIONAMIENTO POR HASHING
Cuando no es posible el direccionamiento
directo, pero es necesario el acceso directo
se utiliza el método de acceso Hashing
(transformación de llaves o aleatorizacion),
para obtener una dirección de
almacenamiento a partir de un campo llave
ORGANIZACIÓN INDEXADA
La tercera forma de acceder a los registros es
por medio de un índice. La forma básica del
índice incluye llave de registro y dirección de
almacenamiento de registro.
La búsqueda es mas fácil gracias al índice ya
que es mas sencillo que buscarlo directamente
en el archivo
CARACTERÍSTICAS DE UN INDICE
Cada registro en el índice contiene
únicamente dos datos; una llave de
registro y una dirección de
almacenamiento.
Para encontrar un registro se busca
en el índice la llave de registro
deseado, se ingresa la información al
programa y se dirige al registro
directamente.
LA ORGANIZACIÓN INDEXADA PUEDE
SER:
Secuencial: Que van en orden
ascendente divido por bloques de
almacenamiento con cantidades
especificas
No secuencial: El índice no posee un
orden especifico pero muestra la
información de la ubicación del registro
en el mismo índice
CINTA MAGNÉTICA
CINTA MAGNÉTICA
CINTA MAGNÉTICA
CINTA MAGNÉTICA
DISCOS MAGNÉTICOS
DISCOS MAGNÉTICOS
DISCOS MAGNÉTICOS
DISCOS MAGNÉTICOS
CONCLUSIONES
Después de realizar este trabajo nos hemos dado cuenta
de la gran importancia y del papel tan importante que
representan los archivos. La correcta organización y
almacenamiento de la información nos permite ahorrar
espacio, tiempo, dinero, personal, de igual forma agiliza y
permita que tanto la recuperación y consulta de la
información sea mas fácil y rápido.
BIBLIOGRAFÍA
Diagrama de estructura de datos, disponible en:
http://www.oocities.org/es/avrrinf/tabd/T3/T3.htm
Teoría y administración de bases de datos, disponible en:
http://www.geocities.ws/acrmpos/tabd/t1/t3.html
Terminología Básica de Archivos
http://www.alegsa.com.ar/Diccionario/Cat/51.php
http://es.wikipedia.org/wiki
es.kioskea.net/contents/repar/filesys.php3
Tipos de archivos, disponible en:
http://aprendeenlinea.udea.edu.co/lms/moodle/file.php/464/Modulo1/TiposAr
chivos.pdf
Amaya Amaya, Jairo. Sistemas de información gerenciales: hardware,
software, redes, internet, diseño (2a. Ed.).
Colombia: Ecoe Ediciones, 2010. p 21.
http://site.ebrary.com/lib/bibliojaverianasp/Doc?id=10472672&ppg=39
Copyright © 2010. Ecoe Ediciones. All rights reserved.
Top Related