Post on 14-Dec-2014
description
“ Conceptos Básicos de Archivos”
Instituto Tecnológico de HermosilloInstituto Tecnológico de Hermosillo
Unidad I: “Conceptos Básicos de Archivos” Organización de Datos
Al igual que en otras disciplinas la información se esquematiza como un sistema de Entrada, Proceso y Salida.
En donde los datos (entrada) son el insumo que requieren del procesamiento (proceso) para producir la Información (salida).
Unidad I: “Conceptos Básicos de Archivos” Organización de Datos
Entrada de Datos
Procesamiento de Datos
Salida de Información
Unidad I: “Conceptos Básicos de Archivos” Organización de Datos
Datos: Sucesos, hechos, eventos que son REGISTRADOS a través de medición (cuantitativa o cualitativa), observación, etc.
Información: Son datos manipulados o procesados que son presentados de manera adecuada a los usuarios para servir de soporte a la toma de decisiones (organizaciones) con las características de Exactitud, Relevancia y Oportunidad
Unidad I: “Conceptos Básicos de Archivos” Organización de Datos
• Capacitación.
•Captura.
•Registro.
• Ordenamiento.
• Op. Aritméticas.
• Op. Lógicas.
• Presentaciones de Reportes.
• Condensados.
• Consultas.
• Sumarios
• Usuarios Directos.
•Usuarios Indirectos
Unidad I: “Conceptos Básicos de Archivos” Organización de Datos
Tipo de Datos Estructura de Datos Organización de Archivos
Primitivos
Compuestos
Simple Compuesto
Entero Arreglo Lineal No lineal
Secuencial
Booleano Registro Cola Árbol Binario
Relativo
Carácter Cadena Pila B-Tree Indexado
Real Lista B+Tree Multillave
Árbol General
Unidad I: “Conceptos Básicos de Archivos” Organización de Datos
Campo: Los datos pueden ser representados por números y caracteres, de tal manera que un dato como el nombre de un empleado, el número de control de un alumno o un precio pueden ser identificados por un elemento que se le llama campo, entonces obtendríamos los campos, nombre, control y precio.
Registro: Un registro es el conjunto completo de datos relacionados pertenecientes a una entrada, tal como un cheque bancario. Al ser considerado como una unidad única, el cheque bancario es, por lo tanto, un registro que consta de 7 campos separados, todos ellos relacionados con la transacción de pago.
Archivo: Un archivo es una colección de registros relacionados. Se incluye cada registro en un archivo ya que pertenece a la misma entidad. Por ejemplo un archivo de cuentas está formado solamente por las cuentas de los clientes.
Unidad I: “Conceptos Básicos de Archivos” Organización de Datos
En computación el término Archivo tiene varios significados y clasificaciones:
Archivos de texto: secuencia de caracteres (ASCII).
Archivos de datos: Son estructurados, o también conocido como FORMATEADOS ( con comas, espacios fijos puntos y comas etc.)
Unidad I: “Conceptos Básicos de Archivos” Organización de Datos
Archivo Maestro: Contiene los datos que representan el estado actual de una organización o empresa.
Archivo Trabajo: Son los archivos auxiliares utilizados por los programas y que son regularmente borrados por estos una vez que son utilizados. Se dice que son transparentes para el usuario.
Archivo Respaldo: Es una copia obtenida del archivo maestro con el sentido de proteger los datos en caso de que el maestro se deteriore.
Archivo Fuente: Contiene el código de algún lenguaje de programación que utiliza los datos para procesarlos en alguna solución para la empresa
Archivo de Transacciones: También es auxiliar en el proceso de Actualización del archivo maestro (siempre y cuando sea archivo Secuencial).
Unidad I: “Conceptos Básicos de Archivos” Organización de Datos
Archivos de Entrada (input): Son los archivos que “alimentan” un procesamiento de datos, o sea solo son leídos, ejemplo: El archivo de transacciones en el procesamiento de la actualización del maestro en la organización secuencial.
Archivos de Salida (output): son los archivos que solo son escritos, y son donde los datos de salida de un procesamiento son escritos. Ejemplo el archivo de transacciones rechazadas en la actualización del maestro en la organización secuencial.
Archivo de Entrada/Salida (input/output): Estos archivos son leídos y escritos en el procesamiento de datos, o sea proporcionan los datos de entrada al proceso y también los datos procesados son escritos en el mismo. Ejemplo los archivos directos implementados en dispositivos de acceso aleatorio, presentan esta característica.
Unidad I: “Conceptos Básicos de Archivos” Organización de Datos
Archivos Secuenciales: (datos en forma contigua, se puede guardar tanto cinta, como en discos magnéticos, impractico para el acceso directo de un dato)
Archivos Directos: Necesitan se guardados en dispositivos de acceso directo( disco, etc.) , el acceso directo a un solo dato si puede ser efectuado.
Archivos Indexados: También se puede conseguir el acceso directo a un dato especifico sobre un archivo secuencial que es el de datos, aunque se requiere para hacerlo de un archivo auxiliar llamado índice.
Archivos Multillave: El acceso directo puede realizarse con características distintas de los datos, para hacerlo requiere de varios índices organizados en un archivo.
Unidad I: “Conceptos Básicos de Archivos” Organización de Datos
Creación: Esta operación hace “nacer” un archivo con los datos que son escritos por algún procesamiento. Existen dos formas: Cargado de registros y Creación de estructura(esqueleto) previa al guardado de datos.
Actualización: Es el procesamiento en el cual los registros pueden tener las siguientes modificaciones: baja o eliminación de registros de datos, modificación de registros de datos o Alta o agregación de registros.
Mantenimiento: Es el proceso que permite agregar, modificar o eliminar CAMPOS del archivo. Existen dos tipos de mantenimiento: Reorganización: cambiar la organización a otra. Reestructuración: cambios con los tipos y/o tamaños de
campos Recuperación: Es el acceso a un archivo con el propósito de
extracción de información, si el volumen a extraer es bajo se dice que es una consulta y normalmente se despliega por pantalla, su modo de procesamiento es interactivo. Si el volumen es alto, es la generación de reportes, el modo de procesamiento
es en Lote.
Unidad I: “Conceptos Básicos de Archivos” Organización de Datos
Volatilidad: se refiere a las supresiones, adiciones y cambios que se efectúan en un periodo determinado. Cuando se acceda a un archivo varias veces en una jornada, se dice que tiene elevada volatilidad. Ejemplo: sistemas de reservación, bancos, etc.
Actividad: Es la medida de proporción de registros que se accedan en un lote de actualización. La proporción de actividad es igual al numero de registros procesados en un Lote, comparado con el numero de registros total del archivo.
Tamaño: Se refiere al espacio ocupado por el archivo en el medio de almacenamiento. Debe considerarse no solo la ocupación actual del archivo sino también la posibilidad de un crecimiento futuro.
Unidad I: “Conceptos Básicos de Archivos” Organización de Datos
Abrir: Esta operación permite tener acceso posteriormente a los registros de datos para acceder.
Cerrar: esta operación busca proteger los datos de los archivos a posibles accesos por error.
Leer registro: Esta operación de lectura lleva información (bloque de datos) del registro leído en el medio de almacenamiento a la memoria.
Grabar registro: Esta operación lleva un (bloque de datos) registro de la memoria hasta el medio de almacenamiento.
Saltar al registro N: Esta operación lleva el puntero hasta un registro especifico (N). Solo para archivos organizados directos.
Reinicio de apuntador: esta operación lleva el apuntador a hasta el inicio del archivo.
Unidad I: “Conceptos Básicos de Archivos” Organización de Datos
El registro es un tipo de dato estructurado constituido por un conjunto de elementos (campos) que pueden ser de diferentes tipos de datos, ejemplo:
Registro: empleado Elementos del registro empleado: Numero (Entero) Nombre (Cadena[30]) Departamento (Entero) Puesto (Entero) Sueldo (Real)Definición de registros: Declaraciones Variables NomRegistro: Registro Dato1: Tipo de dato Dato2: Tipo de dato . DatoN: Tipo de dato FinRegistro
Unidad I: “Conceptos Básicos de Archivos” Organización de Datos
Abrir archivo Escritura “X”Leer datos A , BDO ESCRIBIR REGISTRO CON DATOS A Y B EN EL ARCHIVO “X” Leer datos A, BWHILE A <> 0 El siguiente algoritmo permite agregar registro a un archivo previamente
creado: Abrir archivo Agregación “X” Leer datos A , B DO AGREGAR REGISTRO CON DATOS A Y B EN EL ARCHIVO “X” Leer datos A, B WHILE A <> 0
Unidad I: “Conceptos Básicos de Archivos” Organización de Datos
INICIOAbrir el archivo para lectura X.LEER REGISTRO DEL ARCHIVO. WHILE no sea fin de archivo 1. IF es una bandera de control THEN A. Imprimir resumen y
pie de página 2. ENDIF 3. Imprimir detalle para este registro 4. Acumular a totales 5. Leer siguiente registro DEL ARCHIVOENDWHILEImprimir resumen y pie de páginaFin
Unidad I: “Conceptos Básicos de Archivos” Organización de Datos
Al estar utilizando un archivo secuencial como MAESTRO, el realizar las operaciones de actualización se llevará con el auxilio de un archivo de transacciones, debido a que se realizará el proceso en lote para que sea mas eficiente. El proceso se muestra en la siguiente figura:
Archivos Transaccion
es Modificado
Archivo Maestro Nuevo
Archivo Maestro
Viejo
Archivo Transaccion
es Rechazadas
Actualización
Unidad I: “Conceptos Básicos de Archivos” Organización de Datos
Abrir archivo Lectura “X”Colocar puntero al inicio del archivoSolicitar Numero registro a buscarLeer NMover puntero hasta registro NIF existe Registro THEN Leer Registro Datos en el archivo en
REG |Imprimir REGelse Imprimir “no se encontró el registro
buscado”endiffin
Unidad I: “Conceptos Básicos de Archivos” Organización de Datos
La transmisión de información entre memoria primaria y secundaria se lleva a cabo a través de operaciones básicas de lectura y escritura de registros pero con unidades de tamaño fijo denominados lotes, de tal manera que se pueden definir de la siguiente manera:
Bloque: Es la cantidad más pequeña de datos que puede ser transferida entre memoria secundaria y primaria en un acceso a un archivo.
Unidad I: “Conceptos Básicos de Archivos” Organización de Datos
Los datos son arreglados de acuerdo a alguna relación abstracta, esto es, depende de la aplicación requerida. El usuario siempre ve el archivo como una secuencia de registro continuo o elementos lógicos.
Los registros pueden ser de longitud fija o longitud variable, los cuales pueden tener llave o no tenerla, los registros fijos son elementos lógicos del mismo tamaño, y los registros variables son elementos lógicos de diferentes tamaños.
La longitud fija en el tamaño del campo produce un desperdicio de espacio, pero en cambio facilita la localización y extracción de la información en dicho campo, al no tener que preocuparse por su tamaño.
Unidad I: “Conceptos Básicos de Archivos” Organización de Datos
En el caso de longitud variable sucede al revés, hay un mejor aprovechamiento en espacio, pero se complica la localización y extracción de información.
· Si el registro contiene un número fijo de campos de longitud fija cada uno de ellos, entonces será de longitud fija.
· Si el registro contiene un número variable de campos de longitud fija cada uno de ellos, entonces será de longitud variable.
· Si el registro contiene un número variable de campo en que alguno de ellos sea de longitud variable, entonces será de longitud variable.
Unidad I: “Conceptos Básicos de Archivos” Organización de Datos
Los datos son arreglados por su adyacencia física, esto es, dependiente del dispositivo de almacenamiento secundario; cintas magnéticas o discos magnéticos (discos flexibles, discos duros, paquete de disco, etc.). Los registros son de tamaño fijo o tamaño variable y pueden organizarse de varia formas para constituir archivos físicos.
Unidad I: “Conceptos Básicos de Archivos” Organización de Datos
En este dispositivo el archivo físico está formado por un conjunto de registros físicos, los bloques están organizados en forma contigua, ya que se asignan en forma consecutiva.
La cinta magnética es uno de los medios más conocidos y menos caros de almacenar datos en sistemas de todos los tamaños. Este método de almacenamiento secundario de archivos tiene ventajas y desventajas específicas que se deben superar.
Los datos se almacenan a lo largo de la superficie de la cinta en una densidad específica, medida en bytes/pulgada (bpi). La densidad estándar del registro se mide por el número de bpi. La densidad de los sistemas de red principal es de 1600 y 6250 bpi.
Unidad I: “Conceptos Básicos de Archivos” Organización de Datos
La densidad de registros de una unidad de cinta magnética es fija y no se puede alterar, pero muchos modelos tienen la opción de almacenar en dos tipos de densidad distintas.
Los datos se leen o se miden en la cinta en bloques de registros físicos y solo cuando la cinta se mueve hacia delante, a través de la unidad de cinta, esta pasa por la cabeza de lectura y escritura de la unidad. La cinta, para y recomienza cuando el sistema le dice ala unidad cinta que lea el siguiente registro físico.
Con el fin de permitir un espacio para que la unidad de cinta se detenga y recomience el movimiento de la cinta sin perder datos, se utiliza espacios entre los bloques para separar cada bloque. Un espacio entre los bloques (también llamado espacio entre los registros) es un longitud de cinta en blanco que mide 0.3 pulgadas.
Unidad I: “Conceptos Básicos de Archivos” Organización de Datos
Para hacer un mejor uso del espacio de almacenamiento, usualmente los analistas en sistemas reducen el número de los espacios necesarios entre los lotes mediante la creación de bloques.
Cada registro físico, ya sea que contenga 1 byte de datos o una entidad mucho mayor, es precedido y seguido por un espacio entre los bloques.
La creación de bloques ocurre cuando el sistema almacena varios registros lógicos dentro de un único registro físico. El número de registro en el bloque se llama factor de bloqueo. Si almacenar un archivo de registros médicos en una cinta magnética, el analista especifica un factor de 30, el sistema almacenará 30 registros lógicos dentro de cada bloque.
Todos los bloques en un archivo de cinta magnética utilizan el mismo factor de bloqueo. Así, si un bloque es registrado con un factor de 30, todos juntan en bloques de 30.un bloque puede ser tan grande como sea necesario, siempre que se pueda leer en la memoria principal aun tiempo.
La longitud máxima de cualquier bloque esta determinada, por el
número que puede contener el buffer.
Unidad I: “Conceptos Básicos de Archivos” Organización de Datos
Los datos se escriben o se leen de los discos solo cuando esta girando dentro de la unidad de disco. La rotación del disco varía de aproximadamente 200 a varios miles de revoluciones por minuto, dependiendo del drive que se utilice
Las cabezas de lectura y escritura detectan en forma electrónica los datos almacenados en la superficie del disco. Normalmente, las cabezas de lectura y escritura son parte del drive, sin embargo en los sistemas Winchester, las cabezas vienen sellados en el mismo paquete del disco para mejorar la velocidad de acceso.
Los datos se almacenan en la superficie del disco en una o mas pistas, que son círculos concéntricos con una capacidad fija de almacenamiento medido en bytes con pista. Los disquetes pequeños tienen menos de 34 pistas por superficie, mientras que los grandes tienen varios cientos de pistas por superficie. Cada pista se identifica mediante un número (desde 0 en orden ascendente con movimientos de 1) y un número de superficie.
Unidad I: “Conceptos Básicos de Archivos” Organización de Datos
Las cabezas de lectura y escritura en un disco están instaladas juntos.
Las cabezas en cada superficie pueden accesar una sola pista en esa superficie. Por lo tanto, si existen 20 superficies en un paquete de disco, el sistema puede escribir o leer de cualquiera de las 20 pistas. Cuando el brazo de acceso se posiciona. Las pistas identificadas con el mismo número forman lo que se conoce como un cilindro.
Para accesar aun registro específico, el programa debe terminar y especificar el cilindro y superficie donde se encuentra el registro.
Este concepto es un aspecto importante de los dos métodos de direccionamiento utilizadas en dispositivos de acceso directo:
Direccionamiento de pista y de sector.
Unidad I: “Conceptos Básicos de Archivos” Organización de Datos
La forma de direccionamiento de uso más común en la computadoras grandes utiliza el concepto de direccionamiento, pista /cilindro.
Punto Índice: La distribución general de una pista bajo el concepto de pista /cilindro, consiste de un punto índice, dirección inicial, registro descriptor de la pista y registro de datos. El punto índice señala el comienzo de una pista, todas las pistas del disco están sincronizadas con el punto índice.
Dirección Inicial: Durante la inicialización, el sistema escribe la dirección inicial y la pista.
Si por alguna razón el sistema no se puede escribir una dirección inicial, el dispositivo no se puede utilizar. La dirección inicial consta de 4 datos.
· El byte bandera indica si la pista es una pista primaria o alternativa.
· El cilindro y más número de carga de lectura y escritura identifican juntos una pista específica en el disco, característica esencial para los métodos de direccionamiento directo y por hashing.
· Los bytes de verificación son par la detección de errores.
Unidad I: “Conceptos Básicos de Archivos” Organización de Datos
Es el registro descriptor de la misma, el cual describe como se organizan los datos de la parte restante de la misma. Se incluyen nueve datos. Bytes bandera, número de cilindros, número de cabeza de lectura y escritura, se repiten en el registro descriptor. Ya que en caso de que surja la necesidad, se puedan mover los datos de una pista primaria a una alternativa.
El número de registro es el número secuencial del registro en la pista.
Los números de cilindro, cabeza y registro conforman la identificación del registro, la cual distingue un registro en un disco de otro y, junto con los detalles de longitud de los datos, describe el área tomada en cuenta.
El byte de longitud de la llave y los bytes de longitud de los datos describe la cantidad de espacio abarcado por cada registro. Los bytes de longitud de los datos son instrumentos para almacenar los registros de longitud variable, los bytes de verificación son para control de errores.
Unidad I: “Conceptos Básicos de Archivos” Organización de Datos
Regresar a Índice de Unidades