Temario Capitulo 18-19 Complete

8/15/2019 Temario Capitulo 18-19 Complete

http://slidepdf.com/reader/full/temario-capitulo-18-19-complete 1/4

Universidad Politécnica de Sinaloa Base de datos distribuidas Jesús Alberto Rodríguez Juárez

6-3 Informática


6-3 Informática

TEMARIO DE REPASO CAPITULO 18Ampliabilidad: se refiere al manejo de transacciones más largas mediante el incremento del grado de paralelismo

Ampliabilidad por lotes aumenta el tamaño de la base de datos, y las tareas son trabajos más largos cuyos tiempos de ejecución

dependen del tamaño de la base de datos.

Ampliabilidad de transacciones aumenta la velocidad con la que se envían las transacciones a la base de datos y el tamaño de la

base de datos crece proporcionalmente a la tasa de transacciones.Ampliabilidad lineal. La ampliabilidad se define como TP /TG. Ampliabilidad sublineal. Se dice que el sistema paralelo MG tiene

una ampliabilidad lineal sobre la tarea Q si TP = TG. Si TG > TP.

Ganancia de velocidad: se refiere a la ejecución en menos tiempo de una tarea dada mediante el incremento del grado de

paralelismo.

Ganancia de velocidad lineal. Si la ganancia de velocidad es N cuando el sistema más grande tiene N veces más recursos (UCP,

discos, etc.) que el sistema más pequeño.

Ganancia de velocidad sublineal. Si la ganancia de velocidad es menor que N.

Arquitectura de memoria no uniforme: cada procesador tiene acceso directo a una sola memoria compartida. Todas las

ubicaciones de la memoria son equidistantes (en cuanto a tiempos de acceso) a cada procesador.

Arquitecturas paralelas de bases de datos : existen varios modelos de arquitecturas para las máquinas paralelasMemoria

compartida. Todos los procesadores comparten una memoria común.

Disco compartido. Todos los procesadores comparten un conjunto de discos común (Figura b). Algunas veces los sistemas de disco

compartido se denominan agrupaciones.

Sin compartimiento. Los procesadores no comparten ni memoria ni disco .

Jerárquico. Este modelo es un híbrido de las arquitecturas anteriores .

En un sistema distribuido de bases de datos se almacenala base de datos en varias computadoras.

Datos compartidos. La principal ventaja de construir un sistema distribuido de bases de datos es poder disponer de un entorno

donde los usuarios puedan acceder desde una única ubicación a los

Costes de inicio. El inicio de un único proceso lleva asociado un coste.

Procesos servidor. Son procesos que reciben consultas del usuario (transacciones), las ejecutan, y devuelven los resultados.

Proceso gestor de bloqueos: Este proceso implementa una función de gestión de bloqueos que incluye concesión de bloqueos,

liberación de bloqueos y detección de interbloqueos.

Hebra: Es como un proceso, pero varias hebras se ejecutan como parte del mismo proceso, y todas las hebras dentro de un

proceso se ejecutan en el mismo espacio de memoria virtual. Dentro de un proceso se pueden ejecutar concurrentemente

múltiples hebras.

Proceso escritor de bases de datos: Hay uno o más procesos que vuelcan al disco los bloques de memoria intermedia modificados

de forma continua

Proceso punto de revisión: Este proceso realiza periódicamente puntos de revisión

Proceso monitor de proceso: Este proceso observa otros procesos y, si cualquiera de ellos falla, realiza acciones de recuperación

para el proceso, tales como cancelar cualquier transacción que estuviera ejecutando el proceso fallido, y reinicia el proceso.

Interferencia. Como los procesos que se ejecutan en un sistema paralelo acceden con frecuencia a recursos compartidos, pueden

sufrir un cierto retardo como consecuencia de la interferencia de cada nuevo proceso en la competencia con los procesos

existentes por el acceso a los recursos más comunes, como el bus del sistema, los discos compartidos o incluso los bloqueos. Este

fenómeno afecta tanto a la ganancia de velocidad como a la ampliabilidad.

Paralelismo de grano grueso. Dispone de unos pocos procesadores (normalmente dos o cuatro) que comparten la misma

memoria principal. Las bases de datos que se ejecutan en tales máquinas habitualmente no intentan dividir una consulta simple

entre los distintos procesadores, sino que ejecuta cada consulta en un único procesador posibilitando la concurrencia de varias

consultas. Así, estos sistemas soportan una mayor productividad,

Paralelismo de grano fino. Tienen un gran número de procesadores y los sistemas de bases de datos que se ejecutan sobre ellasintentan hacer paralelas las tareas simples (consultas, por ejemplo) que solicitan los usuarios.

Bus.Todos los componentes del sistema pueden enviar o recibir datos de un único bus de comunicaciones.

El bus puede ser una red Ethernet o una interconexión paralela. Las arquitecturas de bus trabajan bien para un pequeño número

de procesadores el bus sólo puede gestionar la comunicación de un único componente en cada momento, las arquitecturas de bus

son menos apropiadas según aumenta el paralelismo.

Malla. Los componentes se organizan como los nodos de una retícula de modo que cada componente está conectado con todos

los nodos adyacentes. En una malla bidimensional cada nodo está conectado con cuatro nodos adyacentes.

Hipercubo. Se asigna a cada componente un número binario de modo que dos componentes tienen una conexión directa si sus

correspondientes representaciones binarias difieren en un solo bit.

SESGO: Al dividir cada tarea en un cierto número de pasos paralelos se reduce el tamaño del paso medio. Por ejemplo, si se divide

una tarea de tamaño 100 en 10 partes y la división está sesgada.

SERVIDOR DE DATOS: Son servidores de área local en las cuales alcanzan velocidades altas. se puede acceder a ellos desde

terminales o equipos.




6-3 Informática


6-3 Informática

Caché de bloqueos: Los bloqueos también pueden ser almacenados en la memoria caché del cliente si la utilización de los datos

está prácticamente dividida entre los clientes, de manera que un cliente rara vez necesita datos que están siendo utilizados por

otros clientes.

CACHÉ DE DATOS:Los datos que se envían al cliente en favor de una transacción se pueden alojar en una caché del cliente incluso

una vez completada la transacción, si dispone de suficiente espacio de almacenamiento libre.

SERVIDORES DE TRANSACCIONES: tienen múltiples procesos, ejecutándose posiblemente en múltiples procesadores,dado que

estos procesos tienen acceso a los datos comunes, como la memoria intermedia de la base de datos, los sistemas almacenan

dichos datos en memoria compartida.

SISTEMAS CLIENTE-SERVIDOR Los terminales conectados a un sistema central han sido suplantados por computadoras

personales. De igual forma, la interfaz de usuario, que solía estar gestionada directamente por el sistema central, está pasando a

ser gestionada, cada vez más, por las computadoras personales.

SISTEMAS CENTRALIZADOS: poseen memorias caché locales donde se almacenan copias de ciertas partes de la memoria para

acelerar el acceso a los datos.

SISTEMAS DISTRIBUIDOS: se almacena la base de datos en varias computadoras. Varios medios de comunicación, como las redes

de alta velocidad o las líneas telefónicas, son los que pueden poner en contacto las distintas computadoras de un sistema

distribuido. No comparten ni memoria ni discos.

SISTEMAS CENTRALIZADOS: Poseen memorias caché locales donde se almacenan copias de ciertas partes de la memoria para

acelerar el acceso a los datos.

Sistemas en paralelo. Los sistemas paralelos mejoran la velocidad de procesamiento y de E/S mediante la utilización de UCP y

discos en paralelo de procesamiento y de E/S mediante la utilización de UCP y discos en paralelo. El procesamiento paralelo se

realizan muchas operaciones simultáneamente.

Tiempo de Respuesta. El buen rendimiento de los sistemas interactivos de transacciones.

Sistemas de servidores. Los sistemas servidores pueden dividirse en servidores de transacciones y servidores de datos:

Servidores de Transacciones:Porcionan una interfaz a través de la cual los clientes pueden enviar peticiones para realizar una

acción que el servidor ejecutará y cuyos resultados se devolverán al cliente.

Servidores de datos:

Permiten a los clientes interaccionar con los servidores realizando peticiones de lectura o modificación de datos en unidades tales

como archivos o páginas.

Tipos de redes. Las redes de área local (LANs, Local Area Networks) surgen a principios de los 70 como una forma de

comunicación y de compartimiento de datos entre varias computadoras.

Las redes de área amplia (WAN, Wide Area Networks) Surge como un proyecto de investigación académica para proporcionar una

comunicación eficiente entre varios lugares permitiendo que una gran comunidad de usuarios pudiera compartir hardware y

software de una manera conveniente y económica.

Una red de área de almacenamiento (SAN, Storage-Area Network) es un tipo especial de red de área local de alta velocidaddestinada a conectar numerosos bancos de dispositivos de almacenamiento (discos) a las computadoras que utilizan los datos.

Tolerancia ante fallos. la capacidad de un sistema de acceder a la información, aun en caso de producirse algún fallo o anomalía

en el sistema.

TEMARIO DE REPASO CAPITULO 19

Algoritmo luchador. Si no hay ningún sitio activo con un número más elevado, el sitio que se ha recuperado obliga a todos los

sitios con números más bajos a permitirle transformarse en el sitio coordinador, aunque ya haya un coordinador activo con un

número más bajo.

Algoritmo de selección. El ordenamiento por selección (Selection Sort en inglés) es unalgoritmo de ordenamiento que

requiere O operaciones para ordenar una lista de n elementos.Alias. Conjunto de nombres alternativos o alias para los elementos de datos

Árboles distribuidos de directorio. La información sobre las organizaciones puede hallarse dividida entre varios AIDs, cada uno de

los cuales almacena información sobre algunas entradas.

Autonomía. La principal ventaja de compartir datos por medio de distribución de datos es que cada ubicación es capaz de

mantener un grado de control sobre los datos que se almacenan localmente.

Las bases de datos distribuidas heterogéneas. permiten que cada sitio tenga sus propios esquemas y código de sistema de bases

de datos.

En las bases de datos distribuidas homogéneas todos los sitios tienen idéntico software de sistemas gestores de bases de datos,

son conscientes de la existencia de los demás sitios y acuerdan cooperar en el procesamiento de las solicitudes de los usuarios

Estrategia de semireunion. Es otra estrategia que a veces mejora los resultados, Se basa en transferir solamente las

tuplas y atributos

Una estrategia posible para lograr todo esto es la siguiente:

1. Calcular temp1 ← ΠR1 ∩ R2 (r1) en S1.2. Enviar temp1 de S1 a S2.

3. Calcular temp2 ←r2 temp1 en S2.




6-3 Informática


6-3 Informática

4. Enviar temp2 de S2 a S1. 5. Calcular r1 temp2 en S1. La relación resultante es la misma que r1 r2.

Fragmentación de los datos. Si la relación r se fragmenta, r se divide en varios fragmentos r1, r2, . . . , rn. Estos fragmentos

contienen suficiente información como para permitir la reconstrucción de la relación original r

La fragmentación horizontal divide la relación asignando cada tupla de r en uno o más fragmentos.

La fragmentación vertical divide la relación descomponiendo el esquema R de la relación r.

Gestor distribuido de bloqueos. la función de gestor de bloqueos se halla distribuida entre varios sitios.

Gestor único de bloqueos. El sistema mantiene un único gestor de bloqueos que reside en un sitio único escogido (digamos Si ).

Gestor de transacciones. Asegura que la base de datos quede en un estado consistente (correcto) a pesar de los fallos del

sistema, y que las ejecuciones de transacciones concurrentes ocurran si conflictos.

Instantánea consistente con las transacciones. Permite mejor rendimiento que serializabilidad, sin embargo aún evita la mayoría

de las anomalías de la concurrencia que serializabilidad evita (pero no siempre todas).

Marcas Temporales. se concede a cada transacción una marca temporal única que el sistema utiliza para decidir el orden de

secuenciación.

Mediadores .Son sistemas que integran varios orígenes de datos heterogéneos, proporcionan una vista global integrada de los

datos y ofrecen facilidades de consulta en el sistema global.

Mensajería Persistente. Los mensajes persistentes (que está garantizado que se entregan exactamente una vez,

independientemente de los fallos) se envían a los sitios remotos para solicitar que se emprendan acciones en ellos.

Modalidades de los fallos del sistema. Los tipos básicos de fallos son:• Fallo de un sitio • Pérdida de mensajes • Fallo de un enlace

de comunicaciones • División de la red, La pérdida o deterioro de los mensajes siempre constituye una posibilidad en los sistemas

distribuidos.

Procesamiento distribuido de consultas. Para los sistemas centralizados el criterio principal para medir el coste de una estrategia

dada es el número de accesos a disco. En los sistemas distribuidos hay que tener en cuenta varios asuntos más, entre los que se

incluyen • El coste de la transmisión de los datos por la red • La ganancia potencial en rendimiento si se hace que varios sitios

procesen en paralelo partes de la consulta

Propagación perezosa. Permiten que continúe el procesamiento de las transacciones (incluidas las actualizaciones) aunque un

sitio quede desconectado de la red, lo que mejora la disponibilidad, pero, por desgracia, lo hacen a costa de la consistencia.

El protocolo de acceso ligero a directorios LDAP (Lightweight Directory Access Protocol). los sistemas de directorios se

implementan como uno o varios servidores que atienden a varios clientes.

Árboles distribuidos de directorio. La información sobre las organizaciones puede hallarse dividida entre varios AIDs, cada uno de

los cuales almacena información sobre algunas entradas.

Nombre distinguido (ND). En LDAP los directorios almacenan entradas, que son parecidas a los objetos. Cada entrada debe tener

un nombre distinguido (ND), que identifica de manera única esa entrada.

Nombres distinguidos relativos. Los ND, a su vez, está formado por una secuencia de nombres distinguidos relativos (NDR).

Compromiso de dos fases (C2F). Durante el funcionamiento normal, luego describe el modo en que maneja los fallos y,finalmente, la manera en que ejecuta la recuperación y el control de la concurrencia.

Estado de preparación (El protocolo de compromiso). Cuando T completa su ejecución (es decir, cuando todos los sitios en los que

se ha ejecutado T informan a Ci de que T se ha completado) Ci inicia el protocolo C2F. Fase 1 Añade, fase 2 prepara.

Problema del bloqueo. Si el coordinador falla durante la ejecución del protocolo de compromiso para la transacción T, los sitios

participantes deben decidir el destino de T.

Transacciones dudosas. Son transacciones para las que no se encuentra ningún registro < T preparada>, ni en el registro histórico.

Protocolo de compromiso de tres fases (C3F). Es una extensión del protocolo de compromiso de dos fases que evita el problema

del bloqueo con determinadas suposiciones.

Protocolo de compromiso. Si hay que asegurar la atomicidad, todos los sitios en los que se ejecute una transacción T deben

coincidir en el resultado final de la ejecución. T debe comprometerse en todos los sitios o abortarse en todos los sitios.

Protocolos para las réplicas. Si la relación r se replica, se guarda una copia de dicha relación en dos o más sitios.

Copia principal. Para cada elemento de datos Q la copia principal de Q debe residir exactamente en un sitio.

Protocolo de consenso de quórum. Es una generalización del protocolo de mayoría. El protocolo de consenso de quórum asigna acada sitio un peso no negativo.

Base de datos virtual. Se utiliza para hacer referencia a los sistemas de varias bases de datos o a los sistemas mediadores.

Control de Concurrencia. El término concurrencia se refiere al hecho de que los DBMS (Sistemas de Administración de Bases de

Datos) permiten que muchas transacciones accedan a una misma base de datos a la vez. Como bien es sabido, en un sistema de

éstos se necesita algún tipo de mecanismo de control de concurrencia para asegurar que las transacciones concurrentes no

interfieran entre sí.

Coordinador suplente. Es un sitio que, además de otras tareas, mantiene de manera local suficiente información como para

permitirle asumir el papel de coordinador con un perjuicio mínimo al sistema distribuido.

Coordinador de transacciones. Coordina la ejecución de las diferentes transacciones (tanto locales como globales) iniciadas en ese

sitio.

Disponibilidad. Si un sitio de un sistema distribuido falla, los sitios restantes pueden seguir trabajando.

• División de la red. Cuando una red queda dividida caben dos posibilidades:

1. El coordinador y todos los sitios participantes siguen en una de las particiones

2. El coordinador y los participantes quedan en varias particiones.




6-3 Informática


6-3 Informática

Protocolo de mayoría. Funciona de la manera siguiente. Si el elemento de datos Q se replica en n sitios diferentes se debe enviar

un mensaje de solicitud de bloqueo a más del 50 por 100 de los n sitios en los que se almacena Q.

Protocolo de sesgado. Concede un tratamiento más favorable a las solicitudes de bloqueos compartidos que a las solicitudes de

bloqueos exclusivos.

Referencia.. Explicación o relación de un acontecimiento que se hace de palabra o por escrito.

Replica de datos. Si la relación r se replica, se guarda una copia de dicha relación en dos o más sitios.

Réplica maestro-esclavo. La base de datos permite las actualizaciones en el sitio principal y las propaga de manera automática a

las réplicas de los demás sitios.

Réplica multimaestro (también denominada réplica de actualización distribuida). Se permiten las actualizaciones en cualquier

réplica de los elementos de datos y se propagan de manera automática a todas las réplicas.

Robustez. La capacidad de continuar funcionando incluso durante los fallos.

Enfoque basado en la mayoría. Puede modificarse para que funcione a pesar de los fallos.

Protocolo leer uno, escribir todos. Ya que hay que escribir todas las réplicas.

Protocolo lectura de uno, escritura de todos los disponibles. En este enfoque las operaciones de lectura se llevan a cabo como en

el esquema leer uno, escribir todos; se puede leer cualquier réplica disponible y se obtienen un bloqueo de lectura sobre esa

réplica.

Reintegración al sistema de los sitos o de los enlaces reparados. Exige la adopción de precauciones. Cuando se recupera un sitio

que ha fallado, debe iniciar un procedimiento para actualizar sus tablas del sistema para que reflejen las modificaciones realizadas

mientras estaba fuera de servicio.

Selección de coordinador. Si el coordinador falla debido a un fallo del sitio en el que reside el sistema, sólo puede continuar la

ejecución reiniciando un nuevo coordinador en otro sitio. Servidor de nombres. Ayuda a asegurar que el mismo nombre no se

utilice para elementos de datos diferentes.

Sistema de varias bases de datos. Una base de datos federada es un sistema en el que varias bases de datos parecen funcionar

como una sola entidad.

Sistemas de directorio. Pueden considerarse una modalidad especializada de base de datos en la que la información se organiza

de manera jerárquica parecida al modo en que los archivos se organizan en los sistemas de archivos.

El sufijo de los AIDs .Es una secuencia de pares RDN=valores (RDN, Relative Distinguished Name, nombre relativo distinguido) que

identifica la información que almacena cada AID; los pares están concatenados con el resto del nombre distinguido generado

recorriendo el árbol desde la entrada hasta la raíz.

Transacciones distribuidas. El acceso a los diferentes elementos de datos en los sistemas distribuidos suele realizarse mediante

transacciones, que deben preservar las propiedades ACID.

Transacciones locales. Son las que tienen acceso a los datos y los actualizan sólo en una base de datos local.

Transacciones globales. Son las que tienen acceso a datos y los actualizan en varias bases de datos locales.

Transparencia de los datos. No se debe exigir a los usuarios de los sistemas distribuidos de bases de datos que conozcan laubicación física de los datos ni el modo en que se puede tener acceso a ellos en un sitio local concreto.

Transparencia de la fragmentación. No se exige a los usuarios que conozcan el modo en que se ha fragmentado la relación.

Transparencia de la réplica. Los usuarios ven cada objeto de datos como lógicamente único.

Transparencia de la ubicación. No se exige a los usuarios que conozcan la ubicación física de los datos.

Tratamiento de los interbloqueos. La prevención de interbloqueos puede dar lugar a esperas y retrocesos innecesarios.

Grafos locales de espera. Se crean de la manera habitual para las transacciones y los elementos de datos locales. Cuando una

transacción Ti en el sitio S1 necesita un recurso del sitio S2, envía un mensaje de solicitud al sitio S2.

Grafo global de espera. La unión de todos los grafos locales.

Temario Capitulo 18-19 Complete

Documents

Transcript of Temario Capitulo 18-19 Complete