Temario Capitulo 18-19 Complete
-
Upload
alberto-r-juarez -
Category
Documents
-
view
218 -
download
0
Transcript of Temario Capitulo 18-19 Complete
8/15/2019 Temario Capitulo 18-19 Complete
http://slidepdf.com/reader/full/temario-capitulo-18-19-complete 1/4
Universidad Politécnica de Sinaloa Base de datos distribuidas Jesús Alberto Rodríguez Juárez
6-3 Informática
Universidad Politécnica de Sinaloa Base de datos distribuidas Jesús Alberto Rodríguez Juárez
6-3 Informática
TEMARIO DE REPASO CAPITULO 18Ampliabilidad: se refiere al manejo de transacciones más largas mediante el incremento del grado de paralelismo
Ampliabilidad por lotes aumenta el tamaño de la base de datos, y las tareas son trabajos más largos cuyos tiempos de ejecución
dependen del tamaño de la base de datos.
Ampliabilidad de transacciones aumenta la velocidad con la que se envían las transacciones a la base de datos y el tamaño de la
base de datos crece proporcionalmente a la tasa de transacciones.Ampliabilidad lineal. La ampliabilidad se define como TP /TG. Ampliabilidad sublineal. Se dice que el sistema paralelo MG tiene
una ampliabilidad lineal sobre la tarea Q si TP = TG. Si TG > TP.
Ganancia de velocidad: se refiere a la ejecución en menos tiempo de una tarea dada mediante el incremento del grado de
paralelismo.
Ganancia de velocidad lineal. Si la ganancia de velocidad es N cuando el sistema más grande tiene N veces más recursos (UCP,
discos, etc.) que el sistema más pequeño.
Ganancia de velocidad sublineal. Si la ganancia de velocidad es menor que N.
Arquitectura de memoria no uniforme: cada procesador tiene acceso directo a una sola memoria compartida. Todas las
ubicaciones de la memoria son equidistantes (en cuanto a tiempos de acceso) a cada procesador.
Arquitecturas paralelas de bases de datos : existen varios modelos de arquitecturas para las máquinas paralelasMemoria
compartida. Todos los procesadores comparten una memoria común.
Disco compartido. Todos los procesadores comparten un conjunto de discos común (Figura b). Algunas veces los sistemas de disco
compartido se denominan agrupaciones.
Sin compartimiento. Los procesadores no comparten ni memoria ni disco .
Jerárquico. Este modelo es un híbrido de las arquitecturas anteriores .
En un sistema distribuido de bases de datos se almacenala base de datos en varias computadoras.
Datos compartidos. La principal ventaja de construir un sistema distribuido de bases de datos es poder disponer de un entorno
donde los usuarios puedan acceder desde una única ubicación a los
Costes de inicio. El inicio de un único proceso lleva asociado un coste.
Procesos servidor. Son procesos que reciben consultas del usuario (transacciones), las ejecutan, y devuelven los resultados.
Proceso gestor de bloqueos: Este proceso implementa una función de gestión de bloqueos que incluye concesión de bloqueos,
liberación de bloqueos y detección de interbloqueos.
Hebra: Es como un proceso, pero varias hebras se ejecutan como parte del mismo proceso, y todas las hebras dentro de un
proceso se ejecutan en el mismo espacio de memoria virtual. Dentro de un proceso se pueden ejecutar concurrentemente
múltiples hebras.
Proceso escritor de bases de datos: Hay uno o más procesos que vuelcan al disco los bloques de memoria intermedia modificados
de forma continua
Proceso punto de revisión: Este proceso realiza periódicamente puntos de revisión
Proceso monitor de proceso: Este proceso observa otros procesos y, si cualquiera de ellos falla, realiza acciones de recuperación
para el proceso, tales como cancelar cualquier transacción que estuviera ejecutando el proceso fallido, y reinicia el proceso.
Interferencia. Como los procesos que se ejecutan en un sistema paralelo acceden con frecuencia a recursos compartidos, pueden
sufrir un cierto retardo como consecuencia de la interferencia de cada nuevo proceso en la competencia con los procesos
existentes por el acceso a los recursos más comunes, como el bus del sistema, los discos compartidos o incluso los bloqueos. Este
fenómeno afecta tanto a la ganancia de velocidad como a la ampliabilidad.
Paralelismo de grano grueso. Dispone de unos pocos procesadores (normalmente dos o cuatro) que comparten la misma
memoria principal. Las bases de datos que se ejecutan en tales máquinas habitualmente no intentan dividir una consulta simple
entre los distintos procesadores, sino que ejecuta cada consulta en un único procesador posibilitando la concurrencia de varias
consultas. Así, estos sistemas soportan una mayor productividad,
Paralelismo de grano fino. Tienen un gran número de procesadores y los sistemas de bases de datos que se ejecutan sobre ellasintentan hacer paralelas las tareas simples (consultas, por ejemplo) que solicitan los usuarios.
Bus.Todos los componentes del sistema pueden enviar o recibir datos de un único bus de comunicaciones.
El bus puede ser una red Ethernet o una interconexión paralela. Las arquitecturas de bus trabajan bien para un pequeño número
de procesadores el bus sólo puede gestionar la comunicación de un único componente en cada momento, las arquitecturas de bus
son menos apropiadas según aumenta el paralelismo.
Malla. Los componentes se organizan como los nodos de una retícula de modo que cada componente está conectado con todos
los nodos adyacentes. En una malla bidimensional cada nodo está conectado con cuatro nodos adyacentes.
Hipercubo. Se asigna a cada componente un número binario de modo que dos componentes tienen una conexión directa si sus
correspondientes representaciones binarias difieren en un solo bit.
SESGO: Al dividir cada tarea en un cierto número de pasos paralelos se reduce el tamaño del paso medio. Por ejemplo, si se divide
una tarea de tamaño 100 en 10 partes y la división está sesgada.
SERVIDOR DE DATOS: Son servidores de área local en las cuales alcanzan velocidades altas. se puede acceder a ellos desde
terminales o equipos.
8/15/2019 Temario Capitulo 18-19 Complete
http://slidepdf.com/reader/full/temario-capitulo-18-19-complete 2/4
Universidad Politécnica de Sinaloa Base de datos distribuidas Jesús Alberto Rodríguez Juárez
6-3 Informática
Universidad Politécnica de Sinaloa Base de datos distribuidas Jesús Alberto Rodríguez Juárez
6-3 Informática
Caché de bloqueos: Los bloqueos también pueden ser almacenados en la memoria caché del cliente si la utilización de los datos
está prácticamente dividida entre los clientes, de manera que un cliente rara vez necesita datos que están siendo utilizados por
otros clientes.
CACHÉ DE DATOS:Los datos que se envían al cliente en favor de una transacción se pueden alojar en una caché del cliente incluso
una vez completada la transacción, si dispone de suficiente espacio de almacenamiento libre.
SERVIDORES DE TRANSACCIONES: tienen múltiples procesos, ejecutándose posiblemente en múltiples procesadores,dado que
estos procesos tienen acceso a los datos comunes, como la memoria intermedia de la base de datos, los sistemas almacenan
dichos datos en memoria compartida.
SISTEMAS CLIENTE-SERVIDOR Los terminales conectados a un sistema central han sido suplantados por computadoras
personales. De igual forma, la interfaz de usuario, que solía estar gestionada directamente por el sistema central, está pasando a
ser gestionada, cada vez más, por las computadoras personales.
SISTEMAS CENTRALIZADOS: poseen memorias caché locales donde se almacenan copias de ciertas partes de la memoria para
acelerar el acceso a los datos.
SISTEMAS DISTRIBUIDOS: se almacena la base de datos en varias computadoras. Varios medios de comunicación, como las redes
de alta velocidad o las líneas telefónicas, son los que pueden poner en contacto las distintas computadoras de un sistema
distribuido. No comparten ni memoria ni discos.
SISTEMAS CENTRALIZADOS: Poseen memorias caché locales donde se almacenan copias de ciertas partes de la memoria para
acelerar el acceso a los datos.
Sistemas en paralelo. Los sistemas paralelos mejoran la velocidad de procesamiento y de E/S mediante la utilización de UCP y
discos en paralelo de procesamiento y de E/S mediante la utilización de UCP y discos en paralelo. El procesamiento paralelo se
realizan muchas operaciones simultáneamente.
Tiempo de Respuesta. El buen rendimiento de los sistemas interactivos de transacciones.
Sistemas de servidores. Los sistemas servidores pueden dividirse en servidores de transacciones y servidores de datos:
Servidores de Transacciones:Porcionan una interfaz a través de la cual los clientes pueden enviar peticiones para realizar una
acción que el servidor ejecutará y cuyos resultados se devolverán al cliente.
Servidores de datos:
Permiten a los clientes interaccionar con los servidores realizando peticiones de lectura o modificación de datos en unidades tales
como archivos o páginas.
Tipos de redes. Las redes de área local (LANs, Local Area Networks) surgen a principios de los 70 como una forma de
comunicación y de compartimiento de datos entre varias computadoras.
Las redes de área amplia (WAN, Wide Area Networks) Surge como un proyecto de investigación académica para proporcionar una
comunicación eficiente entre varios lugares permitiendo que una gran comunidad de usuarios pudiera compartir hardware y
software de una manera conveniente y económica.
Una red de área de almacenamiento (SAN, Storage-Area Network) es un tipo especial de red de área local de alta velocidaddestinada a conectar numerosos bancos de dispositivos de almacenamiento (discos) a las computadoras que utilizan los datos.
Tolerancia ante fallos. la capacidad de un sistema de acceder a la información, aun en caso de producirse algún fallo o anomalía
en el sistema.
TEMARIO DE REPASO CAPITULO 19
Algoritmo luchador. Si no hay ningún sitio activo con un número más elevado, el sitio que se ha recuperado obliga a todos los
sitios con números más bajos a permitirle transformarse en el sitio coordinador, aunque ya haya un coordinador activo con un
número más bajo.
Algoritmo de selección. El ordenamiento por selección (Selection Sort en inglés) es unalgoritmo de ordenamiento que
requiere O operaciones para ordenar una lista de n elementos.Alias. Conjunto de nombres alternativos o alias para los elementos de datos
Árboles distribuidos de directorio. La información sobre las organizaciones puede hallarse dividida entre varios AIDs, cada uno de
los cuales almacena información sobre algunas entradas.
Autonomía. La principal ventaja de compartir datos por medio de distribución de datos es que cada ubicación es capaz de
mantener un grado de control sobre los datos que se almacenan localmente.
Las bases de datos distribuidas heterogéneas. permiten que cada sitio tenga sus propios esquemas y código de sistema de bases
de datos.
En las bases de datos distribuidas homogéneas todos los sitios tienen idéntico software de sistemas gestores de bases de datos,
son conscientes de la existencia de los demás sitios y acuerdan cooperar en el procesamiento de las solicitudes de los usuarios
Estrategia de semireunion. Es otra estrategia que a veces mejora los resultados, Se basa en transferir solamente las
tuplas y atributos
Una estrategia posible para lograr todo esto es la siguiente:
1. Calcular temp1 ← ΠR1 ∩ R2 (r1) en S1.2. Enviar temp1 de S1 a S2.
3. Calcular temp2 ←r2 temp1 en S2.
8/15/2019 Temario Capitulo 18-19 Complete
http://slidepdf.com/reader/full/temario-capitulo-18-19-complete 3/4
Universidad Politécnica de Sinaloa Base de datos distribuidas Jesús Alberto Rodríguez Juárez
6-3 Informática
Universidad Politécnica de Sinaloa Base de datos distribuidas Jesús Alberto Rodríguez Juárez
6-3 Informática
4. Enviar temp2 de S2 a S1. 5. Calcular r1 temp2 en S1. La relación resultante es la misma que r1 r2.
Fragmentación de los datos. Si la relación r se fragmenta, r se divide en varios fragmentos r1, r2, . . . , rn. Estos fragmentos
contienen sufi- ciente información como para permitir la reconstrucción de la relación original r
La fragmentación horizontal divide la relación asignando cada tupla de r en uno o más fragmentos.
La fragmentación vertical divide la relación descomponiendo el esquema R de la relación r.
Gestor distribuido de bloqueos. la función de gestor de bloqueos se halla distribuida entre varios sitios.
Gestor único de bloqueos. El sistema mantiene un único gestor de bloqueos que reside en un sitio único escogido (digamos Si ).
Gestor de transacciones. Asegura que la base de datos quede en un estado consistente (correcto) a pesar de los fallos del
sistema, y que las ejecuciones de transacciones concurrentes ocurran si conflictos.
Instantánea consistente con las transacciones. Permite mejor rendimiento que serializabilidad, sin embargo aún evita la mayoría
de las anomalías de la concurrencia que serializabilidad evita (pero no siempre todas).
Marcas Temporales. se concede a cada transacción una marca temporal única que el sistema utiliza para decidir el orden de
secuenciación.
Mediadores .Son sistemas que integran varios orígenes de datos heterogéneos, proporcionan una vista global integrada de los
datos y ofrecen facilidades de consulta en el sistema global.
Mensajería Persistente. Los mensajes persistentes (que está garantizado que se entregan exactamente una vez,
independientemente de los fallos) se envían a los sitios remotos para solicitar que se emprendan acciones en ellos.
Modalidades de los fallos del sistema. Los tipos básicos de fallos son:• Fallo de un sitio • Pérdida de mensajes • Fallo de un enlace
de comunicaciones • División de la red, La pérdida o deterioro de los mensajes siempre constituye una posibilidad en los sistemas
distribuidos.
Procesamiento distribuido de consultas. Para los sistemas centralizados el criterio principal para medir el coste de una estrategia
dada es el número de accesos a disco. En los sistemas distribuidos hay que tener en cuenta varios asuntos más, entre los que se
incluyen • El coste de la transmisión de los datos por la red • La ganancia potencial en rendimiento si se hace que varios sitios
procesen en paralelo partes de la consulta
Propagación perezosa. Permiten que continúe el procesamiento de las transacciones (incluidas las actualizaciones) aunque un
sitio quede desconectado de la red, lo que mejora la disponibilidad, pero, por desgracia, lo hacen a costa de la consistencia.
El protocolo de acceso ligero a directorios LDAP (Lightweight Directory Access Protocol). los sistemas de directorios se
implementan como uno o varios servidores que atienden a varios clientes.
Árboles distribuidos de directorio. La información sobre las organizaciones puede hallarse dividida entre varios AIDs, cada uno de
los cuales almacena información sobre algunas entradas.
Nombre distinguido (ND). En LDAP los directorios almacenan entradas, que son parecidas a los objetos. Cada entrada debe tener
un nombre distinguido (ND), que identifica de manera única esa entrada.
Nombres distinguidos relativos. Los ND, a su vez, está formado por una secuencia de nombres distinguidos relativos (NDR).
Compromiso de dos fases (C2F). Durante el funcionamiento normal, luego describe el modo en que maneja los fallos y,finalmente, la manera en que ejecuta la recuperación y el control de la concurrencia.
Estado de preparación (El protocolo de compromiso). Cuando T completa su ejecución (es decir, cuando todos los sitios en los que
se ha ejecutado T informan a Ci de que T se ha completado) Ci inicia el protocolo C2F. Fase 1 Añade, fase 2 prepara.
Problema del bloqueo. Si el coordinador falla durante la ejecución del protocolo de compromiso para la transacción T, los sitios
participantes deben decidir el destino de T.
Transacciones dudosas. Son transacciones para las que no se encuentra ningún registro < T preparada>, ni en el registro histórico.
Protocolo de compromiso de tres fases (C3F). Es una extensión del protocolo de compromiso de dos fases que evita el problema
del bloqueo con determinadas suposiciones.
Protocolo de compromiso. Si hay que asegurar la atomicidad, todos los sitios en los que se ejecute una transacción T deben
coincidir en el resultado final de la ejecución. T debe comprometerse en todos los sitios o abortarse en todos los sitios.
Protocolos para las réplicas. Si la relación r se replica, se guarda una copia de dicha relación en dos o más sitios.
Copia principal. Para cada elemento de datos Q la copia principal de Q debe residir exactamente en un sitio.
Protocolo de consenso de quórum. Es una generalización del protocolo de mayoría. El protocolo de consenso de quórum asigna acada sitio un peso no negativo.
Base de datos virtual. Se utiliza para hacer referencia a los sistemas de varias bases de datos o a los sistemas mediadores.
Control de Concurrencia. El término concurrencia se refiere al hecho de que los DBMS (Sistemas de Administración de Bases de
Datos) permiten que muchas transacciones accedan a una misma base de datos a la vez. Como bien es sabido, en un sistema de
éstos se necesita algún tipo de mecanismo de control de concurrencia para asegurar que las transacciones concurrentes no
interfieran entre sí.
Coordinador suplente. Es un sitio que, además de otras tareas, mantiene de manera local suficiente información como para
permitirle asumir el papel de coordinador con un perjuicio mínimo al sistema distribuido.
Coordinador de transacciones. Coordina la ejecución de las diferentes transacciones (tanto locales como globales) iniciadas en ese
sitio.
Disponibilidad. Si un sitio de un sistema distribuido falla, los sitios restantes pueden seguir trabajando.
• División de la red. Cuando una red queda dividida caben dos posibilidades:
1. El coordinador y todos los sitios participantes siguen en una de las particiones
2. El coordinador y los participantes quedan en varias particiones.
8/15/2019 Temario Capitulo 18-19 Complete
http://slidepdf.com/reader/full/temario-capitulo-18-19-complete 4/4
Universidad Politécnica de Sinaloa Base de datos distribuidas Jesús Alberto Rodríguez Juárez
6-3 Informática
Universidad Politécnica de Sinaloa Base de datos distribuidas Jesús Alberto Rodríguez Juárez
6-3 Informática
Protocolo de mayoría. Funciona de la manera siguiente. Si el elemento de datos Q se replica en n sitios diferentes se debe enviar
un mensaje de solicitud de bloqueo a más del 50 por 100 de los n sitios en los que se almacena Q.
Protocolo de sesgado. Concede un tratamiento más favorable a las solicitudes de bloqueos compartidos que a las solicitudes de
bloqueos exclusivos.
Referencia.. Explicación o relación de un acontecimiento que se hace de palabra o por escrito.
Replica de datos. Si la relación r se replica, se guarda una copia de dicha relación en dos o más sitios.
Réplica maestro-esclavo. La base de datos permite las actualizaciones en el sitio principal y las propaga de manera automática a
las réplicas de los demás sitios.
Réplica multimaestro (también denominada réplica de actualización distribuida). Se permiten las actualizaciones en cualquier
réplica de los elementos de datos y se propagan de manera automática a todas las réplicas.
Robustez. La capacidad de continuar funcionando incluso durante los fallos.
Enfoque basado en la mayoría. Puede modificarse para que funcione a pesar de los fallos.
Protocolo leer uno, escribir todos. Ya que hay que escribir todas las réplicas.
Protocolo lectura de uno, escritura de todos los disponibles. En este enfoque las operaciones de lectura se llevan a cabo como en
el esquema leer uno, escribir todos; se puede leer cualquier réplica disponible y se obtienen un bloqueo de lectura sobre esa
réplica.
Reintegración al sistema de los sitos o de los enlaces reparados. Exige la adopción de precauciones. Cuando se recupera un sitio
que ha fallado, debe iniciar un procedimiento para actualizar sus tablas del sistema para que reflejen las modificaciones realizadas
mientras estaba fuera de servicio.
Selección de coordinador. Si el coordinador falla debido a un fallo del sitio en el que reside el sistema, sólo puede continuar la
ejecución reiniciando un nuevo coordinador en otro sitio. Servidor de nombres. Ayuda a asegurar que el mismo nombre no se
utilice para elementos de datos diferentes.
Sistema de varias bases de datos. Una base de datos federada es un sistema en el que varias bases de datos parecen funcionar
como una sola entidad.
Sistemas de directorio. Pueden considerarse una modalidad especializada de base de datos en la que la información se organiza
de manera jerárquica parecida al modo en que los archivos se organizan en los sistemas de archivos.
El sufijo de los AIDs .Es una secuencia de pares RDN=valores (RDN, Relative Distinguished Name, nombre relativo distinguido) que
identifica la información que almacena cada AID; los pares están concatenados con el resto del nombre distinguido generado
recorriendo el árbol desde la entrada hasta la raíz.
Transacciones distribuidas. El acceso a los diferentes elementos de datos en los sistemas distribuidos suele realizarse mediante
transacciones, que deben preservar las propiedades ACID.
Transacciones locales. Son las que tienen acceso a los datos y los actualizan sólo en una base de datos local.
Transacciones globales. Son las que tienen acceso a datos y los actualizan en varias bases de datos locales.
Transparencia de los datos. No se debe exigir a los usuarios de los sistemas distribuidos de bases de datos que conozcan laubicación física de los datos ni el modo en que se puede tener acceso a ellos en un sitio local concreto.
Transparencia de la fragmentación. No se exige a los usuarios que conozcan el modo en que se ha fragmentado la relación.
Transparencia de la réplica. Los usuarios ven cada objeto de datos como lógicamente único.
Transparencia de la ubicación. No se exige a los usuarios que conozcan la ubicación física de los datos.
Tratamiento de los interbloqueos. La prevención de interbloqueos puede dar lugar a esperas y retrocesos innecesarios.
Grafos locales de espera. Se crean de la manera habitual para las transacciones y los elementos de datos locales. Cuando una
transacción Ti en el sitio S1 necesita un recurso del sitio S2, envía un mensaje de solicitud al sitio S2.
Grafo global de espera. La unión de todos los grafos locales.