Descargar

Base de Datos Distribuidas


Partes: 1, 2

  1. Introducción
  2. Ventajas y desventajas de los sistemas distribuidos
  3. Sistema de gestión de base de datos distribuida
  4. Ambientes de bases de datos distribuidas
  5. Problemas fundamentales a resolver en las bases de datos distribuidas
  6. Fragmentación
  7. Las 12 reglas de un SGBDD
  8. Conclusiones
  9. Bibliografía

1. Introducción

Una Base de Datos Distribuida (BDD) es una colección de datos distribuidos en diferentes nodos de una red de computadoras. Cada sitio de la red es autónomo, puede ejecutar aplicaciones locales y al menos una aplicación global, lo cual requiere el acceso a datos, ubicados en varios sitios, usando un subsistema de comunicación [Ceri, 1984]. Para el diseño de BDDs se han definido dos grandes estrategias [Ceri, 1987]: el enfoque Top-Down y el Bottom-Up. En el enfoque Top-Down se comienza diseñando el esquema global, luego se concibe la fragmentación de la BD y la localización de los fragmentos en los sitios. Se completa ejecutando, en cada sitio, el diseño físico de los datos. Por otro lado el enfoque Bottom-Up se basa en la integración de esquemas ya creados en un esquema global a partir de las BD existentes.

Los Sistemas de Bases de Datos Distribuidas representan más naturalmente la estructura geográficamente descentralizada de una organización, aumentan la disponibilidad de los datos, reducen el tráfico de comunicación y es justificable, además, por el abaratamiento de los costos en el equipamiento y la infraestructura de comunicaciones de las redes de computadoras. El diseño de las Bases de Datos Distribuidas posee las fases del diseño centralizado y cuenta, además, con dos nuevos problemas que caracterizan el proceso de distribución de datos, e incluyen la determinación de: cómo dividir la base de datos en componentes para localizarlos en diferentes sitios, qué cantidad de datos debe ser replicados y cómo deben los fragmentos replicados ser localizados.

Existen varias definiciones sobre qué es un sistema distribuido pero hay divergencias entre ellas, para nuestros propósitos es suficiente expresar que un sistema distribuido es una colección de computadoras independientes interconectadas entre sí que aparecen ante los usuarios del sistema como una única computadora [Özsu, 1991].

2. Ventajas y Desventajas de los sistemas distribuidos

Ventajas

  • El acceso a los datos es más rápido debido a que los datos se localizan más cercanos al lugar donde se utilizan.

  • El procesamiento es rápido debido a que varios nodos intervienen en el procesamiento de una carga de trabajo,

  • Nuevos nodos se pueden agregar fácil y rápidamente.

  • La probabilidad de que una falla en un solo nodo afecte al sistema es baja y existe una autonomía e independencia entre los nodos.

  • Control local de los datos con que se interactúa.

  • Mayor tolerancia a los fallos

Desventajas

  • Es más complicado el control y la manipulación de los datos

  • Es compleja el aseguramiento de la integridad de la información en presencia de fallas no predecibles tanto de componentes de hardware como de software. La integridad se refiere a la consistencia, validez y exactitud de la información.

  • El control de concurrencia y los mecanismos de recuperación son mucho más complejos que en un sistema centralizado dado que los datos pueden estar replicados.

La distribución de la BD requiere determinar la fragmentación y la localización. La fragmentación es el proceso de dividir una relación en pequeñas porciones llamadas fragmentos [Meghini, 1991]. Las razones principales para la fragmentación son el incremento del nivel de concurrencia y el desempeño del sistema. Existen dos alternativas para fragmentar datos: fragmentación horizontal (FH) y fragmentación vertical (FV). La combinación de las anteriores resulta en una fragmentación híbrida. Es importante seguir tres reglas, las cuales aseguran que la BD no tenga cambios semánticos durante la fragmentación: completitud, reconstrucción y disjuntura.

3. Sistema de Gestión de Base de Datos Distribuida

Un sistema de gestión de bases de datos distribuidas (SGBDD) es un Sistema de Gestión de bases de datos que gestiona la BD distribuida

Funcionalidades adicionales de un SGBDD

  • Accede a sitios remotos y transmite consultas y datos a través de varios sitios mediante una red de comunicación.

  • Almacena el esquema de distribución y replicación de los datos en el catalogo del sistema.

  • Establece las estrategias de ejecución de las consultas y las transacciones que acceden a los datos en más de un sitio.

  • Decide sobre cual copia de los datos replicados acceder.

  • Mantiene la consistencia de las copias de los datos replicados.

  • Realiza la recuperación ante los fallos.

Partes: 1, 2
Página siguiente