Base de Datos Distribuida

Base de Datos Distribuida

Es un conjunto de múltiples bases de datos lógicamente relacionadas las cuales se encuentran distribuidas en diferentes espacios lógicos y geográficos. La necesidad de almacenar datos de forma masiva dio paso a la creación de los sistemas de bases de datos. Por lo tanto, una base de datos distribuida es una colección de múltiples bases de datos interconectadas, que pueden estar extendidas físicamente a través de varios lugares comunicados mediante una red informática.

Una BDD es una base de datos construida en una red de computadoras, en la cual la información que estructurara la base de datos se almacena en diferentes sitios de la red, y los sistemas de información que las utilizan acceden a los datos en distintos lugares. Entonces, es una colección de datos que pertenecen a un solo sistema, pero que se encuentran físicamente distribuidos en varios servidores (o computadores) de datos en una red de computadoras que se conectan entres sí mediante alguna red de comunicación en el cual cada sitio puede tener un sistema de base de datos y que deben de haber sido diseñados para trabajar en conjunto. Logrando así que los usuarios puedan obtener acceso a los datos desde cualquier punto de la red como si estuviesen almacenados todos en el mismo lugar. Por esto se considera como una especie de consorcio o sociedad entre diferentes sistemas de gestión de base de datos individuales (locales).

Las Base de Datos Distribuida (BDD en inglés Distributed Database Management System, DDBMS) se sitúa en nodos de una red de computadoras, la colección de datos se encuentra distribuidos en estos sitios que tienen la capacidad de procesamiento autónomo y de hacer procesos locales, cada sitio realiza la ejecución de al menos una transacción global, la cual requiere accesos a datos en diversos sitios. estos almacenan datos que pertenecen lógicamente a un sólo sistema, pero se encuentra físicamente esparcido en varios “sitios” de la red. Un sistema de base de datos distribuidos se compone de un conjunto de sitios, conectados entre sí mediante algún tipo de red de comunicaciones. Y un componente de software en cada sitio realiza las funciones de sociedad necesarias, y la combinación de este componente con el sistema de gestión de base de datos (SGBD) que ahí se encuentra, constituyen el llamado Sistema Administrativo o Gestión de Base de Datos Distribuidas (SGBDD en ingles DDBMS, Distributed DataBase Management System).

Desde el punto de vista del usuario final, un sistema distribuido deberá ser idéntico a un sistema no distribuido. Los usuarios de un sistema distribuido se comportan en su manipulación de información exactamente como si el sistema no estuviera distribuido. Todos los problemas de los sistemas distribuidos son de tipo interno o a nivel de realización, no pueden existir problemas de tipo externo o a nivel del usuario final.
Las bases de datos distribuidas ofrecen algunas ventajas clave sobre las bases de datos centralizadas. Muchas empresas están cambiando a bases de datos distribuidas (en las cuales la base de datos, como su nombre lo indica, se distribuye a través de una matriz de servidores en varias ubicaciones), por una variedad de razones.


Las BDD pueden ser:


     Homogéneas: Todos los sitios tienen el mismo SGBD, son conscientes de la existencia de los demás sitios y cooperan en el procesamiento de las solicitudes. Los sitios locales mantienen un mismo esquema y SGBD.
     Heterogéneas: Cada sitio puede tener un SGBD distinto, así como esquemas diferentes. Puede que algunos sitios no conozcan a otros. Puede que solo ofrezcan facilidades limitadas para la cooperación en el procesamiento de transacciones.

Ventajas


·         Refleja una estructura organizacional – los fragmentos de la base de datos se ubican en los departamentos a los que tienen relación.

·         Autonomía local – un departamento puede controlar los datos que le pertenecen.

·         Disponibilidad – En caso de fallo en la base de datos, el todo el sistema de base de datos centralizada se detiene y el fallo afectara solo a un fragmento de la base de datos en lugar de a toda la BDD. Sin embargo, en sistemas distribuidos, cuando un componente falla, el funcionamiento del sistema continua, aunque pueda tener una reducción de rendimiento. Por lo tanto, una base de datos distribuida es más fiable.

·         Rendimiento –Si los datos están distribuidos de una manera eficiente, las peticiones de los usuarios van a poder ser satisfechas directamente desde los datos locales, por lo que se proporciona una respuesta más rápida. Por otro lado, en sistemas centralizados, todas las solicitudes tienen que pasar a través del ordenador central, lo cual incrementa el tiempo de respuesta. Los datos generalmente se ubican cerca del sitio con mayor demanda, también los sistemas trabajan en paralelo, lo cual permite balancear la carga en los servidores.

·         Economía – En sistemas de bases de datos distribuidas, si el dato se localiza allí dónde es más usado, el coste de comunicación para manipulación de datos puede ser minimizado.  Es más barato crear una red de muchas computadoras pequeñas, que tener una sola computadora muy poderosa.

·        Modularidad Si el sistema necesita ser ampliado con nuevas localizaciones o nuevas unidades, en sistemas de base de datos centralizados, esta acción requiere sustanciales esfuerzos adicionales, así como la interrupción del servicio. Sin embargo, en las bases de datos distribuidas, el trabajo simplemente requiere agregar nuevos ordenadores y datos en los nuevos sitios y finalmente conectarlos al sistema distribuido, sin que exista ninguna interrupción de funciones. Esto no es factible en sistemas centralizados. Se pueden modificar, agregar o quitar sistemas de la base de datos distribuida sin afectar a los demás sistemas (módulos).

·         Seguridad Puede otorgar permisos a secciones individuales de la base de datos general, para una mejor protección interna y externa.

·         Crecimiento – Si agrega una nueva ubicación a su negocio, es simple crear un nodo adicional dentro de la base de datos, lo que hace que la distribución sea altamente escalable.

 Desventajas

o   Complejidad - Es más complicado el control y la manipulación de los datos. Se debe asegurar que la base de datos sea transparente, se debe lidiar con varios sistemas diferentes que pueden presentar dificultades únicas. El diseño de la base de datos se tiene que trabajar tomando en cuenta su naturaleza distribuida, por lo cual no podemos pensar en hacer nodos que afecten varios sistemas.

o   Economía - Un sistema de gestión de base de datos distribuida exige un software complejo y a menudo costoso para proporcionar transparencia a los datos y coordinar los diferentes sitios. La complejidad y la infraestructura necesaria implica que se necesitará una mayor mano de obra.

o   Seguridad - se debe trabajar en la seguridad de la infraestructura, así como cada uno de los sistemas.

o   Integridad - La necesidad de actualización de datos en múltiples sitios, plantea problemas de integridad de datos. Es compleja el aseguramiento de la integridad de la información en presencia de fallas no predecibles tanto de componentes de hardware como de software. La integridad se refiere a la consistencia, validez y exactitud de la información. Se vuelve difícil mantener la integridad, aplicar las reglas de integridad a través de la red puede ser muy caro en términos de transmisión de datos.

o   Falta de experiencia - las bases de datos distribuidas son un campo relativamente nuevo y poco común por lo cual no existe mucho personal con experiencia o conocimientos adecuados.

o   Sobrecarga de procesamiento - Incluso con operaciones simples, se puede requerir un gran número de cálculos y comunicaciones para conseguir proporcionar uniformidad de datos en todos los sitios.

o   Carencia de estándares - aún no existen herramientas o metodologías que ayuden a los usuarios a convertir un DBMS centralizado en un DBMS distribuido.

o   Diseño de la base de datos se vuelve más complejo - además de las dificultades que generalmente se encuentran al diseñar una base de datos, el diseño de una base de datos distribuida debe considerar la fragmentación, replicación y ubicación de los fragmentos en sitios específicos.

o   Sobrecarga por distribución de datos inadecuada -La capacidad de respuesta de las consultas depende en gran medida de una distribución adecuada de los datos. Si la distribución es incorrecta, a menudo nos encontraremos con una respuesta muy lenta a las solicitudes de los usuarios.

Comentarios

Entradas populares