Base de Datos Distribuida
Base de Datos Distribuida
Es un conjunto de múltiples bases de datos lógicamente
relacionadas las cuales se encuentran distribuidas en diferentes espacios
lógicos y geográficos. La necesidad de almacenar datos de forma masiva dio paso
a la creación de los sistemas de bases de datos. Por lo tanto, una base de
datos distribuida es una colección de múltiples bases de datos interconectadas,
que pueden estar extendidas físicamente a través de varios lugares comunicados
mediante una red informática.
Una BDD es una base de datos construida en una red de
computadoras, en la cual la información que estructurara la base de datos se
almacena en diferentes sitios de la red, y los sistemas de información que las
utilizan acceden a los datos en distintos lugares. Entonces, es una colección
de datos que pertenecen a un solo sistema, pero que se encuentran físicamente
distribuidos en varios servidores (o computadores) de datos en una red de
computadoras que se conectan entres sí mediante alguna red de comunicación en
el cual cada sitio puede tener un sistema de base de datos y que deben de haber
sido diseñados para trabajar en conjunto. Logrando así que los usuarios puedan
obtener acceso a los datos desde cualquier punto de la red como si estuviesen
almacenados todos en el mismo lugar. Por esto se considera como una especie de
consorcio o sociedad entre diferentes sistemas de gestión de base de datos
individuales (locales).
Las Base de Datos Distribuida (BDD en inglés Distributed Database Management System, DDBMS) se sitúa en nodos de una red de computadoras, la colección de datos se encuentra
distribuidos en estos sitios que tienen la capacidad de procesamiento autónomo
y de hacer procesos locales, cada sitio realiza la ejecución de al menos una
transacción global, la cual requiere accesos a datos en diversos sitios. estos almacenan
datos que pertenecen lógicamente a un sólo sistema, pero se encuentra
físicamente esparcido en varios “sitios” de la red. Un sistema de base de datos
distribuidos se compone de un conjunto de sitios, conectados entre sí mediante
algún tipo de red de comunicaciones. Y un componente de software en cada sitio
realiza las funciones de sociedad necesarias, y la combinación de este
componente con el sistema de gestión de base de datos (SGBD) que ahí se encuentra,
constituyen el llamado Sistema Administrativo o Gestión de Base de Datos Distribuidas
(SGBDD en ingles DDBMS, Distributed DataBase Management System).
Desde el punto de vista del usuario final, un sistema
distribuido deberá ser idéntico a un sistema no distribuido. Los usuarios de un
sistema distribuido se comportan en su manipulación de información exactamente
como si el sistema no estuviera distribuido. Todos los problemas de los
sistemas distribuidos son de tipo interno o a nivel de realización, no pueden
existir problemas de tipo externo o a nivel del usuario final.
Las bases de datos distribuidas ofrecen algunas ventajas
clave sobre las bases de datos centralizadas. Muchas empresas están cambiando a
bases de datos distribuidas (en las cuales la base de datos, como su nombre lo
indica, se distribuye a través de una matriz de servidores en varias
ubicaciones), por una variedad de razones.
Las BDD pueden ser:
⊷ Homogéneas: Todos los sitios tienen el
mismo SGBD, son conscientes de la existencia de los demás sitios y cooperan en
el procesamiento de las solicitudes. Los sitios locales mantienen un mismo
esquema y SGBD.
⊷ Heterogéneas: Cada sitio puede tener un
SGBD distinto, así como esquemas diferentes. Puede que algunos sitios no
conozcan a otros. Puede que solo ofrezcan facilidades limitadas para la
cooperación en el procesamiento de transacciones.
Ventajas
·
Refleja una estructura organizacional – los fragmentos
de la base de datos se ubican en los departamentos a los que tienen relación.
·
Autonomía local – un departamento puede controlar los
datos que le pertenecen.
·
Disponibilidad – En caso de fallo en la base de datos,
el todo el sistema de base de datos centralizada se detiene y el fallo afectara
solo a un fragmento de la base de datos en lugar de a toda la BDD. Sin embargo,
en sistemas distribuidos, cuando un componente falla, el funcionamiento del
sistema continua, aunque pueda tener una reducción de rendimiento. Por lo tanto,
una base de datos distribuida es más fiable.
·
Rendimiento –Si los datos están distribuidos de una
manera eficiente, las peticiones de los usuarios van a poder ser satisfechas
directamente desde los datos locales, por lo que se proporciona una respuesta
más rápida. Por otro lado, en sistemas centralizados, todas las solicitudes
tienen que pasar a través del ordenador central, lo cual incrementa el tiempo
de respuesta. Los datos generalmente se ubican cerca del sitio con mayor
demanda, también los sistemas trabajan en paralelo, lo cual permite balancear
la carga en los servidores.
·
Economía – En sistemas de bases de datos distribuidas,
si el dato se localiza allí dónde es más usado, el coste de comunicación para
manipulación de datos puede ser minimizado.
Es más barato crear una red de muchas computadoras pequeñas, que tener
una sola computadora muy poderosa.
·
Modularidad – Si el sistema necesita ser ampliado
con nuevas localizaciones o nuevas unidades, en sistemas de base de datos
centralizados, esta acción requiere sustanciales esfuerzos adicionales, así
como la interrupción del servicio. Sin embargo, en las bases de datos
distribuidas, el trabajo simplemente requiere agregar nuevos ordenadores y
datos en los nuevos sitios y finalmente conectarlos al sistema distribuido, sin
que exista ninguna interrupción de funciones. Esto no es factible en sistemas
centralizados. Se pueden modificar, agregar o quitar sistemas de la base de
datos distribuida sin afectar a los demás sistemas (módulos).
·
Seguridad – Puede otorgar permisos a secciones
individuales de la base de datos general, para una mejor protección interna y
externa.
·
Crecimiento – Si agrega una nueva ubicación a su
negocio, es simple crear un nodo adicional dentro de la base de datos, lo que
hace que la distribución sea altamente escalable.
Desventajas
o Complejidad
- Es más complicado el control y la manipulación de los datos. Se debe asegurar
que la base de datos sea transparente, se debe lidiar con varios sistemas
diferentes que pueden presentar dificultades únicas. El diseño de la base de
datos se tiene que trabajar tomando en cuenta su naturaleza distribuida, por lo
cual no podemos pensar en hacer nodos que afecten varios sistemas.
o Economía -
Un sistema de gestión de base de datos distribuida exige un software complejo y
a menudo costoso para proporcionar transparencia a los datos y coordinar los
diferentes sitios. La complejidad y la infraestructura necesaria implica que se
necesitará una mayor mano de obra.
o Seguridad -
se debe trabajar en la seguridad de la infraestructura, así como cada uno de
los sistemas.
o Integridad
- La necesidad de actualización de datos en múltiples sitios, plantea problemas
de integridad de datos. Es compleja el aseguramiento de la integridad de la
información en presencia de fallas no predecibles tanto de componentes de
hardware como de software. La integridad se refiere a la consistencia, validez
y exactitud de la información. Se vuelve difícil mantener la integridad,
aplicar las reglas de integridad a través de la red puede ser muy caro en
términos de transmisión de datos.
o Falta de
experiencia - las bases de datos distribuidas son un campo relativamente nuevo
y poco común por lo cual no existe mucho personal con experiencia o
conocimientos adecuados.
o Sobrecarga
de procesamiento - Incluso con operaciones simples, se puede requerir un gran
número de cálculos y comunicaciones para conseguir proporcionar uniformidad de
datos en todos los sitios.
o Carencia de
estándares - aún no existen herramientas o metodologías que ayuden a los
usuarios a convertir un DBMS centralizado en un DBMS distribuido.
o Diseño de
la base de datos se vuelve más complejo - además de las dificultades que
generalmente se encuentran al diseñar una base de datos, el diseño de una base
de datos distribuida debe considerar la fragmentación, replicación y ubicación
de los fragmentos en sitios específicos.
o Sobrecarga
por distribución de datos inadecuada -La capacidad de respuesta de las
consultas depende en gran medida de una distribución adecuada de los datos. Si
la distribución es incorrecta, a menudo nos encontraremos con una respuesta muy
lenta a las solicitudes de los usuarios.
Comentarios
Publicar un comentario