Sunteți pe pagina 1din 12

SITEMAS DE BASES DE DATOS DISTRIBUIDAS

ERICK FELIPE RECAMN GUZMN ANGIE LIZET MORA LANCHEROS YEISSON ARGEMIRO VIRGUES ALDANA CAMILO ANDRES GONZALEZ GUZMN ALEJANDRO TIQUE CIFUENTES

UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS BASE DE DATOS AVANZADAS BOGOTA DICIEMBRE 2012

BASES DE DATOS DISTRIBUIDAS


Son aquellos fragmentos que se encuentran almacenados en lugares distintos. Estos sitios constan con una computadora y una DBMS (Sistema de gestin de base de datos), para administrar la base local situada conectndose entre s aquellos fragmentos de una base distribuida por medio de una red de comunicacin.

BASE DE DATOS DISTRIBUIDAS En el mundo actual, diversos tipos de personas, en varios lugares a nivel mundial, querrn compartir un gran base de datos, estas empresas que tienen la finalidad de garantizar el compartimiento de los archivos de los usuarios optan por dividir esta base de datos en unas ms pequeas denominados fragmentos, los cuales se pueden colocar en distintas ubicaciones. Entonces llamamos base de datos distribuidas a los fragmentos que se encuentran almacenados en lugares distintos. Estos sitios constan con una computadora y una DBMS (Sistema de gestin de base de datos), para administrar la base local situada conectndose entre s aquellos fragmentos de una base distribuida por medio de una red de comunicacin.

Al momento de surgir una peticin de consulta de cualquier sitio, el administrador general de la base de datos, analiza esta peticin y determina qu tipo de base de datos distribuidas (fragmentos) se puede necesitar. Las bases de datos locales pueden conectarse fsicamente de diversas formas:

Las principales diferencias entre estos tipos de configuraciones podemos tener lo siguiente: Costo de la instalacin: El costo de conectar fsicamente las localidades del sistema Costo de la comunicacin: El costo del tiempo y el dinero que interviene en enviar un mensaje desde una localidad a otra.

Fiabilidad: La frecuencia con que falla una lnea de comunicacin o una localidad. Disponibilidad: La posibilidad de acceder a la informacin a pesar que podran existir los fallos en algunas localidades o lneas de comunicacin. Se han llegado a necesitar y desarrollar diversas implantaciones: -1 (Sistema para la distribucin de base de datos) de la corporacin americana: sistemas relacionales en distintos lugares conectados por medio de las redes de comunicacin

de IMB: el MSC permite la intercomunicacin de dos o ms sistemas de base de datos de IMS

/ ISC (Sistema del control de la informacin del cliente / Sistema de comunicacin Internacional) de IBM: ISC conecta dos o ms sistemas CICS Construccin de una base de datos distribuidos Base distribuida particionada: una base de datos global se divide en tres partes (A, B, C), donde cada una de las bases se almacena en lugares diferentes.

Base de datos multiplicada y distribuida: las bases de datos se duplican en cada sitio, con el objetivo de reducir costos de comunicacin y aumentar el desempeo del sistema, eliminando la necesidad de la transmisin de datos en las diferentes ubicaciones. Este sistema es raro por su costo de las replicas de sus bases y el proceso de la actualizacin de los datos.

Distribucin de la base de datos combinando replicas y particiones: en la actualidad este tipo de distribucin se emplea con mayor frecuencia. El archivo se divide basndose en el patrn que usa, es decir los datos se guardan en los lugares donde puede ser accesado con ms frecuencia, pero si requiere un dato en ms de un sitio, este fragmento puede estar almacenado en cada uno de estos sitios. Los usuarios que utilizan este tipo de sistema no necesitan saber que el almacenamiento se encuentra distribuido en distintos sitios, o que algunos de estos fragmentos se encuentran repetidos en algunos sitios. El objetivo principal de este tipo de distribucin es proteger a los programas de cualquier tipo de cambio cuando los fragmentos se mueven de un lugar a otro, todo este tipo de procedimientos se los llama transparencia de la ubicacin y transparencia de la rplica.

Ventajas de las bases de datos distribuidas Compartimiento de datos: los usuarios de una base pueden tener acceso a los datos de otra base. Por ejemplo desde una oficina de una empresa matriz en el caso del gerente puede tener acceso a los datos de todos sus trabajadores y de otros tambin en una empresa sucursal de la misma.

Autonoma: existe un administrador del sistema responsable del nivel de seguridad global cada base tiene un cierto grado de control, en cada base hay otro administrador local que puede tener a llegar un cierto nivel de autonoma diferente Disponibilidad: si en sistema de base de datos distribuidos llega a fallar un fragmento los otros fragmentos pueden seguir funcionando. Los datos tambin pueden llegar a duplicarse en los fragmento llegando a encontrar los datos con ms facilidad. El sistema debe detectar el fallo y tomar medidas necesarias para reparar el fallo, en este momento el sistema no debe utilizar la base daada, una vez arreglado el fallo debe necesitar un mecanismo para integrarla al sistema de nuevo, pero con menos complicaciones. Desventajas de las bases de datos distribuidas Costo del desarrollo del software: sistema complejo para mantener la coordinacin y estabilidad entre los fragmentos provoca que este desarrollo sea costoso Mayor probabilidad de errores: como las bases locales funcionan en paralelo, es ms difcil asegurar el funcionamiento correcto y los procedimientos de recuperacin de fallos del sistema.

Mayor sobrecarga de procesamiento: el intercambio de archivos, mensajes y la ejecucin de algoritmos que constituyen el funcionamiento de las bases locales da como resultado una sobrecarga que no se da en los sistemas centralizados. Actualizacin de los datos duplicados: algunos datos pueden estar duplicados en varios sitios, por lo tanto este tipo de actualizacin se debe llegar a cabo en todos los lugares que exista datos duplicados Transparencia de ubicacin: la mayora de este tipo de sistemas no alcanzan su completa transferencia de su ubicacin, por lo tanto requieren de la ayuda del usuario, transfiriendo archivos para su procesamiento local.

Optimizacin de los procesos de consulta: cuando existe una consulta en un sistema distribuido, existe muchas manera de que esta consulta se divida en subpreguntas para recuperar los datos en las diferentes bases locales, este tiempo vara dependiendo de la ruta donde este el procedimiento Diseo de la base de datos distribuidas El diseo de un sistema de base de datos distribuido implica la toma de decisiones sobre la ubicacin de los programas que accedern a la base de datos y sobre los propios datos que constituyen a esta base. La ubicacin de los programas que accedieron a la base no debera tener un excesivo problema porque se puede tener una copia de ellos en cada mquina de la red. Tradicionalmente se ha clasificado a los sistemas de bases de datos distribuidos en tres dimensiones: el nivel de comparticin, las caractersticas de acceso a los datos y el nivel de conocimiento de las caractersticas de acceso. Transparencia y autonoma Es importante que el sistema reduzca al mnimo la necesidad de que el usuario se d cuenta de cmo est almacenada una relacin. El sistema puede ocultar los detalles de la informacin en la red. Esto se denomina transparencia de la red. La transparencia de la red se relaciona con la autonoma local. La transparencia de la red es el mtodo por el cual los usuarios del sistema pueden ignorar los detalles del diseo distribuido. La autonoma local es el mtodo por el cual el diseador o administrador de una localidad pueden ser independientes del resto del sistema distribuido.

Almacenamiento distribuido de datos Replica: el sistema consiste en varias copias iguales, donde cada copia se guarda en una base diferente, lo que significa la rplica de los datos.

Fragmentacin de datos: si una base se encuentra fragmentada, esta base se dividir en numerosos fragmentos. Los fragmentos contienen suficiente informacin para permitir la reconstruccin de la base original.

Fragmentacin horizontal: divide la base asignando a cada divisin a uno o varios fragmentos. Fragmentacin vertical: divide la base de un modo especial, igual que una descomposicin, implica el concepto de varios subconjuntos. Fragmentacin mixta: la base se divide por medio de una serie de relaciones de fragmentos, donde cada fragmento tiene como resultado los procedimientos de las fragmentaciones horizontales y mixtas Replica y fragmentacin de datos: la rplica y fragmentacin de datos se puede aplicar de manera continua, es decir de una pequea divisin que anteriormente se ha fragmentado tambin se puede hacer una rplica y estos fragmentos tambin se pueden volver a fragmentar. Transparencia de la red Los datos se pueden guardar de muchas maneras en el sistema de bases distribuidas, pero tambin es de suma importancia que este sistema disminuya cualquier informacin que los usuarios necesitan saber cmo se guarda el dato en la base. Entonces el sistema pude ocultar este tipo de detalle de la distribucin de los datos en la red a esto se lo llama transparencia de red: Denominacin de los elementos de datos: todos los elementos de los datos, las divisiones, y las copias de las bases, deben tener nombres nicos, pero en este tipo de sistemas hay que asegurarse de que dos procedimientos no utilicen el mismo nombre para distintos elementos de datos. Cada copia y cada fragmento de un elemento deben tener tambin un nombre nico, es muy importante diferenciar cuales copias y fragmentos de las bases del mismo elemento. Transparencia y actualizaciones: es muy importante asegurar que todas las copias de un elemento o una base y que todas sus fragmentaciones se actualicen constantemente, pero tambin puede que exista muchos problemas si hay constantemente acceso a alguna base en especfica, lo que da lugar a que se actualice una base antes que otra.

Transparencia de localizacin Si el sistema es transparente en cuanto a la repeticin y fragmentacin de las bases donde se ocultar al usuario gran parte del esquema de la base de datos distribuida. Sin embargo, el componente de los nombres que identifican a la base obliga al usuario a darse cuenta del hecho de que el sistema est distribuido. La transparencia de localizacin se logra creando un conjunto de claves o alias para cada usuario. As, el usuario puede referirse a los datos usando nombres sencillos que el sistema los traduce a nombres completos. Con el uso de los alias, no ser necesario que el usuario conozca la localizacin fsica de un dato. Adems, el administrador de la base de datos puede cambiar un dato de una base a otra sin afectar a los usuarios. Modelo de transacciones distribuidas El acceso a los diferentes elementos de las bases en los sistemas de bases distribuidas se puede realizar mediante transacciones donde se debe conservar las propiedades ACID ( conjunto de caractersticas que se necesitan para que una serie de instrucciones puedan ser consideradas como transacciones ) Hay que tener en cuenta dos tipos de transacciones. Transacciones locales: tienen total acceso y actualizacin de datos en una sola de las bases locales Transacciones globales: tienen total acceso y actualizacin en varias bases de datos en varias bases de datos locales Arquitectura del sistema: Cada procedimiento tiene su propio gestor de transacciones locales, cuya funcin es asegurar las propiedades ACID, los diferentes gestores de transacciones ayudan para la ejecucin de las transacciones globales, por lo tanto cada procedimiento del sistema contiene en si dos subsistemas: Gestor de transacciones: gestiona la ejecucin de las transacciones que tienen el total acceso a los datos guardados en la base local, pero tomando en cuenta que las transacciones de este tipo solo pueden ser locales. El coordinador de transacciones: coordina la ejecucin de las diferentes transacciones tanto locales como globales. Cada gestor de transacciones es responsable de conservar un registro con la finalidad de poder recuperar informacin en caso de emergencia. Modos de fallos del sistema: los sistemas de bases de datos distribuidos pueden tener los mismos fallos que los sistemas de base de datos centralizados, por ejemplo: errores de software, hardware, o fallos graves del disco, pero existen otros fallos muy importantes en este tipo de sistema.

protocolos de control de la transmisin, como TCP/IP.

Modos de fallos del sistema: los sistemas de bases de datos distribuidos pueden tener los mismos fallos que los sistemas de base de datos centralizados, por ejemplo: errores de software, hardware, o fallos graves del disco, pero existen otros fallos muy importantes en este tipo de sistema.

protocolos de control de la transmisin, como TCP/IP.

Robustez de las bases de datos distribuidas Para que este tipo de sistema sea robusto debe primeramente detectar los fallos, volver a su configuracin del sistema para que pueda recuperarse el enlace. Los diferentes tipos de errores se tratan cada uno de manera diferente. prdida de mensaje se trata mediante la retransmisin

El sistema puede que detecte que se ha producido un tipo de fallo, pero no ser posible determinar el tipo de fallo y si estaban activadas las transacciones en las bases averiadas en el momento del error, hay que abortarlas, es decir es necesario que aborten este tipo de transacciones lo antes posible, porque pueden que exista bloqueos sobre las bases

que sigan activos. Si la base que se encuentra averiada es el servidor central de alguna base local, se debe hacer un tipo se eleccin para determinar el nuevo servidor, pero la reincorporacin de una nuevas base al sistema requiere que se tome precauciones. Cuando se recupera una base averiada, se debe realizar una serie de procedimientos para actualizar la base y mostrar los cambios realizados mientras estaba inactiva, y si la base tenia copias de algunos de los elementos, deber obtener los valores actualizados de dichos datos, y sobre todo asegurarse que recibir las actualizaciones posteriores. La reincorporacin de base puede llegar a ser muy complicado, una solucin para reincorporacin de la base es detener temporalmente todo el sistema, mientras se arregla el error, pero una detencin temporal del sistema puede llegar a ocasionar problemas, por tal motivo se han desarrollado tcnicas que permitan que las bases averiadas se reincorporen mientras se actualiza los datos correspondientes.

FUENTES DE INFORMACIN

Alice Y. H.

Tercera edicin Abraham Silberschatz, Henry F. Korth, S. Sudarshan

S-ar putea să vă placă și