Sunteți pe pagina 1din 7

RESUMEN UNIDAD II BDD

Un sistema distribuido de bases de datos consiste en un conjunto de localidades, cada uno de las cuales puede participar en la ejecucin de transacciones que accedan a datos de una o varias localidades. La diferencia principal entre los sistemas de base de datos centralizados y distribuidos es que, en los primeros, los datos residen en una sola localidad, mientras que, en los ltimos, se encuentran en varias localidades. Un sistema distribuido de base de datos consiste en un conjunto de localidades, cada una delas cuales mantiene un sistema de base de datos local. Se debe definir la red donde se distribuir el sistema; Puede ser una red totalmente conectada, prcticamente conectada, con estructura de rbol, de estrella o de anillo; para la eleccin va depender del costo de instalacin, comunicacin, fiabilidad, disponibilidad y otros aspectos que se tomen en cuenta. Distribucin de Datos:

Ventajas Utilizacin compartida de los datos y distribucin del control Fiabilidad y disponibilidad Agilizacin del procesamiento de consultas

Desventajas Coste del desarrollo de software Mayor posibilidad de errores Mayor tiempo extra de

procesamiento

La principal ventaja de los sistemas distribuidos es la capacidad de compartir y acceder a la informacin de una forma fiable y eficaz.

La desventaja principal de los sistemas distribuidos es la mayor complejidad que se requiere para garantizar una coordinacin adecuada entre localidades. Transparencia de red: es ocultar los detalles de informacin en la red, esta se relaciona con la autonoma local.

Autonoma local es el grado hasta el cual el diseador o administrador de una localidad pueden ser independientes del resto del sistema distribuido. Los datos que se recomienda ocultar son: Nombre de los datos, repeticin, su fragmentacin, localizacin de fragmentos y copias. Cada una de las localidades de la base de datos tienen que tener un id nico, para que se permitan diferenciar y evitar errores de sobreescritura. Para solucionar estos problemas se puede hacer uso de un asignador central de nombre que asigne nombres automticamente. Transparencia de la repeticin y la fragmentacin: el usuario no sabr a que replica o fragmento esta accediendo y no ser indispensable que lo especifique el usuario a la hora de realizar una consulta, el sistema tiene que ser capaz de reunir la informacin y presentarla al cliente. Transparencia de localizacin: La transparencia de localizacin se logra creando un conjunto de seudnimos o alias para cada usuario. As, el usuario puede referirse a los datos usando nombres sencillos que el sistema traduce a nombres completos. Con el uso de seudnimos, no ser necesario que el usuario conozca la localizacin fsica de un dato. Adems, el administrador de la base de datos puede cambiar un dato de una localidad a otra sin afectar a los usuarios. Transparencia y actualizaciones El principal problema es la sincronizar la concurrencia de los usuarios y realizar las ultimas modificaciones que se le hicieron a los datos. El sistema deber hacer comparaciones, con el fin de evitar la redundancia de los datos. Un diccionario de datos es un conjunto de metadatos que contiene las caractersticas lgicas de los datos que se van a utilizar en el sistema que se programa, incluyendo nombre, descripcin, alias, contenido y organizacin. Para documentar las caractersticas del sistema, incluyendo partes o componentes as como los aspectos que los distinguen. Tambin es necesario saber bajo que

circunstancias se lleva a cabo cada proceso y con que frecuencia ocurren. Se enfoca en 3 caractersticas principales: Naturaleza de las transacciones: las actividades de la empresa que se llevan a cabo mientras se emplea el sistema. Preguntas: solicitudes para la recuperacin o procesamiento de informacin para generar una respuesta especfica. Archivos y bases de datos: detalles de las transacciones y registros maestros que sonde inters para la organizacin. Capacidad del sistema: Habilidad del sistema para aceptar, procesar y almacenar transacciones y datos Transparencia: La podemos ver como la ocultacin de los usuarios y programadores de aplicacin de los componentes especificados por separado. De manera que vean una aplicacin como un todo y no como componentes separados. Transparencia de Localizacin.-Permite a los usuarios accesar a la informacin de un archivo cualquiera de la BD sin necesidad de indicar en que computadora se encuentra el archivo. Transparencia de Fragmentacin.-Permite al usuario accesar a la informacin de un archivo fragmentado como si todos los datos del archivo estuvieran en una misma computadora. Transparencia de rplica: Los usuarios ven cada objeto de datos como lgicamente nico, si saber que esta formado por diversas replicas de la BD. La fragmentacin de los datos permite dividir un objeto en dos o ms segmentos o fragmentos. El objeto podra ser una base de datos o una tabla. Fragmentacin horizontal: es la divisin de los datos por columnas (campos).

Fragmentacin vertical: es la divisin de las tablas por renglones (tupla o registros). Ffragmentacin mixta o hibrida: puede llevarse a cabo de tres formas diferentes: desarrollando primero la fragmentacin vertical y, posteriormente, aplicando la fragmentacin horizontal sobre los fragmentos verticales La distribucin de los datos se puede dar: CENTRALIZADA La BD est centralizada en un lugar y los usuarios estn distribuidos. REPLICADAS Cada nodo contara con una copia exacta de la BD original. PARTICIONADAS Habr una solo una replica pero la informacin se distribuir entre los nodos de acuerdo a la informacin que requiera cada uno.

El propsito de establecer una arquitectura de un sistema de bases de datos distribuidas es ofrecer un nivel de transparencia adecuado para el manejo de la informacin Un nivel de transparencia adecuado permite ocultar los detalles de

implementacin a las capas de alto nivel de un sistema y a otros usuarios La independencia de datos es la inmunidad de las aplicaciones de usuario a los cambios en la definicin y/u organizacin de los datos y viceversa. La independencia de datos se puede dar en dos aspectos: lgica y fsica. Independencia lgica de datos Los cambios que se realicen el la estructura lgica del sistema no afectaran el funcionamiento de la misma.

Independencia fsica de datos. La base de datos se puede mover de lugar o dispositivo de almacenamiento y esto no deber afectar a las aplicaciones del usuario. El objetivo que debe cumplir la de la transparencia es: tienen la propiedad comn de permitir que el usuario sienta que es el nico que esta utilizando la base de datos Tipos de Transparencia: *Transparencia de distribucin, permite que la base de datos siempre se mire como un todo, sin importar si tiene replicas, fue particionada, fragmentada o bien su localizacin. *Transparencia de transaccin, una transaccin se cumple o no cumple no puede quedar a medio proceso. En este punto se actualizan los datos de los distintos sitios de la red lo que garantiza el xito de la transaccin. *Transparencia de Fallas: si algunos de los nodos falla, el sistema contina funcionando normalmente como si nunca hubiera pasado nada y cuando se arregle el nodo podr reincorporarse al sistema sin ningn problema. *Transparencia de Desempeo, La BDD ser capaz de funcionar sobre

cualquier plataforma o arquitectura y garantiza buscar la mejor ruta para el envi de los datos y su pronta respuesta. *Transparencia de heterogeneidad: permite integrar varios DBMS, el sistema deber transformar la solicitud de un esquema y dar respuesta. Algoritmos Distribucin Datos No Replicados: Esta tecnologa lleva a los desarrolladores a enfrentar un problema, la carencia de metodologas y herramientas de apoyo para su diseo que permitan decidir la ubicacin de los datos en cada uno de los diferentes sitios que componen la red de computadoras.

El Modelo FURD, ha sido desarrollado para resolver el problema del diseo de las Bases de Datos Distribuidas, el cual esta divido en dos etapas o fases: la fragmentacin y la ubicacin de fragmentos. Algoritmos Distribucin Datos Replicados: Este problema tiene 2 restricciones: 1 Restriccin. Cada atributo se almacena solamente en un solo sitio (Para bases de datos distribuidas no replicadas) 2 Restriccin. Cada atributo m se ubica en un sitio i que al menos ejecute una consulta que involucre al atributo (Para bases de datos distribuidas replicadas) Las dos razones que llevan a la replicacin de datos es la tolerancia a fallos y mejorar el rendimiento del sistema Los aspectos que se toman el cuenta para medir el rendimiento del sistema es el tiempo de respuesta y la disponibilidad de los datos cuando esto se solicitan. La replicacin es inmediata cuando el sistema da una pronta respuesta y diferida cuando se toma unos minutos para arrojar el resultado. Mtodos que sobre salen: Mtodo de copia primaria: cada nodo guarda una lista de los nodos a los que se puede comunicar. Mtodo de Quorum: se da acceso a los nodos que se encuentran dentro del mismo grupo. Mtodo de copias disponibles: Las lecturas Mantienen el dato del ultimo valor del dato actualizado y las escrituras tendr efecto cuando al menos se actualice una copia.

By Mirna Meza

S-ar putea să vă placă și