Sunteți pe pagina 1din 6

Base de datos distribuidas

Una base de datos distribuida (BDD) es un conjunto de mltiples bases de datos lgicamente relacionadas
las cuales se encuentran distribuidas en diferentes espacios lgicos (pej. un servidor corriendo 2 mquinas
virtuales) e interconectados por una red de comunicaciones. Dichas BDD tienen la capacidad de realizar
procesamiento autnomo, esto permite realizar operaciones locales o distribuidas. Un sistema de Bases de
Datos Distribuida (SBDD) es un sistema en el cual mltiples sitios de bases de datos estn ligados por un
sistema de comunicaciones de tal forma que, un usuario en cualquier sitio puede acceder los datos en
cualquier parte de la red exactamente como si estos fueran accedidos de forma local.
Un sistema distribuido de bases de datos se almacenan en varias computadoras. Los principales factores
que distinguen un SBDD de un sistema centralizado son los siguientes:
- Hay mltiples computadores, llamados sitios o nodos.
- Estos sitios deben de estar comunicados por medio de algn tipo de red de comunicaciones para
transmitir datos y rdenes entre los sitios.
Inicialmente podemos decir que las SGBD surgen como respuesta a la distribucin que las empresas ya
tiene, al menos de manera lgica (divisiones, Departamentos, etc.) y que en ocasiones tambin de manera
fsica (plantas, fabricas). Toso esto nos lleva a que posiblemente los datos tambin estn distribuidos, ya
que cada unidad organizacional mantendr los datos con los que normalmente opere.
A cada una de estas subdivisiones se les llama islas de informacin, y lo que hace un sistema distribuido
es establecer los puentes necesarios para conectar a esas islas entre s.
En definitiva lo que pretende es que la estructura de la base de datos refleje la estructura de realidad una
BD virtual compuesta de varias BDs reales distintas que se encuentran en varios sitios distintos.
Definicin:
Podemos ver las BDD como un coleccin de mltiples bases de datos interrelacionadas lgicamente y
distribuidas por un red de computadores, formando un nica gran base de datos.
Tipo de Base de Datos Distribuidas:
Una de las decisiones ms importantes que el diseador de base de datos distribuidas debe tomar es el
posicionamiento de la data en el sistema y el esquema bajo el cual lo desea realizar. Para esto existen
cuatro alternativas principales: centralizada, replicada, fragmentada e hibrida.
Centralizada:
Es muy similar al modelo Cliente/Servidor en el sentido que la BDD est centraliza en un lugar y los usuarios
estn distribuidos. Este modelo solo brinda la ventaja de tener el procesamiento distribuido ya que en
sentido de disponibilidad y fiabilidad de los datos no se gana nada.
Replicadas:
El esquema de la BDD de replicacin consiste en que cada nodo debe tener su copia completa de la base de
datos. Es fcil ver que este esquema tiene un alto costo en el almacenamiento de la informacin. Debido a
que la actualizacin delos datos debe ser realizada en todas las copias, tambin tiene un alto costo de
escritura, pero todo esto vale la pena si tenemos un sistema en el que se va a escribir pocas veces y leer
muchas, y donde la disponibilidad y fiabilidad de los datos sea de mxima importancia.
Particionadas:
Este modelo consiste en que solo hay una copia de cada elemento, pero la informacin est distribuida a
travs delos nodos. En cada nodo se aloja uno o ms fragmentos disjuntos de la base de datos, como los
fragmentos no se replican esto disminuye el costo de almacenamiento, pero sacrifica la disponibilidad y
fiabilidad de los datos. Algo que se debe tomar en cuenta cuando se desea implementar este modelo es la
granularidad de la fragmentacin. La fragmentacin se realiza tambin de tres formas:
-Horizontal
-Vertical
-Mixto
-Hibrida: este esquema simplemente representa la combinacin del esquema de particin y replicas. Se
particiona la relacin y a la vez los fragmentes estn selectivamente replicados a travs del sistema de BDD.

Los Objetivos de una SBDD
1. Autonoma local:
Los sitios en un sistema distribuido deben ser autnomos.
-Autonoma local, significa que todas las operaciones en un sitio dado estn controladas por este sitio
-Seguridad, integridad y representacin de almacenamiento de los datos locales permanecen bajo el
control y jurisdiccin del sitio local.
2. Independencia de un sitio Central
La autonoma central implica que todos los sitios deben ser tratados como iguales. Por lo tanto, no debe
haber particularmente ninguna dependencia de un sitio maestro central para algn servicio central. Tal
que todo el sistema dependa de ese sitio central. Asimismo existen algunas razones por las cuales no
debera haber un sitio central como por ejemplo:
-el sitio central puede ser un cuello de botella
-el sistema seria vulnerable; es decir, si el sitio central falla, tambin fallara todo el sistema
3. el sistema debe estar en continua operacin:
Una ventaja de los sistemas distribuidos es que deben proporcionar mayor confiabilidad y mayor
disponibilidad.
Confiabilidad, la probabilidad de que el sistema est listo y funcionando en cualquier momento dado. Los
SD no son una propuesta de todo o nada; pueden continuar operando cuando hay alguna falla en algn
componente independiente.
Disponibilidad, probabilidad de que el sistema est listo y funcionando continuamente a lo largo de un
periodo especificado, podemos decir q nunca debera ser necesario apagar el sistema.
4. Procesamiento de consultas Distribuidas
El sistema debe ser capaz de procesar consultas que afecten a datos de ms de un sitio y hacerlo de forma
optimizada. Este hecho puede ser considerado como otra razn por la que los sistemas distribuidos siempre
son relacionales.
Distribuciones Homogneas:
En los sistemas de bases de datos distribuidas homogneas todos los sitios emplean idntico software de
gestin de bases de datos, son conscientes de la existencia de los dems sitio y acuerdan cooperar en el
procesamiento de las solicitudes de los usuarios.
En estos sistemas, los sitios locales renuncian a una parte de su autonoma en cuanto a su derecho a
modificar los esquemas o el software de gestin de bases de datos. Este software tambin debe cooperar
con los dems sitios en el intercambio de la informacin sobre las transacciones para hacer posible su
procesamiento entre varios sitios.
Distribuciones Heterogneas:
Las BDs Heterogneas o Multibase de Datos son aquellas donde Sitios diferentes utilizan diferentes
DBMSs, siendo cada uno esencialmente autnomo. Es posible que algunos sitios no sean conscientes de la
existencia de los dems y quizs proporcionen facilidades limitadas para la cooperacin en el
procesamiento de transacciones
Ventajas y desventajas
Ventajas
Refleja una estructura organizacional - los fragmentos de la base de datos se ubican en los departamentos a
los que tienen relacin.
Autonoma local - un departamento puede controlar los datos que le pertenecen.
Disponibilidad - un fallo en una parte del sistema solo afectar a un fragmento, en lugar de a toda la base
de datos.
Rendimiento - los datos generalmente se ubican cerca del sitio con mayor demanda, tambin los sistemas
trabajan en paralelo, lo cual permite balancear la carga en los servidores.
Economa - es ms barato crear una red de muchas computadoras pequeas, que tener una sola
computadora muy poderosa.
Modularidad - se pueden modificar, agregar o quitar sistemas de la base de datos distribuida sin afectar a
los dems sistemas (mdulos).
Desventajas
Complejidad - Se debe asegurar que la base de datos sea transparente, se debe lidiar con varios sistemas
diferentes que pueden presentar dificultades nicas. El diseo de la base de datos se tiene que trabajar
tomando en cuenta su naturaleza distribuida, por lo cual no podemos pensar en hacer joins que afecten
varios sistemas.
Economa - la complejidad y la infraestructura necesaria implica que se necesitar una mayor mano de
obra.
Seguridad - se debe trabajar en la seguridad de la infraestructura as como cada uno de los sistemas.
Integridad - Se vuelve difcil mantener la integridad, aplicar las reglas de integridad a travs de la red puede
ser muy caro en trminos de transmisin de datos.
Falta de experiencia - las bases de datos distribuidas son un campo relativamente nuevo y poco comn por
lo cual no existe mucho personal con experiencia o conocimientos adecuados.
Carencia de estndares - an no existen herramientas o metodologas que ayuden a los usuarios a convertir
un DBMS centralizado en un DBMS distribuido.
Diseo de la base de datos se vuelve ms complejo - adems de las dificultades que generalmente se
encuentran al disear una base de datos, el diseo de una base de datos distribuida debe considerar la
fragmentacin, replicacin y ubicacin de los fragmentos en sitios especficos.
Base de datos orientada a objetos
En una base de datos orientada a objetos, la informacin se representa mediante objetos como los
presentes en la programacin orientada a objetos. Cuando se integra las caractersticas de una base de
datos con las de un lenguaje de programacin orientado a objetos, el resultado es un sistema gestor de
base de datos orientada a objetos (ODBMS, object database management system). Un ODBMS hace que los
objetos de la base de datos aparezcan como objetos de un lenguaje de programacin en uno o ms
lenguajes de programacin a los que d soporte. Un ODBMS extiende los lenguajes con datos persistentes
de forma transparente, control de concurrencia, recuperacin de datos, consultas asociativas y otras
capacidades.
Los ODBMS son una buena eleccin para aquellos sistemas que necesitan un buen rendimiento en la
manipulacin de tipos de dato complejos.
Los ODBMS proporcionan los costes de desarrollo ms bajos y el mejor rendimiento cuando se usan objetos
gracias a que almacenan objetos en disco y tienen una integracin transparente con el programa escrito en
un lenguaje de programacin orientado a objetos, al almacenar exactamente el modelo de objeto usado a
nivel aplicativo, lo que reduce los costes de desarrollo y mantenimiento.
Inteligencia empresarial
El trmino inteligencia empresarial se refiere al uso de datos en una empresa para facilitar la toma de
decisiones. Abarca la comprensin del funcionamiento actual de la empresa, bien como la anticipacin de
acontecimientos futuros, con el objetivo de ofrecer conocimientos para respaldar las decisiones
empresariales.
Es la habilidad para transformar los datos en informacin, y la informacin en conocimiento, de forma que
se pueda optimizar el proceso de toma de decisiones en los negocios.
Las herramientas de inteligencia se basan en la utilizacin de un sistema de informacin de inteligencia que
se forma con distintos datos extrados de los datos de produccin, con informacin relacionada con la
empresa o sus mbitos y con datos econmicos.
Datawarehouse
Un Datawarehouse es una base de datos corporativa que se caracteriza por integrar y depurar informacin
de una o ms fuentes distintas, para luego procesarla permitiendo su anlisis desde infinidad de
pespectivas y con grandes velocidades de respuesta. La creacin de un datawarehouse representa en la
mayora de las ocasiones el primer paso, desde el punto de vista tcnico, para implantar una solucin
completa y fiable de Business Intelligence.
La ventaja principal de este tipo de bases de datos radica en las estructuras en las que se almacena la
informacin (modelos de tablas en estrella, en copo de nieve, cubos relacionales... etc). Este tipo de
persistencia de la informacin es homognea y fiable, y permite la consulta y el tratamiento jerarquizado de
la misma (siempre en un entorno diferente a los sistemas operacionales).
Datamart
Un Datamart es una base de datos departamental, especializada en el almacenamiento de los datos de un
rea de negocio especfica. Se caracteriza por disponer la estructura ptima de datos para analizar la
informacin al detalle desde todas las perspectivas que afecten a los procesos de dicho departamento. Un
datamart puede ser alimentado desde los datos de un datawarehouse, o integrar por s mismo un
compendio de distintas fuentes de informacin.
Por tanto, para crear el datamart de un rea funcional de la empresa es preciso encontrar la estructura
ptima para el anlisis de su informacin, estructura que puede estar montada sobre una base de datos
OLTP, como el propio datawarehouse, o sobre una base de datos OLAP. La designacin de una u otra
depender de los datos, los requisitos y las caractersticas especficas de cada departamento. De esta forma
se pueden plantear dos tipos de datamarts:
Datamart OLAP
Se basan en los populares cubos OLAP, que se construyen agregando, segn los requisitos de cada rea o
departamento, las dimensiones y los indicadores necesarios de cada cubo relacional. El modo de creacin,
explotacin y mantenimiento de los cubos OLAP es muy heterogneo, en funcin de la herramienta final
que se utilice.
Datamart OLTP
Pueden basarse en un simple extracto del datawarehouse, no obstante, lo comn es introducir mejoras en
su rendimiento (las agregaciones y los filtrados suelen ser las operaciones ms usuales) aprovechando las
caractersticas particulares de cada rea de la empresa. Las estructuras ms comunes en este sentido son
las tablas report, que vienen a ser fact-tables reducidas (que agregan las dimensiones oportunas), y las
vistas materializadas, que se construyen con la misma estructura que las anteriores, pero con el objetivo de
explotar la reescritura de queries (aunque slo es posibles en algunos SGBD avanzados, como Oracle).

Datamining (Minera de datos)
El datamining (minera de datos), es el conjunto de tcnicas y tecnologas que permiten explorar grandes
bases de datos, de manera automtica o semiautomtica, con el objetivo de encontrar patrones repetitivos,
tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto.
Bsicamente, el datamining surge para intentar ayudar a comprender el contenido de un repositorio de
datos. Con este fin, hace uso de prcticas estadsticas y, en algunos casos, de algoritmos de bsqueda
prximos a la Inteligencia Artificial y a las redes neuronales.
De forma general, los datos son la materia prima bruta. En el momento que el usuario les atribuye algn
significado especial pasan a convertirse en informacin. Cuando los especialistas elaboran o encuentran un
modelo, haciendo que la interpretacin que surge entre la informacin y ese modelo represente un valor
agregado, entonces nos referimos al conocimiento.

S-ar putea să vă placă și