Sunteți pe pagina 1din 118

ESCUELA DE CIENCIAS BSICAS E INGENIERA

Ingeniera de Sistemas
ASIGNATURA: Bases de Datos II

CORPORACIN UNIVERSITARIA REMINGTON


DIRECCIN PEDAGGICA
Este material es propiedad de la Corporacin Universitaria Remington (CUR), para los estudiantes de la CUR
en todo el pas.

2011

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 5

CRDITOS

El mdulo de estudio de la asignatura Bases de Datos II del Programa Ingeniera de Sistemas es propiedad de la
Corporacin Universitaria Remington. Las imgenes fueron tomadas de diferentes fuentes que se relacionan en los
derechos de autor y las citas en la bibliografa. El contenido del mdulo est protegido por las leyes de derechos de
autor que rigen al pas.
Este material tiene fines educativos y no puede usarse con propsitos econmicos o comerciales. El autor es Tutor del
CAT de la ciudad de Armenia y el trabajo se desarrollo con el apoyo del Operador Logstico FUNEC

AUTOR
Carolina Henao Murillo
Especialista En Gerencia Informtica
Terminacin: Cursando Actualmente Segundo Semestre, Ingeniera De Sistemas, Curso: Diplomado En Docencia
Universitaria, Curso: Fortalecimiento De La Tecnologa En La Educacin
Curso: Asesora Para La Aprehensin de Procesos Tecnolgicos
Instructora Sena, Tutora CUR
caritohenao@hotmail.com
Nota: el autor certific (de manera verbal o escrita) No haber incurrido en fraude cientfico, plagio o vicios de autora; en
caso contrario eximi de toda responsabilidad a la Corporacin Universitaria Remington, y se declar como el nico
responsable.

RESPONSABLES
Escuela de Ciencias Bsicas e Ingeniera
Director Dr. Mauricio Seplveda
Director Pedaggico
Octavio Toro Chica
dirpedagogica.director@remington.edu.co
Coordinadora de Medios y Mediaciones
Anglica Ricaurte Avendao
mediaciones.coordinador01@remington.edu.co

GRUPO DE APOYO
Personal de la Unidad de Medios y Mediaciones
EDICIN Y MONTAJE
Primera versin. Febrero de 2011.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 6

Derechos Reservados

Esta obra es publicada bajo la licencia CreativeCommons. Reconocimiento-No Comercial-Compartir Igual 2.5 Colombia.

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 7

TABLA DE CONTENIDO
1.

MAPA DE LA ASIGNATURA ............................................................................................. 8

2.

INTRODUCCIN ............................................................................................................. 9

2.1.

Futuro de las Bases de Datos .................................................................................................. 9

2.2.

Bases de Datos Activas .......................................................................................................... 14

3.

FUNCIONALIDAD ......................................................................................................... 22

3.1.

Bases de Datos Orientadas a Objetos (BDOO) y Bases de Datos Objeto Relacionales (BDOR)
22

3.2.

Bases de Datos Deductivas y Difusas .................................................................................... 33

3.3.

Bases de Datos Multimedia y Web ....................................................................................... 43

3.4.

Almacenes de Datos y Bases de Datos XML .......................................................................... 60

4.

DISTRIBUCIN ............................................................................................................. 70

4.1.

Bases de Datos Distribuidas .................................................................................................. 71

4.2.

Bases de Datos Federadas y Mviles .................................................................................... 83

5.

RENDIMIENTO ............................................................................................................. 99

5.1.

Bases de Datos Grid y Paralelas ............................................................................................ 99

6.

PISTAS DE APRENDIZAJE ............................................................................................ 117

7.

GLOSARIO ................................................................................................................. 118

8.

BIBLIOGRAFA............................................................................................................ 119

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 8

1. MAPA DE LA ASIGNATURA
BASES DE DATOS II
PROPSITO GENERAL DEL MDULO
Lograr una perspectiva global de las diversas tecnologas de bases de datos avanzadas y
su importancia en el mundo informtico.

OBJETIVO GENERAL
Proponer un modelo avanzado de bases de datos que administre la informacin de una
manera ptima, utilizando las herramientas tecnolgicas adecuadas.

OBJETIVOS ESPECFICOS
Conocer las principales tendencias en el rea de sistemas de bases de datos.
Determinar el tipo de base de datos que se requiere en una organizacin.
Disear el modelo avanzado de la base de datos basado en modelos que extienden
o sustituyen al modelo relacional.
Implementar la base de datos utilizando las tecnologas de bases de datos
avanzadas.

UNIDAD 1

UNIDAD 2

UNIDAD 3

UNIDAD 4

Fundamentacin
conceptual en el
futuro de las bases
de datos y bases
de datos activas.

Fundamentacin
procedimental y
competencias
interpretativas y
propositivas en el
manejo de BDOO,
bases de datos
deductivos
y
difusos. Al igual
que bases de
datos multimedia
y web, y almacn
de datos y XML.

Capacidad para
representar y
recordar
objetos y sus
propiedades en
bases de datos
distribuidas,
federadas
y
mviles.

Habilidad
y
destreza
para
usar
equipos,
procedimientos
de
rutina
y
complejos en el
rendimiento de
las bases de
datos GRID y
paralelas.

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 9

2. INTRODUCCIN
Se busca dar una visin general del futuro de la informacin, para ello se deben conocer los
antecedentes, evolucin y actualidad de las bases de datos, con el fin de enmarcar la importancia
del manejo de la informacin por medio de las tecnologas aplicadas para esta tarea.
OBJETIVO GENERAL
Conocer las principales tendencias en el rea de sistemas de bases de datos.
OBJETIVOS ESPECFICOS
Conocer los antecedentes, evolucin y actualidad de las bases de datos, enmarcando la
importancia del manejo de la informacin por medio de las tecnologas aplicadas.
Conceptualizar que por medio de los sistemas de bases de datos activas se logra un nuevo
nivel de independencia de datos.
Prueba Inicial
1. Sabe usted que es una base de datos.
2. Identifica usted la importancia del manejo de la informacin en nuestro entorno.
3. Describa mnimo tres caractersticas que se debe tener en cuenta para el manejo de la
informacin.
4. Reconoce el valor del manejo de los datos haciendo uso de las tecnologas de la
informacin y las comunicaciones.

2.1. Futuro de las Bases de Datos


Introduccin: Las bases de datos como producto estratgico de primer orden como apoyo en la
gestin de la informacin en las organizaciones.

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 10

http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/futuro.pdf

Evolucin de la Gestin de Datos: Generaciones de las bases de datos, tercera generacin, su


definicin y caractersticas principales.
Gestin de las empresas con cobol
Procesos datos
Generaciones de bases de datos
1 SGBD en red
2 SGBD relacionales
3 SGBD inteligentes, activos
Orientados a objetos
3 GENERACIN DE BASES DE DATOS
Proporciona capacidades de gestin de datos al igual que sus predecesoras, permitiendo que
grandes cantidades de datos persistentes sean compartidos por muchos usuarios. Tambin
proporcionan gestin de objetos, permitiendo tipos de datos muchos ms complejos, objetos
multimedia, datos derivados, encapsulamiento de la semntica de los datos, as como otras
nuevas capacidades. Algunos proporcionan incluso gestin de conocimiento, soportando un gran
nmero de reglas complejas para inferencia automtica de informacin y mantener las
restricciones de integridad entre datos.
Cattell (1991)
Gestiona informacin de una manera natural, haciendo esta informacin fcil de almacenar,
acceder y utilizar. Es necesario:
- Un fuerte soporte para texto, imagen, voz, animacin y vdeo
- Un modelo de bases de datos orientado al objeto
Un soporte de reglas declarativas para expresar las interrelaciones semnticas entre objetos.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 11

Khoshafian et al. (1990)


Nuevos Retos:
Seales de preocupacin Buchmann (1996)
Los SGBD son monolticos
Existen ms datos en hojas de clculo que en SGBD
El 50% de los datos en produccin estn en sistemas heredados (legacy systems)
Muchas aplicaciones no necesitan ms que ficheros
Los servicios de rplica no escalan por encima de los 10.000 nodos
No se puede combinar datos estructurados y no estructurados
Cambios en el entorno empresarial Keen (1985)
Flexibilidad organizacional
Adaptacin al cambio
Cobertura
Extensiones inter-empresa
Cooperaciones y alianzas
Procesos integrados
Gestin integrada y consistente

EMPRESA ABIERTA
Datos mal gestionados Zachman (1996)
El 70% de los informes se utilizan para volver a introducir datos en bases de datos
80/90% del tiempo se dedica al mantenimiento
60/70% se dedica a mantener interfaces y transformar datos de una base a otra
100M$ a parchear programas por errores al pasar datos
70% de las lneas de cdigo slo mueven datos
20/40% de toda la mano de obra de EEUU se dedica a recoger, almacenar y recuperar informacin
Avances en el hardware y las comunicaciones
Leyes de la evolucin del hardware:
Ley de Moore
Ley de Hoagland
Ley de Joy
Prediccin de gray
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 12

Mquinas paralelas
Tcnicas de compresin
Dispositivos de almacenamiento ptico
Digitalizadores de audio y vdeo
Factores y Lneas de Evolucin:

http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/futuro.pdf

http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/futuro.pdf

Funcionabilidad Inteligencia

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 13

http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/futuro.pdf

Rendimiento
BD paralelas
BD en tiempo real
BD en memoria principal
Distribucin
BD distribuidas
BD federadas
Multibases de datos
BD mviles
BD y web

Inteligencia
BD activas
BD deductivas
BD orientadas a objetos
BD seguras
BD difusas
Almacenes de datos
BD multimedia

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 14

Madurez de las Nuevas Tecnologas

http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/futuro.pdf

Ejercicio Tema 1
Segn el planteamiento de esta unidad, y desde su punto de vista como aspirante al ttulo de
Ingeniero de Sistemas, cree un ensayo en el cual plasme su punto de vista prospectivo sobre el
futuro de la informacin y su manejo haciendo uso de las tecnologas aplicadas para esta tarea.

2.2. Bases de Datos Activas


Introduccin: Definiciones de SGBD ACTIVO, PASIVO Y DEDUCTIVO, Ventajas y utilidades en SGBD.
SGBD ACTIVO:
Cuando se producen ciertas condiciones ejecuta de forma automtica ciertas acciones.

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 15

Debe ser capaz de monitorizar y reaccionar ante eventos de manera oportuna y eficiente.
http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/activas.pdf
SGBD DEDUCTIVO:
Capaz de deducir hechos adicionales a partir de la base de datos extensional aplicando axiomas
deductivos y reglas de inferencia.
SGBD PASIVO:

http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/activas.pdf

VENTAJAS
Mayor productividad
Mejor mantenimiento
Reutilizacin de cdigo
Reduccin del trfico de mensajes

UTILIDAD EN SGBD
Instantneas
Datos derivados
Reglas de integridad
Seguridad y auditora

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 16

Posibilidad
de
optimizacin
semntica Facilitar el acceso a la
BD a usuarios finales

Gestin de versiones

Componentes: Paton y Daz (1998)


Modelo de Conocimiento: Eventos, condicin, accin
Describe la situacin y la reaccin correspondiente
EVENTO
FUENTE (operacin, envo de mensajes, gestin de transacciones, excepciones, reloj, aplicacin...)
GRANULARIDAD (registro, conjunto)
TIPO DE EVENTO (primitivo, compuesto)
PAPEL (obligatorio, opcional, ninguno)
EVENTOS COMPUESTOS
DISYUNCIN
CONJUNCIN
SECUENCIA
NEGACIN
REPETICIN
MODELO DE CONOCIMIENTO
CONDICIN
PAPEL (obligatorio, opcional, ninguno)
AMBITO
Sobre parmetros del evento
Sobre estado de la BD
Al comienzo de la transaccin (BDT)
Cuando ocurri el evento (BDE)
Cuando se evala la condicin (BDc)
ACCIN
OPCIONES (operacin, envo de mensajes, actualizacin de reglas, abortar transaccin, hacer en
lugar de, externo)
AMBITO
Al comienzo de la transaccin (BDT)
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 17

Cuando ocurri el evento (BDE)


Cuando se evala la condicin (BDc)
Modelo de Ejecucin: Modos de acoplamiento
Realiza un seguimiento de la situacin y gestiona el comportamiento activo

http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/activas.pdf

http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/activas.pdf

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 18

http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/activas.pdf

http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/activas.pdf

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 19

http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/activas.pdf

http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/activas.pdf

Productos: Interbase, Postgres, SQL

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 20

http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/activas.pdf

http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/activas.pdf

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 21

http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/activas.pdf

Manifiesto de SGBDA: ACTNET (1996)


Caractersticas de los SGBDA
Un SGBDA es un SGBD
Un SGBDA tiene un modelo de reglas ECA
Un SGBDA debe soportar la gestin de reglas y la evolucin de la base de reglas
Caractersticas de ejecucin de reglas ECA
Un SGBDA tiene un modelo de ejecucin
Un SGBDA debe ofrecer diferentes modelos de acoplamiento
Un SGBDA debe implementar modos de consumo
Un SGBDA debe gestionar la historia de eventos
Un SGBDA debe implementar resolucin de conflictos
Caractersticas de aplicacin y usabilidad
Un SGBDA debera poseer un entorno de programacin
Un SGBD A debera ser ajustable
Ejercicio Tema 2
Con el objetivo de conceptualizar el Tema Bases de Datos Activas, de respuesta clara y precisa a
los siguientes interrogantes:
1. Cules son los Componentes de las Bases de Datos Activas?
2. Enumere los Productos y sus caractersticas ms relevantes.
3. Segn su concepto cul es la importancia del manifiesto de SGBDA?
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 22

3. FUNCIONALIDAD
Conocer que antes de la llegada de las Bases de Datos Orientadas a Objetos, las Bases de Datos
tradicionales no estaban diseadas para almacenar objetos, por ende al guardar los datos de un
programa con el enfoque Orientado a Objeto aumentaba de modo significativo su complejidad,
dando espacio a ms cdigo y ms esfuerzos de programacin, as como la dificultad de la
diferencia de esquemas.
OBJETIVO GENERAL
Determinar el tipo de base de datos que se requiere en una organizacin.
OBJETIVOS ESPECFICOS
Conocer que antes de la llegada de las Bases de Datos Orientadas a Objetos, las Bases de
Datos tradicionales no estaban diseadas para almacenar objetos.
Comprender que surgen recientes aplicaciones que consisten en ofrecer recursos para
definir Reglas Deductivas que permiten concluir, inferir u obtener informacin nueva a
partir de los datos almacenados o sucesos condicionados.
Prueba Inicial
1. Sabe usted que es un objeto.
2. Identifica usted los objetos que componen una base de datos.
3. Normaliza usted una base de datos.

3.1. Bases de Datos Orientadas a Objetos (BDOO) y Bases de Datos Objeto


Relacionales (BDOR)
Bases de datos orientadas a objetos:
Introduccin: Las bases de datos orientadas a objetos (BDOO) son aquellas cuyo modelo de datos
est orientado a objetos y almacenan y recuperan objetos en los que se almacena estado y
comportamiento. Su origen se debe a que en los modelos clsicos de datos existen problemas para
representar cierta informacin, puesto que aunque permiten representar gran cantidad de datos,
las operaciones que se pueden realizar con ellos son bastante simples.
Las clases utilizadas en un determinado lenguaje de programacin orientado a objetos son las
mismas clases que sern utilizadas en una BDOO; de tal manera, que no es necesaria una
transformacin del modelo de objetos para ser utilizado por un SGBDOO. De forma contraria, el
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 23

modelo relacional requiere abstraerse lo suficiente como para adaptar los objetos del mundo real
a tablas.
Las bases de datos orientadas a objetos surgen para evitar los problemas que surgen al tratar de
representar cierta informacin, aprovechar las ventajas del paradigma orientado a objetos en el
campo de las bases de datos y para evitar transformaciones entre modelos de datos (usar el
mismo modelo de objetos).
1. Conceptos relacionados con las bases de datos orientadas a objetos: En este apartado se
explican los conceptos relacionados con las BDOO:
Base de datos orientada a objetos (BDOO): una coleccin persistente y compatible de objetos
definida por un modelo de datos orientado a objetos.
Modelo de datos orientado a objetos: Un modelo de datos que captura la semntica de los
objetos soportados en la programacin orientada a objetos.
Sistema Gestor de Bases de Datos Orientadas a Objetos (SGBDOO): El gestor de una base de
datos orientada a objetos.
2. Origen de las Bases de Datos Orientadas a Objetos: El origen de las BDOO se encuentra
bsicamente en las siguientes razones:
La existencia de problemas para representar cierta informacin y modelar ciertos aspectos
del mundo real, puesto que los modelos clsicos permiten representar gran cantidad de
datos, pero las operaciones y representaciones que se pueden realizar sobre ellos son
bastante simples.
El paso del modelo de objetos al modelo relacional genera dificultades que en el caso de
las BDOO no surgen ya que el modelo es el mismo.
Por lo tanto, las bases de datos orientadas a objetos surgen bsicamente para tratar de
paliar las deficiencias de los modelos anteriores y para proporcionar eficiencia y sencillez a
las aplicaciones.
Las debilidades y limitaciones de los SGBDR son:
Pobre representacin de las entidades del mundo real.
Sobrecarga y poca riqueza semnticas.
Soporte inadecuado para las restricciones de integridad y empresariales
Estructura de datos homognea
Operaciones limitadas
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 24

Dificultades para gestionar las consultas recursivas


Desadaptacin de impedancias
Problemas asociados a la concurrencia, cambios en los esquemas y el inadecuado acceso
navegacional.
No ofrecen soporte para tipos definidos por el usuario (slo dominios)
Mientras que las necesidades de las aplicaciones actuales con respecto a las bases de datos son:
Soporte para objetos complejos y datos multimedia
Identificadores nicos
Soporte a referencias e interrelaciones
Manipulacin navegacional y de conjunto de registros
Jerarquas de objetos o tipos y herencia
Integracin de los datos con sus procedimientos asociados
Modelos extensibles mediante tipos de datos definidos por el usuario
Gestin de versiones
Facilidades de evolucin
Transacciones de larga duracin
Interconexin e interoperabilidad
Debido a las limitaciones anteriormente expuestas, el uso de BDOO es ms ventajoso si se
presenta en alguno de los siguientes escenarios:
Un gran nmero de tipos de datos diferentes
Un gran nmero de relaciones entre los objetos
Objetos con comportamientos complejos
Se puede encontrar este tipo de complejidad acerca de tipos de datos, relaciones entre objetos y
comportamiento de los objetos principalmente en aplicaciones de ingeniera, manufacturacin,
simulaciones, automatizacin de oficina y en numerosos sistemas de informacin. No obstante, las
BDOO no estn restringidas a estas reas. Ya que al ofrecer la misma funcionalidad que su
precursoras relacionales, el resto de campos de aplicacin tiene la posibilidad de aprovechar
completamente la potencia que las BDOO ofrecen para modelar situaciones del mundo real.
3. Caractersticas de las Bases de Datos Orientadas a Objetos y diferencias de stas con respecto
a las relacionales:
Mientras que en una BDR los datos a almacenar se almacenan representados en tablas en un
BDOO los datos se almacenan como objetos. Un objeto en BDOO como en POO es una entidad
identificable unvocamente que describe tanto el estado como el comportamiento de una entidad

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 25

del mundo real. El estado de un objeto es descrito mediante atributos mientras que su
comportamiento es definido mediante mtodos.
Las caractersticas asociadas a las BDOO son:
Objetos: cada entidad del mundo real se modela como un objeto.
La forma de identificar objetos es mediante un identificador de objetos (OID, Object
Identifier), nico para cada objeto. Generalmente este identificador no es accesible ni
modificable para el usuario (modo de aumentar la integridad de entidades y la integridad
referencial). Los OID son independientes del contenido. Es decir, si un objeto cambia los
valores de atributos, sigue siendo el mismo objeto con el mismo OID. Si dos objetos tienen
el mismo estado pero diferentes OID, son equivalentes pero tienen identidades diferentes.
Encapsulamiento: cada objeto contiene y define procedimientos (mtodos) y la interfaz
mediante la cual se puede acceder a l y otros objetos pueden manipularlo. La mayora de
los SGBDOO permite el acceso directo a los atributos incluyendo operaciones definidas por
el propio SGBDOO las cuales leen y modifican los atributos para evitar que el usuario
tenga que implementar una cantidad considerable de mtodos cuyo nico propsito sea el
de leer y escribir los atributos de un objeto. Generalmente, los SGBDOO permiten al
usuario especificar qu atributos y mtodos son visibles en la interfaz del objeto y pueden
invocarse desde afuera.
Otros conceptos utilizados de la misma manera que en la POO son:
Clases
Herencia simple, mltiple y repetida.
Polimorfismo de operacin, de inclusin y paramtrico; ligadura tarda (late binding); sobrecarga
(overloading) y suplantacin o anulacin (overriding).
Objetos complejos
4. Manifiesto Malcolm Atkinson: Caractersticas de un BDOO: En 1989 se hizo el Manifiesto de los
sistemas de base de datos orientados a objetos el cual propuso trece caractersticas obligatorias
para un SGBDOO y cuatro opcionales. Las trece caractersticas obligatorias estaban basadas en dos
criterios: deba tratarse de un sistema orientado a objetos y un SGBD.
Caractersticas obligatorias de orientacin a objetos:
1. Deben soportarse objetos complejos
2. Deben soportarse mecanismos de identidad de los objetos
3. Debe soportarse la encapsulacin
4. Deben soportarse los tipos o clases
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 26

5.
6.
7.
8.

Los tipos o clases deben ser capaces de heredar de sus ancestros


Debe soportarse el enlace dinmico
El DML debe ser computacionalmente complejo
El conjunto de todos los tipos de datos debe ser ampliable

Caractersticas obligatorias de SGBD:


1. Debe proporcionarse persistencia a los datos
2. El SGBD debe ser capaz de gestionar bases de datos de muy gran tamao
3. El SGBD debe soportar a usuarios concurrentes
4. El SGBD debe ser capaz de recuperarse de fallos hardware y software
5. El SGBD debe proporcionar una forma simple de consultar los datos.
Caractersticas opcionales:
1. Herencia mltiple
2. Comprobacin de tipos e inferencia de tipos
3. Sistema de base de datos distribuido
4. Soporte de versiones
5. Ventajas e inconvenientes de las BDOO: Aunque los SGBDOO pueden proporcionar soluciones
apropiadas para muchos tipos de aplicaciones avanzadas de bases de datos, tambin tienen sus
desventajas.
Las ventajas de un SGBDOO son:
Mayor capacidad de modelado: El modelado de datos orientado a objetos permite
modelar el mundo real de una manera mucho ms fiel. Esto se debe a:
Un objeto permite encapsular tanto un estado como un comportamiento
Un objeto puede almacenar todas las relaciones que tenga con otros objetos
Los objetos pueden agruparse para formar objetos complejos (herencia).
Ampliabilidad: Esto se debe a:
Se pueden construir nuevos tipos de datos a partir de los ya existentes.
Agrupacin de propiedades comunes de diversas clases e incluirlas en una superclase, lo que
reduce la redundancia.
Reusabilidad de clases, lo que repercute en una mayor facilidad de mantenimiento y un menor
tiempo de desarrollo.
Lenguaje de consulta ms expresivo: El acceso navegacional desde un objeto al siguiente
es la forma ms comn de acceso a datos en un SGBDOO. Mientras que SQL utiliza el

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 27

acceso asociativo. El acceso navegacional es ms adecuado para gestionar operaciones


como los despieces, consultas recursivas, etc.
Adecuacin a las aplicaciones avanzadas de base de datos: Hay muchas reas en las que
los SGBD tradicionales no han tenido excesivo xito como el CAD, CASE, OIS, sistemas
multimedia, etc. en los que las capacidades de modelado de los SGBDOO han hecho que
esos sistemas s resulten efectivos para este tipo de aplicaciones.
Mayores prestaciones: Los SGBDOO proporcionan mejoras significativas de rendimiento
con respecto a los SGBD relacionales. Aunque hay autores que han argumentado que los
bancos de prueba usados estn dirigidos a aplicaciones de ingeniera donde los SGBDOO
son ms adecuados. Tambin est demostrado que los SGBDR tienen un rendimiento
mejor que los SGBDOO en las aplicaciones tradicionales de bases de datos como el
procesamiento de transacciones en lnea (OLTP).
Los inconvenientes de un SGBDOO son: Carencia de un modelo de datos universal. No hay ningn
modelo de datos que est universalmente aceptado para los SGBDOO y la mayora de los modelos
carecen una base terica.
Carencia de experiencia: Todava no se dispone del nivel de experiencia del que se
dispone para los sistemas tradicionales.
Carencia de estndares: Existe una carencia de estndares general para los SGBDOO.
Competencia: Con respecto a los SGBDR y los SGBDOR. Estos productos tienen una
experiencia de uso considerable. SQL es un estndar aprobado y ODBC es un estndar de
facto. Adems, el modelo relacional tiene una slida base terica y los productos
relacionales disponen de muchas herramientas de soporte que sirven tanto para
desarrolladores como para usuarios finales.
La optimizacin de consultas compromete la encapsulacin: La optimizacin de consultas
requiere una compresin de la implementacin de los objetos, para poder acceder a la
base de datos de manera eficiente. Sin embargo, esto compromete el concepto de
encapsulacin.
El modelo de objetos an no tiene una teora matemtica coherente que le sirva de base.
6. ODMG: el estndar de facto para modelos de objetos: ODMG es un grupo de representantes de
la industria de bases de datos el cual fue concebido en el verano de 1991 con el objetivo de definir
estndares para los SGBDOO. Uno de sus estndares, el cual lleva el mismo nombre del grupo
(ODMG), es el del modelo para la semntica de los objetos de una base de datos. El modelo de
objetos ODMG es un superconjunto del modelo de objetos de OMG, que permite portar tanto los
diseos como las implementaciones entre diversos sistemas compatibles.

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 28

La ltima versin del estndar, ODMG 3.0, propone los siguientes componentes principales de la
arquitectura ODMG para un SGBDOO:
Modelo de objetos
Lenguaje de definicin de objetos (ODL, Object Definition Language)
Lenguaje de consulta de objetos (OQL, Object Query Language)
Conexin con los lenguajes C++, Smalltalk y Java (al menos)
El modelo de objetos ODMG permite que tanto los diseos como las implementaciones, sean
portables entre los sistemas que lo soportan.
ODL es un lenguaje para definir la especificacin de los tipos de objetos para sistemas compatibles
con ODMG. ODL es el equivalente de DDL (Data Definition Language o lenguaje de definicin de
datos) de los SGBD tradicionales. Define los atributos y las relaciones entre tipos y especifica la
signatura de las operaciones. Su principal objetivo es el de facilitar la portabilidad de los esquemas
entre sistemas compatibles al mismo tiempo que proporciona interoperabilidad entre distintos
SGBD. La sintaxis de ODL extiende el lenguaje de definicin de interfaces (IDL) de la arquitectura
CORBA (Common Object Request Broker Architecture).
OQL es un lenguaje declarativo del tipo de SQL que permite realizar consultas sobre bases de
datos orientadas a objetos, incluyendo primitivas de alto nivel para conjuntos de objetos y
estructuras. Est basado en SQL-92, proporcionando un superconjunto de la sentencia SELECT.
OQL no posee primitivas para modificar el estado de los objetos, ya que stas se deben realizar a
travs de los mtodos que dichos objetos poseen. La sintaxis bsica de OQL es una estructura
SELECT...FROM...WHERE..., como en SQL.
7. Bases de Datos Objeto - Relacionales:
Introduccin a las Bases de datos Objeto-Relacionales: Una Base de Datos Objeto Relacional
(BDOR) es una base de datos que desde el modelo relacional evoluciona hacia una base de datos
ms extensa y compleja incorporando para obtener este fin, conceptos del modelo orientado a
objetos. Podemos decir que un Sistema de Gestin Objeto-Relacional (SGBDOR) contiene dos
tecnologas; la tecnologa relacional y la tecnologa de objetos.
En una base de datos objeto-relacional se siguen almacenando tuplas, aunque la estructura de las
tuplas no est restringida a contener escalares (tipos compuestos como vectores, conjuntos, etc.)
sino que las relaciones pueden ser definidas en funcin de otras, que es lo que denominamos
herencia directa.

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 29

8. Caractersticas de las Bases de datos Objeto-Relacionales: Con las Bases de Datos ObjetoRelacional, se pueden crear nuevos tipos de datos, que permiten gestionar aplicaciones ms
complejas con una gran riqueza de dominios. Estos pueden ser tipos compuestos, lo que implica
que se debe definir al menos dos mtodos transformadores:
Uno para convertir el tipo nuevo a ASCII
Otro que convierte de ASCII al nuevo tipo.
Se soportan tipos complejos como: registros, conjuntos, referencias, listas, pilas, colas y arreglos.
Se pueden crear funciones que tengan un cdigo en algn lenguaje de programacin como por
ejemplo: SQL, Java, C, etc.
Existe una mayor capacidad expresiva para los conceptos y asociaciones.
Se pueden crear operadores asignndole un nombre y existencia de nuevas consultas con mayor
capacidad consultiva.
Se soporta el encadenamiento dinmico y herencia en los tipos tupla o registro.
Se pueden compartir varias bibliotecas de clases ya existentes, esto es lo que conocemos como
reusabilidad.
Posibilidad de incluir el chequeo de las reglas de integridad referencial a travs de los triggers.
Soporte adicional para seguridad y activacin de la versin cliente-servidor.
Anotar como punto final de este apartado, el inconveniente que tienen las BDOR, y es que
aumenta la complejidad del sistema y por tanto se ocasiona un aumento del costo asociado.
9. Tipos de Datos definidos por el Usuario: Los usuarios pueden definir sus propios tipos de datos,
a partir de los tipos bsicos provistos por el sistema o por otros tipos de datos predefinidos
anteriormente por el usuario. Estos tipos de datos pueden pertenecer a dos categoras distintas:
Los tipos de objetos (object types)
Los tipos para colecciones (collection types).
10. Tipos de Objetos: Un tipo de objetos define a lo que conocemos como una entidad del mundo
real. Se los pueden interpretar como una plantilla de objetos de ese tipo. Est compuesto por los
siguientes elementos:
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 30

Para identificar el tipo de objetos se utiliza un nombre.


Unos atributos que pueden ser de un tipo de datos bsico o de un tipo definido por el
usuario, que representan la estructura y los valores de los datos de ese tipo.
Unos mtodos que son procedimientos o funciones escritos en el lenguaje PL/SQL
almacenndose de esta forma en la base de datos, o escritos en C almacenndose
externamente.
11. Mtodos: A la vez que creamos un tipo de objeto, realizamos la especificacin de los mtodos.
Los mtodos se pueden ejecutar sobre los objetos de su mismo tipo. A continuacin mostramos
un ejemplo: si x es una variable PL/SQL que almacena objetos del tipo Alumnos_T, entonces
x.FechaNacimiento () calcula la fecha de nacimiento del alumno almacenado en x.
Mtodos Constructores de Tipo: Todos los tipos de objetos tienen asociado por defecto un
mtodo que se encarga de construir nuevos objetos de ese. El nombre del mtodo es el
mismo que el nombre del tipo, y sus parmetros que tenemos en dicho mtodo son los
atributos del tipo de objetos.
Mtodos de Comparacin: Estos mtodos son utilizados para que se pueda comparar los
objetos de un cierto tipo. Esta accin se lleva a cabo indicando cul es el criterio de
comparacin. Para poder hacer posible la realizacin de una comparacin es necesario
escoger entre un mtodo MAP o un mtodo ORDER:
Un mtodo de MAP es utilizado para indicar cul de los atributos del tipo se va a utilizar para
ordenar los objetos del tipo.
Un mtodo ORDER utiliza los atributos del objeto sobre el que se ejecuta para realizar un clculo y
compararlo con otro objeto del mismo tipo que toma como argumento de entrada. Este mtodo
debe devolver un valor negativo si el primero es mayor que el segundo, un valor positivo si ocurre
lo contrario y un cero si ambos son iguales.
Tablas de Objetos: Tras definir los tipos de objetos, stos pueden utilizarse para definir
otros tipos, tablas que almacenen objetos de esos tipos, o para definir el tipo de los
atributos de una tabla. Por ejemplo podemos definir una tabla que utiliza un tipo de datos
complejo para una de sus columnas. Una tabla de objetos es una clase especial de tabla
que almacena un objeto en cada fila.
Referencias entre Objetos: Los identificadores nicos, permiten que puedan ser
referenciados desde los atributos de otros objetos o desde las columnas de tablas. El tipo
de datos proporcionado por Oracle para soportar esta facilidad se denomina REF. Un
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 31

atributo de tipo REF almacena una referencia a un objeto del tipo definido, e implementa
una relacin de asociacin entre los dos tipos de objetos.
Tipos para Colecciones: Los tipos para colecciones se definen para poder implementar
relaciones 1:N. Un dato de tipo coleccin est formado por un nmero indefinido de
elementos, todos del mismo tipo. As es posible almacenar un conjunto de tuplas en un
nico atributo, en forma de array o de tabla anidada.
Los tipos para colecciones tambin tienen por defecto unas funciones constructoras de
colecciones cuyo nombre coincide con el del tipo. Los argumentos de entrada de estas funciones
son el conjunto de elementos que forman la coleccin separados por parntesis.
12. El Tipo VARRAY: Un array es un conjunto ordenado de elementos del mismo tipo. Cada
elemento tiene asociado un ndice que indica su posicin dentro del array. Un tipo VARRAY se
puede utilizar para:
Definir el tipo de datos de una columna de una tabla relacional.
Definir el tipo de datos de un atributo de un tipo de objetos.
Para definir una variable PL/SQL, un parmetro, o el tipo que devuelve una funcin.
No se produce ninguna reserva de espacio al declarar un tipo VARRAY. Se almacenar con
el resto de columnas de su tabla, si el espacio que requiere lo permite. En caso contrario,
se almacenar aparte de la tabla como un BLOB.
Es imposible poner condiciones sobre los elementos almacenados dentro de un VARRAY,
en las consultas. Esta es la principal limitacin que tiene este tipo de dato.
Tablas Anidadas: Una tabla anidada es un conjunto de elementos del mismo tipo en el que
no existe un orden predefinido. Estas tablas solamente pueden tener una columna que
puede ser de un tipo de datos bsico, o de un tipo de objetos definido por el usuario.
13. Herencia de tipos: La herencia de tipos surge por la posibilidad de definir tipos que sean
subtipos de otros supertipos. Aparte de que los subtipos definen sus propios atributos y sus
mtodos, los subtipos heredan los atributos y los mtodos definidos para sus supertipos. Los
subtipos son capaces de redefinir los mtodos que heredan, que es lo que conocemos como
polimorfismo.
Por ejemplo, desde el objeto general supertipo TIPO_PERSONA podemos definir el subtipo
TIPO_EMPLEADO que heredarn las caractersticas de su supertipo TIPO_PERSONA. El tipo objeto

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 32

especializado TIPO_EMPLEADO pueden tener atributos adicionales o pueden redefinir mtodos


del objeto padre TIPO_PERSONA extendiendo la funcionalidad de sus tipos objeto.
CREATE TYPE TIPO_PERSONA AS Object
(nombre varchar2(25), fecha_nac date
member function EDAD( ) return number,
member function PRINTME( ) return varchar2) not final;
CREATE TYPE TIPO_EMPLEADO UNDER TIPO_PERSONA
(sueldo number,
member function PAGA ( ) return number,
overriding member function PRINTME( ) return varchar2);
1. POSTGRES: Comenz como un proyecto denominado Ingres en la Universidad Berkeley de
California. En 1986 se continu con el desarrollo del cdigo de Ingres para crear el primer
SGBD objeto-relacional. En este sistema se mejora el modelo relacional a partir de que los
usuarios pueden crear sus propios tipos. El usuario puede introducir en las relaciones
atributos de tipo bsico o predefinidos por el mismo.
POSTGRES tambin mantiene la propiedad de herencia entre tipos de objetos de las bases de
datos objeto-relacionales. Desarrollando de una manera ms rpida y compleja estos tipos para su
desarrollo.
2. SQL: Se trata de un SGBD objeto-relacional. SQL: 99 permite crear los tipos estructurados
definidos por el usuario; Estos tipos estructurados tienen un nmero de caractersticas:
Pueden ser definidos para tener uno o ms atributos, los cuales pueden ser:
Tipos empotrados como INTEGER
Tipos de coleccin como ARRAY, u otro tipo de estructuras.
Todos los aspectos de su comportamiento son provistos mediante mtodos, funciones y
procedimientos.
Sus atributos son encapsulados mediante el uso del sistema generador observador y
mutador de funciones (funciones get y set)
Las comparaciones de sus valores son nicamente realizadas mediante funciones definidas
por el usuario.
Existe las jerarquas de tipo, en las cuales ms tipos especializados (subtipos) tienen todos
sus atributos y todos los mtodos de los tipos generalizados (supertipos), pero pueden
agregar nuevos atributos y mtodos particulares.

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 33

Ejercicio Tema 1
1. Defina: Base de datos orientada a objetos (BDOO), Modelo de datos orientado a objetos y
Sistema Gestor de Bases de Datos Orientadas a Objetos (SGBDOO).
2. Mencione y explique las caractersticas asociadas a las BDOO.
3. Explique las caractersticas obligatorias de orientacin a objetos y SGBD, segn el
Manifiesto Malcolm Atkinson.
4. Cite las ventajas e inconvenientes de las BDOO.
5. Qu es y que componentes posee el ODMG: el estndar de facto para modelos de
objetos.
6. Cules son las caractersticas de las Bases de datos Objeto-Relacionales?
7. Cules son los Tipos de Datos definidos por el Usuario?. Mencinelos y ejemplifquelos.
8. En qu consiste la herencia de tipos?

3.2. Bases de Datos Deductivas y Difusas


1. Bases de Datos Deductivas:
Introduccin: En el afn de ofrecer una respuesta a las necesidades planteadas por los usuarios y
por las aplicaciones avanzadas, en donde se necesitan herramientas semnticamente ms ricas
que las provistas por las Bases de Datos Relacionales, aparecen recientes aplicaciones de los
sistemas de bases de datos que consiste en ofrecer recursos para definir Reglas Deductivas que
permitan deducir, inferir u obtener informacin nueva a partir de los datos almacenados.
La meta de estas aplicaciones es incorporar a las Bases de Datos Relacionales los beneficios de la
lgica como instrumento para la formalizacin integrada de los aspectos estticos y dinmicos del
modelado de aplicaciones.

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 34

http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/08-09/Funcionalidad2.pdf

Existen diversas clases de BDDs y para cada una de ellas existe una semntica bien definida. Las
BDDs son muy usadas en las reas de: inteligencia artificial, sistemas expertos, representacin del
conocimiento, tecnologa de agentes, sistemas de informacin, integracin de datos, por nombrar
algunas.
Existe una importante relacin entre BDDs y programacin lgica. Una BDD es, en esencia, un
programa lgico; mapeo de relaciones base hacia hechos, y reglas que son usadas para definir
nuevas relaciones en trminos de las relaciones base y el procesamiento de consultas.
2. Representacin de la informacin: Las BDDs se representan mediante:
Conjunto de aserciones, o hechos, conocidos como la base de datos extensional (EDB): Los
hechos se especifican de manera similar a como se especifican las relaciones, excepto que no es
necesario incluir los nombres de los atributos. Recordemos que una tupla en una relacin describe
algn hecho del mundo real cuyo significado queda determinado en parte por los nombres de los
atributos. En una Base de Datos Deductiva, el significado del valor del atributo en una tupla queda
determinado exclusivamente por su posicin dentro de la tupla.
Conjunto de reglas (axiomas), referidos como la base de datos intencional (IDB): Las reglas se
parecen un poco a las vistas relacionales. Especifican relaciones virtuales que no estn
almacenadas realmente, pero que se pueden formar a partir de los hechos aplicando mecanismos
de inferencia basados en las especificaciones de las reglas. La principal diferencia entre las reglas y
las vistas es que en las primeras puede haber recursin y por tanto pueden producir vistas que no
es posible definir en trminos de las vistas relacionales estndar.

http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/08-09/Funcionalidad2.pdf

La EDB se encuentra generalmente almacenada en una base de datos relacional, y constituye el


conocimiento bsico de las BDDs. Las reglas permiten obtener o deducir nuevo conocimiento a
partir de la EDB, conocimiento que no se encuentra almacenado directamente en la EDB. De esta
manera, las BDDs permiten inferir nuevo conocimiento, el cual puede ser usado para la toma de
decisiones importantes del negocio.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 35

3. Manejo de las BDDs, Sintaxis y semntica de Datalog: En un sistema de BDDs por lo regular se
usa un lenguaje declarativo para especificar reglas. Con lenguaje declarativo se quiere decir un
lenguaje que define lo que un programa desea lograr, en vez de especificar los detalles de cmo
lograrlo.
Una mquina de inferencia (o mecanismo de deduccin) dentro del sistema puede deducir hechos
nuevos a partir de la base de datos interpretando las reglas. El modelo empleado en las BDDs est
ntimamente relacionado con el modelo de datos relacional, y sobre todo con el formalismo del
clculo relacional. Tambin est relacionado con el campo de la programacin lgica y el lenguaje
Prolog. Los trabajos sobre BDDs basados en lgica han utilizado Prolog como punto de partida.
Con un subconjunto de Prolog llamado Datalog se definen reglas declarativamente junto con un
conjunto de relaciones existentes que se tratan como literales en el lenguaje. Aunque la estructura
gramatical se parece a la de Prolog, su semntica operativa (esto es, la forma como debe
ejecutarse un programa en Datalog) queda abierta.
4. Sintaxis y semntica de Datalog: Las BDDs se componen de clusulas de Horn que constituyen
reglas del tipo "modus ponendo ponens", es decir, "Si es verdad el antecedente, entonces es
verdad el consecuente". No obstante, la forma de escribir las clusulas de Horn es al contrario de
lo habitual. Primero se escribe el consecuente y luego el antecedente.
%hechos
hombre(teraj).
hombre(abraham).
hombre(najor).
hombre(haran).
hombre(lot).
hombre(ismael).
hombre(isaac).
hombre(batuel).
hombre(laban).
hombre(esaud).
hombre(jacob).
mujer(sarai).
mujer(melca).
mujer(jesca).
mujer(agar).
mujer(rebeca).
padre(teraj,sarai).
padre(teraj,abraham).
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 36

padre(teraj,najor).
padre(teraj,haran).
padre(abraham,ismael).
padre(abraham,isaac).
padre(najor,batuel).
padre(haran,melca).
padre(haran,jesca).
padre(haran,lot).
padre(isaac,esaud).
padre(isaac,jacob).
padre(batuel,laban).
padre(batuel,rebeca).
madre(agar,ismael).
madre(sarai,isaac).
madre(melca,batuel).
madre(rebeca,esaud).
madre(rebeca,jacob).
casado(abraham,sarai).
casado(isaac,rebeca).
casado(najor,melca).
%reglas
hijo(X,Y) :- hombre(X),(padre(Y,X);madre(Y,X)).
hija(X,Y) :- mujer(X),(padre(Y,X);madre(Y,X)).
abuelo(X,Y) :- padre(X,Z),(padre(Z,Y);madre(Z,Y)).
abuela(X,Y) :- madre(X,Z),(padre(Z,Y);madre(Z,Y)).
hermano(X,Y) :- (X\==Y),hombre(X),hijo(X,Z),(hijo(Y,Z);hija(Y,Z)).
hermana(X,Y) :- (X\==Y),mujer(X),hija(X,Z),(hijo(Y,Z);hija(Y,Z)).
tio(X,Y) :- hermano(X,Z),(padre(Z,Y);madre(Z,Y)).
tia(X,Y) :- hermana(X,Z),(padre(Z,Y);madre(Z,Y)).
6
sobrino(X,Y) :- hombre(X),(tio(Y,X);tia(Y,X)).
sobrina(X,Y) :- mujer(X),(tio(Y,X);tia(Y,X)).
primo(X,Y) :- hombre(X),sobrino(X,Z),(padre(Z,Y);madre(Z,Y)).
prima(X,Y) :- mujer(X),sobrina(X,Z),(padre(Z,Y);madre(Z,Y)).
a_directo(X,Y) :- (hijo(Y,X);hija(Y,X)).
a_directo(X,Y) :- (hijo(Z,X);hija(Z,X)),a_directo(Z,Y).
a_indirecto(X,Y) :- not(a_directo(X,Y)),(sobrino(Y,X);sobrina(Y,X)).
a_indirecto(X,Y):not(a_directo(X,Z)),(sobrino(Z,X);sobrina(Z,X)),(a_indirecto(Z,Y);a_directo(Z,Y)).
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 37

ascendiente(X,Y) :- a_directo(X,Y);a_indirecto(X,Y).
d_directo(X,Y) :- (padre(Y,X);madre(Y,X)).
d_directo(X,Y) :- (padre(Z,X);madre(Z,X)),d_directo(Z,Y).
d_indirecto(X,Y) :- not(d_directo(X,Y)),(tio(Y,X);tia(Y,X)).
d_indirecto(X,Y):not(d_directo(Z,Y)),(d_directo(X,Z);d_indirecto(X,Z)),d_indirecto(Z,Y).
El antecedente puede ser una conjuncin de condiciones que se denomina secuencia de objetivos.
Cada objetivo se separa con una coma y puede considerarse similar a una instruccin o llamada a
procedimiento de los lenguajes imperativos. Para representar la disyuncin se utiliza punto y coma
en lugar de la coma, aunque, estrictamente no corresponde a una disyuncin, sino que
internamente se transforma en disyunciones.
En Datalog los valores constantes son de tipo numrico o cadenas de caracteres que empiezan
exclusivamente con letras minsculas y las variables siempre comienzan con una letra mayscula.
Si los argumentos son constantes, el predicado se toma como verdadero, si los argumentos son
variables se le considera una consulta o bien parte de una regla o restriccin.
Para hacer una consulta, utilizamos una clusula de Horn con uno de los parmetros vacos
(poniendo una variable en lugar donde queramos recibir los datos):
?- abuelo(X,isaac).
X = teraj
X = teraj
Yes.
En esta consulta preguntamos por los abuelos de Isaac. Tras utilizar las reglas que hemos
especificado, encontramos que los abuelos son Teraj, por parte de su madre Sarai, y Teraj por
parte de su padre, Abraham. Por ltimo, devuelve verdadero cuando se llega al final del recorrido
del rbol de deduccin. Puede ser, y de hecho es frecuente si no diseamos bien las reglas, que
una consulta caiga en un bucle infinito al realizar la deduccin.
5. Sistema de inferencia: En Datalog no existen instrucciones de control. Su ejecucin se basa en
dos conceptos: la unificacin y el backtracking.
Gracias a la unificacin, cada objetivo determina un subconjunto de clusulas susceptibles de ser
ejecutadas. Cada una de ellas se denomina punto de eleccin. Datalog selecciona el primer punto
de eleccin y sigue ejecutando el programa hasta determinar si el objetivo es verdadero o falso. En
caso de ser falso entra en juego el backtracking, que consiste en deshacer todo lo ejecutado
situando el programa en el mismo estado en el que estaba justo antes de llegar al punto de
eleccin. Entonces se toma el siguiente punto de eleccin que estaba pendiente y se repite de
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 38

nuevo el proceso. Todos los objetivos terminan su ejecucin bien en xito ("verdadero"), bien en
fracaso ("falso").
Existen principalmente dos tipos de inferencia computacional basados en la interpretacin de las
reglas por la teora de la demostracin:
1. Mecanismo de Inferencia Ascendente: Tambin llamado encadenamiento hacia delante o
resolucin ascendente. La mquina de inferencia parte de los hechos y aplica las reglas
para generar hechos nuevos. Conviene usar una estrategia de bsqueda para generar slo
los hechos que sean pertinentes a una consulta.
2. Mecanismo de Inferencia Descendente: Tambin llamado encadenamiento hacia atrs o
resolucin descendente. Parte del predicado que es el objetivo de la consulta e intenta
encontrar coincidencias con las variables que conduzcan a hechos vlidos de la base de
datos. Retrocede desde el objetivo buscado para determinar hechos que lo satisfacen. Si
no existieran los hechos que buscamos, el sistema entonces buscar la primera regla cuya
cabeza (LHS) tenga el mismo nombre de predicado que la consulta.
3. Ventajas: Las principales ventajas al utilizar una BDD son las siguientes:
Tener la capacidad de expresar consultas por medio de reglas lgicas.
Permitir consultas recursivas y algoritmos eficientes para su evaluacin.
Contar con negaciones estratificadas.
Soportar objetos y conjuntos complejos.
Contar con mtodos de optimizacin que garanticen la traduccin de especificaciones
dentro de planes eficientes de acceso.
Como caracterstica fundamental de una Base de Datos Deductiva es la posibilidad de
inferir informacin a partir de los datos almacenados, es imperativo modelar la base de
datos como un conjunto de frmulas lgicas, las cuales permiten inferir otras frmulas
nuevas.
4. Inconvenientes: La explotacin de las reglas de deduccin en una BDD plantea algunos
problemas:
Encontrar criterios que permitan, para una ley dada; decidir su utilizacin como regla de
deduccin o como regla de coherencia.
Replantear correctamente, en un contexto deductivo, las convenciones habituales en una
base de datos (representaciones de informaciones negativas, eficacia de las respuestas a
las interrogaciones, cierre del dominio).
Desarrollar procedimientos eficaces de deduccin. La posibilidad de caer en bucles
infinitos es un problema muy importante.

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 39

5. Bases de Datos Difusas:


Introduccin: Una de las caractersticas del lenguaje natural, que hace difcil su utilizacin en
sistemas computacionales es su imprecisin. Por ejemplo conceptos como pequeo o grande,
tienen significados diferentes de acuerdo al contexto en el que se estn utilizando, e incluso
dentro del mismo contexto, pueden significar cosas diferentes para diferentes individuos.
La teora de los conjuntos difusos desarrollada por Zadeh, provee una poderosa herramienta para
la representacin y manejo de la imprecisin por lo que actualmente est siendo utilizada en
varios campos para el diseo de sistemas basados en reglas difusas.
La teora de conjuntos difusos, extiende la teora clsica de conjuntos al permitir que el grado de
pertenencia de un objeto a un conjunto sea representada como un nmero real entre 0 y 1 en vez
del concepto clsico en el que solo se tiene la posibilidad de pertenecer a un conjunto o no
pertenecer al mismo; en otras palabras, el grado de pertenencia a un conjunto en la teora clsica
tiene solo dos valores posibles: 0 y 1.
En el sentido ms amplio, un sistema basado en reglas difusas es un sistema basado en reglas
donde la lgica difusa es utilizada como una herramienta para representar diferentes formas de
conocimiento acerca del problema a resolver, as como para modelar las interacciones y relaciones
que existen entre sus variables. Debido a estas propiedades, los sistemas basados en reglas difusas
han sido aplicados de forma exitosa en varios dominios en los que la informacin vaga o imprecisa
emerge en diferentes formas. Actualmente, el modelo relacional no permiten el procesamiento de
consultas del tipo Encontrar a todos los gerentes cuyo sueldo no sea muy alto dado que ni el
clculo ni el lgebra relacional, que establecen el resultado de cualquier consulta como una nueva
relacin, tienen la capacidad de permitir consultas de una manera difusa.
En los ltimos aos, algunos investigadores han lidiado con el problema de relajar el modelo
relacional para permitirle admitir algunas imprecisiones; esto conduce a sistemas de bases de
datos que encajan en el campo de la Inteligencia Artificial, ya que permiten el manejo de
informacin con una terminologa que es muy similar a la del lenguaje natural. Una solucin que
aparece recurrentemente en los trabajos de investigacin actuales en esta rea es la fusin de los
sistemas manejadores de bases de datos relacionales con la lgica difusa, lo que da lugar a lo que
se conoce como sistemas manejadores de bases de datos difusas o FRDBMS (por sus siglas en
ingls, Fuzzy Relational Database Management System).
6.

Modelos de Implementacin: El problema de la implementacin de los sistemas


gestores de bases de datos difusas ha sido tratado en dos vertientes principales:
Iniciar con un sistema gestor de bases de datos relacionales (SGBDR) con informacin
precisa y desarrollar una sintaxis que permita formular consultas imprecisas, lo cual da
origen a extensiones SQL, como Fuzzy SQL, con capacidades de manejar la imprecisin.

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 40

Construir un gestor de bases de datos relacionales difusas (SGBDRD) prototipo que


implemente un modelo concreto de base de datos relacional difusa en el que la
informacin imprecisa pueda ser almacenada. Dentro de esta vertiente existen dos
grandes ramas: Los modelos a travs de unificacin por relaciones de similitud y los
modelos relacionales basados en distribuciones de probabilidades.
7. Representacin de la Informacin: Los elementos relacionados con la manipulacin de
informacin difusa pueden tener representaciones diferentes. Por ejemplo, una
distribucin normalizada de probabilidades puede ser representada por diferentes tipos
de funciones (trapezoidal, triangular, intervalar, etc.). Lo ms usual, es que se usen
funciones de tipo trapezoidal. Lo mismo puede decirse de la forma en la que se modelan
los operadores relacionales difusos as como los dems elementos difusos que aparezcan
en el sistema.
El criterio empleado para seleccionar la forma de representacin de los mltiples elementos
difusos del sistema manejador de base de datos, puede afectar de manera determinante la
funcionalidad y desempeo de la base de datos, por lo que debera ser uno de los puntos centrales
en los que el experto ajuste la arquitectura del FRDBMS al problema especfico a tratar mediante
el mismo. Puede decirse entonces que este criterio de seleccin y ajuste constituye un paso entre
la formulacin de una base de datos relacional difusa y la implementacin de un sistema basado
en la misma.
La informacin que se puede manejar en una base de datos difusa puede dividirse en dos tipos
principales:
Datos Precisos: Manejados usualmente mediante la representacin provista por la base de
datos relacional husped.
Datos Imprecisos: Los modelos usualmente consideran dos tipos de representacin para
los datos imprecisos adems de la informacin desconocida o indeterminada que se
maneja mediante los tipos unknown, undefined y null:
Datos imprecisos sobre dominios ordenados: Este grupo de datos contiene distribuciones
de probabilidad definidas en dominios continuos o discretos, pero ordenados.

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 41

http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/08-09/Funcionalidad2.pdf

Datos con analogas sobre dominios discretos: Este grupo de datos se construye sobre
dominios discretos en los que existen definidas relaciones de proximidad entre sus
valores. En este caso se deber almacenar la representacin de los datos adems de la
representacin de las relaciones de proximidad definidas para los valores en el dominio.
Tipo de dato Indefinido (undefined): Cuando un atributo toma el valor undefined, esto
refleja el hecho de que ningn valor de su dominio es permitido. Por ejemplo: el nmero
de telfono de alguien que no tiene telfono.
Tipo de dato desconocido (unknown): Los datos de este tipo expresan nuestra ignorancia
sobre el valor que el atributo toma, sin embargo expresa tambin que puede tomar uno
de los valores del dominio. Por ejemplo la fecha de nacimiento de alguien, la
desconocemos pero tiene que tener alguna.
Tipo de dato nulo (null): Cuando un atributo toma el valor nulo, esto significa que no
tenemos informacin sobre l, ya sea porque no conocemos su valor o porque es
imposible asignarle un valor del dominio. Por ejemplo el email de alguien es null si
desconocemos su valor o si lo tiene o no.
8. Manejo de las BDRD: Para el manejo de las bases de datos relacionales difusas (BDRD) se
utiliza el lenguaje Fuzzy SQL (FSQL) que es un lenguaje que deriva de SQL, incorporando las
siguientes novedades.
Etiquetas Lingsticas: En las sentencias FSQL las etiquetas van precedidas del smbolo $,
para poder distinguirlas fcilmente.
Comparadores Difusos: Permiten comparar dos atributos o un atributo con una constante.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 42

Conectivas Lgicas: Pueden usarse NOT, AND y OR, para enlazar condiciones difusas
simples.
Umbral de Cumplimiento (threshold): Tras cada condicin simple puede imponerse un
umbral de cumplimiento mnimo (por defecto es 1), con el siguiente formato:
<condicin_simple> THOLD. La palabra reservada THOLD es opcional y puede sustituirse
por un comparador tradicional (=, <, <=...) modificando el sentido de la consulta. Por
defecto es equivalente al comparador >=.
Constantes Difusas: Pueden usarse en el SELECT todas las constantes difusas ya definidas:
UNKNOWN, UNDEFINED y NULL, $[a,b,c,d] (Distrib. de posibilidad Trapezoidal), $label
(Etiquetas), [n,m] (Intervalo) y #n (valores aproximados).
Funcin CDEG (<atributo>): Usada en la lista de seleccin, la funcin CDEG calcula, para
cada tupla, el grado de cumplimiento del atributo del argumento en la condicin de la
clusula WHERE.
Funcin CDEG(*): Calcula el grado de cumplimiento de cada tupla en la condicin de forma
global, para todos sus atributos y no slo para uno de ellos en particular. La funcin CDEG
usa, por defecto, los operadores tpicos para la negacin (1x), conjuncin (t-norma del
mnimo) y disyuncin (s-norma del mximo), pero pueden usarse otros (si se definen).
Carcter Comodn %: Similar al carcter comodn * de SQL, pero este incluye adems la
funcinCDEG aplicada a todos los atributos de la condicin. No incluye CDEG (*).
Condicin con IS: Tambin admite condiciones del tipo: <atributo_difuso> IS [NOT]
{UNKNOWN | UNDEFINED | NULL}.
Cuantificadores Difusos: Tiene dos modalidades que se aplican como condicin en la
clusula HAVING que sigue a una clusula GROUP BY:
Q elementos de X cumplen A:
$Cuantificador FUZZY[r] (condicin_difusa) THOLD
9. Ventajas:
Almacenar Imprecisin: la informacin que tengamos de un atributo particular de un
objeto, aunque esta informacin no sea el valor exacto. Suelen usar Etiquetas Lingsticas
con alguna definicin asociada (por ejemplo, un conjunto difuso visto como una
Distribucin de Posibilidad), o sin ninguna definicin asociada (escalares con una
relacin de similitud definida entre ellos).

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 43

Operar con esa informacin de forma coherente: (especialmente en las operaciones de


consulta). Muchos autores estudian la consulta difusa en BD clsicas: (Tahani, 1977; Bosc
et al., 1988, 1994, 1995; Wong, 1990; Galindo et. al., 1998a).
10. Inconvenientes:
Lenguaje de consulta incmodo, debido al gran nmero de parmetros que deben
utilizarse.
Comparadores abstractos que hacen difcil la decisin de cul debemos usar.
Falta de estandarizacin, derivado de la poca popularidad de este tipo de bases de datos.
Ejercicio Tema 2
1.
2.
3.
4.
5.

Cmo se representan las BDD (Bases de Datos Deductivas)?


Cul es la Sintaxis y semntica de Datalog?
Cite como mnimo tres ventajas e inconvenientes de las Bases de Datos Deductivas.
Qu son las Bases de Datos Difusas?
Explique las dos vertientes principales sobre la problemtica de la implementacin de los
sistemas gestores de bases de datos difusas.
6. Cules son los dos tipos principales con los que se puede manejar la informacin en una
base de datos difusa? Explquelos.
7. Cules son y en qu consisten las operaciones relacionales difusas?
8. Segn su criterio, realice una comparativa entre las Bases de Datos Deductivas y las Bases
de Datos Difusas.

3.3. Bases de Datos Multimedia y Web


1. Bases De Datos Multimedia
Introduccin: Este tipo de bases de datos tienen mucha relacin con los SGBD objeto relacionales
(SGBDOR) y los orientados a objetos (SGBDOO) ya que pueden almacenar tipos de datos
multimedia:

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 44

http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/funcionalidad%203.pdf

Podemos distinguir dos tipos de bases de datos multimedia fundamentales:


Bases de datos referenciales: son bancos de datos sobre material como pelculas, series
de televisin o msica. En la mayora de los casos, la informacin que se almacena hace
referencia a cuestiones descriptivas (autor, ttulo, duracin, productor, etc.) o a cuestiones
tcnicas (formato, duracin, etc.).
Bases de datos descriptivas: se trata de sistemas de anlisis de contenido que, ms all de
los datos tcnicos o generales que contiene la mayora de bases de datos referenciales,
aportan informacin especfica sobre el contenido. Estos bancos de datos no resultan tan
habituales y de hecho se encuentran en un estado de desarrollo embrionario, ya que el
anlisis de la imagen y del sonido no se halla tan automatizado como el del texto.
Existe, sin embargo, un nmero importante de bases de datos referenciales que actualmente se
emplean tanto en entornos cerrados (por ejemplo, las bases de datos que gestionan las
plataformas de televisin) como en redes abiertas del tipo Internet, que permiten una consulta en
muchos casos gratuita y libre por parte de los usuarios.
2. Integracin Multimedia En Las Bases De Datos: El nacimiento de la multimedia ha
renovado por completo la idea de base de datos. Si bien desde siempre se han visto
como almacenes de informacin (textual y numrica), regidos por un conjunto de
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 45

normas que le aportaban semntica. Con la llegada de la Multimedia el abanico se


ampla con la posibilidad de completar los objetos a los que representan. El ambiente de
un sistema de gestin de bases de datos multimedia integra texto, datos, video, imagen
(esttica y dinmica) y sonido.
Las bases de datos multimedia estn en un marco que adems de los datos se le incluye la nueva
caracterstica de que pueden tener variabilidad espacial y temporal. Por lo tanto, un documento
introducido en una base de datos multimedia es una composicin temporal, en la cual hay que
introducir los diferentes tipos de datos, tanto como las relaciones de configuracin y temporales
existentes entre ellos. Los datos deben estar sincronizados, controlando tanto su estado como su
comportamiento.
Los documentos multimedia se forman mediante la agregacin de objetos de diferentes tipos,
objetos que pueden ser de gran tamao, y llegan a mostrar gran variedad en lo referido a
estructura y representacin. La representacin del documento multimedia busca comunicar de
forma efectiva no slo el documento y su contenido, sino tambin la semntica, los conceptos
subyacentes y la relacin entre ellos. Uno de los enfoques bsicos es el anlisis de las
caractersticas de los usuarios humanos del sistema, para lo cual es indispensable conocer los
patrones de comportamiento del usuario en el acceso y comprensin de las estructuras
informativas.
En el momento en el que se comienza a disear e implantar una base de datos multimedia, el
objeto de trabajo ya no resulta ser el registro tradicional: el usuario est tratando con un
documento electrnico con todo lo que ello conlleva (texto, grficos, imgenes, datos, imgenes
animadas, sonidos). Adems a esto hay que sumarle los grandes volmenes de informacin
almacenadas en diferentes plataformas y aplicaciones, distribuidas en diferentes localizaciones
geogrficas... Todo esto condiciona a que las Bases de Datos Multimedia tengan dos caractersticas
principales: a) La disponibilidad de bases de datos avanzadas, en un entorno de fcil utilizacin por
parte del usuario. b) El establecimiento de redes de telecomunicaciones de alta velocidad.
3. Sistemas De Bases De Datos Multimedia: Tambin llamadas "gestores de informacin
hipermedial" los Sistemas gestores de bases de datos se diferencia de a otros SGBD
tradicionales (que ofrecan limitaciones en aspectos como el acceso complejo a datos, la
transferencia de datos con otros sistemas, o la inexistencia de adecuados interfaces de
usuario) en intentar disear e implementar Sistemas que sean capaces de utilizar
"inteligentemente" los datos disponibles, e integrar las viejas y las antiguas aplicaciones
de forma conjunta y sin problemas.
Una base de informacin hipermedial tiene varios componentes:
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 46

1.
2.
3.
4.

Base de presentacin: parmetros a aplicar para mostrar la informacin al usuario.


Base de estructura: visin lgica del hiperdocumento, segn un modelo.
Base de contenido: conjunto de documentos que se integran en el hiperdocumento.
Base de utilizacin: informacin sobre hbitos y comportamiento de cada usuario.

En su modelaje conceptual (correspondiente al esquema conceptual definido por ANSI/X3/SPARC),


las bases de datos multimedia debe cumplir dos fases:
1. Cognicin, centrado en cmo reconocer el mundo real, sus entidades y relaciones.
2. Modelizacin, centrado en cmo representar los conocimientos obtenidos en la fase
anterior, de manera que sean manipulables por la mquina.
A pesar de ser la integracin de bases de datos heterogneas una de las razones del desarrollo de
sistemas de gestin de bases de datos multimedia, la industria todava no ha establecido todava
estndares de formato entre ellas, por lo que se repite la misma situacin que en momentos
anteriores, entre ficheros de base de datos correspondientes a aplicaciones como dBASE, Paradox,
etc. Aunque las aplicaciones tradicionales ya ofrecen "puentes" para compartir sus bases de datos,
por el momento esto no es posible en lo que respecta a las bases de datos multimedia. Sin
embargo, estn comenzando a aparecer en el mercado nuevas aplicaciones que, sin cumplir los
requerimientos clsicos de un SGBD, pueden generar documentos multimedia, tomando como
base informacin y datos contenidos en otros tipos de fichero. Los lmites entre la base de datos
"real", y el documento multimedia resultante "virtual", son difciles de establecer en el estado
actual de la tecnologa. Si puede decirse que es posible establecerse un algoritmo que define el
proceso de formateo y composicin del documento, en dos niveles:
1. Jerarqua lgica del contenido del documento.
2. Jerarqua fsica del documento formateado.
Requisitos De Bases De Datos Multimedia: Un adecuado SGBD Multimedia debera
ofrecer herramientas para buscar, recuperar, manipular, ordenar y organizar los textos,
imgenes, vdeos en un entorno de formato libre, de tal forma que pueda utilizar
documentos de muy diverso formato, tamao y disposicin. El SGBD de datos multimedia
debera ofrecer lenguajes de descripcin de documentos avanzados, permitir el diseo de
estructuras de datos muy flexibles, y ofrecer mecanismos de bsqueda altamente
efectivos.
Como resumen, un sistema de base de datos multimedia debera:
Encontrar rpidamente la informacin multimedia, buscando cualquier nmero de
objetos referidos a un contenido de informacin.
Conectar documentos segn su contenido informativo, relacionando extractos de
informacin relacionada, de varios documentos, en un documento nuevo.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 47

Facilitar el acceso instantneo a los ficheros pertinentes, incluyendo los mecanismos


necesarios de compresin y descompresin para la manipulacin de aquellos.
Conocer y manipular, por parte del usuario, la estructura misma de la informacin.
Crear relaciones entre grupos de elementos informativos.
La implantacin y explotacin de Bases de datos Multimedia exige dos elementos
importantes:
Disponibilidad de Bases de Datos Avanzadas, en un entorno de fcil utilizacin por parte
del usuario.
Establecimiento de redes de telecomunicaciones de alta velocidad.
Metodologa De Una Base De Datos Multimedia: La creacin e implantacin de un
sistema de bases de datos multimedia no puede separarse de la adopcin de una
metodologa adecuada para ello. De la misma forma que en los sistemas "tradicionales" de
bases de datos, el enfoque a utilizar es el basado en un sistema integrado de informacin:
1. Definicin de las tareas y objetivos a cumplir por la unidad informativa.
2. Desarrollo de un metamodelo y de una metodologa para el desarrollo de un sistema de
informacin estratgica.
3. Inventario de los elementos de tecnologas de la informacin disponibles.
4. Inventario de las herramientas y de los repositorios de informacin existentes.
5. Creacin de un diccionario de metadatos y de su metodologa.
6. Consolidacin de las conclusiones obtenidas, a travs de metamodelos.

Los tres niveles de un sistema de bases de datos multimedia


http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/funcionalidad%203.pdf

La utilizacin de este tipo de bases de datos, en lo que se incluyen representaciones complejas de


la realidad, hace necesario la utilizacin de dos niveles de organizacin y de descripcin. En
primer lugar, una nivel de conocimiento, de metadatos, conceptual y difuso. En segundo lugar, un
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 48

nivel de datos, concreto y analtico. El concepto clave de las nuevas bases de datos, a partir de la
presente dcada, ser "significado", superando el clsico "dato" o "informacin".
4. Cuestiones de La Base de Datos Multimedia: Estos son algunos de las cuestiones que
an quedan por discutir a la hora de tratar con bases de Datos Multimedia:
Modelado: Dado que se va a trabajar con objetos complejos, que van desde simples textos
hasta videos, pasando por imgenes y sonido, el objetivo es encontrar un modelo que
permita describir la estructura de los objetos, y sobre el que pueda definirse lenguajes de
acceso especializados. Si queremos almacenar datos de texto, la mejor opcin es una Base
de Datos Relacional, pero para almacenar objetos de video, por ejemplo, una mejor
opcin sera una base de Datos Orientada a Objetos. Elegir una u otra a sabiendas de que
habr ambos tipos de datos es algo sobre lo que se debe seguir investigando. Y es que en
un objeto multimedia que represente el parte de una compaa de seguros en un
accidente, por ejemplo, este podra tener imgenes del accidente, formularios de los
implicados, grabaciones de audio de ambas partes, informe sobre los hechos decidir que
modelado es ms conveniente constituye una cuestin compleja sobre la que an se
debate.
Indexacin de imgenes: A la hora de indexar la informacin de una imagen, la cuestin es
optar por tcnicas de reconocimiento y procesamiento de imgenes o bien por la
asignacin manual de frases y trminos. La primera de estas tcnicas sufre un problema de
escalabilidad, ya que no es capaz de manejar el crecimiento continuo de trabajo, debido
en gran parte a que es una tcnica a la que le queda mucho por avanzar. La asignacin
manual de trminos est actualmente ms acogida por su sencillez de adaptacin, aunque
resolver sus problemas de ambigedad de trminos requiere tcnicas ms complejas.
Por ejemplo, si decidiramos buscar Calatrava podramos encontrarnos con obras del famoso
arquitecto, con poblaciones con ese nombre o con personas con ese apellido. Una solucin a esto
es relacionar el trmino con su contexto. Es decir, diferenciar las imgenes con Calatrava que
estn junto a Venecia o Puente no trataran sobre lo mismo que si acompaa a Ciudad Real o
Poblacin.
Recuperacin de textos: Un problema que tambin est relacionado con la recuperacin
de la informacin. Por un lado, y similar a lo expuesto con las imgenes, hay problemas a
la hora de indexar correctamente frases. En contraposicin a la utilizacin de trminos
unitarios, parece que aadir descriptores supone una mejora sustancial, estos deben ser
buenos indicadores del contenido. Por otro lado, el vocabulario del usuario es usualmente
diferente del usado a la hora de indexar el documento, por lo que sera ideal el uso de un
diccionario de sinnimos para ampliar la consulta del usuario. El problema de esto es, una
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 49

vez ms, la ambigedad del lenguaje. La solucin, de nuevo, puede solucionarse


relacionando el trmino con el contexto.
5. Tcnicas De Recuperacin De La Informacin: Los nuevos elementos que se presentan en los
documentos (audio, video, imgenes fijas o dinmicas) han hecho que se investigue sobre nuevas
tcnicas para la recuperacin de los mismos. Cabe citar:
Recuperacin de Audio: este problema se divide en varios niveles.
Primitivas bsicas: se asignan identificadores textuales a los archivos y el sistema se
encarga de recuperarlos con ese identificador.
Primitivas a nivel sintctico: amplan las posibilidades de recuperacin de sonidos
teniendo en cuenta aspectos como la frecuencia a la que se muestreo el archivo de audio,
cuantificacin, tamao de archivo, formato de compresin utilizado, y otras relacionadas
fuertemente con la acstica como niveles de agudos, grabes, dB, etc.
Primitivas a nivel semntico: tienen en cuenta el contexto en el que se genera el audio,
permitiendo diferenciar entre una conversacin o una pieza de msica.
Recuperacin de Vdeo al igual que en audio podemos dividirlo en:
Primitivas bsicas: tienen la capacidad de detectar planos, pudiendo detectar el encuadre
de escenas.
Primitivas a nivel sintctico en ella se tratan caractersticas propias de la imagen como
pueden ser brillo, luminosidad,...
Primitivas a nivel semntico al igual que en del sonido nos permite recuperar pelculas por
aspectos caractersticos de sta como tipo de pelcula.
Con todo esto llegamos a la conclusin de que el problema de recuperacines tan complejo
debido a que el usuario espera del sistema que encuentre elementos relevantes basados en
semnticas personales o culturales. La representacin de informaciones de carcter semntico es
muy compleja y requiere de tcnicas que implican a ciencias como la Inteligencia Artificial.
6. Ventajas E Inconvenientes de una Base de Datos Multimedia:
Ventajas:
La posibilidad de integrar en un nico sistema una gran diversidad de formatos (imgenes,
texto, video, sonido, etc).
Ofrecen mayor variedad a la hora de representar la informacin.
Un gran, y creciente, mercado potencial que augura que se siga investigando activamente
en el futuro.
Inconvenientes
Necesita grandes espacios para almacenar toda la informacin que queremos.

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 50

Este tipo de bases de datos necesitan grandes anchos de banda para obtener un
rendimiento ptimo.
Complejidad en cuanto a programar operaciones, o incluso la interfaz, debido a la alta
cantidad de formatos que hay que manejar, lo que puede repercutir en su rendimiento.
7. Bases De Datos Web
Introduccin: La utilizacin de la World Wide Web (www) para presentar y acumular datos se ha
desarrollado mucho ms all de la sencilla presentacin de pginas, ya no se hacen los antiguos
diseos web en los que los diseadores creaban una pgina independiente para cada elemento de
la coleccin que queran mostrar, esas pginas eran difciles de mantener y de organizar.
Cabe hacer mencin especial al gran nmero de aplicaciones a las que da soporte Internet, as
como a la naturaleza de las mismas, ya que no son aplicaciones estticas sino que estn en
constante renovacin (esto hace que sea especialmente importante separar los datos con los que
se trabaja de la aplicacin que los gestiona). Todo ello influye en la forma de almacenar y organizar
la informacin, debiendo de tener en cuenta todos estos factores a la hora de crear una BBDD
para la web.
Cualquier sitio web que presente informacin sobre un conjunto de elementos similares es
candidato para la utilizacin de una base de datos web.
La solucin general consiste en definir una base de datos, aadir un registro para cada elemento
(directamente en la base de datos o dinmicamente por la web) y despus consultar dicha base de
datos para generar pginas web sobre la marcha. Una pgina de men codificada en HyperText
Markup Language (HTML) convierte en una consulta a una base de datos de varios registros. Esto
supone una increble ventaja sobre todo a la hora del mantenimiento ya que es ms fcil tratar
una base de datos que muchas pginas individuales. Tambin un aumento de las capacidades del
HTML ya que ste tiene muchas limitaciones. Las tecnologas web estn reemplazando
arquitecturas como la terminal o cliente-servidor, incluyendo servicios y servidores web y de base
de datos entre ellos.
El funcionamiento de un navegador web es el siguiente:
1. El usuario haciendo uso del navegador web (sistema cliente) solicita visualizar una pgina
web.
2. El navegador solicita esta pgina (que est codificada en lenguaje HTML, el lenguaje que
puede interpretar) al servidor web (sistema servidor).
3. El servidor web enva la informacin que le han pedido, en HTML, al navegador del
usuario.
4. El navegador muestra la pgina web en la pantalla del usuario.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 51

El servidor debe devolver la informacin solicitada en HTML, as la informacin puede estar


almacenada en el servidor de forma esttica (un fichero .html) o ser generada de forma dinmica y
codificada en HTML.

http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/funcionalidad%203.pdf

8. Integracin Web BBDD: Tras observar la necesidad de que los servidores contacten
con las bases de datos se necesitan mecanismos para conseguir esta comunicacin; stos
mecanismos son conocidos cmo middleware web a bases de datos. Como hemos visto en
el primer apartado, es necesario integrar la web con Bases de Datos; para conseguir esta
integracin necesitamos una extensin que nos permite la comunicacin entre el servidor
web y la base de datos. Esta extensin se conoce como middleware web a Bases de Datos.
Nuestro servidor web se puede comunicar con este middleware a travs de dos interfaces:
CGI (Common Gateway Interface): Interfaz de entrada comn (en castellano) es
tecnologa web que permite a un cliente (explorador web) solicitar datos de un programa
ejecutado en un servidor web. CGI especifica un estndar para transferir datos entre el
cliente y el programa. Es un mecanismo de comunicacin entre el servidor web y una
aplicacin externa cuyo resultado final de la ejecucin son objetos MIME. En una
aplicacin CGI, el servidor web pasa las solicitudes del cliente a un programa externo. Este
programa puede estar hecho en cualquier lenguaje que soporte el servidor, aunque por
razones de portabilidad se suelen usar lenguajes de script (PHP, Perl, Python, ASP..), y
puede realizar multitud de operaciones incluyendo el acceso a la base de datos. La salida
de dicho programa es enviada al cliente en lugar del archivo esttico tradicional. El CGI
tiene una gran desventaja y es que al utilizar scripts que son programas externos, estos
deben de ejecutarse con cada solicitud lo que disminuye mucho la eficiencia del sistema
servidor; sin embargo las tecnologas web estn ampliando horizontes y pasando parte de
la carga que antes soportaba el servidor al cliente por medio de tecnologas como AJAX
(Javascript asncrono y XML).

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 52

API (Application Programming Interface): Interfaz de Programa de Aplicacin (en


castellano). Proporcionan unas funciones que suelen permitir entre otras cosas el acceso a
BBDD y la gestin de sesiones de usuario. Tiene la ventaja de que se ejecutan cmo parte
del servidor, ganando con ello tiempo ya que no se tienen que ejecutar cada vez que se
solicite una pgina, adems permite conexiones compartidas. La mayor desventaja que
presenta es que es dependiente del servidor que utilicemos, decrementando de ese modo
la portabilidad del sistema.
9. Caractersticas De BBDD WEB: Los distintos Sistemas Gestores de Bases de Datos (SGBD)
existentes incorporan en sus ltimas versiones software de tipo middleware (capa de
software que se sita sobre el SGBD) para aadir conectividad a la base de datos a travs
de Internet, por lo que realmente las bases de datos web no son ms que SGBD utilizados
y orientados con vistas a la web. Los middleware desarrollados en los distintos SGBD
suelen emplear ODBC (traduce las consultas de datos de la aplicacin en comandos que el
SGBD entienda) para conectar con la BD, junto con diversos conjuntos de herramientas
para facilitar al usuario la implementacin de la comunicacin con la BD a travs de
Internet.
Las principales caractersticas que debe cumplir un SGBD utilizado en tecnologa web son las
siguientes:
1.
2.
3.
4.

Permitir acceso concurrente a los datos.


Ofrecer mecanismos de seguridad.
Soportar transacciones.
Permitir almacenar grandes volmenes de datos, y almacenamiento de diferentes
archivos.

10. Datos Semiestructurados: Los datos semiestructurados son datos que pueden ser irregulares o
incompletos y cuya estructura puede cambiar de forma rpida o impredecible. Debido a esto, a
este tipo de datos no se les puede fijar un esquema fijo de antemano. La informacin asociada a
dicho esquema normalmente est contenida dentro de los propios datos. La diferencia entre los
SGBD semiestructurados con los relacionales o los orientados a objetos es que estos ltimos
deben seguir un esquema predefinido, como es el caso de los relacionales, cuyo esquema est
orientado a tablas, o los orientados a objetos, que ofrecen la posibilidad de crear estructuras ms
ricas pero aun as los datos deben estar fijados a un esquema predefinido. Es por eso que estos
SGBD tienen problemas a la hora de manejar datos semiestructurados.
Soluciones para el tratamiento de los datos semiestructurados: Existen una serie de
modelos y SGBD que permiten tratar con datos semiestructurados:

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 53

1. Modelos de Intercambio de Objetos (OEM, Object Exchange Model): Es un modelo de


objetos anidados que fue diseado originalmente para el proyecto TSIMMIS (The
Standford-IBM Manager of Multiple Information Sources) para soportar la integracin de
datos de diferentes origines de datos. Los datos OEM son carentes de esquema y autodescriptivos y puede considerarse como un grafo dirigido etiquetado, donde los nodos son
objetos

http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/funcionalidad%203.pdf

Como se puede observar en la figura, un objeto OEM est compuesto por un identificador nico
de objeto, por ejemplo &9, una etiqueta textual descriptiva, name, un tipo, string, y un valor, Ann
Beech. Estos objetos pueden clasificarse como atmicos o complejos. Los atmicos son objetos
que contienen un valor para el tipo base (entero, cadena de caracteres,) y pueden reconocerse
en el diagrama porque no tienen ninguna arista saliente. Todos los dems son objetos complejos,
cuyo tipo es un conjunto de identificadores de objetos. Los objetos complejos pueden ser padres
de mltiples objetos o hijos de mltiples padres.
Este tipo de objetos se puede considerar como una cudrupla (label,oid, type, value).
Por ejemplo:
{Staff, &4, set, (&9, &10)}
{name, &9, string, Ann Beech}
{salary, &10, decimal, 12000}
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 54

2. Lore (Lightweight Object Repository): Lore es un SGBD para datos semiestructurados que
utiliza el modelo OEM. Tiene un lenguaje de consulta propio, Lorel, que es una extensin
del lenguaje OQL (Object Query Lenguaje). Las caractersticas ms notables de este SGBD
son:
Tiene una sintaxis similar a SQL.
Obtiene resultados significativos an en ausencia de algunos datos.
Opera uniformemente con datos de diferentes tipos.
Devuelve informacin heterognea.
Resmenes de datos que se generan y mantienen dinmicamente que permiten realizar
consultas significativas y son utilizados por el procesador de consultas para aumentar la
eficiencia de cada consulta.
Un ejemplo de consulta Lorel sera:
SELECT s.Oversees
FROM DreamHome.Staff s
WHERE s.name = Ann Beech
Cuyo resultado sera:
Answer
PropertyForRent &5
street &11 2 Manor Rd
type &12 Flat
monthlyRent &13 375
OverseenBy &4
PropertyForRent &6
Street &14 18 Dale Rd
type &15 1
annualRent &16 7200
OverseenBt &4
3. XML (eXtensible Markup Lenguage): XML es un metalenguaje (un lenguaje para describir
otros lenguajes) que permite a los diseadores crear sus propias etiquetas personalizadas
para proporcionar funcionalidad no disponible en HTML.
Fue en 1998 cuando la W3C (World Wide Web Consortium) ratifico formalmente la primera
versin de XML como un estndar de intercambio de datos. Existen dos modelos de datos
principales a la hora de trabajar con XML.

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 55

Estos son el modelo centrado en los datos y el modelo centrado en los documentos. En un modelo
centrado en los documentos, XML se utiliza como formato de almacenamiento e intercambio para
datos que estn estructurados.
En este caso, los datos podran almacenarse en un SGBD relacional, objeto-relacional u orientado a
objetos. Por tanto, para poder almacenar datos XML en SGBD tradicionales es necesario
transformar las colecciones XML en esquemas compatibles con los SGBD tradicionales. Por
ejemplo, XML ha sido completamente integrado en los sistemas Oracle9i, Oracle10g y Oracle11g a
travs de una extensin llamada Oracle XML DB. En el caso de las consultas SQL, en el estndar
SQL: 2003 hay definidas una serie de extensiones a SQL que permiten la publicacin de cdigo
XML. Estas extensiones son conocidas como SQL/XML.
En el caso de que XML se use para codificar datos semiestructurados, los SGBD tradicionales no
podrn gestionarlos correctamente. Para realizar esto se necesitara un modelo centrado en los
documentos. Para estos sistemas se usa una base de datos XML nativa (NXD, Native XML
Database). Las NXD Definen un modelo de datos (lgico) para un documento XML (para el
documento, no para los datos contenidos en el) y almacena y extrae documentos de acuerdo con
dicho modelo. Ejemplos de estos modelos son el modelo de los datos de XPath, los XML Infoset, y
los modelos explicitados por el DOM y los eventos en SAX 1.0.Se pueden distinguir dos tipos de
NXD segn su almacenamiento:
Basados en texto: almacenan el cdigo XML como texto, por ejemplo como un archivo de
un sistema de archivos o como un dato de tipo CLOB en un SGBD relacional.
Basados en modelo: almacenan el cdigo XML en alguna representacin interna en forma
de rbol.
4. Tecnologas Web Dinmicas:
CGI (COMMON GATEWAY INTERFACE) La interfaz de pasarela comn (Common Gateway
Interface, CGI) es un protocolo estndar que permite extender las capacidades de HTTP,
permitiendo interactuar una aplicacin con un servidor web. sta aplicacin puede estar
escrita en varios lenguajes como C, C++, Java, Perl, Python La tarea de un servidor es
responder las peticiones (en el caso de un servidor web, de navegadores web) devolviendo
una salida. Cada vez que llega una peticin, el servidor analiza que se est pidiendo y
devuelve la respuesta apropiada.
A continuacin se describe la forma de actuacin de un CGI de forma esquemtica:
1. En primera instancia, el servidor recibe una peticin (el cliente ha activado un URL que
contiene el CGI), y comprueba si se trata de una invocacin de un CGI.
2. Posteriormente, el servidor prepara el entorno para ejecutar la aplicacin. Esta informacin
procede mayoritariamente del cliente.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 56

3. Seguidamente, el servidor ejecuta la aplicacin, capturando su salida estndar.


4. A continuacin, la aplicacin realiza su funcin: como consecuencia de su actividad se va
generando un objeto MIME que la aplicacin escribe en su salida estndar.
5. Finalmente, cuando la aplicacin finaliza, el servidor enva la informacin producida, junto
con informacin propia, al cliente, que se encontraba en estado de espera. Es
responsabilidad de la aplicacin anunciar el tipo de objeto MIME que se genera (campo
CONTENT_TYPE), pero el servidor calcular el tamao del objeto producido.
Ejemplo de cmo conectarse a una Base de Datos ODBC usando PERL:
Paso 1. Conectarse a la Base de Datos:
$dbName = "BaseDatos";
$dbDriver = "ODBC";
$dbUserName = "Usuario";
$dbPassword = "Password";
$sql = SELECT * FROM USUARIOS;;
$dbh = DBI->connect($dbName, $dbUserName, $dbPassword, $dbDriver);
Paso 2. Realizar Consulta y traer registros a un array:
$dataObject = $dbh->prepare($sql);
$dataObject->execute();
@dbRows = $dataObject->fetchall_arrayref();
Paso 3. Cerrar Result y Conexion
$dbh->disconnect(); PHP (
PHP (Hypertext Pre-Processor): PHP es un lenguaje de programacin interpretado usado
normalmente para la creacin de pginas web dinmicas. PHP es un acrnimo recursivo
que significa "PHP Hypertext Pre-processor" (inicialmente PHP Tools, o, Personal Home
Page Tools). Cuando el cliente hace una peticin al servidor para que le enve una pgina
web, el servidor ejecuta el intrprete de PHP.
ste procesa el script solicitado que generar el contenido de manera dinmica (por ejemplo
obteniendo informacin de una base de datos). El resultado es enviado por el intrprete al
servidor, quien a su vez se lo enva al cliente. Permite la conexin a diferentes tipos de servidores
de bases de datos tales como MySQL, Oracle, ODBC o Microsoft SQL Server. Tal vez la mayor
ventaja de PHP sobre sus competidores es la integracin con los sistemas de bases de datos y el
soporte nativo a las distintas bases de datos existentes, libres y comerciales.
Ejemplo de cmo conectarse a una Base de Datos MySQL.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 57

Paso 1. Conectarse a la Base de Datos:


$link=mysql_connect("localhost","usuario","Password")
Paso 2. Seleccionar Base de Datos y Realizar Consulta:
mysql_select_db("base_datos",$link)
$result=mysql_query("select * from prueba",$link);
Paso 3. Recoger registros del resultado de la consulta:
while($row = mysql_fetch_array($result)) {
printf("Nombre: %s Apellidos: %s", $row["Nombre"],$row["Apellidos"]);
}
Paso 4. Cerrar Result y Conexin:
mysql_free_result($result);
mysql_close($link);
ASP.NET Herramienta de desarrollo web comercializado por Microsoft. Es usado por
programadores para construir sitios web, aplicaciones web y servicios XML. Forma parte
de la plataforma .NET de Microsoft y es la tecnologa sucesora de la tecnologa Active
Server Pages (ASP). ASP.net ofrece dos maneras de conectarse a una base de datos web:
Controles de Origen de Datos: Permiten encapsular el acceso a los datos en un control
que se puede configurar con informacin sobre la conexin y la consulta. Estos controles
sern utilizados por otros controles para mostrar resultados de consultas en la Base de
Datos. Para conectarse a una base de datos mediante un control de origen de datos,
deber realizar las operaciones siguientes:
1. Determinar el tipo de control de origen de datos que necesita, dependiendo del tipo
elegido puede necesitar seleccionar un proveedor, como System.Data.SqlClient para
SQLServer, System.Data.OleDb para OleDb, System.Data.Odbc para conexiones mediante
Odbc o System.Data.OracleClient para bases de datos Oracle.
2. Agregar el control de origen de datos a la pgina y establecer sus propiedades para el
acceso a datos.
Codificacin mediante clases de ADO.net: Esta prctica es aconsejable si sus requisitos
son demasiado complejos para utilizar los controles de origen de datos o si desea crear un
componente independiente que realice el acceso a los datos fuera de sus pginas Web.
ADO.net, el cual es un conjunto de los componentes del software que pueden ser usados
por los programadores para accesar a datos y a servicios de datos, el cual proporciona
objetos Connection, Reader, DataSet, para conectarse a una Base de Datos realizaramos
lo siguiente:
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 58

Paso 1. Creamos un objeto SqlConnection:


Dim myConnection As New SqlConnection
("server=(local)\NetSDK;database=pubs;Trusted_Connection=yes")
Paso 2. Crear un Adaptador de Objetos SqlDataAdapter:
Dim myCommand As New SqlDataAdapter("select * from Authors", myConnection)
Paso 3. Crear un DataSet y ejecutar la consulta:
Dim ds As New DataSet()
myCommand.Fill(ds, "Authors")
Paso 4. Cerrar DataSet y Conexin:
ds.close()
myConnection.close()
JSP (JavaServer Pages): JavaServer Pages (JSP) es una tecnologa Java que permite generar
contenido dinmico para web, en forma de documentos HTML, XML o de otro tipo. El
funcionamiento general de la tecnologa JSP es que el Servidor de Aplicaciones interpreta
y compila el cdigo contenido en la pgina JSP para construir el cdigo Java del servlet a
generar. Este servlet ser el que genere el documento (tpicamente HTML) que se
presentar en la pantalla del Navegador del usuario.
JDBC es una API pura de Java que se usa para ejecutar comandos de SQL. Suministra una serie de
clases e interfaces que permiten al desarrollador de web escribir aplicaciones que gestionen Bases
de Datos.
La interaccin tpica con una base de datos consta de los siguientes cuatro pasos bsicos:
Paso 1. Abrir la conexin a la base de datos:
Connection conexion =
DriverManager.getConnection ("jdbc:odbc:Nombre_ODBC","usuario","password");
Paso 2. Ejecutar consultas a la base de datos:
Statement consulta = conexion.createStatement();
ResultSet rs = consulta.executeQuery("select dni,nombre,apellidos,edad from agenda");
Paso 3. Procesar los resultados. En este caso los muestra en pantalla:
while (rs.next()) {
out.println("DNI ->"+ rs.getString("dni"));
out.println("NOMBRE ->"+ rs.getString("nombre"));
out.println("APELLIDOS ->"+ rs.getString("apellidos"));
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 59

out.println("EDAD ->"+ rs.getInt("edad"));


}
Paso 4. Cerrar la conexin a la base de datos:
rs.close (); consulta.close (); conexion.close();
5. Ventajas E Inconvenientes de La BBDD Web: Las principales ventajas e inconvenientes que
proporciona el uso de un SGBD en la web se mencionan a continuacin:

1.
2.
3.
4.
5.

Ventajas:
Independencia del Hardware y el Software.
Independencia de la ubicacin.
Facilita el mantenimiento de las aplicaciones web, materializando la separacin entre la
persistencia de datos y las capas de presentacin y dominio de la aplicacin.
Facilita la portabilidad del sistema.
Independencia de la plataforma.

Inconvenientes:
1. Decremento de la seguridad al estar accesible desde cualquier ubicacin.
2. Incremento de la complejidad de diseo de la aplicacin web.
3. Fiabilidad dependiente de la disponibilidad de red del servidor y/o servidores donde se
aloja la Base de Datos.
Ejercicio Tema 3
1. Qu es Middleware Web a Bases de Datos?
2. Cules son las principales caractersticas que debe cumplir un SGBD utilizado en
tecnologa web?
3. Cul es la diferencia entre los SGBD semiestructurados con los relacionales o los
orientados a objetos?
4. Defina: CGI (COMMON GATEWAY INTERFACE).
5. Qu es PHP (Hypertext Pre-Processor)?
6. Cules son las dos maneras de conectarse a una base de datos web ASP.net?. Explique
su respuesta.
7. Cite un ejemplo de BBDD-WEB.
8. Qu son las Bases de Datos Multimedia?
9. Cules son los componentes de una base de informacin hipermedial?
10. Cules son los requisitos de una Base de Datos Multimedia?

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 60

3.4. Almacenes de Datos y Bases de Datos XML


1. Almacenes de Datos
Introduccin: Los almacenes de datos, tambin llamados Data Warehouse, son almacenes de
informacin temtica, orientadas a cubrir las necesidades a las organizaciones con el fin de
obtener un sistema de soporte para la gestin, control y apoyo de la toma de decisiones y as una
ventaja comercial. Es considerado como la solucin para acceder a los datos almacenados en
sistemas no relacionales.
Conceptos: Debido a la complejidad y rendimiento, los almacenes de datos han sido
rechazados, sin embargo, actualmente ha surgido un defensor, Hill Inmon, que es
considerado como el padre de los almacenes de datos y los define los datos como:
Clasificados por temas, ya que estn organizados de manera que todos los elementos de
datos relativos al mismo evento u objeto del mundo real queden unidos entre s.
Integrados, ya que las bases de datos contienen datos de todos los sistemas operacionales
de la organizacin y deben ser consistentes.
Variables en el tiempo, los cambios producidos en los datos a lo largo del tiempo quedan
registrados para que los informes que se puedan generar reflejen esas variaciones.
No Voltil, ya que los datos no se modifican ni se elimina, una vez almacenado un dato,
ste se convierte en informacin de solo lectura y se mantiene para futuras consultas, en
lugar de sustituir la informacin ya existente.
Por tanto el objetivo de los almacenes de datos es integrar todos los datos en un nico almacn en
el cual los usuarios puedan ejecutar consultas con facilidad, generar informes y realizar anlisis,
por tanto es una tecnologa de gestin y de anlisis de datos.
2. Arquitectura: A partir de la Figura 1 donde se muestran cada una de las partes que forman
un almacn de datos, se definen de forma aclaratoria a continuacin.

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 61

http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/08-09/FUNCIONALIDAD%204.pdf

Repositorio de Datos Operacionales: El repositorio de datos operacionales es la fuente


donde se encuentran los datos primitivos, actuales e integrados, por lo tanto es el
encargado de suministrar datos al sistema, estos datos operacionales pueden ser:
Mayoritariamente precedentes de sistemas mainframe.
Datos de estaciones de trabajo o servidores privados.
Sistemas externos como las bases de datos comerciales, de proveedores o clientes, o
incluso de Internet.
Datos departamentales almacenados en Sistemas Propietario.
Gestor de Carga: Es el encargado de la extraccin y carga de los datos del repositorio de
datos, adems de realizar algunas transformaciones simples a los datos con el fin de que
estn adaptados a las necesidades del almacn de datos.
Gestor del Almacn de Datos: Realiza las operaciones relacionadas con la gestin de los datos
dentro del almacn utilizando herramientas especficas que realizan operaciones como la
transformacin de datos para la incorporacin de stos en las tablas del almacn de datos, la
creacin de ndices y vistas de las tablas base, creacin de copias de seguridad y archivado de
datos, adems del anlisis de los datos para garantizar la coherencia de los mismos.

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 62

Tipos de Datos: En esta rea del almacn de datos es donde se encuentran todos los datos
contenidos en la base de datos.
Datos Detallados: Son los que se obtienen directamente del procesado de los datos, no se
encuentran almacenados en lnea, sino que se puede acceder a ellos con un nivel ms bajo
de detalle. Se almacenan de disco ocupando mucho espacio, sin embargo as se facilita el
acceso.
Datos Poco Resumidos y Muy Resumidos: Contienen los datos que el gestor del Almacn
de datos ha establecido como resmenes predefinidos, con el propsito de acelerar las
consultas. Pueden verse modificados constantemente con el fin de responder a las
variaciones de las consultas. Los datos poco resumidos corresponden al primer nivel de
agregacin de los datos detallados actualmente, o lo que es lo mismo a las consultas que
se realizan habitualmente, siendo estos almacenados en disco. Mientras que los muy
resumidos corresponden con el nivel ms alto de agregacin, o lo que es lo mismo a las
consultas que se realizan muy a menudo y que se deben obtener muy rpidamente.
Datos de Archivo/ Copia de seguridad: Es el rea donde se guardan los datos detallados y
resumidos con el fin de mantener un archivo y copias de seguridad de los datos.
Metadatos: Describen la estructura de los datos que se contienen en el almacn y pueden
ser utilizados por los gestores de carga, del almacn de datos y de consultas.
El Sistema Gestor de Base de Datos (SGBD): El principal problema que se encuentra al
utilizar almacenes de datos es el tamao del mismo, por tanto es de gran importancia una
buena eleccin de un SGBD que debe cumplir con unos requisitos tales como:
Una buena velocidad de carga.
El Procesamiento de carga.
La gestin de la calidad de los datos.
La velocidad de las consultas.
Escalabilidad en el nmero de usuarios.
Administracin del almacn.
Anlisis dimensional integrado.
La funcionalidad avanzada de consultas.
Gestor de Consultas: Es el encargado en gestionar las operaciones asociadas a las
consultas que realizan los usuarios, dirigiendo las consultas a las tablas apropiadas y
planificar la ejecucin de las mismas. La complejidad del gestor viene determinada por la
funcionalidad de la base de datos y las herramientas de acceso de los usuarios finales.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 63

Herramientas de Acceso Para Usuarios: El objetivo es proporcionar una herramienta de


acceso para los usuarios en la cual se puedan tomar decisiones estratgicas. Por tanto la
comunicacin entre el almacn de datos y la herramienta ser mediante consultas de tipo
ad-hoc. En el mercado podemos encontrar herramientas que pueden ser clasificadas en
los cinco grupos siguientes:
Herramientas de consulta y generacin de informes, soportan instrucciones SQL, con la
facilidad de que el usuario no tiene por qu saber cmo es la estructura de stas
instrucciones ni de la estructura de la base de datos, adems, se utilizan para generar
informes peridicos de carcter operacional o para soportar altos volmenes de tareas.
Herramientas de desarrollo de aplicaciones personalizadas utilizando herramientas
grficas de acceso a los datos en entornos cliente-servidor.
Sistemas de informacin ejecutiva, que dan soporte a todos los niveles de gestin de una
organizacin, proporcionando una visin de los datos que contiene y un acceso a fuentes
de datos externa.
Herramientas de Procesamiento analtico en lnea (OLAP), agilita las consultas de grandes
cantidades de datos utilizando bases de datos multidimensionales. Se utilizan en
generacin de informes de ventas, marketing, etc.
3. Mercados De Datos: Es un subconjunto de datos de un almacn relativos a los requisitos
de un departamento o rea de negocio concretos. Este subconjunto de datos puede
funcionar de forma autnoma, o bien enlazado al almacn de datos. El motivo por el cual
se crean mercados de datos es el crecimiento que tiene el almacn y as facilitar su
construccin y utilizacin. Las caractersticas de los mercados de datos son:
Se centra en los requisitos de los usuarios asociados a un departamento o rea de negocio
concretos.
Como diferencia con los almacenes de datos, los mercados no contiene datos
operacionales detallados.
Son ms sencillos a la hora de utilizarlos y comprender sus datos, debido a que la cantidad
de informacin que contienen es mucho menor que en los almacenes de datos.
4. Flujos de Datos: Los siguientes flujos de datos corresponden con el procesamiento de datos en
un almacn, siguiendo la figura.

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 64

http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/08-09/FUNCIONALIDAD%204.pdf

Flujo de Entrada: Es el proceso de extraccin y carga de los sistemas de origen de datos al


almacn a travs del repositorio de datos, aunque es necesario reconstruir los datos antes
de introducirlos en el almacn, realizando la limpieza, la reestructuracin para conseguir
los requisitos del almacn y conseguir la coherencia entre s y los ya existentes.
Flujo Ascendente: Es el proceso de resumen, empaquetamiento y distribucin con el fin
de aadir valor a los datos. Donde el resumen agrupa los datos con el fin de hacerlos ms
cmodos y tiles para el usuario final. El empaquetamiento convirtiendo los datos de
detalle o resumen a otros formatos ms tiles. La distribucin de los datos a los usuarios
apropiados.
Flujo Descendente: Es el proceso de archivado y creacin de copias de seguridad de los
datos, donde el archivado es importante para el mantenimiento, efectividad y las
prestaciones del almacn, ya que los datos antiguos con menor valor son transferidos a un
archivo permanente. Otro de los fines es garantizar la reconstruccin del almacn en el
estado actual en caso de producirse una prdida de datos o fallo.
Flujo de Salida: Es el proceso de disponibilidad de los datos a los usuarios finales a travs
de las herramientas. Es el flujo que ms influye en cuestin de obtener una ventaja
competitiva, o lo que es lo mismo obtener el mximo beneficio al almacn mediante la
actividad de Acceso, la solicitud del usuario en obtener los datos intentando que la
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 65

herramienta de consulta para acceder al origen de datos sea la ms apropiada y efectiva. Y


la actividad de Suministro que intenta suministrar informacin a las estaciones de trabajo
de los usuarios.
Metaflujo: Es el proceso de gestin de transferencia de los metadatos. Debido a los
constantes cambios producidos en el entorno de la organizacin, los metadatos deben
actualizarse continuamente que reflejen estos cambios.
5. Ventajas E Inconvenientes: La implantacin de un almacn de datos puede beneficiar a una
organizacin en:
La inversin que realiza una organizacin para una correcta implantacin de un sistema de
almacn de datos conlleva un costo muy elevado, sin embargo el retorno de la inversin
es garantizado en gran medida.
Como consecuencia de la ventaja anterior se pueden conseguir una ventaja competitiva
debido a una buena toma de decisiones gracias al almacn de datos implantado.
Mejoran la productividad de los responsables en la toma de decisiones de la organizacin
debido a:
Los almacenes de datos hacen ms fcil el acceso a una gran variedad de datos.
Se obtiene una base de datos clasificada por temas e histrica.
Integracin de informacin procedente de mltiples sistemas eternos.
Sin embargo, utilizar almacenes de datos tambin plantea algunos problemas como:
La subestimacin del tiempo requerido para extraer, limpiar y cargar los datos en el
almacn.
Problemas con los sistemas de origen de los datos.
Los datos obtenidos no son suficientes.
Pueden suponer altos gastos. Adems de los gastos de mantenimiento que son muy
elevados.
6. Bases de Datos XML:
Introduccin: XML se ha convertido en el lenguaje ms ampliamente utilizado para la
representacin de datos semi-estructurados. Su utilizacin como lenguaje de formateo de
documentos se ha extendido a otros campos, siendo actualmente el lenguaje estndar para el
intercambio de informacin, integracin de datos y de aplicaciones, etc.
XML es un lenguaje de marcado que deriva de SGML (Standard Generalized Markup Language).
Las principales aplicaciones de XML relacionadas con el tratamiento de datos son la
representacin de datos estructurados (bases de datos) o semi-estructurados (aplicaciones de
negocios). Tambin es de mucha utilidad su funcin como lenguaje de formato de datos a la hora
de comunicar aplicaciones, facilitando la integracin de informacin procedente de varias
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 66

aplicaciones. XML se ha consolidado como uno de los principales lenguajes para el intercambio de
informacin.
XML no es un lenguaje que haya sido diseado para el almacenamiento de datos. El tener que
repetir etiquetas en todo el documento aade una redundancia que hace que XML no sea un
lenguaje eficiente a la hora de representar datos. Aun as podemos destacar una serie de ventajas:
Las etiquetas hacen que los datos estn autodocumentados.
Su capacidad de extensin hace adaptable al lenguaje al mbito en el que se est
aplicando.
Permite representar estructuras de datos anidados.
Los documentos XML tienen un formato no rgido, lo que quiere decir que se puede aadir
ms informacin o simplemente ignorarla.
7. Lenguaje De Definicin De Datos XML: Aunque el lenguaje XML no aparece como un lenguaje
especfico para disear bases de datos, posteriormente sus ventajas para el intercambio de
informacin han hecho que cada vez sea ms ampliamente utilizado como lenguaje para la
descripcin de datos.
Los lenguajes de definicin son aquellos que nos permiten, al igual que en bases de datos
relaciones, describir la estructura que van a tener los datos (es decir, los documentos XML). Al
igual que SQL (en bases de datos relacionales) proporciona una sintaxis para describir la estructura
de los datos en base al modelo relacional, el lenguaje de definicin de datos XML puede tener un
modelo de datos subyacente y una sintaxis para describirlo. El modelo subyacente al que se tiene
que ajustar un documento XML, viene determinado, o bien por una DTD (Document Type
Definition) o bien por un XML Schema, que adems es en s un fichero XML.
A continuacin se muestra una tabla donde se comparan las bases de datos relacionales, las
orientadas a objetos y los datos XML:

http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/08-09/FUNCIONALIDAD%204.pdf
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 67

8. Almacenamiento de Datos XML: Debido a la aceptacin que ha tenido XML se hace necesario
mecanismos para el almacenamiento y gestin de datos XML. Una solucin natural son los ficheros
de texto plano, pero debido a los diversos problemas que estos conllevan se utilizan soluciones
basadas en la tecnologa de bases de datos. Estas son las diferentes alternativas para el
almacenamiento de datos XML:
Almacenamiento en ficheros planos.
Almacenamiento en BD.
En BD relacionales
Almacenamiento como cadenas de caracteres
Representacin en rbol
Asignacin a relaciones
En BD como ficheros planos: atributo de tipo XML en una columna
Almacenamiento en BD XML Nativas
Bases de datos Relaciones y XML: Existen diferentes mecanismos para almacenar la
informacin de los documentos XML en bases de datos relacionales:
Almacenamiento como cadenas de caracteres: esta solucin trata de almacenar todo el
documento XML en un campo de una tabla. El inconveniente que tiene esta solucin es
que el SGBD no puede conocer la estructura del documento XML.
Representacin en rbol: los datos son representados como un rbol y se almacenan en
dos tablas:
Nodos(id, tipo, etiqueta, valor)
Hijos(id-hijo, id-padre)
La tabla hijo establece la relacin entre cada elemento y atributo y su elemento padre.
Se puede aadir un atributo ms (posicin) a hijo, que guarda el orden de los hijos. Esta
aproximacin tiene la ventaja de que permite almacenar cualquier dato XML, aunque ste no
tenga una estructura conocida (DTD o esquema XML) en formato relacional.
Asignacin a relaciones: se trata de un enfoque hbrido en el que los elementos XML, cuyo
esquema es conocido, se asignan a relaciones y atributos. Para cada tipo de elemento
cuyo esquema es conocido, se crea una relacin del modo siguiente:
Se crea un atributo id para almacenar una identificacin nica para cada elemento.
Todos los atributos de elemento se convierten en atributos de la relacin.
Todos los subelementos que se producen una sola vez se convierten en atributos.
Si el valor del subelemento es texto, el atributo almacena el texto como valor.
Para subelementos complejos, la relacin correspondiente al subelemento almacena el
contenido del subelemento junto al id del padre y el atributo almacena el id del
subelemento.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 68

Si el subelemento puede aparecer varias veces en el elemento, se representa en una tabla


separada, similar a la relacin hijo para identificar el subelemento y su padre.
Bases de datos XML: En la actualidad, existen diferentes soluciones para el
almacenamiento de documentos XML que segn WESTERMAN Y KLAS (2003), se pueden
clasificar en dos conjuntos: las bases de datos nativas como Tamino (SOFTWARE AG, 2001)
o ToX (BARBOSA, 2001); y extensiones XML a las bases de datos, que permiten el
almacenamiento de documentos XML en SGBD convencionales, normalmente relacionales
u objeto-relacionales.
Bases de datos XML nativas: Las bases de datos XML surgen por la necesidad de una
gestin eficiente de grandes cantidades de documentos XML, argumentando que los
documentos XML no se pueden almacenar en SGBD convencionales debido a su
naturaleza jerrquica y semiestructurada. Los productos de bases de datos XML nativas,
estn centrados en el almacenamiento y gestin de documentos XML. Este tipo de
gestores tienen las siguientes caractersticas:
Definen un modelo para estructura de los documentos XML (por ejemplo un DTD).
Corresponde al modelo relacional de las BD clsicas.
Almacenan y recuperan documentos de acuerdo a ese modelo. Los documentos XML son,
por tanto, la unidad de almacenamiento. Corresponden a las tuplas del modelo relacional.
Para el almacenamiento final, el gestor puede tener su propio modelo de
almacenamiento, es decir, no se requiere un modelo subyacente concreto (puede ser una
base de datos relacional, OO o jerrquica; o un formato de almacenamiento propietario).
Dependiendo del modelo de almacenamiento, este tipo de gestores se pueden clasificar
de la siguiente forma:
Almacenamiento basado en texto (ficheros de texto):
Aplican tcnicas de compresin para reducir el espacio de almacenamiento.
Mantienen ndices adicionales para aumentar la eficiencia en el acceso a la informacin.
Pueden definirse sobre bases de datos o sobre sistemas de ficheros.
Almacenamiento basado en modelo:
Definen un modelo de datos lgico (como DOM) para la estructura jerrquica de los
documentos XML.
Almacenan los documentos de acuerdo con este modelo usando el modelo de
almacenamiento que se desee (transformacin a base de datos relacional, Persistent
DOM, etc.).
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 69

Extensiones XML a las bases de datos: Las extensiones XML a las bases de datos permiten
el almacenamiento y la gestin de documentos XML en SGBD convencionales,
habitualmente relacionales u objeto-relaciones (OR). Existen diferentes aproximaciones
para el almacenamiento:
Almacenamiento no estructurado: los documentos XML se almacenan directamente en
formato de texto en un atributo de tipo fichero, como por ejemplo, CLOB (Carcter Large
Object).
Almacenamiento estructurado: se usa un metamodelo de documentos XML capaz de
representar rboles de nodos de documentos XML, que se construye utilizando primitivas
de modelado del SGBD convencional que hay por debajo. La estructura de los documentos
XML se convierte en el esquema de base de datos. El contenido de los documentos XML se
puede consultar utilizando las facilidades proporcionadas por el SGBD.
Ejercicio de autoevaluacn
Cul es el objetivo de los almacenes de datos?
Qu es el repositorio de datos operacionales?
Cules son los requisitos que debe cumplir el SGBD?
Cules son los cinco grupos en que pueden clasificarse las herramientas de acceso para los
usuarios?
Enumere las caractersticas de los mercados de datos.
Describa los diferentes flujos de datos que pueden darse en un almacn de datos.
Qu es Lenguaje De Definicin De Datos XML?
Cules son las diferentes alternativas para el almacenamiento de datos XML?

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 70

4. DISTRIBUCIN
Conocer que las bases de datos distribuidas son un grupo de informacin que corresponde a un
sistema que se encuentra repartido entre computadores de una misma red, ya sea a nivel local o
global, cada sitio en la red es independiente tanto en sus capacidades de procesamiento, como en
la realizacin de operaciones locales; en cada uno de estos equipos debe ejecutarse un programa
a nivel global que admita la consulta de toda la informacin como si se tratase de uno solo.
OBJETIVO GENERAL
Disear el modelo avanzado de la base de datos basado en modelos que extienden o
sustituyen al modelo relacional.
OBJETIVOS ESPECFICOS
Conocer que las bases de datos distribuidas son un grupo de informacin que corresponde
a un sistema que se encuentra repartido entre computadores de una misma red, ya sea a
nivel local o global.
Comprender que un sistema de bases de datos federadas es una coleccin de sistemas de
bases de datos cooperativos y autnomos.
Prueba Inicial
1. Sabe usted Qu son Bases de Datos Distribuidas?
2. Identifica usted los tipos de almacenamiento en una base de datos distribuida.
3. Identifique mnimo tres ventajas y tres desventajas de la implementacin de las bases de
datos distribuidas.
4. Sabe usted Qu son Bases de Datos Federadas y Mviles?
5. Enumere 3 caractersticas principales de los Sistemas Gestores de Bases de Datos
Federadas.
6. Defina que son las bases de datos mviles.
7. Identifique cuales con las aplicaciones mviles y los tipos de datos.

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 71

4.1. Bases de Datos Distribuidas


1. Qu son Bases de Datos Distribuidas?
Son un grupo de datos que pertenecen a un sistema pero a su vez est repartido entre
ordenadores de una misma red, ya sea a nivel local o cada uno en una diferente localizacin
geogrfica, cada sitio en la red es autnomo en sus capacidades de procesamiento y es capaz de
realizar operaciones locales y en cada uno de estos ordenadores debe estar ejecutndose una
aplicacin a nivel global que permita la consulta de todos los datos como si se tratase de uno solo.
Comparacin:

http://www.iessanvicente.com/colaboraciones/BBDDdistribuidas.pdf

Para tener una base de datos distribuida debe cumplirse las condiciones de una Red
Computacional. Una red de comunicacin provee las capacidades para que un proceso
ejecutndose en un sitio de la red enve y reciba mensajes de otro proceso ejecutndose en un
sitio distinto. Parmetros a considerar incluyen: Retraso en la entrega de mensajes, Costo de
transmisin de un mensaje y Confiabilidad de la red. Diferentes tipos de redes: POINT-TO-POINT,
BROADCAST, LAN, WAN.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 72

2. Arquitectura de las Bases de Datos:

Integracin lgica por medio de diseo TOP-DOWN (DISTDB)


http://www.iessanvicente.com/colaboraciones/BBDDdistribuidas.pdf

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 73

Integracin lgica por medio de bottom-up (Multidatabase)


http://www.iessanvicente.com/colaboraciones/BBDDdistribuidas.pdf

Global Schema: Define todos los datos que estn incluidos en la bd distribuida tal como si
la bd no fuera distribuida. Consiste de una definicin de relaciones globales.
Fragmentation Schema: Traduccin entre relaciones globales y fragmentos. (Una relacin
global puede consistir de varios fragmentos pero un fragmento est asociado con slo una
relacin global).
Allocation Schema: Define el sitio (o sitios) en el cual un fragmento est localizado.
Local Maping Schema: Traduce los fragmentos locales a los objetos que son manejados
por el SMBD local
Separacin entre fragmentacin y localizacin.
Transparencia de Fragmentacin
Transparencia de Localizacin
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 74

Control explcito de redundancia


Independencia de BD locales
Ejemplo de una Base de Datos Distribuidas:

http://www.iessanvicente.com/colaboraciones/BBDDdistribuidas.pdf

http://www.iessanvicente.com/colaboraciones/BBDDdistribuidas.pdf

3. Tipos de almacenamiento:
Replica: El sistema conserva varias copias o rplicas idnticas de una tabla. Cada rplica se
almacena en un nodo diferente.
Ventajas:
Disponibilidad: El sistema sigue funcionando an en caso de cada de uno de los nodos.
Aumento del paralelismo: Varios nodos pueden realizar consultas en paralelo sobre la
misma tabla. Cuantas ms rplicas existan de la tabla, mayor ser la posibilidad de que el
dato buscado se encuentre en el nodo desde el que se realiza la consulta, minimizando
con ello el trfico de datos entre nodos.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 75

Inconveniente:
Aumento de la sobrecarga en las actualizaciones: El sistema debe asegurar que todas las rplicas
de la tabla sean consistentes. Cuando se realiza una actualizacin sobre una de las rplicas, los
cambios deben propagarse a todas las rplicas de dicha tabla a lo largo del sistema distribuido.
Fragmentacin: Existen tres tipos de fragmentacin la horizontal, la vertical y la mixta.
Fragmentacin Horizontal: Una tabla T se divide en subconjuntos, T1, T2, ...Tn. Los fragmentos se
definen a travs de una operacin de seleccin y su reconstruccin se realizar con una operacin
de unin de los fragmentos componentes. Cada fragmento se sita en un nodo.
Pueden existir fragmentos no disjuntos: combinacin de fragmentacin y replicacin.
Ejemplo:

Tabla inicial de alumnos


http://www.iessanvicente.com/colaboraciones/BBDDdistribuidas.pdf

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 76

Tabla de alumnos fragmentada


http://www.iessanvicente.com/colaboraciones/BBDDdistribuidas.pdf

Fragmentacin Vertical: Una tabla T se divide en subconjuntos, T1, T2, ...Tn. Los fragmentos se
definen a travs de una operacin de proyeccin.
Cada fragmento debe incluir la clave primaria de la tabla. Su reconstruccin se realizar con una
operacin de join de los fragmentos componentes, pueden existir fragmentos no disjuntos:
combinacin de fragmentacin y replicacin.
Ejemplo:

http://www.iessanvicente.com/colaboraciones/BBDDdistribuidas.pdf

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 77

Fragmentacin Mixta: Como el mismo nombre indica es una combinacin de las dos anteriores
vistas he aqu un ejemplo a partir de una tabla fragmentada horizontalmente.

http://www.iessanvicente.com/colaboraciones/BBDDdistribuidas.pdf

http://www.iessanvicente.com/colaboraciones/BBDDdistribuidas.pdf

http://www.iessanvicente.com/colaboraciones/BBDDdistribuidas.pdf

Replica y Fragmentacin: Las tcnicas de rplica y fragmentacin se pueden aplicar sucesivamente


a la misma relacin de partida. Un fragmento se puede replicar y a su vez esa rplica ser
fragmentada, para luego replicar alguno de esos fragmentos.
4. Niveles de Transparencia en una Base de Datos Distribuida: El propsito de establecer
una arquitectura de un sistema de bases de datos distribuidas es ofrecer un nivel de
transparencia adecuado para el manejo de la informacin.

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 78

La transparencia se define como la separacin de la semntica de alto nivel de un sistema de los


aspectos de bajo nivel relacionados a la implementacin del mismo. Un nivel de transparencia
adecuado permite ocultar los detalles de implementacin a las capas de alto nivel de un sistema y
a otros usuarios.
El sistema de bases de datos distribuido permite proporcionar independencia de los datos.
La independencia de datos se puede dar en dos aspectos: lgica y fsica.
Independencia lgica de datos. Se refiere a la inmunidad de las aplicaciones de usuario a
los cambios en la estructura lgica de la base de datos. Esto permite que un cambio en la
definicin de un esquema no debe afectar a las aplicaciones de usuario. Por ejemplo, el
agregar un nuevo atributo a una relacin, la creacin de una nueva relacin, el
reordenamiento lgico de algunos atributos.
Independencia fsica de datos. Se refiere al ocultamiento de los detalles sobre las
estructuras de almacenamiento a las aplicaciones de usuario. la descripcin fsica de datos
puede cambiar sin afectar a las aplicaciones de usuario. Por ejemplo, los datos pueden ser
movidos de un disco a otro, o la organizacin de los datos puede cambiar.
La transparencia al nivel de red se refiere a que los datos en un SBDD se accedan sobre una red de
computadoras, sin embargo, las aplicaciones no deben notar su existencia. La transparencia al
nivel de red conlleva a dos cosas:
Transparencia sobre la localizacin de datos. el comando que se usa es independiente de
la ubicacin de los datos en la red y del lugar en donde la operacin se lleve a cabo. Por
ejemplo, en Unix existen dos comandos para hacer una copia de archivo. Cp se utiliza para
copias locales y rcp se utiliza para copias remotas. En este caso no existe transparencia
sobre la localizacin.
Transparencia sobre el esquema de nombramiento. Lo anterior se logra proporcionando
un nombre nico a cada objeto en el sistema distribuido. As, no se debe mezclar la
informacin de la localizacin con en el nombre de un objeto.
La transparencia sobre replicacin de datos se refiere a que si existen rplicas de objetos de la
base de datos, su existencia debe ser controlada por el sistema no por el usuario. Se debe tener en
cuenta que cuando el usuario se encarga de manejar las rplicas en un sistema, el trabajo de ste
es mnimo por lo que se puede obtener una eficiencia mayor. Sin embargo, el usuario puede
olvidarse de mantener la consistencia de las rplicas teniendo as datos diferentes. La
transparencia a nivel de fragmentacin de datos permite que cuando los objetos de la bases de
datos estn fragmentados, el sistema tiene que manejar la conversin de consultas de usuario
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 79

definidas sobre relaciones globales a consultas definidas sobre fragmentos. As tambin, ser
necesario mezclar las respuestas a consultas fragmentadas para obtener una sola respuesta a una
consulta global. El acceso a una base de datos distribuida debe hacerse en forma transparente. En
resumen, la transparencia tiene como punto central la independencia de datos.
La responsabilidad sobre el manejo de transparencia debe estar compartida tanto por el sistema
operativo, el sistema de manejo de bases de datos y el lenguaje de acceso a la base de datos
distribuida. Entre estos tres mdulos se deben resolver los aspectos sobre el procesamiento
distribuido de consultas y sobre el manejo de nombres de objetos distribuidos.
5. Procesamiento Distribuido de Consultas: El procesamiento de consultas es de suma
importancia en bases de datos centralizadas. Sin embargo, en BDD ste adquiere una
relevancia mayor. El objetivo es convertir transacciones de usuario en instrucciones para
manipulacin de datos. No obstante, el orden en que se realizan las transacciones afecta
grandemente la velocidad de respuesta del sistema. As, el procesamiento de consultas
presenta un problema de optimizacin en el cual se determina el orden en el cual se hace
la menor cantidad de operaciones. En BDD se tiene que considerar el procesamiento local
de una consulta junto con el costo de transmisin de informacin al lugar en donde se
solicit la consulta.
6. Recuperacin: En los entornos distribuidos de datos podemos encontrar lo siguientes:
Fallo de los nodos: Cuando un nodo falla, el sistema deber continuar trabajando con los
nodos que an funcionan. Si el nodo a recuperar es una base de datos local, se debern
separar los datos entre los nodos restantes antes de volver a unir de nuevo el sistema
Copias mltiples de fragmentos de datos: El subsistema encargado del control de
concurrencia es el responsable de mantener la consistencia en todas las copias que se
realicen y el subsistema que realiza la recuperacin es el responsable de hacer copias
consistentes de los datos de los nodos que han fallado y que despus se recuperarn.
Transaccin distribuida correcta: Se pueden producir fallos durante la ejecucin de una
transaccin correcta si se plantea el caso de que al acceder a alguno de los nodos que
intervienen en la transaccin, dicho nodo falla.
Fallo de las conexiones de comunicaciones: El sistema debe ser capaz de tratar los
posibles fallos que se produzcan en las comunicaciones entre nodos. El caso ms extremo
es el que se produce cuando se divide la red. Esto puede producir la separacin de dos o
ms particiones donde las particiones de cada nodo pueden comunicarse entre s pero no
con particiones de otros nodos.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 80

Para implementar las soluciones a estos problemas, supondremos que los datos se
encuentran almacenados en un nico nodo sin repeticin. De sta manera slo existir
un nico catlogo y un nico DM (Data Manager) encargados del control y acceso a las
distintas partes de los datos. Para mantener la consistencia de los datos en el entorno
distribuido contaremos con los siguientes elementos:
Catlogo: Programa o conjunto de programas encargados de controlar la ejecucin
concurrente de las transacciones.
CM (Cache Manager): Subsistema que se encarga de mover los datos entre las memorias
voltiles y no voltiles, en respuesta a las peticiones de los niveles ms altos del sistema de
bases de datos. Sus operaciones son Fetch(x) y Flush(x).
RM (Recovery Manager): Subsistema que asegura que la base de datos contenga los
efectos de la ejecucin de transacciones correctas y ninguno de incorrectas. Sus
operaciones son Start, Commit, Abort, Read, Write, que utilizan a su vez los servicios del
CM.
DM (Data Manager): Unifica las llamadas a los servicios del CM y el RM.
TM (Transaction Manager): Subsistema encargado de determinar que nodo deber
realizar cada operacin a lo largo de una transaccin.
Las operaciones de transaccin que soporta una base de datos son: Start, Commit y Abort. Para
comenzar una nueva transaccin se utiliza la operacin Start. Si aparece una operacin commit, el
sistema de gestin da por terminada la transaccin con normalidad y sus efectos permanecen en
la base de datos. Si, por el contrario, aparece una operacin abort, el sistema de gestin asume
que la transaccin no termina de forma normal y todas las modificaciones
7. Ventajas y Desventajas:
Ventajas:
Los sistemas de bases de datos distribuidos tienen mltiples ventajas. En primer lugar los
datos son localizados en lugar ms cercano, por tanto, el acceso es ms rpido, el
procesamiento es rpido debido a que varios nodos intervienen en el procesamiento de
una carga de trabajo, nuevos nodos se pueden agregar fcil y rpidamente. La
comunicacin entre nodos se mejora, los costos de operacin se reducen, son amigables al
usuario, la probabilidad de que una falla en un solo nodo afecte al sistema es baja y existe
una autonoma e independencia entre los nodos.
Las razones por las que compaas y negocios migran hacia bases de datos distribuidas
incluyen razones organizacionales y econmicas, para obtener una interconexin confiable
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 81

y flexible con las bases de datos existentes, y por un crecimiento futuro. El enfoque
distribuido de las bases de datos se adapta ms naturalmente a la estructura de las
organizaciones. Adems, la necesidad de desarrollar una aplicacin global (que incluya a
toda la organizacin), se resuelva fcilmente con bases de datos distribuidas. Si una
organizacin crece por medio de la creacin de unidades o departamentos nuevos,
entonces, el enfoque de bases de datos distribuidas permite un crecimiento suave.
Los datos se pueden colocar fsicamente en el lugar donde se accedan ms
frecuentemente, haciendo que los usuarios tengan control local de los datos con los que
interactan. Esto resulta en una autonoma local de datos permitiendo a los usuarios
aplicar polticas locales respecto del tipo de accesos a sus datos.
Mediante la replicacin de informacin, las bases de datos distribuidas pueden presentar
cierto grado de tolerancia a fallos haciendo que el funcionamiento del sistema no dependa
de un solo lugar como en el caso de las bases de datos centralizadas.
La independencia de datos se puede dar en dos aspectos: lgica y fsica.
Desventajas:
Las razones por las que compaas y negocios migran hacia bases de datos distribuidas
incluyen razones organizacionales y econmicas, para obtener una interconexin confiable
y flexible con las bases de datos existentes, y por un crecimiento futuro. El enfoque
distribuido de las bases de datos se adapta ms naturalmente a la estructura de las
organizaciones. Adems, la necesidad de desarrollar una aplicacin global (que incluya a
toda la organizacin), se resuelva fcilmente con bases de datos distribuidas. Si una
organizacin crece por medio de la creacin de unidades o departamentos nuevos,
entonces, el enfoque de bases de datos distribuidas permite un crecimiento suave.
Los datos se pueden colocar fsicamente en el lugar donde se accedan ms
frecuentemente, haciendo que los usuarios tengan control local de los datos con los que
interactan. Esto resulta en una autonoma local de datos permitiendo a los usuarios
aplicar polticas locales respecto del tipo de accesos a sus datos.
Mediante la replicacin de informacin, las bases de datos distribuidas pueden presentar
cierto grado de tolerancia a fallos haciendo que el funcionamiento del sistema no dependa
de un solo lugar como en el caso de las bases de datos centralizadas.
La independencia de datos se puede dar en dos aspectos: lgica y fsica.

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 82

Ejercicio Tema 1
1.
2.
3.
4.
5.

Qu son Bases de Datos Distribuidas?


Explique los tipos de almacenamiento.
Cules son los niveles de transparencia en una Base de Datos Distribuida?
Explique los aspectos lgicos y fsicos de independencia de datos.
En qu consiste el Procesamiento Distribuido de Consultas?

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 83

4.2. Bases de Datos Federadas y Mviles


1. Bases de Datos Federadas:
La definicin de Base de Datos Federada ha sido realizada por varios autores. As, Sheth A.P. and
Larson, J.A. definieron el concepto base de datos federada como una coleccin de sistemas de
bases de datos independientes, cooperativos, posiblemente heterogneos, que son autnomos y
que permiten compartir todos o algunos de sus datos. Adems, Larson ampli esta definicin
diciendo que en un sistema federado los usuarios tienen acceso a los datos, de los distintos
sistemas, a travs de una interfaz comn; sin embargo, no existe un esquema global que describa
a todos los datos de las distintas bases de datos, sino que en su lugar hay varios esquemas
unificados, cada uno describiendo porciones de bases de datos y archivos para el uso de cierta
clase de usuarios.
La primera definicin pone de manifiesto todas las propiedades que definen a una Base de Datos
Federada: heterogeneidad, autonoma y distribucin. Una Base de Datos Federada se dice que es
heterognea debido a que los sistemas de bases de datos que lo forman pueden tener cualquier
arquitectura. En cuanto a la autonoma, esta propiedad se cumple ya que cada sistema de bases
de datos funciona por s mismo y de forma local. Por ltimo, el concepto de distribucin hace
referencia a que cada sistema de bases de datos puede estar localizado en cualquier punto.
En cuanto a la segunda definicin, se explica que un sistema federado est compuesto por los
datos de las diferentes bases de datos que forman el esquema, pero que dichos datos no estn
presentes en ningn esquema global. Adems, no necesariamente todos los datos de una base de
datos son compartidos a los usuarios, sino que se tiene la posibilidad de compartir slo una
porcin de los datos.
2. Caractersticas de los SGBDF:
Un Sistema Gestor de Bases de Datos Federadas (SGBDF) es el responsable de proveer una vista de
datos transparente al usuario. Esto significa que el usuario percibe a la base de datos federada
como una nica base de datos local, y no mltiples bases de datos que contienen diferentes datos,
que es como en realidad est configurado.
Un SGBDF no contiene ningn dato, sino que accede a los datos almacenados en las diferentes
bases de datos que forman el esquema. Para acceder a dichos datos es necesario establecer las
denominadas federaciones. Una federacin es una vista que se establece en una base de datos en
particular para exteriorizar los datos que se desean mostrar.

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 84

A continuacin se muestra una figura que ilustra la conexin entre los diferentes elementos que
forman una base de datos federada.

http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/08-09/Distribuidas2.pdf

Como se puede apreciar en la figura anterior, un SGBDF est formado por varios gestores de bases
de datos. Dichos gestores pueden ser tanto gestores de bases de datos centralizadas (SGBD) como
gestores de bases de datos distribuidas (SGBDD). Los SGBDD, adems, pueden ser a su vez
sistemas de bases de datos federados. Tanto los sistemas gestores como las bases de datos que lo
forman son denominados componentes del SGBDF.
Los componentes de un SGBDF pueden ejecutar tanto sus operaciones locales como participar en
la ejecucin de las consultas sobre los datos federados (operaciones globales). La autonoma de
cada componente es controlada por el administrador del sistema junto a cada administrador de
cada uno de los componentes. Esto es debido a que dicha autonoma difiere segn la necesidad de
federacin existente de cada base de datos con el esquema global. Todas las federaciones en
conjunto forman el sistema federado. En cualquier momento, segn la necesidad, cualquiera de
ellas puede variar. Como se ha dicho antes, el usuario final es transparente a las uniones entre
componentes que haya por debajo, por lo que el nico cambio que un usuario puede percibir es
que tenga acceso a diferentes datos en el esquema global.
3. Tipos de SGBDF: Los SGBDF se pueden clasificar en 2 grandes categoras: fuertemente
acoplados y dbilmente acoplados. Antes de detallar ambas categoras, se muestra un
esquema que especfica los diferentes tipos de bases de datos federadas.

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 85

Taxonoma de los SGBDF


http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/08-09/Distribuidas2.pdf

Como se puede apreciar, vuelve a aparecer el concepto de autonoma como elemento


diferenciador entre sistemas federados y sistemas que no lo son. En cuanto a los otros 2
conceptos, heterogeneidad y distribucin, ambos se cumplen debido a que la propia definicin de
sistema federado lo hace posible, al estar compuesto ste de varios SGBD separados en
localizaciones diferentes y con distinta arquitectura.
SGBDF fuertemente acoplados: Este tipo de sistema federado posee un esquema
conceptual global que est formado por un subconjunto de los esquemas conceptuales
locales, compuesto de los datos que cada sistema local decide compartir. El esquema
conceptual global en un sistema fuertemente acoplado implica la integracin de partes de
los esquemas conceptuales locales o de los esquemas externos locales.
En la siguiente figura se ilustra una arquitectura de referencia para un sistema gestor de
base de datos federado estrechamente acoplado, es decir, que tiene un esquema
conceptual global.

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 86

Arquitectura de referencia para un SGBDF fuertemente acoplado


http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/08-09/Distribuidas2.pdf

Las caractersticas de un SGBDF fuertemente acoplado son las siguientes:


El administrador global del sistema federado tiene todo el control sobre la creacin y el
acceso a los sistemas de bases de datos componente.
Soporta uno o ms esquemas federados.
La utilizacin de un SGBDF de este tipo concierne una serie de ventajas:
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 87

Capacidad de soportar actualizaciones.


La interpretacin de la semntica de los mltiples datos integrados en el sistema federado
es uniforme.
Aun as, este tipo de sistema federado posee las siguientes desventajas:
Debido a la libertad que disfrutan los administradores globales se puede llegar a violar la
autonoma que poseen los sistemas componente.
No soporta la evolucin dinmica de los esquemas de exportacin o componentes.
SGBDF dbilmente acoplados: Existe otro tipo de sistema federado, dbilmente acoplado,
que se basa en no tener un esquema conceptual global. En este caso, los esquemas
externos estn compuestos por uno o ms esquemas conceptuales locales.
Este otro tipo de sistema federado posee las siguientes caractersticas:
Los usuarios son los responsables de la creacin y el mantenimiento de las federaciones
mediante la utilizacin de vistas.
Soporta sistemas de bases de datos altamente autnomos, los cuales los usuarios deben
tratar.
En cuanto a las ventajas de utilizar este tipo de SGBDF:
Dispone de gran flexibilidad para mapear diferentes semnticas de los mismos objetos en
distintos esquemas de exportacin.
Se tiene mayor facilidad para soportar la evolucin de los componentes.
Y las desventajas de los SGBDF dbilmente acoplados son las siguientes:
Resulta de gran dificultad la comprensin de grandes cantidades de esquemas de
exportacin.
Los esfuerzos para gestionar este tipo de sistema se duplican.
Existen problemas para actualizar las vistas que utilizan los usuarios.
4. Tipos de Arquitectura para un SGBDF: A continuacin se van a detallar dos tipos de
arquitecturas para el manejo de bases de datos federadas. Hay otras muchas, pero en este
documento nos vamos a centrar en la arquitectura de Sheth A.P. and Larson, J.A. y la
arquitectura propuesta por ANSI/SPARC.

Arquitectura de 5 niveles (Sheth y Larson): Sheth y Larson propusieron una arquitectura


compuesta por 5 niveles de esquemas, los cuales son los siguientes:
Esquema Local: Se trata del esquema conceptual de las bases de datos componente.
Esquema Componente: Se obtiene tras transformar el esquema local en un Modelo de
Datos Comn.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 88

Esquema de Exportacin: Representa un subconjunto de la totalidad de los datos que


contiene el esquema componente. Este subconjunto de datos es el que se quiere
compartir en la base de datos federada.
Esquema Federado: Est formado por la integracin de todos los esquemas de exportacin
de cada base de datos componente.
Esquema Externo: Representa una vista hacia un usuario o conjunto de usuarios
determinado. No necesariamente este esquema contiene todos los datos que forman el
esquema federado, sino que puede ser un subconjunto de estos.
En la siguiente figura se muestra un ejemplo de este tipo de arquitectura que muestra todo lo
explicado anteriormente.

http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/08-09/Distribuidas2.pdf

5. Arquitectura de 3 niveles (ANSI/SPARC): Este tipo de arquitectura es muy utilizada en el


diseo de bases de datos relacionales. Est formada por los siguientes niveles:
Nivel Fsico: Est compuesto por el esquema interno. Dicho esquema contiene las
diferentes bases de datos componente que forman la base de datos federada.
Nivel Lgico: Corresponde al esquema conceptual. Este nivel contiene el modelo global de
datos, es decir, el conjunto de datos compartido por todas las bases de datos
componente.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 89

Nivel Externo: Est representado por el esquema externo. Este esquema est compuesto
por las diferentes vistas que poseen los usuarios a los datos compartidos.
Para mostrar de forma ms clara esta arquitectura se sugiere la siguiente figura:

Arquitectura de 3 niveles (ANSI/SPARC)


http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/08-09/Distribuidas2.pdf

6. Problemas de Implementacin: La implementacin de este tipo de base de datos


concierne una serie de problemas que se citan a continuacin:
Incompatibilidad entre los sistemas de consulta de los diferentes fabricantes.
Diferente codificacin utilizada por las bases de datos componente.
Generacin de cdigos de error incompatibles por los diferentes fabricantes.
Dificultades para establecer un control de la concurrencia en las distintas transacciones.
Las transacciones son heterogneas debido a que cada SGBD mantiene su autonoma.
7. Aplicaciones Comerciales: Existen multitud de aplicaciones comerciales que soportan
bases de datos federadas. Todos los sistemas gestores de bases de datos conocidos
poseen la posibilidad de crear este tipo de bases de datos. Por ejemplo, IBM, ORACLE,
MySQL, SQL Server, etc., permiten la creacin de bases de datos federadas. El problema
que surge es cuando se desea realizar una base de datos federada que consulta los datos
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 90

de otra base de datos con una tecnologa diferente, es decir, de otro fabricante. En este
caso las posibilidades se reducen, y es necesaria la incorporacin de algn componente
extra que incrementa el costo considerablemente.
8. Caso de Uso: MySQL: A continuacin se va a realizar un ejemplo sencillo de base de datos
federada. Para ello se va a utilizar el SGBD MySQL, que dispone de una versin gratuita
que permite crear bases de datos federadas.
En primer lugar se va a definir la tabla cliente que ser consultada por la tabla federada. Notar que
pertenece a la base de datos bbdd1.
CREATE DATABASE IF NOT EXISTS bbdd1;
USE bbdd1;
DROP TABLE IF EXISTS `cliente`;
CREATE TABLE `cliente` (
`idCliente` int(10) unsigned NOT NULL auto_increment,
`Nombre` varchar(45) NOT NULL,
`Apellidos` varchar(45) NOT NULL,
PRIMARY KEY (`idCliente`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8;

http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/08-09/Distribuidas2.pdf

Ahora, nuestra base de datos federada va a contener otra tabla que va a tener una federacin a
esta primera tabla definida.

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 91

CREATE DATABASE IF NOT EXISTS bbdd_federada;


USE bbdd_federada;
DROP TABLE IF EXISTS `cliente_federada`;
CREATE TABLE `cliente_federada` (
`idCliente` int(10) unsigned NOT NULL auto_increment,
`Nombre` varchar(45) NOT NULL,
`Apellidos` varchar(45) NOT NULL,
PRIMARY KEY (`idCliente`)
) ENGINE=FEDERATED DEFAULT CHARSET=utf8
COMMENT:mysql://root@remote_host:9306/bbdd1/cliente;
http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/08-09/Distribuidas2.pdf

La tabla federada que se acaba de crear muestra los mismos datos que la tabla remota a la que
consulta. Notar que con referencia a la definicin de la primera tabla existen 2 diferencias:
El motor de consulta cambia de MyISAM a FEDERATED.
Se aade el atributo COMMENT donde se especifica la direccin de la tabla remota a la
que tiene que consultar.
9. Base de Datos Mviles:
Introduccin: En los ltimos aos se han producido grandes avances en las tecnologas de
comunicacin inalmbricas. Estos avances, junto al uso cada vez ms extendido de los
dispositivos mviles, han causado la aparicin de una nueva disciplina: la computacin
mvil. Gracias a la computacin mvil, los usuarios pueden acceder a una base de datos
remota en cualquier momento y en cualquier lugar. Los empleados de una empresa
pueden trabajar desde su casa, desde las instalaciones del cliente o mientras estn de
viaje, de la misma forma que si estuvieran en la oficina. La computacin mvil introduce el
concepto de base de datos mvil. Una base de datos mvil es una base de datos portable,
fsicamente independiente del servidor corporativo de base de datos y capaz de
comunicarse con ese servidor desde sitios remotos para compartir datos corporativos.
Utilizando bases de datos mviles, los trabajadores pueden acceder a los datos
corporativos desde cualquier dispositivo que disponga de conexin a Internet.
Arquitectura: La arquitectura general de una plataforma mvil es un modelo distribuido
formado por computadores fijos, estaciones base y unidades mviles. Los computadores
fijos son computadores de uso general que no disponen de medios para comunicarse con
las unidades mviles. Las estaciones base disponen de enlaces inalmbricos para conectar
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 92

con las unidades mviles; son mquinas que actan de intermediarios entre las unidades
mviles y los computadores fijos. Los computadores fijos y las estaciones base estn
interconectados por medio de una red fija (cableada) de alta velocidad. Las unidades
mviles se conectan a las estaciones base mediante enlaces inalmbricos; los enlaces ms
comunes son el estndar 802.11 (Wi-Fi), el servicio GPRS y la tecnologa Bluetooth.

Arquitectura general de una plataforma mvil (Dunham y Helal, 1995)


http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/08-09/Distribuidas2.pdf

Las unidades mviles se pueden mover libremente por un espacio conocido como dominio de
movilidad geogrfica, cuyo alcance est determinado por la cobertura de los enlaces inalmbricos.
Este dominio se divide en dominios ms pequeos llamados celdas. Cada celda es controlada por
una estacin base. El movimiento de las unidades mviles dentro del dominio de movilidad
geogrfica no debe estar restringido, es decir, se debe garantizar el acceso a la informacin
aunque las unidades mviles se muevan entre las celdas.
Modos de funcionamiento: Hay dos modos de funcionamiento para trabajar con los
datos:
El usuario de un dispositivo mvil se conecta al servidor de base de datos corporativo y
trabaja directamente con los datos.

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 93

El usuario descarga una copia de los datos y trabaja con ellos de forma local.
Posteriormente, se conectar al servidor de base de datos corporativo para actualizar la
base de datos.
La adopcin del modo funcionamiento depende fundamentalmente de los requisitos de cada
aplicacin. Otro factor importante a la hora de elegir el modo de funcionamiento es la tecnologa
de comunicacin utilizada para conectar a las estaciones base; el costo puede ser elevado si la
conexin con el servidor es permanente y se utiliza una comunicacin de pago como GPRS.
6. Sistemas Gestores de Bases de Datos mviles: Muchos fabricantes ofrecen SGBD mviles
capaces de comunicarse con los principales SGBD relacionales. Estos SGBD mviles estn
adaptados a los recursos limitados de las unidades mviles y proporcionan una serie de
funcionalidades adicionales:
Comunicacin con el servidor centralizado de base de datos mediante tcnicas de
comunicacin inalmbrica.
Replicacin de datos en el servidor centralizado de base de datos y en el dispositivo mvil.
Sincronizacin de datos entre el servidor centralizado de base de datos y el dispositivo
mvil.
Gestin de datos en el dispositivo mvil.
Anlisis de los datos almacenados en el dispositivo mvil.
7. Aplicaciones mviles y tipos de datos: Las aplicaciones mviles se clasifican en las dos
siguientes categoras: aplicaciones verticales y aplicaciones horizontales (Imielinski y
Badrinath, 1994).
En las aplicaciones verticales, los usuarios acceden a los datos en una celda especfica; fuera de la
celda los datos no estn disponibles. Un ejemplo de aplicacin vertical es la obtencin de
informacin sobre las plazas libres de un determinado parking. En las aplicaciones horizontales, los
datos estn distribuidos por todo el sistema, y los usuarios pueden acceder a ellos desde cualquier
celda. La aplicacin horizontal ms comn es el acceso al correo electrnico.
Los datos se clasifican en tres categoras:
Datos privados: pertenecen a un usuario y slo l puede acceder a ellos y manejarlos. Por
ejemplo, los datos del perfil de un usuario de cualquier aplicacin que gestione datos
personales.
Datos pblicos: pueden ser consultados por cualquier usuario, pero slo pueden ser
modificados por una nica fuente. Por ejemplo, los datos de las cotizaciones de la bolsa.

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 94

Datos compartidos: pueden ser accedidos por un grupo determinado de usuarios, quienes
tienen permisos para leerlos y para escribirlos. Por ejemplo, los datos de seguros de una
compaa aseguradora que vende productos utilizando agentes comerciales.
Las aplicaciones horizontales utilizan, principalmente, datos pblicos, mientras que las
aplicaciones horizontales suelen utilizar ms los datos compartidos.
8. Ejemplos de bases de datos mviles: iAnywhere Solutions, empresa filial de Sybase, lidera
el ranking del mercado de bases de datos mviles gracias a SQL Anywhere. Este paquete
proporciona bases de datos que pueden utilizarse tanto a nivel de servidor (soporta
mquinas de hasta 64bits) como a nivel de dispositivo mvil. SQL Anywhere se compone
de las siguientes tecnologas:
SQL Anywhere Server: sistema gestor de bases de datos relacionales para los sistemas de
bases de datos mviles.
Ultralite: sistema gestor de bases de datos que puede embeberse en dispositivos mviles.
Mobilink: tecnologa de sincronizacin para el intercambio de datos entre bases de datos
relacionales y bases de datos no relacionales.
QAnywhere: facilita el desarrollo de aplicaciones mviles robustas y seguras.
SQL Remote: permite a los usuarios de dispositivos mviles sincronizar sus datos con otras
bases de datos SQL Anywhere.
DB2 Everyplace de IBM es una base de datos relacional y un servidor de sincronizacin que
permite extender las aplicaciones y los datos empresariales a dispositivos mviles. Gracias a un
consumo de recursos reducido, esta base de datos puede integrarse en dispositivos como PDAs y
telfonos mviles.
Microsoft tambin ofrece una base de datos para dispositivos mviles. Se trata de Microsoft SQL
Server Compact 3.5, un motor de bases de datos que permite desarrollar aplicaciones en cualquier
plataforma Windows incluyendo Tablet PCs, Pocket PCs, Smart Phones y equipos de escritorio.
Oracle Database Lite 10g es la solucin de Oracle para desarrollar aplicaciones en entornos
mviles. Proporciona un cliente que permite la realizacin de consultas SQL para acceder a los
datos locales del dispositivo y un servidor para gestionar los datos de forma centralizada.
Otros productos menos utilizados son Borlands JDataStore, una base de datos Java para
dispositivos mviles y aplicaciones Web, o MobiSnap, un proyecto de investigacin cuyo objetivo
es soportar el desarrollo de aplicaciones con bases de datos relacionales en entornos mviles.

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 95

9. Caso de estudio: Oracle Database Lite 10g: Oracle Database Lite 10g es una solucin
integrada para el desarrollo de aplicaciones en entornos mviles. Para evitar que los
dispositivos mviles estn continuamente conectados al servidor, Oracle Database Lite
10g proporciona una pequea base de datos para gestionar los datos empresariales de
forma local en el dispositivo mvil.

Arquitectura de las aplicaciones Oracle Database Lite 10g


http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/08-09/Distribuidas2.pdf

La figura anterior muestra la arquitectura de las aplicaciones Oracle Database Lite 10g. Esta
arquitectura contiene los siguientes componentes:
Mobile Sync Module: aplicacin instalada en el dispositivo mvil que permite la
sincronizacin de datos con el servidor empresarial.
Oracle Lite RDBMS: sistema gestor de bases de datos relacionales creado especficamente
para dispositivos mviles. Proporciona interfaces ODBC, JDBC, SODA y ADO para permitir
la utilizacin de aplicaciones desarrolladas en lenguajes como Java, C/C++ y Visual Basic.
Oracle Lite database: base de datos instalada en el dispositivo mvil.
Mobile Server: servidor intermedio entre los dispositivos mviles y el servidor empresarial.
Permite la instalacin y actualizacin de aplicaciones en los dispositivos mviles y se

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 96

comunica con el mdulo Mobile Sync para sincronizar los datos entre el dispositivo mvil y
el servidor empresarial.
Message Generator and Processor (MGP): mdulo utilizado en la sincronizacin de datos
para detectar y solucionar cualquier conflicto que pueda producirse en la actualizacin de
los datos del servidor.
Mobile Server Repository: repositorio que contiene informacin necesaria para que el
Mobile Server pueda ejecutarse. Esta informacin se almacena junto a los datos del
negocio, en la misma base de datos.
Los pasos para poner en funcionamiento una aplicacin con Oracle Database Lite 10g son los
siguientes:
1. Instalar y configurar la base de datos Oracle en el servidor.
2. Instalar y configurar el Mobile Server en el equipo que har de intermediario entre los
dispositivos mviles y el servidor.
3. Instalar y configurar el Mobile Server Repository en el servidor.
4. Instalar Oracle Lite RDBMS y Mobile Sync en los dispositivos mviles; para facilitar esta
tarea, Oracle ofrece un producto llamado Mobile Development Kit, que instala
rpidamente todos los componentes en los dispositivos mviles.
Una base de datos local Oracle Lite contiene un subconjunto de los datos almacenados en la base
de datos Oracle. Los cambios realizados en el dispositivo mvil deben sincronizarse con los datos
del servidor. De esta tarea se encarga el mdulo Mobile Sync; primero enva los cambios al Mobile
Server, y despus descarga los nuevos cambios y los aplica en la base de datos local Oracle Lite.

Sincronizacin de datos entre la base de datos local y la base de datos remota


http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/08-09/Distribuidas2.pdf
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 97

5. Similitudes entre Bases de Datos Mviles y Bases de Datos Federadas:


Las dos bases de datos son modelos distribuidos de bases de datos a los cules se accede
de forma remota, ya sea desde un equipo fijo o un equipo mvil.
Los dos sistemas tienen mecanismos de privilegios de usuarios. Dependiendo de los
privilegios que tenga el usuario que accede al sistema, dicho usuario podr acceder a una
parte del esquema u a otra.
En estos sistemas el usuario no es consciente de la disposicin geogrfica en la que se
encuentra el servidor o servidores de bases de datos. Esta caracterstica tambin da al
usuario un gran nivel de movilidad y de acceso a los datos desde cualquier punto.
Son sistemas complejos que necesitan una gran infraestructura que d soporte a este tipo
de bases de datos.
Necesitan tener definidos mecanismos de concurrencia de los datos para que no se vea
daada la integridad de los mismos en el caso de que varios usuarios accedan a los
mismos datos a la vez.
Al tener la parte de almacenamiento de datos, y el acceso a los mismos, distribuida, se
libera de una gran carga computacional a los equipos implicados en el sistema.
Para acceder a dichos sistemas se necesita una interfaz, adaptada al dispositivo desde el
cual se va a acceder, que d soporte y acceso a las funcionalidades disponibles al usuario
por parte del sistema.
6. Diferencias entre Bases de Datos Mviles y Bases de Datos Federadas:
A los sistemas de bases de datos mviles se accede por medio de dispositivos mviles.
stos, a su vez, acceden por medio de estaciones base y estn comunicados directamente
con la base de datos, aunque tambin se puede acceder desde equipos fijos. Las bases de
datos federadas slo son accesibles desde equipos fijos conectados a la infraestructura del
sistema de bases de datos.
Los sistemas de bases de datos mviles estn formados por un slo tipo gestor de bases de
datos, y todos los equipos conectados al sistema atacan al mismo gestor de base de datos.
A diferencia de stos, las bases de datos federadas permiten conectar diferentes sistemas
gestores de bases de datos, que conforman una sola base de datos.
Los sistemas de bases de datos mviles permiten a los usuarios trabajar de forma
desconectada con los datos, y una vez que stos han sido modificados, los usuarios
sincronizan dichos datos con el sistema. Esto evita que los dispositivos mviles tengan que
estar siempre conectados al sistema para interactuar y acceder a la base de datos.
En el caso de las bases de datos mviles, el sistema se puede reducir slo al dispositivo
mvil que lo ejecuta, ya que ste es el nico que contiene la base de datos y accede a

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 98

ellos. Este tipo de sistemas son sistemas gestores de bases de datos embebidos en el
mismo dispositivo.
Las bases de datos federadas son un conjunto de esquemas unificados, a diferencia de las
bases de datos mviles, que slo disponen de un esquema global.
Los sistemas de bases de datos federados permiten dar acceso a una gran cantidad de
datos que los dems sistemas no podran permitir ni soportar.
7. En qu casos es ms recomendable usar un sistema u otro?: Las bases de datos mviles
son recomendadas en los casos en los que los usuarios deben estar movindose de un
lugar para otro para realizar las funciones y cuando la informacin que deben tratar se
puede mostrar y tratar en un dispositivo mvil. Este tipo de base de datos tambin
permite a los dispositivos mviles y a las aplicaciones que corren en ellos almacenar datos,
con todas las ventajas que ofrece un gestor de base de datos. Los sistemas de bases de
datos federados son usados cuando la cantidad de datos es muy grande y, adems,
cuando los mismos se encuentren en diferentes sistemas. Estos sistemas permiten unificar
las bases de datos para permitir al usuario acceder a los datos de forma transparente, sin
que sea consciente de la modularidad de la base de datos, y as poder acceder a diferentes
datos de diferentes bases de datos a la vez.

EJERCICIO DE AUTOEVALUACIN
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.

Defina en sus propias palabras que es una Base de Datos Federada.


Cules son las principales caractersticas de los SGBDF?
En qu consiste el SGBDF fuertemente acoplados?
En qu consisten los dos tipos de arquitecturas para el manejo de bases de datos
federadas?
La implementacin de este tipo de base de datos concierne una serie de problemas que
se cite algunos de ellos.
Qu son las Bases de Datos Mviles?
Cul es la arquitectura general de una plataforma mvil?
Hay dos modos de funcionamiento para trabajar con los datos. Explquelos.
Cules son las tres categoras de en qu se clasifican los datos?
Cite tres ejemplos de Bases de Datos Mviles.

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 99

5. RENDIMIENTO
Identificar de forma general el concepto de paralelismo en las bases de datos, el cual se puede
definir como la particin de la base de datos (normalmente a nivel de relaciones) para procesar de
manera paralela en diferentes discos y con distintos procesadores una sola operacin sobre la
base de datos.
OBJETIVO GENERAL
Implementar la base de datos utilizando las tecnologas de bases de datos avanzadas.
OBJETIVOS ESPECFICOS
Identificar de forma general el concepto de paralelismo en las bases de datos y
reconocerla como una tecnologa innovadora para manejar ordenadamente todo tipo de
recursos, entre ellos equipos de cmputo, almacenamiento y aplicaciones definidas.
Prueba Inicial
1. Defina que son las Bases de Datos Paralelas.
2. Qu es paralelismo E/S?
3. Qu es paralelismo entre consultas?
4. Enumere 5 caractersticas de las Bases de Datos GRID.
5. Identifique 5 ventajas e inconvenientes de las Bases de Datos en un Sistema GRID.
6. Qu son los metadatos en Bases de Datos en un Sistema GRID.

5.1. Bases de Datos Grid y Paralelas


1. Bases de Datos Paralelas:
Introduccin: De forma general el concepto de paralelismo en las bases de datos lo podramos
definir como la particin de la base de datos (normalmente a nivel de relaciones) para poder
procesar de forma paralela en distintos discos y con distintos procesadores una sola operacin
sobre la base de datos. Hace unos aos este tipo de bases de datos estaban casi descartadas pero
actualmente casi todas las marcas de bases de datos venden este producto con xito. Esto se ha
debido ha:
Los requisitos transaccionales que tienen las empresas han aumentado al mismo tiempo
que ha crecido el empleo de computadoras. Adems los sitios web tienen millones de
visitantes para los que se requieren bases de datos enormes.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 100

Las empresas utilizan cada vez mayores volmenes de datos para planificar sus
actividades. Las consultas usadas para estos fines son de ayuda a la toma de decisiones y
pueden necesitar hasta varios terabytes de datos que no se pueden manejar con un nico
procesador en el tiempo necesario.
La naturaleza orientada a conjuntos de las consultas se presta a la paralelizacin.
Las mquinas paralelas con varios procesadores son relativamente baratas.
El paralelismo se usa para mejorar la velocidad en la ejecucin de consultas. Adems el
paralelismo se usa para proporcionar dimensionabilidad ya que la creciente carga de trabajo se
trata sin incrementar el tiempo de respuesta pero incrementando el grado de paralelismo. Existen
cuatro arquitecturas de sistemas paralelos:
De memoria compartida: Todos los procesadores comparten una memoria comn.
De discos compartidos: Todos los procesadores comparten un conjunto de discos comn.
Sin compartimiento: Los procesadores no comparten ni memoria ni disco.
Jerrquica: Este modelo es un hbrido de las arquitecturas anteriores.
Paralelismo de E/S: De forma general podemos hablar de paralelismo de E/S cuando
hablamos de divisiones en las relaciones entre varios discos para reducir el tiempo
necesario de su recuperacin. Normalmente la divisin ms comn en un entorno de
bases de datos paralelas es la divisin horizontal. En este tipo de divisin las tuplas de
cada relacin se dividen entre varios discos de modo que cada tupla resida en un disco
distinto. Suponiendo que tenemos n discos (D0,D1,,Dn-1) entre los que se van a dividir
los datos, existen varias estrategias de divisin:
Turno rotatorio: Se recorre la relacin y la i-sima tupla se enva al disco Di mod n quedando una
distribucin homognea de las tuplas en los discos.
Divisin por asociacin: Se escogen varios atributos del esquema de la relacin y se designan
como atributos de divisin. Se escoge una funcin de asociacin cuyo rango es
{0,1,,n-1}. Cada tupla de la relacin original se asocia en trminos de los atributos de divisin. Si
la funcin de asociacin devuelve i, la tupla de ubica en el disco DI.
Divisin por rangos: Se distribuye rangos contiguos de valores de los atributos a cada disco. Para
ello se escoge un atributo de divisin, AD, como vector de divisin y la relacin se divide de la
siguiente manera:
Sea *vo, v1, , vn-2] el vector de divisin con i<j y vi<vj. Considrese una tupla t tal que t[A]=x.
Si x< vo entonces t se ubica en el disco Do.
Si xvn-2 entonces t se ubica en el disco Dn-1.
Si vix < vi+1 entonces t se ubica en el disco DI+1

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 101

Comparativa entre tcnicas de divisin: Cuando ya hemos dividido una relacin en varios
discos se puede recuperar en paralelo utilizndolos todos de la misma manera que se
puede escribir en paralelo cuando se est dividiendo una relacin. Por lo tanto, cuando se
quiera leer (o escribir) la relacin completa ganaremos tiempo gracias al paralelismo.
Adems de leer de forma completa una relacin existen otro tipo de lecturas o consultas:
Exploracin de la relacin completa: Ya mencionada
Consultas concretas: Buscan tuplas con un determinado valor para un atributo concreto.
Consultas de rango: Buscan tuplas con un valor que est dentro de un rango para un
atributo concreto.
Las tcnicas de divisin explicadas permiten estos tipos de acceso pero con diferentes niveles de
eficacia:
Turno rotatorio: Se adapta bien a la exploracin completa pero no es eficiente para
consultas concretas y de rango ya que tiene que buscar en todos los discos.
Divisin por asociacin: Este esquema se adapta bien a las consultas concretas basadas en
el atributo de divisin ya que dirigimos la consulta al disco que se nos indica la funcin de
asociacin para el atributo y el valor del mismo. Tambin se adapta bien a una exploracin
completa si la funcin de asociacin reparte bien las tuplas en los discos. Sin embargo no
es adecuada esta tcnica para consultas concretas cuando el atributo de bsqueda no
coincide con el atributo de divisin.
Divisin por rangos: Se adapta bien a las consultas concretas y de rango basadas en el
atributo de divisin. Para consultas concretas se debe analizar el vector de divisin para
ver en que disco est la tupla al igual que para una consulta de rango se consulta el vector
de divisin para ver en que rango de discos estn las tuplas.
Resumiendo, la eleccin de la tcnica depende de las operaciones que se vayan a ejecutar.
En general se prefiere divisin por asociacin o por rangos a turno rotatorio. En la siguiente tabla
se resume la comparativa:

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 102

http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/Rendimiento.pdf

El problema de las divisiones por asociacin es que tienden a almacenar un alto porcentaje de
tuplas en algunos discos especficos, situacin que no se da con el turno rotatorio. Esto se debe a
que muchas tuplas contiene valores similares en sus atributos. Para minimizar este problema se
debe de elegir un vector de divisin equilibrado.
Si una relacin contiene un nmero pequeo de tuplas sta no debe ser dividida y debe
almacenarse en un solo disco.
2. Paralelismo entre consultas: Los sistemas de bases de datos con arquitectura paralela
deben asegurar de que dos procesadores no actualicen simultneamente los mismos
datos de manera independiente. Cuando un procesador accede a los datos o los actualiza,
el sistema de bases de datos debe garantizar que tenga su ltima versin en la memoria
intermedia. El problema de asegurar que la versin sea la ltima disponible se denomina
problema de coherencia de cache. Existen una serie de protocolos para garantizar la
coherencia de cache, que normalmente se integran con los de control de concurrencia
para reducir la sobrecarga.
Los protocolos de este tipo de sistemas de disco compartido son los siguientes:
Antes de cualquier acceso de lectura o escritura de una pgina, la transaccin la bloquea
en modo compartido o excluso, segn corresponda. Inmediatamente despus de obtener
el bloqueo compartido o exclusivo de la pgina, la transaccin lee tambin su copia ms
reciente del disco compartido.
Antes de que una transaccin libere el bloqueo exclusivo de una pgina, la traslada al disco
compartido, posteriormente libera el bloqueo.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 103

Con este protocolo se garantiza que cuando una transaccin establece un bloqueo
compartido o exclusivo sobre una pgina, obtenga la copia correcta de la pgina.
3. Paralelismo en consultas: Es la ejecucin en paralelo de una nica consulta entre varios
procesadores y discos, cuyo objetivo es acelerar las consultas de ejecucin prologada. Por
tanto se puede hacer paralelas las consultas haciendo paralelas las operaciones que las
forman.
Existen dos maneras de ejecutar en paralelo una sola consulta:
Paralelismo en operaciones. Se puede acelerar el procesamiento de las consulta haciendo
paralela la ejecucin de cada una de sus operaciones individuales ordenacin, seleccin,
proyeccin y reunin.
Paralelismo entre Operaciones. Se puede acelerar el procesamiento de la consulta
ejecutando en paralelo las diferentes operaciones de las expresiones de las consultas.
Por lo tanto el objetivo que se persigue es dividir la relacin que interviene en la consulta por
medio de tcnicas de divisin de relaciones, guardar dichas relaciones en discos que van a ser
gestionados cada uno de ellos por un procesador, a su vez, cada procesador ejecuta su consulta
local y cada uno de estos resultados parciales se unen para formar la respuesta a la consulta.
Paralelismo en operaciones: Ya que las operaciones relacionales trabajan con relaciones
que contienen grandes conjuntos de tuplas, las operaciones se pueden paralelizar
ejecutndolas sobre subconjuntos diferentes de las relaciones en paralelo. Segn el tipo
de operacin se siguen distintos criterios en el tratamiento que son:
Ordenacin Paralela
Reunin Paralela.
Ordenacin paralela: Dependiendo del criterio en la divisin de la relacin se pueden
distinguir dos tipos de ordenacin:
Ordenacin divisin de Rangos: Esta forma de divisin por rangos posee dos etapas
diferenciadas:
Redistribuir las tuplas de la relacin utilizando una estrategia de divisin por rangos, de
manera que todas las tuplas que se hallen dentro del rango i-simo se enven al
procesador Pi, que almacena temporalmente la relacin en el disco Di. Para implementar
en paralelo la divisin por rangos cada procesador lee las tuplas de su disco y las enva al
procesador de destino. Cada procesador P0,P1Pn tambin recibe las tuplas
correspondientes a su particin y las almacena localmente.

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 104

Cada uno de los procesadores ordena localmente su particin de la relacin sin interactuar con los
dems. La operacin final de mezcla es trivial ya que la divisin por rangos de la primera etapa
asegura que los valores de la clave del procesador Pi sean menores que los procesador Pj
Ordenacin y mezcla externa paralela: Este tipo de ordenacin es una alternativa a la efectuada
por la divisin por rangos. Las etapas que se definen una vez que la relacin se ha divida entre los
diferentes discos D1,D2Dn-a son las siguientes:
1. Cada procesador Pi ordena localmente los datos del disco Di
2. El sistema mezcla las partes ordenadas por cada procesador para obtener el resultado
ordenado final.
A su vez el paso en el que el sistema realiza la mezcla puede ser tambin paralelizado mediante la
siguiente secuencia de acciones.
1. El sistema divide en rangos las particiones ordenadas encada procesador Pi entre los
procesadores P0,P1Pn-1. Enva las tuplas de acuerdo con el orden establecido por lo que
cada procesador recibe las tuplas en corrientes ordenadas.
2. Cada procesador Pi, realiza una mezcla de las corrientes segn las recibe para obtener una
sola parte ordenada.
3. Las partes ordenadas de los procesadores P0,P1 Pn-1 se concatenan para obtener el
resultado final.
Reunin paralela: La operacin reunin exige que el sistema compare pares de tuplas
para ver si satisface la condicin de reunin, si la cumple aade el par al resultado de la
reunin. Los algoritmos de reunin paralela intentan repartir entre varios procesadores los
pares que hay que comparar. Cada procesador procesa luego localmente parte de la
reunin. Despus, el sistema rene los resultados de cada procesador para producir el
resultado final. Existe un problema por el cual no todas los tipos de reuniones pueden ser
divididas por lo que existen distintas formas de proceder que son:
Reunin por Divisin: Vlida para reuniones de tipo equirreuniones y reuniones naturales, en la
cual existen n procesadores y las relaciones que hay que reunir son r y s. La reunin por divisin
funciona de esta forma:
El sistema divide las relaciones r y s en n particiones r0,r1,rn-1 y s0,s1,sn-1
Enva las particiones ri y si al procesador Pi, donde la reunin se procesa localmente.
Existen dos maneras diferentes de dividir las relaciones r y s y son:
Divisin por rangos de los atributos de reunin, en el que se debe usar el mismo vector de
divisin.

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 105

Divisin por asociacin de los atributos de reunin, se debe usar la misma funcin de
asociacin.
Una vez divididas las relaciones se pueden utilizar localmente cualquier tcnica de reunin en cada
procesador Pi para calcular la reunin de ri y s.
Reunin con fragmentos y replicas: Proporcionan una alternativa para las reuniones que no puede
ser procesada por la tcnica de reunin por divisin, como por ejemplo si la condicin de reunin
es una desigualdad. En este tipo de reuniones pueden paralelizarse utilizando una tcnica
denominada fragmentos y replicas, cuyo funcionamiento es el siguiente.
1. El sistema divide una de las relaciones (por ejemplo s) mediante cualquier tcnica de
divisin, incluida por turno rotatorio.
2. El sistema replica la otra relacin r en todos los procesadores
3. El procesador Pi procesa localmente la reunin de ri con todos, utilizando cualquier tcnica
de reunin.
Reunin por asociacin dividida en paralelo. La reunin por asociacin realizada en cada
procesador es independiente de las realizadas en otros procesadores, y recibir las tuplas de ri y de
si es parecido a leerlas del disco. En concreto, se puede utilizar el algoritmo hbrido de reunin por
asociacin para guardar en cach algunas de las tuplas de entrada, y evitar as los costos de
escribirlas y volver a leerlas.

http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/Rendimiento.pdf

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 106

Otras operaciones relacionales: Tambin se puede realizar en paralelo la evaluacin de


otras operaciones relacionales:
Seleccin: Sea la seleccin me(r). Considrese primero el caso en el que e es de la forma ai = v,
donde ai es un atributo y v es un valor. Si la relacin r se divide basndose en ai la seleccin se
lleva a cabo en un solo procesador. Si e es de la forma l ) ai ) u (es decir, que e es una seleccin de
rango) y la relacin se ha dividido por rangos basndose en ai, entonces la seleccin se lleva a cabo
en cada procesador cuya particin se solape con el rango de valores especificado. En el resto de
los casos la seleccin se lleva a cabo en todos los procesadores en paralelo.
Eliminacin de duplicados: La eliminacin de duplicados puede llevarse a cabo por ordenacin;
puede utilizarse cualquiera de las tcnicas de ordenacin en paralelo, con la optimizacin de
eliminar los duplicados durante la ordenacin tan pronto como se encuentren. Tambin se puede
realizar la eliminacin de duplicados en paralelo dividiendo las tuplas (mediante divisin por
rangos o por asociacin) y llevando a cabo localmente en cada procesador la eliminacin de
duplicados.
Proyeccin: Se puede llevar a cabo la proyeccin sin eliminacin de duplicados segn se leen en
paralelo las tuplas del disco. Si se va a llevar a cabo la eliminacin de duplicados se puede utilizar
las tcnicas que se acaban de describir.
Agregacin: La agregacin puede considerarse una operacin. Se puede paralelizar la operacin
dividiendo la relacin basndose en los atributos de agrupacin y procesando luego localmente los
valores de agregacin en cada procesador. Se puede utilizar divisin por rangos o por asociacin.
Si la relacin ya est dividida basndose en los atributos de agrupacin se puede omitir el primer
paso.
Costo de la evaluacin en paralelo de las operaciones: Se puede obtener el paralelismo
dividiendo la E/S entre varios discos y el trabajo de la UCP entre varios procesadores. Si se
logra un reparto as sin sobrecarga y no hay sesgo en el reparto del trabajo, las
operaciones en paralelo que utilicen n procesadores tardarn 1/n lo que tardaran en un
solo procesador. Ya se sabe cmo estimar el costo de operaciones como la reunin o la
seleccin. El costo en tiempo del procesamiento paralelo sera entonces 1/n el del
procesamiento secuencial de la operacin.
Tambin hay que tener en cuenta los costos siguientes:
Los costos de iniciar la operacin en varios procesadores.
El sesgo en la distribucin de trabajo entre los procesadores, con algunos procesadores
con mayor nmero de tuplas que otros.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 107

La contencin de recursos como la memoria, los discos y la red de comunicaciones que


dan lugar a retrasos.
El costo de construir el resultado final transmitiendo los resultados parciales desde cada
procesador.
Aunque dividir una sola consulta en varios pasos en paralelo reduce el tamao del paso medio, es
el tiempo de procesamiento del paso ms lento el que determina el tiempo empleado en procesar
la consulta en su conjunto. Una evaluacin en paralelo de las particiones, por ejemplo, slo es tan
rpida como la ms lenta de sus ejecuciones en paralelo. Por tanto, el rendimiento se ve muy
afectado por cualquier sesgo en la distribucin del trabajo entre los procesadores. El problema del
sesgo de la divisin est ntimamente relacionado con el del desbordamiento de particiones en las
reuniones por asociacin secuenciales.
Se puede utilizar la resolucin del desbordamiento y las tcnicas de evitacin desarrolladas para
las reuniones por asociacin para tratar el sesgo cuando se utilice la divisin por asociacin.
4. Paralelismo entre operaciones: Hay dos formas de paralelismo entre operaciones: el
paralelismo de encauzamiento y el paralelismo independiente.
Paralelismo de encauzamiento: El encauzamiento supone una importante fuente de economa de
procesamiento para el procesamiento de consultas de bases de datos. La ventaja principal de la
ejecucin encauzada de las evaluaciones secuenciales es que se puede ejecutar una secuencia de
operaciones de ese tipo sin escribir en el disco ninguno de los resultados intermedios.
En los sistemas paralelos el encauzamiento se utiliza principalmente por la misma razn que en los
sistemas secuenciales. Sin embargo, el encauzamiento puede utilizarse tambin como fuente de
paralelismo, del mismo modo que el encauzamiento de instrucciones se utiliza como fuente de
paralelismo en el diseo de hardware. Esta forma de paralelismo se denomina paralelismo de
encauzamiento.
El paralelismo encauzado resulta til con un nmero pequeo de procesadores, pero no puede
extenderse bien:
1. En primer lugar, las cadenas del cauce no suelen lograr la longitud suficiente para
proporcionar un alto grado de paralelismo.
2. En segundo lugar, no es posible encauzar los operadores de relacin que no producen
resultados hasta que se ha tenido acceso a todas las entradas, como la operacin
diferencia de conjuntos.
3. En tercer lugar, slo se obtiene una aceleracin marginal en los casos frecuentes en que el
costo de ejecucin de un operador es mucho mayor que los de los dems operadores.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 108

Por consiguiente, cuando el grado de paralelismo es elevado, la importancia del encauzamiento


como fuente de paralelismo es secundaria respecto de la del paralelismo de particiones. La razn
fundamental para utilizar el encauzamiento es que las ejecuciones encauzadas pueden evitar
escribir en el disco los resultados intermedios.
Paralelismo independiente: Las operaciones en las expresiones de las consultas que son
independientes entre s pueden ejecutarse en paralelo. Esta forma de paralelismo se denomina
paralelismo independiente.
Al igual que el paralelismo encauzado, el paralelismo independiente no proporciona un alto grado
de paralelismo y es menos til en sistemas con un elevado nivel de paralelismo, aunque resulta
til con un grado menor de paralelismo.
4. Optimizacin de consultas: Un factor importante en el xito de la tecnologa relacional ha
sido el diseo con xito de optimizadores de consultas. Los optimizadores de consultas
para la evaluacin de consultas en paralelo son ms complicados que los optimizadores de
consultas para la evaluacin secuencial de consultas. En primer lugar, los modelos de
costos son ms complicados dado que hay que tener en cuenta los costos de divisin, y
deben tenerse en consideracin aspectos como el sesgo y la contencin de recursos.
Resulta de mayor importancia el asunto de la paralelizacin de las consultas. Supngase
que de algn modo se ha escogido una expresin (de entre las equivalentes a la consulta)
para utilizarla para evaluar la consulta.
El modo en que se paralelice cada operacin y el nmero de procesadores que se utilizar
para ello.
Las operaciones que se encauzan entre los diferentes procesadores, las operaciones que
se ejecuten independientemente en paralelo y las que se ejecuten secuencialmente, una
tras otra.
5. Diseo de sistemas paralelos: La carga de datos en paralelo desde fuentes externas es un
requisito importante si se van a tratar grandes volmenes de datos entrantes.
Un gran sistema paralelo de bases de datos debe abordar tambin los siguientes aspectos de
disponibilidad:
El poder de recuperacin frente al fallo de algunos procesadores o discos.
La reorganizacin interactiva de los datos y los cambios de los esquemas.

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 109

Con un gran nmero de procesadores y de discos la probabilidad de que al menos un procesador o


un disco funcionen mal es significativamente mayor que en sistema con un nico procesador y un
solo disco. Un sistema paralelo mal diseado dejar de funcionar si cualquier componente
(procesador o disco) falla. Suponiendo que la probabilidad de fallo de cada procesador o disco es
pequea, la probabilidad de fallo del sistema asciende.
Por tanto, los sistemas paralelos de bases de datos de gran escala se disean para operar incluso si
falla un procesador o un disco. Los datos se replican en al menos dos procesadores. Si falla un
procesador se puede seguir teniendo acceso desde los dems procesadores a los datos que
guarda. El sistema hace un seguimiento de los procesadores con fallos y distribuye el trabajo entre
los que funcionan. Las peticiones de los datos guardados en el emplazamiento con fallo se desvan
automticamente a los emplazamientos de las copias de seguridad que guardan una rplica de los
datos.
Cuando se manejan grandes volmenes de datos (del orden de terabytes), las operaciones
sencillas, como la creacin de ndices, y los cambios en los esquemas, como aadir una columna a
una relacin, pueden tardar mucho tiempo (quizs horas o incluso das). Por tanto, es inaceptable
que los sistemas de bases de datos no estn disponibles mientras se llevan a cabo tales
operaciones. Los sistemas paralelos de bases de datos permiten que tales operaciones se lleven a
cabo interactivamente, es decir, mientras el sistema ejecuta otras transacciones.
6. Bases de Datos Grid:
Introduccin: Grid es una tecnologa que surgi como una nueva forma de computacin
distribuida. Ian Foster y Carl Kesselman son considerados los padres de esta tecnologa,
introducida por ellos en los aos 90. Esta tecnologa se basa en la utilizacin de recursos externos
adems de los locales, logrando con ello una mayor disponibilidad de recursos para la realizacin
de una tarea.
La tecnologa estndar, o una de las ms utilizadas en su comienzo al menos, es el Globus Toolkit.
El objetivo es permitir el uso de recursos libres de otras computadoras localizadas en otro lugar
geogrfico y que no estn utilizando toda su potencia. De este modo alguien que no disponga de la
suficiente potencia o recursos en su lugar de trabajo, no se ver imposibilitado para realizar la
tarea deseada ya que podr hacer uso de recursos ajenos.
Como consecuencia del uso de una red Grid, un usuario puede hacer uso de recursos libres
situados en los computadores que se encuentren dentro de esta red Grid, sin importar la
localizacin del mismo. De este modo, el usuario dispone de un computador ficticio con la
potencia, disco duro o memoria RAM necesitada.

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 110

Por otro lado, podemos decir que con Grid, no ponemos atencin en los datos que se transmiten
en s, como es el caso de los sistemas Cliente-Servidor sino que el punto de inters y estudio son
los recursos computacionales y el uso que se hace de ellos.
Otro avance de Grid es que genera un incremento de las posibilidades del uso de internet ya que
proporciona un incremento de su usabilidad. De este modo se obtiene una mayor velocidad de
procesamiento as como la facilidad de tener bases de datos de mayor tamao.
Una definicin de computacin Grid encontrada en wikipedia es la siguiente:
GRID COMPUTING: Es una tecnologa innovadora que permite utilizar de forma coordinada todo
tipo de recursos (entre ellos cmputo, almacenamiento y aplicaciones especficas) que no estn
sujetos a un control centralizado. En este sentido es una nueva forma de computacin distribuida,
en la cual los recursos pueden ser heterogneos (diferentes arquitecturas, supercomputadores,
clusters...) y se encuentran conectados mediante redes de rea extensa (por ejemplo Internet).
Desarrollado en mbitos cientficos a principios de los aos 90 su entrada al mercado comercial
siguiendo la idea de la llamada Utility Computing supone una revolucin que dar mucho que
hablar. Las caractersticas de esta arquitectura seran:
Capacidad de balanceo de sistemas: no habra necesidad de calcular la capacidad de los
sistemas en funcin de los picos de trabajo, ya que la capacidad se puede reasignar desde
la granja de recursos a donde se necesite;
Alta disponibilidad. Con la nueva funcionalidad, si un servidor falla, se reasignan los
servicios en los servidores restantes;
Reduccin de costos: Con esta arquitectura los servicios son gestionados por "granjas de
recursos". Ya no es necesario disponer de "grandes servidores" y podremos hacer uso de
componentes de bajo costo.
7. Grid middleware: En las tecnologas Grid, adems de tenerse en cuenta el hardware como
son los recursos, los dispositivos de almacenamiento y por supuesto la propia red Grid, es
necesario un soporte software que gestione todas las transferencias y el modo en que se
realizan, as como la seguridad, todo esto resulta una tarea complicada y no exenta de
posibles errores. Esto no implica que la aparicin de un error en un equipo y en una
localizacin determinada, provoque el error en toda la red.
8. Bases de datos GRID: Las Bases de Datos Grid nos proporcionan una visin uniforme de
bases de datos heterogneas en los entornos Grid. Es decir, puesto que existen diversos
tipos de bases de datos, refirindonos con ellos a que stas pueden ser relacionales,
orientadas a objetos, en XML, etctera, nuestro sistema nos tiene que proporcionar la
abstraccin necesaria de los datos para que el usuario no distinga entre s est accediendo
a una relacional o a una orientada a objetos, ya que el usuario no le importa cmo se
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 111

realice el trabajo, solo necesita que se haga y debe ser el Grid middleware quien se ocupe
de que se efecte correctamente.
Por otro lado la especificacin de los servicios de bases de datos deben ser ortogonales a los
mecanismos de autentificacin y autorizacin de los sistemas Grid, lo que significa que las bases
de datos deben poseer sistemas de seguridad que identifiquen a un usuario del Grid y que por
tanto permitan o no su acceso. Las propias bases de datos deben de ser transparentes al usuario,
logrando as que este se abstraiga de todo lo relacionado con el cmo se hace, donde o incluso
que recursos o almacenamiento est siendo utilizado. Del mismo modo, no deber preocuparse
por la administracin de los recursos.
9. Requisitos para la utilizacin de BBDD en Grid: Para utilizar Base de Datos en el GRID,
estas primeramente deben de cumplir una serie de condiciones previas, como son las
normas de seguridad en un GRID.
Algunos aspectos claves de la seguridad en el GRID son:
Autentificacin: Verificacin de la validez de la identidad de un usuario, recurso, servicio,..
Autorizacin: Cada recurso o usuario solo debe usar los servicios para los que est
permitido (control de acceso).
Integridad: Asegura que los datos no han sido alterados fraudulentamente.
Confidencialidad: Informacin sensible como puede ser informacin de carcter. personal,
orientacin sexual, datos mdicos o bancarios, no puede ser observada por terceros.
Gestin de claves: Hace referencia a la gestin de seguridad, proceso de distribucin,
generacin y almacenamiento de claves.
Encriptacin:
Simtrica: El proceso de encriptacin se realiza usando la misma clave privada.
Inconvenientes: El emisor y el receptor deben intercambiar la clave.
Asimtrica: Se utilizan dos claves diferentes para encriptar y desencriptar datos.
Criptografa de clave pblica.
Lentitud considerable en mensajes grandes.
Aparicin de patrones que puede simplificar su criptoanlisis.
Secure Socket Layer/ Transport Layer Security (SSL/ TLS): Protocolo de comunicacin
segura.
Autentificacin Mutua: Dos entidades que quieren comunicarse usan su clave pblica
almacenada en un certificado digital para autentificarse.
Estos servicios fundamentales se garantizan mediante:
GRID Security Infrastructure (GSI)
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 112

Public Key Infrastructure (PKI)


10. Integracin de Bases de datos en un sistema Grid: En los sistemas de bases de datos Grid
los servicios ofrecidos deben estar, en la medida de lo posible estandarizados, y decimos
en la medida de lo posible ya que resulta imposible que todos los servicios se estandaricen
debido a la existencia de distintos tipos de bases de datos que pueden existir en el sistema
y que pueden estar usando lenguajes diferentes que no pueden ser integrados en un nico
lenguaje debido a su naturaleza. De esta forma podemos aumentar la portabilidad de
dichos sistemas. Otra de las ventajas de estandarizar siempre es reducir el esfuerzo de
construccin del sistema.
Con lo mencionado anteriormente se hace imprescindible la presencia de los metadatos en este
tipo de sistemas. Con los metadatos lo que conseguimos es que cada sistema que se conecta al
Grid pueda comunicar al resto los servicios que ofrece. Del mismo modo podremos saber las
operaciones que soporta cada uno. El sistema gestor de bases de datos (SGBD) va a ser el
encargado de saber qu servicios ofrece cada una de las bases de datos, que operaciones se
pueden realizar sobre ellas y de gestionar los permisos de acceso a cada una.
Los servicios que cada sistema debe tener disponibles dentro del Grid son los siguientes:
Metadatos: Nos dan la informacin sobre los servicios que ofrece el sistema. Adems,
cuando los usuarios del sistema soliciten un servicio no saben en qu sistema est y
mediante los metadatos l se pueden construir dinmicamente las interfaces para acceder
a los distintos sistemas de bases de datos que forman parte del Grid.
Manejo de consultas: Como hemos comentado ms arriba los lenguajes pueden ser
diferentes. Por eso en los metadatos se proporciona la informacin necesaria sobre el
lenguaje de consulta que soporta cada base de datos. Tambin es importante que los
resultados de una consulta se puedan enviar a distintos destinos y que sean comprensibles
por stos para poder construir sistemas ms amplios y complejos.
Transacciones: Estas operaciones son en las que interviene un nico sistema de base de
datos y a su vez que cada sistema individual tome parte en las transacciones distribuidas.
La gran variedad de tipos de transacciones que maneja el sistema gestor de base de datos
de un sistema Grid, debido sobre todo a la heterogeneidad de los sistemas individuales
que lo componen, hace que el servicio deba poner claramente en conocimiento del resto
cual es el tipo de transacciones que soporta el sistema individual de base de datos.
Carga del sistema o carga de datos: Cuando tenemos grandes cantidades de taos este tipo
de servicio debe ser capaz de acceder a los protocolos de comunicacin del sistema Grid
para llevar a cabo la transferencia de esos datos.

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 113

Notificacin: Sirve para notificar los cambios que se producen a los clientes que deseen
recibir esa informacin. Los clientes deben poder expresar si estn interesados en recibir
las notificaciones cuando se inserten o se borren datos o cuando se realicen
actualizaciones o en caso de varias acciones como insertar y actualizar. La forma ms
sencilla de que este servicio se ponga en funcionamiento es que el sistema gestor de base
de datos subyacente proporcione la ayuda necesaria, por ejemplo mediante disparadores.
Planificacin: Se debe permitir por ejemplo que cuando un superordenador conecte con
un DBS, la informacin recuperada del DBS se pueda procesar por el superordenador.
El ancho de banda en la red que los conecta necesita ser reservada. Como el acceso exclusivo a un
DBS no es prctico, se requieren mecanismos con suficientes recursos (discos, CPUs, memoria,
red).
11. Ventajas e Inconvenientes de las BBDD en un Sistema GRID: Las bases de datos alojadas
en un sistema GRID van a heredar todas las caractersticas: ventajas e inconvenientes del
sistema al que pertenecen. La Computacin GRID est creada con el fin de ofrecer una
solucin a determinadas cuestiones, como problemas que requieren de:
Un gran nmero de ciclos de procesamiento o un acceso a una gran cantidad de datos.
Las principales ventajas de un sistema GRID son:
Nunca queda obsoleta, ya que se integran diferentes tipos de mquinas y de recursos y
todos los recursos se aprovechan. Si se renuevan todas las PCs de una oficina, se pueden
incorporar las antiguas y las nuevas.
Facilita la posibilidad de compartir, acceder y gestionar informacin, mediante la
colaboracin y la flexibilidad operacional, aunando no slo recursos tecnolgicos dispares,
sino tambin personas y aptitudes diversas.
Permite a las empresas acceder y compartir bases de datos remotas. Esto es de gran
importancia en las empresas que se dedican a la investigacin, en donde enormes
cantidades de informacin son generadas y analizadas casi a diario.
Las empresas pueden mejorar la calidad y el tiempo de entrega de los productos y
servicios que ofrecen, a la vez que reducen costos de TI al permitir la colaboracin
transparente y la comparticin de recursos.
Tiende a incrementar la productividad otorgando a los usuarios finales acceso a los
recursos de computacin, datos y almacenamiento que necesiten, cuando los necesiten.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 114

Se aprovechan los ciclos de procesamiento inutilizados de ordenadores que se encuentran


en diversas zonas geogrficas.
Ejemplo: ordenadores que normalmente se encuentran inutilizados por la noche en una
compaa en Europa, podran ser utilizados en el da por una sede de operaciones en
Amrica.
El paralelismo puede estar visto como un problema, ya que una mquina paralela es muy
costosa. Pero, si tenemos disponibilidad de un conjunto de mquinas heterogneas de
pequeo o mediano porte, cuya potencia computacional sumada sea considerable, eso
permitira generar sistemas distribuidos de muy bajo costo y gran potencia
computacional.
La tolerancia a fallos significa que si una de las mquinas que forman parte del GRID
colapsa, el sistema lo reconoce y la tarea se reenva a otra mquina, con lo cual se cumple
el objetivo de crear infraestructuras operativas flexibles y resistentes. As se obtiene una
tecnologa ms robusta y resistente, capaz de responder a desastres.
Por tanto se puede decir que un sistema GRID proporciona:
Una forma transparente de ejecutar el trabajo que se desea:
Encuentra los recursos (maquinas) disponibles.
Asegura un acceso optimizado a los datos (incluyendo copias locales/ cache).
Comprueba la autorizacin del usuario.
Monitoriza la ejecucin.
Adems, si es posible monitoriza el trabajo
Los principales inconvenientes de un sistema GRID son:
Necesita para mantener su estructura, de diferentes servicios como Internet, conexiones
de 24 horas, los 365 das, con banda ancha, servidores de capacidad, seguridad
informtica, VPN, firewalls, encriptacin, comunicaciones seguras, polticas de seguridad,
normas ISO, y algunas caractersticas ms
12. Metadatos en Bases de Datos en un Sistema GRID:
Por qu son necesarios los metadatos?: En los sistemas de bases de datos GRID los
servicios ofrecidos deben estar, en la medida de lo posible estandarizados ya que resulta
imposible que todos los servicios se estandaricen debido a la existencia de distintos tipos
de bases de datos en el sistema GRID y que pueden estar usando lenguajes diferentes que
no pueden ser integrados en un nico lenguaje. De esta forma podemos aumentar la
portabilidad de dichos sistemas. Otra de las ventajas de estandarizar es reducir el esfuerzo
de construccin del sistema.
Con lo mencionado anteriormente se hace imprescindible la presencia de los metadatos
en este tipo de sistemas. Con los metadatos lo que conseguimos es que cada sistema que

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 115

se conecta al GRID pueda comunicar al resto los servicios que ofrece. Del mismo modo
podremos saber las operaciones que soporta cada uno.
El sistema gestor de bases de datos (SGBD) va a ser el encargado de saber qu servicios ofrece
cada una de las bases de datos, que operaciones se pueden realizar sobre ellas y de gestionar los
permisos de acceso a cada una.
Servicios que describen los metadatos: Los servicios que cada sistema debe tener
disponibles dentro del GRID son los siguientes:
Metadatos: Nos dan la informacin sobre los servicios que ofrece el sistema. Adems,
cuando los usuarios del sistema soliciten un servicio no saben en qu sistema est y
mediante los metadatos se pueden construir dinmicamente las interfaces para acceder a
los distintos sistemas de bases de datos que forman parte del GRID.
Manejo de consultas: Como hemos comentado ms arriba los lenguajes pueden ser
diferentes. Por eso en los metadatos se proporciona la informacin necesaria sobre el
lenguaje de consulta que soporta cada base de datos. Tambin es importante que los
resultados de una consulta se puedan enviar a distintos destinos y que sean comprensibles
por stos para poder construir sistemas ms amplios y complejos.
Transacciones: Estas operaciones son en las que interviene un nico sistema de base de
datos y a su vez que cada sistema individual tome parte en las transacciones distribuidas.
La gran variedad de tipos de transacciones que maneja el sistema gestor de base de datos
de un sistema GRID, debido sobre todo a la heterogeneidad de los sistemas individuales
que lo componen, hace que el servicio deba poner claramente en conocimiento del resto
cual es el tipo de transacciones que soporta el sistema individual de base de datos.
Carga del sistema o carga de datos. Cuando tenemos grandes cantidades de taos este tipo
de servicio debe ser capaz de acceder a los protocolos de comunicacin del sistema GRID
para llevar a cabo la transferencia de esos datos.
Notificacin. Sirve para notificar los cambios que se producen a los clientes que deseen
recibir esa informacin. Los clientes deben poder expresar si estn interesados en recibir
las notificaciones cuando se inserten o se borren datos o cuando se realicen
actualizaciones o en caso de varias acciones como insertar y actualizar. La forma ms
sencilla de que este servicio se ponga en funcionamiento es que el sistema gestor de base
de datos subyacente proporcione la ayuda necesaria, por ejemplo mediante disparadores.
Planificacin: Se debe permitir por ejemplo que cuando un superordenador conecte con
un sistema de base de datos, la informacin recuperada de ese sistema pueda ser
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 116

procesada por el superordenador. El ancho de banda en la red que los conecta necesita
ser reservada. Como el acceso exclusivo a un sistema de base de datos no es prctico, se
requieren mecanismos con suficientes recursos (discos, CPUs, memoria, red).
EJERCICIO DE AUTOEVALUACIN
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.

Defina el concepto de Paralelismo en las Bases de Datos.


Cules con las tcnicas de divisin?. Realice una comparativa entre ellas.
Cules son las dos maneras de ejecutar en paralelo una sola consulta?
Dependiendo del criterio en la divisin de la relacin se pueden distinguir dos tipos
de ordenacin. Explique cada uno de ellos.
Existe un problema por el cual no todas los tipos de reuniones pueden ser divididas
por lo que existen distintas formas de proceder. Cules son?. Explquelas.
Qu son los Optimizadores de consultas?
Un gran sistema paralelo de bases de datos debe abordar aspectos de
disponibilidad. Cules son?
Defina: Bases de Datos GRID.
Mencione algunos aspectos claves de la seguridad en el GRID.
Cules son los servicios que cada sistema debe tener disponibles dentro del Grid?
Mencione algunas Ventajas e Inconvenientes de las BBDD en un Sistema GRID.
Por qu son necesarios los metadatos?
Cules son los servicios que describen los metadatos?

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 117

6. PISTAS DE APRENDIZAJE
Recuerde: Las bases de datos tradicionales, son llamadas tambin pasivas.
Tenga en Cuenta: Cualquier modificacin sobre el comportamiento reactivo se puede llevar a cabo
cambiando solamente las reglas activas, sin necesidad de variar las aplicaciones.
Tener Presente: Para definir Reglas Deductivas que permiten concluir, inferir u obtener
informacin nueva a partir de los datos almacenados o sucesos condicionados.
Recuerde: Una base de datos multimedia es un conjunto de informacin combinada, la cual puede
ser texto, arte grfico, sonido, animacin y vdeo.
Tenga en Cuenta: El Almacn de Datos permite recopilar la informacin de una forma confiable,
segura y de calidad.
Tenga Presente: Las bases de datos distribuidas son un grupo de informacin que corresponde a
un sistema que se encuentra repartido entre computadores de una misma red.
Recuerde: Una red de comunicacin suministra las capacidades para que un proceso en ejecucin
en un sitio de la red enve y reciba mensajes de otro que se encuentra ejecutndose en un sitio
distinto.
Acurdese: En un sistema federado los usuarios tienen acceso a la informacin, de los distintos
sistemas, a travs de una interfaz comn.
Tenga en Cuenta: Las propiedades de una base de datos federada son: heterogeneidad,
autonoma y distribucin.
Recuerde: Gracias a esta computacin, los usuarios logran acceder a una base de datos remota en
cualquier momento y en cualquier lugar.
Tener Presente: Una base de datos paralela es una tecnologa innovadora que maneja
ordenadamente todo tipo de recursos, entre ellos equipos de cmputo, almacenamiento y
aplicaciones definidas.

Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 118

7. GLOSARIO
Bases de Datos Activas: Un sistema de bases de datos activas es un sistema de gestin de bases
de datos (SGBD) que contiene un subsistema que permite la definicin y la gestin de reglas de
produccin (reglas activas).
Datos: Conjunto de smbolos que representan una determinada informacin.
Distribucin: Se denomina distribucin al reparto de uno o varios elementos.
Evento: Un evento es una variante de las propiedades para los campos cuyos tipos sean
delegados. Es decir, permiten controlar la forman en que se accede a los campos delegados y dan
la posibilidad de asociar cdigo a ejecutar cada vez que se aada o elimine un mtodo de un
campo delegado.
Objeto: Un programa tradicional se compone de procedimientos y datos, un programa orientado a
objetos se compone solamente de objetos, que es una encapsulacin general de datos y de los
procedimientos para manipularlo.
Orientado a Objetos: Orientacin a Objeto En la programacin tradicional, se distingue entre los
datos y los procedimientos. En la tcnica de programacin orientada a objeto no es as, puesto que
no existen.
Portabilidad: Se define como la caracterstica que posee un software para ejecutarse en diferentes
plataformas, el cdigo fuente del software es capaz de reutilizarse en vez de crearse un nuevo
cdigo cuando el software pasa de una plataforma a otra. A mayor portabilidad menor es la
dependencia del software con respecto a la plataforma.
Red: Una red de computadoras, tambin llamada red de ordenadores o red informtica, es un
conjunto de equipos informticos conectados entre s por medio de dispositivos fsicos que envan
y reciben impulsos elctricos, ondas electromagnticas o cualquier otro medio para el transporte
de datos, con la finalidad de compartir informacin y recursos y ofrecer servicios. Este trmino
tambin engloba aquellos medios tcnicos que permiten compartir la informacin.
Servidor: En informtica, un servidor es una computadora que, formando parte de una red, provee servicios
a otras computadoras denominadas clientes.
XML: El XML es considerado como un metalenguaje de definicin de documentos estructurados mediante
marcas o etiquetas. Se trata de un estndar del W3C cuyo objetivo es crear unas reglas bsicas para permitir
el intercambio de informacin estructurada entre aplicaciones, y en particular, entre aplicaciones web.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 119

8. BIBLIOGRAFA
Sistemas de bases de datos orientadas a objetos: Conceptos y arquitecturas. Editorial: AddisonWesley / Diaz de Santos. Autores: Elisa Bertino, Lorenzo Martino.
Sistemas de bases de datos: Un enfoque prctico para diseo, implementacin y gestin. 4
Edicin. Editorial: Pearson Addison- Wesley. Autores: Thomas M. Connolly, Carolyn E. Begg.
Fundamentos de Bases de datos. 5 Edicin. Editorial: McGraw Hill. Autores: Silberschatz, Korth,
Sudarshan
Bases de Datos Orientadas a Objeto y el estndar ODMG. Autores: Clara Martn Sastre y Enrique
Medarde Caballero.
http://tejo.usal.es/~fgarcia/docencia/poo/02-03/trabajos/S1T3.pdf
http://kybele.escet.urjc.es/documentos/BD/T3-ModeloOR.pdf
http://informatica.uv.es/iiguia/DBD/Practicas/boletin_1.pdf
http://informatica.uv.es/iiguia/DBD/Teoria/capitulo_4.pdf
L.Mota Herranz y M. Celma Gimnez - Mtodos para la comprobacin de la integridad de en bases
de datos deductivas
Gonzlez Alvarado, Carlos. Sistema de Bases de Datos. Editorial Tecnolgica de Costa Rica, Primera
Edicin, 1996.
Elmasri, Ramez. Sistemas de Bases de Datos. Editorial Addison Wesley Iberoamericana S-A.
Segunda Edicin, 1997.
I.C. Silvia Eloisa Carln Salgado y M.Sc. Rosendo Moreno Rodrguez - Valorizacin de las bases de
datos deductivas y de las bases de datos activas
http://gpd.sip.ucm.es/ Rafael Caballero Roldn. Introduccin a las bases de datos deductivas
P. Julin Iranzo. Apuntes de Programacin Declarativa, 2002
http://sistemas.itlp.edu.mx/revistadsyc Marco Antonio Castro Liera - Bases de Datos Relacionales
Difusas
Grosky, William I. Managing Multimedia Information in Database Systems, University of Detroit,
1997
Connolly T., Begg C., Sistemas de b ases de datos - Un enfoque practica para diseo,
implementacin y gestin. Ed PearsonAddison-Wesley.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 120

Rob P., Coronel C., Sistemas de bases de datos - Diseo Implementacion y Administracion. Ed.
Thomson.
Atzeni P.,Stefano C., Database Systems - Concepts, Languages and Architectures. Ed. McGraw
Hill.
Introduccin a la Documtica http://tramullas.com/documatica/indice.html, Jess Tramullas y
Kronos 1997, 2000.
http://es.wikipedia.org/wiki/Common_Gateway_Interface.html
http://es.wikipedia.org/wiki/AJAX
http://es.wikipedia.org/wiki/P%C3%A1gina_web
http://es.wikipedia.org/wiki/Contenido_din%C3%A1mico
http://www.iec.csic.es/criptonomicon/bd/
http://msdn2.microsoft.com/es-es/library/ms178371(VS.80).aspx
Tecnologa y Diseo de Bases de Datos, PIATTINI VELTHUIS, MARIO G / MARCOS MARTINEZ,
ESPERANZA / CALERO MUOZ, CORAL / VELA SNCHEZ, BELN
Sistemas de Bases de Datos. Un enfoque prctico para diseo, implementacin y gestin,
THOMAS M. CONNOLLY/ CAROLYN E. BEGG
Oracle9i
Data
Warehousing
Guide
Release
2
(9.2):
http://www.mpiinf.mpg.de/departments/d5/teaching/ss05/is05/oracle/server.920/a96520/toc.ht
m
http://es.geocities.com/lenguajesde_recuperacion/xquery.htm
http://www.rhernando.net/modules/tutorials/doc/bd/dw.html
http://es.wikipedia.org/wiki/Almac%C3%A9n_de_datos
http://usuarios.lycos.es/jrodr35/
http://html.rincondelvago.com/bases-de-datos-distribuidas_1.html
http://sacbeob.8m.com/tutoriales/bddistribuidas/index.htm
http://www.cs.cinvestav.mx/SC/prof_personal/adiaz/Disdb/Cap_1.html
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

Corporacin Universitaria Remington Direccin Pedaggica


Bases de Datos II Pg. 121

http://es.wikipedia.org/wiki/Grid_computing
http://www.catedravodafone.etsit.upm.es/formacion/seminarios/grid.html
http://seti.astroseti.org/setiathome/que.php
http://ciencia.astroseti.org/planetary/articulo.php?num=320
http://es.wikipedia.org/wiki/Computaci%C3%B3n_distribuida#Grid
http://websearch.internet2.edu/query.html?Search.x=0&Search.y=0&qt=middleware&col=i2sites
&charset=iso-8859-1
http://wiki.dbgrid.org/index.php
http://www.gridpp.ac.uk/papers/DAISStatementSpec.pdf
SilBerschatz, Kort, Sudarshan Fundamentos de Base de Datos (4 y 5 Edicin), Espaa, Mc Graw
Hill, 2002 y 2007.
http://www.ayi-asociados.com/presentaciones/Grid_cast-B&N.pdf
(http://www.fdi.ucm.es/profesor/rubensm/Doctorado/Introduccion%20a%20la%20Seguridad%20
en%20un%20GRID.pdf)
http://www.gae.unican.es/Top/Presentaciones/SC06/SemanadelaCiencia_UNICAN_v1.ppt
http://indico.ifca.es/indico/getFile.py/access?contribId=9&resId=1&materialId=slides&confId=75
http://www.error500.net/garbagecollector/archives/categorias/bases_de_datos/sistema_gestor_
de_base_de_datos_sgbd.php
http://psicosix.iespana.es/bd2/trabajo01.pdf
http://eu-datagrid.web.cern.ch/eu-datagrid/
DATABASES AND THE GRID. Watson, P. University of Newcastle [2001] WHAT IS THE GRID? A
THREE POINT CHECKLIST. Foster, I., University of Chicago [2002]
ORACLE DATABASE 10G: THE DATABASE FOR THE GRID. An Oracle White Paper.Oracle [2003]
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia

S-ar putea să vă placă și