Sunteți pe pagina 1din 10

Lenguajes de marcas y Sistemas de Gestin de Informacin

Almacenamiento de la informacin

Tema 06 Unidad 01

Almacenamiento de la informacin

Lenguajes de marcas y Sistemas de Gestin de Informacin

Almacenamiento de la informacin

Tema 06 Unidad 01

Contenido 1 2 3 4 5 6 7 8 Almacenamiento de XML ...................................................................................................... 2 Tipos de Bases de datos XML ................................................................................................ 2 Bases de datos XML nativas .................................................................................................. 3 Bases de datos XML habilitadas ............................................................................................ 6 Comparativa de tipos de BD .................................................................................................. 8 Nativa o habilitada? ............................................................................................................. 8 Eleccin de software ............................................................................................................. 9 Fuentes .................................................................................................................................. 9

I.E.S. Pablo Serrano-ASIR1D/DAM1D-B.Soler

Lenguajes de marcas y Sistemas de Gestin de Informacin

Almacenamiento de la informacin

Tema 06 Unidad 01

Almacenamiento de XML

XML se ha consolidado como uno de los principales lenguajes para el intercambio de informacin. El hecho que XML se centra en el contenido, abstrayendo el formato de la presentacin en hojas de estilo independientes, permite una extensa reutilizacin del material. Para las empresas que deben trabajar con datos que provienen de sistemas incompatibles, XML puede servir como una tecnologa comn para el transporte de los datos en torno a un formato neutral. Adems, XML puede manejar toda clases de datos, incluyendo texto, imgenes y sonido, aparte de ser extensible lo que le permite manejar cualquier caso especial de modelado de estructuras complejas. El problema consiste en cmo almacenar la informacin etiquetada con XML: Una opcin es dejar los datos XML en ficheros guardados directamente en el sistema de archivos del sistema operativo. Si se trata de una pequea cantidad de datos guardados en pocos ficheros esta opcin funcionar, pero no es recomendable para una aplicacin con un volumen elevado de informacin. Otra solucin ms eficaz, al igual que para otros formatos, es utilizar bases de datos para almacenar, recuperar y manipular XML. La idea es poner los datos de XML en un rea de trabajo donde la bsqueda, el anlisis, la actualizacin y la salida pueden realizarse en un ambiente ms manejable, ms sistemtico y conocido.

Tipos de Bases de datos XML

No hay un nico modelo de bases de datos. Se puede hacer una clasificacin general segn como se almacenan los datos: XML Enabled Databases (Bases de datos habilitadas para XML): son aquellas que desglosan la informacin de un documento XML en su correspondiente esquema relacional o de objetos; es decir, el XML no se almacena internamente como XML. Son extensiones en las bases de datos convencionales para poder tratar el formato de datos XML. XML Native Databases (Bases de datos nativas de XML): son aquellas que respetan la estructura del documento, se pueden hacer consultas sobre dicha estructura y es posible recuperar el documento tal como fue insertado originalmente. El XML se almacena internamente como XML.

I.E.S. Pablo Serrano-ASIR1D/DAM1D-B.Soler

Lenguajes de marcas y Sistemas de Gestin de Informacin

Almacenamiento de la informacin

Tema 06 Unidad 01

Bases de datos XML nativas

XML no es un lenguaje que haya sido diseado para el almacenamiento de datos, pero sus ventajas para el intercambio de informacin han hecho que cada vez sea ms ampliamente utilizado como lenguaje para la descripcin de datos. Al igual que SQL (en bases de datos relacionales) proporciona una sintaxis para describir la estructura de los datos en base al modelo relacional, el lenguaje de definicin de datos XML puede tener un modelo de datos subyacente y una sintaxis para describirlo. El modelo subyacente al que se tiene que ajustar un documento XML, viene determinado o por una DTD o por un XML Schema. Por tanto, surge un nuevo tipo de bases de datos que no est pensado para sustituir los sistemas de base de datos existentes. Son simplemente otro recurso ms en la caja herramienta de los desarrolladores de XML y se llaman bases de datos XML nativas (en algunos textos se refieren a ellas como NXD de Native XML Database). Son bases de datos, y como tales soportan transacciones, acceso multi-usuario, lenguajes de consulta, etc., y estn diseadas especialmente para almacenar documentos XML. En una BD XML nativa el aspecto principal de los productos es el almacenamiento de los documentos XML. El trmino nativa se utiliza por los vendedores de los productos comerciales especializados en soluciones de BD XML como una estrategia de marketing para diferenciar sus soluciones de las extensiones para XML ofrecidas por los vendedores de SGBD convencionales (BDR, BDOO, ) Se podra definir una NXD como un sistema de gestin de informacin que cumple con lo siguiente: Emplea como unidad lgica fundamental de almacenamiento el documento XML o Define un modelo (lgico) para un documento XML (para el documento, no para los datos) o Almacena y recupera documentos de acuerdo a ese modelo Preserva el orden del documento, las instrucciones de procesamiento, los comentarios, las secciones CDATA y las entidades o Como mnimo, el modelo debe incluir elementos, atributos, manejo de PCDATA y orden dentro del documento No se requiere un modelo subyacente de almacenamiento o Puede ser una BD relacional, orientada a objetos o jerrquica; o un formato de almacenamiento propietario Soporta lenguajes de consulta XML (el ms popular es XQuery)

I.E.S. Pablo Serrano-ASIR1D/DAM1D-B.Soler

Lenguajes de marcas y Sistemas de Gestin de Informacin

Almacenamiento de la informacin

Tema 06 Unidad 01

Almacena los documentos en colecciones o Las colecciones juegan en las bases de datos nativas el papel de las tablas en las DB relacionales o Los documentos se suelen agrupar, en funcin de la informacin que contienen, en colecciones que a su vez pueden contener otras colecciones. Permite validacin de los documentos Admite indexacin o Se ha de permitir la creacin de ndices que aceleren las consultas realizadas frecuentemente Crea identificadores nicos o A cada documento XML se le asocia un identificador nico por el que ser reconocido dentro del repositorio Soporta actualizaciones y borrados o Las BD nativas tienen una gran variedad de estrategias para actualizar y borrar documentos. Muchos sistemas soportan el XUpdate para llevar a cabo esta funcionalidad

Modelo lgico: un documento de XML que, como mnimo, debe incluir elementos, atributos, PCDATA, y el orden del documento. Se almacena y recupera documentos segn ese modelo.

I.E.S. Pablo Serrano-ASIR1D/DAM1D-B.Soler

Lenguajes de marcas y Sistemas de Gestin de Informacin

Almacenamiento de la informacin

Tema 06 Unidad 01

Unidad fundamental de almacenamiento lgico: un documento de XML (tal como una BD relacional tiene una fila en una tabla como su unidad fundamental del almacenamiento lgico).

Modelo de almacenamiento fsico: No se requiere tener ninguno en particular. Por ejemplo, el documento puede ser creado en una base de datos relacional, jerrquica, u orientada a objetos, o utilizar un formato de almacenamiento propietario tal como archivos indexados y comprimidos.

I.E.S. Pablo Serrano-ASIR1D/DAM1D-B.Soler

Lenguajes de marcas y Sistemas de Gestin de Informacin

Almacenamiento de la informacin

Tema 06 Unidad 01

Entre las ventajas de las NXD, se puede destacar: Ofrecen un acceso y almacenamiento de informacin ya en formato XML, sin necesidad de incorporar cdigo adicional. La mayora incorpora un motor de bsqueda de alto rendimiento. Es muy sencillo aadir nuevos documentos XML al repositorio. Se pueden almacenar datos heterogneos.

Por el contrario, se pueden considerar como desventajas de las BDX las que se muestran a continuacin: El problema de espacio al usar XML como formato de representacin de informacin (la adicin de las etiquetas puede incrementar considerablemente el tamao de los datos) Slo pueden guardar y devolver datos en formato XML. Puede resultar difcil indexar documentos para realizar bsquedas. Se suele almacenar la informacin en XML como un documento o como un conjunto de nodos, por lo que su sntesis para formar nuevas estructuras sobre la marcha puede resultar complicada y lenta.

Bases de datos XML habilitadas

Hay una buena cantidad de razones por las cuales utilizar los distintos tipos de bases de datos convencionales para almacenar XML aunque no est en su forma nativa. La principal es que las bases de datos relacionales y las bases de datos orientadas a objeto son muy conocidas, mientras que las bases de datos nativas de XML son nuevas. Como resultado de familiaridad con las bases de datos relacionales y las orientadas a objeto, los usuarios entienden su comportamiento, especialmente con respecto a funcionamiento. Todava hay cierta negativa a moverse a una base de datos nativa de XML, ya que las empresas no desean arriesgarse a migrar hacia una base de datos XML nativa, si es que no tienen la necesidad de hacerlo. Hay algunas crticas respecto al uso de las bases de datos relacionales y las bases de datos orientadas a objeto para almacenar XML: Prdida de estructura: Una de las caractersticas atractivas de XML es su organizacin jerrquica. Las bases de datos relacionales deben asociar (mapear) el XML a las tablas relacionadas y por lo tanto aplanar las estructuras jerrquicas de XML en filas y columnas para poder manejar los datos. Si la jerarqua de los datos XML es compleja, su conversin a un conjunto de tablas produce una gran cantidad de estas o de columnas dentro de cada tabla con valor nulo. Velocidad de acceso: Adems, traducir XML a y desde la base de datos enabled requiere un proceso considerable, especialmente para los documentos grandes o

I.E.S. Pablo Serrano-ASIR1D/DAM1D-B.Soler

Lenguajes de marcas y Sistemas de Gestin de Informacin

Almacenamiento de la informacin

Tema 06 Unidad 01

complejos. Este factor de rendimiento puede ser el ms fastidioso al producir las pginas web ya que pueden ser demasiado lentas para cargarse. Utilizacin directa de la familia de tecnologas XML: En muchos casos, no es posible explotar directamente y al completo algunas tecnologa relacionada con XML como, por ejemplo, las consultas XPath, XSLT, XQL, XQuery, etc.

I.E.S. Pablo Serrano-ASIR1D/DAM1D-B.Soler

Lenguajes de marcas y Sistemas de Gestin de Informacin

Almacenamiento de la informacin

Tema 06 Unidad 01

Comparativa de tipos de BD

A continuacin se muestra una tabla donde se comparan las bases de datos relacionales, las orientadas a objetos y los datos XML:
BD relacionales Modelo (estructura de los datos) Datos Lenguaje de definicin Lenguaje de manipulacin Lenguaje de consulta Relacional BD orientadas a objetos Orientado a objetos BD XML DTD / XSchema / Relax NG

Tuplas SQL SQL SQL

Objetos C++, Java, etc. OQL

Documentos XML XML XQuery, XPath,

Nativa o habilitada?

Los documentos XML pertenecen a dos categoras: "basados en datos" y "basados en documentos". Documentos XML Uso y descripcin Basados en datos Para el transporte de datos Con estructura regular y bien definida. Datos muy estructurados o semiestructurados. Dirigidos a utilizacin automtica (por mquinas). Basados en documentos Para representar documentos. Con grandes cantidades de texto. Con estructuras impredecibles en tamao y contenido. Datos poco estructurados. Orientados a ser interpretadas por humanos. Enfocados a sistemas documentales y de gestin de contenidos. Manual de usuario Folletos de marketing Enciclopedias (tipo wikipedia) Bases de datos XML nativas Sistema de Administracin de Contenidos

Ejemplos

Cmo grabar y recuperar datos?

rdenes de compra Registros de pacientes Datos cientficos (La mayora de nuestros ejercicios) Bases de datos XML enabled (relacionales u orientadas a objetos) Bases de datos XML nativas

I.E.S. Pablo Serrano-ASIR1D/DAM1D-B.Soler

Lenguajes de marcas y Sistemas de Gestin de Informacin

Almacenamiento de la informacin

Tema 06 Unidad 01

Eleccin de software

Tal y como dice la W3C: Hay ms de 40 diferentes paquetes de software que soportan XML Query de alguna manera. Lo que hay que buscar son la disponibilidad de apoyo, plataformas, precio, rendimiento, todos los temas usuales, pero tambin hay que preguntarse si el software es compatible con la sintaxis de la Recomendacin final de W3C o implementa un proyecto anterior. Otra de las caractersticas especficas de XML Query es el soporte para archivos XML, para traer los documentos a travs de HTTP y para la conexin a relacionales (u otros) las fuentes de datos, es decir, si el paquete a la altura de la promesa de XML Query de acceso a la unificacin de muchas formas diferentes de de la informacin. Aqu hay una lista de las implementaciones que recoge la W3C y otra de Ronald Bourret (guru de las bases de datos XML).

Fuentes
http://www.rpbourret.com/xml/XMLAndDatabases.htm http://www.fce.unam.edu.ar/revistacientifica/index.php?option=com_content&task= view&id=1&Itemid=3 http://www.monografias.com/trabajos7/xml/xml.shtml http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/08-09/FUNCIONALIDAD%204.pdf http://ict.udlap.mx/people/carlos/is341/bases12.html

I.E.S. Pablo Serrano-ASIR1D/DAM1D-B.Soler

S-ar putea să vă placă și