Sunteți pe pagina 1din 7

Metadatos

Debido a la gran diversidad y volumen de las fuentes y recursos en Internet, se


hizo necesario establecer un mecanismo para etiquetar, catalogar, describir y
clasificar los recursos presentes en la World Wide Web con el fin de facilitar la
posterior bsqueda y recuperacin de la informacin. Estos mecanismos los
constituyen los llamados metadatos.
Un metadato no es ms que un dato estructurado sobre la informacin, o sea,
informacin sobre informacin, o de forma ms simple, datos sobre datos. Los
metadatos en el contexto de la Web, son datos que se pueden guardar,
intercambiar y procesar por medio del ordenador y que estn estructurados de
tal forma que permiten ayudar a la identificacin, descripcin clasificacin y
localizacin del contenido de un documento o recurso web y que, por tanto,
tambin sirven para su recuperacin.
El concepto de metadatos -datos sobre datos- se puede entender en un sentido
amplio o en un sentido ms estricto. Por ejemplo, en un sentido amplio, si
entendemos que metadatos es un trmino que se utiliza para describir datos
que ofrecen el tipo y la clase de la informacin, esto es, son datos acerca de
datos, podemos considerar que el catlogo de una biblioteca o un repertorio
bibliogrfico son tipos de metadatos. Estos tipos de metadatos emplean,
fundamentalmente, reglas de catalogacin y formatos para transmitir la
informacin, como los formatos MARC. As considerados, cada ficha
catalogrfica es un conjunto de metadatos de un libro o bien de un autor y los
metadatos proporcionan una informacin bsica sobre las obras de un autor y
lo relacionan con otras obras del mismo autor u otras obras de similar
contenido. De la misma forma, los registros de una base de datos llevada a
cabo para indizar o hacer un resumen documental, podran tambin
considerarse como metadatos.
Sin embargo, si acotamos la definicin de metadatos dndole un sentido ms
estricto, los metadatos slo seran posibles en un contexto digital y en red ya
que slo dentro de este contexto se pueden utilizar los metadatos con la
funcin que les caracteriza, que es la de la localizacin, identificacin y
descripcin de recursos, legibles e interpretables por mquina. La definicin
que dan Berners-Lee y el World Wide Web Consortium (W3C) en Metadata
Architecture es esclarecedora para entender el concepto de metadatos en este
estricto sentido: "Los metadatos son informacin inteligible para el ordenador
sobre recursos Web u otras cosas".

Tipos de metadatos:
Metadatos descriptivos
Descripcin e identificacin de recursos de informacin
En el nivel (sistema) local para permitir la bsqueda y la recuperacin
(por ejemplo, bsqueda de una coleccin de imgenes para encontrar
pinturas con ilustraciones de animales);
En el nivel Web, permite a los usuarios descubrir recursos (por ejemplo,
bsqueda en la Web para encontrar colecciones digitalizadas sobre
poesa)
Elementos de muestra
identificadores nicos (PURL, Handle);
atributos fsicos (medios, condicin de las dimensiones);
atributos bibliogrficos (ttulo, autor/ creador, idioma, palabras clavess).
Implementacin de muestra:

Handle;

PURL (Persistent Uniform Resource Locator - Localizador de Recursos


Uniforme y Continuo)

Dublin Core

MARC

Meta Rtulos HTML (HTML Meta Tags).

vocabularios controlados, como por ejemplo:


Tesauro sobre Arte y Arquitectura;
Categoras para la Descripcin de Obras de Arte.
Metadatos estructurales

Facilitan la navegacin y presentacin de recursos electrnicos


Proporcionan informacin sobre la estructura interna de los recursos,
incluyendo pgina, seccin, captulo, numeracin, ndices, y tabla de
contenidos;
Describen la relacin entre los materiales (por ejemplo, la fotografa B
fue incluida en el manuscrito A);
Unen los archivos y los textos relacionados (por ejemplo, el ArchivoA es
el formato JPEG de la imagen de archivo del ArchivoB)
Elementos de muestra:
Rtulos de estructuracin como por ejemplo pgina de ttulo, tabla de
contenidos, captulos, partes, fe de erratas, ndice, relacin con un sub-objeto
(por ejemplo, fotografa de un peridico).
Implementacin de muestra:
SGML
XML
Encoded Archival Description, EAD (Descripcin de Archivo Codificado)
MOA2, Structural Metadata Elements(Elementos de Metadatos Estructurales)
Unin Electrnica Electronic Binding, Ebind)

Metadatos administrativos
Facilitan la gestin y procesamiento de las colecciones digitales tanto a corto
como a largo plazo
Incluyen datos tcnicos sobre la creacin y el control de calidad;
Incluyen gestin de derechos y requisitos de control de acceso y
utilizacin;
Informacin sobre accin de preservacin.
Elementos de muestra:
Datos tcnicos tales como tipo y modelo de escner, resolucin, profundidad de
bit, espacio de color, formato de archivo, compresin, fuente de luz, propietario,
fecha del registro de derecho de autor, limitaciones en cuanto al copiado y
distribucin, informacin sobre licencia, actividades de preservacin (ciclos de
actualizacin, migracin, etc.).
Implementacin de muestra:
MOA2, Administrative Metadata Elements(Elementos de Metadatos
Administrativos);
National Library of Australia, Preservation Metadata for Digital Collections
(Biblioteca Nacional de Australia, Metadatos de Preservacin para Colecciones
Digitales).

Definicin de Diccionario de Datos


Un diccionario de datos es un conjunto de metadatos que contiene las
caractersticas lgicas de los datos que se van a utilizar en el sistema que se
programa, incluyendo nombre, descripcin, alias, contenido y organizacin.
Estos diccionarios se desarrollan durante el anlisis de flujo de datos y ayuda a
los analistas que participan en la determinacin de los requerimientos del
sistema, su contenido tambin se emplea durante el diseo del proyecto.
Identifica los procesos donde se emplean los datos y los sitios donde se
necesita el acceso inmediato a la informacin, se desarrolla durante el anlisis
de flujo de datos y auxilia a los analistas que participan en la determinacin de
los requerimientos del sistema, su contenido tambin se emplea durante el
diseo. En un diccionario de datos se encuentra la lista de todos los elementos
que forman parte del flujo de datos de todo el sistema. Los elementos ms
importantes son flujos de datos, almacenes de datos y procesos. El diccionario
de datos guarda los detalles y descripcin de todos estos elementos.
Contiene las caractersticas lgicas de los sitios donde se almacenan los datos del
sistema, incluyendo nombre, descripcin, alias, contenido y organizacin. Identifica los
procesos donde se emplean los datos y los sitios donde se necesita el acceso
inmediato a la informacin, se desarrolla durante el anlisis de flujo de datos y auxilia a
los analistas que participan en la determinacin de los requerimientos del sistema, su
contenido tambin se emplea durante el diseo.

Razones para su utilizacin:


1. Los sistemas al sufrir cambios continuos, es muy difcil manejar todos los detalles.
Por eso se registra la informacin, ya sea sobre hoja de papel o usando
procesadores de texto. Los analistas ms organizados usan el diccionario de datos
automatizados diseados especficamente para el anlisis y diseo de software.

2. Para manejar los detalles en sistemas muy grandes, ya que tienen enormes
cantidades de datos, aun en los sistemas ms chicos hay gran cantidad de
datos.
Los diccionarios de datos proporcionan asistencia para asegurar significados
comunes para los elementos y actividades del sistema y registrando detalles
adicionales relacionados con el flujo de datos en el sistema, de tal manera que
todo pueda localizarse con rapidez.

3. Para asignarle un solo significado a cada uno de los elementos y actividades


del sistema.
4. Para documentar las caractersticas del sistema, incluyendo partes o
componentes as como los aspectos que los distinguen. Tambin es
necesario saber bajo qu circunstancias se lleva a cabo cada proceso y con
qu frecuencia ocurren. Produciendo una comprensin ms completa. Una
vez que las caractersticas estn articuladas y registradas, todos los
participantes en el proyecto tendrn una fuente comn de informacin con
respecto al sistema.
5. Para facilitar el anlisis de los detalles con la finalidad de evaluar las
caractersticas y determinar donde efectuar cambios en el sistema.

HERRAMIENTAS QUE HACEN USO DEL


DICCIONARIO DE DATOS
NetDynamics
PowerBuilder
Progress
Visual Basic
Base de datos compatible
CA-Clipper, CA-Openingres
DB2 for MVS, DB2 for OS/360
DB2 UDB, DBASE
FoxPro, HIRDB
Informix, Interbase
Microsoft Access, Microsft SQL server
Oracle, Paradox
SAS, SQL Anywhere
SQLBase, Sybase
Teradata
Sistemas operativos compatibles
Windows NT
Windows 95
Windows 98
Erwin
Entre otros

QUE APLICACIONES HACEN USO DEL


DICCIONARIO DE DATOS
Muchas aplicaciones de BD implementan como regla de negocio los
diccionarios de datos
Los diccionarios de datos crean una capa entre la lgica de aplicacin y los
datos

Estndares

ISO/IEC 10027:1990
Esta Norma Internacional describe el marco de una serie de normas internacionales
que especifican un sistema de informacin especializada, llamado un diccionario de
recursos del sistema de informacin (IRDS). Un IRDS se utiliza para controlar y
documentar los recursos de informacin de una empresa.
Esta Norma Internacional define los niveles de datos correspondientes a un IRDS. En
l se definen las interfaces IRDS que son prescritos por otras Normas Internacionales
en la familia de normas IRDS. Tambin define los tipos de contenido de los datos que
son prescritos por otras normas internacionales en el mbito familiar.
Las siguientes normas internacionales contienen disposiciones que, mediante su
referencia en este texto, constituyen disposiciones de esta norma internacional. En el
momento de la publicacin, las ediciones indicadas eran vlidas. Todas las Normas
Internacionales son objeto de revisiones, y los participantes, mediante acuerdos
basados en esta norma, deben investigar la posibilidad de aplicar las ediciones ms
recientes de las Normas Internacionales se enumeran a continuacin. Los miembros
de IEC e ISO mantienen registros de las normas internacionales en vigor.

ISO 19115:2003/2009/2014
Define el esquema requerido para la descripcin de la informacin y servicios
geogrficos mediante metadatos. Proporciona informacin acerca de la identificacin,
la medida, la calidad, los aspectos espaciales y temporales, el contenido, la referencia
espacial, la representacin, la distribucin y otras propiedades de los datos
geogrficos y servicios digitales.

ISO 19109:2005
Define las reglas para crear y documentar esquemas de aplicacin, incluyendo los
principiospara la definicin de funciones. Su mbito de aplicacin incluye lo siguiente:
Modelado conceptual de caractersticas y sus propiedades de un universo de discurso;
Definicin de esquemas de aplicacin.

Uso de la lengua esquema conceptual para esquemas de aplicacin.


Transicin de los conceptos en el modelo conceptual de los tipos de datos en el
esquema
de aplicacin.
Integracin de esquemas normalizados de otras normas ISO de informacin
geogrfica
con
el esquema de aplicacin.
Los siguientes son fuera del mbito de aplicacin:
Eleccin de un lenguaje de esquema conceptual particular para los esquemas de
aplicacin.
Definicin de cualquier esquema de aplicacin en particular.
Representacin de los tipos de entidades y sus propiedades en un catlogo de
fenmenos.
Representacin de metadatos.
Reglas para la asignacin de uno a otro esquema de aplicacin.
Implementacin del esquema de aplicacin en un entorno informtico.
Sistema informtico y diseo de software de aplicacin.
Programacin.
ISO 19110: 2005
define la metodologa para la catalogacin de tipos de entidad y especifica cmo la
clasificacin de los tipos de entidad est organizada en un catlogo de objetos y
presentada a los usuarios de un conjunto de datos geogrficos. ISO 19110: 2005 es
aplicable a la creacin de catlogos de tipos de fenmeno de dominios previamente no
catalogados y para la revisin de catlogos de fenmenos existentes para cumplir con
las prcticas habituales. ISO 19110: 2005 se aplica a la catalogacin de los tipos de
entidades que estn representados en forma digital. Sus principios se pueden
extender a la catalogacin de otras formas de datos geogrficos.
ISO
19110:
2005
Es aplicable a la definicin de las caractersticas geogrficas en el nivel de tipo. ISO
19110: 2005 no es aplicable a la representacin de instancias individuales de cada tipo
y excluye, y esquemas de representacin grfica espacio-temporales como se
especifica en la norma ISO 19107, ISO 19108 y ISO 19117 el futuro,
respectivamente.Tambin excluye criterios de recopilacin de instancias de entidad.
ISO
19910:
2005
Puede ser usado como una base para definir el universo de discurso que se modela
en una aplicacin particular, o para estandarizar aspectos generales de mundo real las
caractersticas que se modela en ms de una aplicacin.
ISO 19108: 2002
Define conceptos para describir las caractersticas temporales de la informacin
geogrfica. Depende de las normas de tecnologa de la informacin existentes para el
intercambio de informacin temporal. Proporciona una base para la definicin de
atributos de entidades temporales, las operaciones de funcin, y asociaciones de
objetos, y para definir los aspectos temporales de los metadatos de la informacin
geogrfica. Desde esta norma se refiere a las caractersticas temporales de la
informacin geogrfica, ya que se abstraen del mundo real, se hace hincapi en
tiempo vlido en lugar de tiempo de la transaccin.
ISO 19107: 2003

Especifica los esquemas conceptuales para describir las caractersticas espaciales de


las caractersticas geogrficas, y un conjunto de operaciones espaciales en
consonancia con estos esquemas. Se trata la geometra de vectores y la topologa
hasta tres dimensiones. En l se definen las operaciones espaciales estndar para su
uso en el acceso, consulta, gestin, tratamiento e intercambio de datos de informacin
geogrfica para objetos espaciales (geomtricas y topolgicas) de hasta tres
dimensiones topolgicas incrustados en espacios de coordenadas de hasta tres ejes.
ISO
19103:
2015
Proporciona normas y directrices para el uso de un lenguaje de esquema conceptual
dentro del contexto de la informacin geogrfica. El lenguaje de esquema conceptual
elegido es el Unified Modeling Language (UML).
ISO
19103.2015
Proporciona un perfil de la Lengua Modelado Unificado (UML).
El tipo de objetivo la normalizacin de este estndar es de esquemas UML que
describen la informacin geogrfica.

ISO 12620: 2009


Proporciona directrices relativas a las restricciones relacionadas con la aplicacin de
una categora de datos del Registro (DCR) aplicable a todos los tipos de recursos
lingsticos, por ejemplo, terminolgica, lexicogrfico, basada en corpus, traduccin
automtica, etc. En l se especifica mecanismos para crear, la seleccin y el
mantenimiento de categoras de datos, as como un formato de intercambio para la
representacin de ellos.

S-ar putea să vă placă și