Sunteți pe pagina 1din 315

E.T.S.

DE INGENIER INFORMATICA IA

UNIVERSIDAD DE GRANADA

Departamento de Ciencias de la Computacin o e Inteligencia Articial

TESIS DOCTORAL Sistema de Gestin de Bases de Datos Relacionales Difusas o Multipropsito. Una Ontolog para la Representacin del o a o Conocimiento Difuso

Carmen Mart nez Cruz

Granada, noviembre de 2008

Editor: Editorial de la Universidad de Granada Autor: Carmen Martnez Cruz D.L.: GR. 2741-2008 ISBN: 978-84-691-8242-0

Sistema de Gestin de Bases de Datos Relacionales o Difusas Multipropsito. Una Ontolog para la o a Representacin del Conocimiento Difuso o
memoria para optar al grado de Doctor en Informtica a

EL DOCTORANDO
Carmen Mart nez Cruz

DIRECTORES
Ignacio J. Blanco Medina Mar Amparo Vila Miranda a

Granada, 17 de Noviembre de 2008


DEPARTAMENTO DE CIENCIAS DE LA COMPUTACION E INTELIGENCIA ARTIFICIAL E.T.S. de INGENIER INFORMATICA IA UNIVERSIDAD DE GRANADA

Agradecimientos
En primer lugar me gustar agradecer a Ma Amparo Vila por la apuesta a que hizo al traerme de la Universidad de Almer para comenzar este periplo a granadino. Gracias a ella y a sus brillantes ideas este trabajo se ha podido llevar adelante y muchos ms continuarn esta l a a nea de investigacin abierta. o Es una excelente directora y soy muy afortunada por haberla tenido. A Nacho fundamentalmente le tengo que agradecer el haber encontrado adems de un director de tesis, un gran amigo. Gracias a l, me plantee venir a e a Granada y nunca me sent sola. Has sido generoso en todo, gracias. A mis padres y mi hermana Eva que siempre me han apoyado y han sufrido conmigo estos largos aos que ha durado la elaboracin de este trabajo. n o Aqu por n est el resultado de mi esfuerzo, gracias por el vuestro que ha a sido mucho mayor que el m o. A mis adorados Ral y Miguel, vosotros me habis apoyado desde el mou e mento cero en que llegue a Granada, porque siempre habis estado ah con una e palabra de aliento o un buen consejo, no lo olvidar. Y a Yolanda, Cristina y e Amador, que por extensin tanto me han aguantado y con ms mrito porque o a e no conocen cmo es esto. o A mis amigos del alma, Beln, Carlos Molina y Jess Alcal, me habis e u a e dado la inercia para trabajar, la sabidur para adaptarme y la energ para a a continuar. Vosotros sabis mejor que nadie lo que me ha costado todo. Mil e gracias por vuestro nimo y apoyo. Viva Mecenas! a A mis amigos de la Universidad de Jan: Antonio Rueda, Carlos Porcel y e Francisco de As por haber aguantado conversaciones monotemticas eternas s, a acerca de mi tesis, por aconsejarme, ayudarme y animarme en este ultimo ao n que tanta falta me ha hecho. Tengo mucha suerte de teneros entre mis las. A Josema, por toda la ayuda que me ha proporcionado. Este trabajo slo o contiene una m nima parte de tu enorme talento. Adems, quiero agradecer al a resto de compaeros del Dpto. de Informtica de la Universidad de Jan, por n a e apoyarme y hacerme la vida ms fcil, en especial a Samu. a a A Mar Jos, Olga, Juanmi, Juan Carlos, Nico, Fernando, Miguel, Carmen a e y Jess Campaa, compaeros del grupo de investigacin IDBIS que siempre u n n o han sido amables y serviciales conmigo, hacindole sentir parte del grupo dese de el primer d Sois un gran ejemplo a seguir y me habis permitido conocer a. e que signica ser un buen investigador. Y a Dani especialmente, por la tranquilidad que me ha transmitido en estos ultimos tiempos, has sido un gran

descubrimiento. Gracias. Tambin agradezco al Dpto. de C.C.I.A. de la Universidad de Granada, e por el marco inmejorable que me ha proporcionado para empezar mi trabajo investigador. No quiero dejar de mencionar a mis ex-compaeros de la Universidad de n Almer ellos -Samuel, Alfonso, Joaqu Jorge y Paco- me motivaron para a, n, comenzar este camino y no lo he olvidado. Finalmente, a mi querida prima May y a mis amigas de fuera de este ambiente universitario que son las que me hacen desconectar de este mundo de ceros y unos, recobrar la cordura y pasar muy buenos ratos: Mar Jess, a u Rosa y Pilar, gracias por estar ah . Tendr que agradecer a algunas personas ms que han pasado por mi vida a a colaborando de alguna forma a que yo realizara este trabajo. Aunque no os mencione aqu os llevo en el corazn. , o

Slo cerrando las puertas detrs de uno o a se abren ventanas hacia el porvenir Franoise Sagan. c

A mi familia.

Indice general
1. Introduccin o 2. Ontolog y Bases de Datos Difusas as 2.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . o 2.2. La Web Semntica . . . . . . . . . . . . . . . . . . . . . a 2.2.1. Bases de Datos en la Web Semntica . . . . . . . a 2.2.2. Hacia donde va la Web . . . . . . . . . . . . . . . 2.3. Ontolog versus Bases de Datos . . . . . . . . . . . . . as 2.3.1. Comunicacin entre Bases de Datos y Ontolog o as 2.3.2. Ontolog como Representacin de Modelos de Bases as o de Datos . . . . . . . . . . . . . . . . . . . . . . . 2.3.3. Integracin de Informacin . . . . . . . . . . . . . o o 2.4. Ontolog Previas . . . . . . . . . . . . . . . . . . . . . as 2.4.1. Ontolog de Tipos de Datos . . . . . . . . . . . . a 2.4.2. Ontolog de Descripcin del SQL2003 . . . . . . a o 3. El problema de la Representacin de Datos Heterogneos o e en Bases de Datos Difusas. Arquitectura de un SGBDR Multipropsito o 3.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . o 3.2. Representacin de Informacin Imprecisa en el Modelo o o Relacional . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.1. Antecedentes del Modelo Relacional Difuso . . . . 3.3. Extensiones al Modelo Relacional para Representar Informacin Imprecisa . . . . . . . . . . . . . . . . . . . . . . o 3.3.1. Modelo Generalizado para Bases de Datos Relacionales Difusas (GEFRED) . . . . . . . . . . . . 3.3.2. Representacin de Informacin Lgica sobre BDD o o o 3.3.3. Ampliacin de GEFRED para la Miner de Datos o a
i

1 9 9 10 11 15 16 20 23 27 29 29 31

33 33 34 34 35 36 39 41

3.4. Unicacin de las Arquitecturas . . . . . . . . . . . . . . o 3.4.1. Visin General del Problema de Unicacin . . . o o 3.4.2. Sistema Actual . . . . . . . . . . . . . . . . . . . 3.4.3. Arquitectura de un Servidor Multipropsito Unio cado . . . . . . . . . . . . . . . . . . . . . . . . . 3.4.4. Ejemplo de Resolucin de una Consulta Compleja o 3.4.5. Ventajas e Inconvenientes del Servidor Unicado .

45 45 46 47 54 61

4. Ontolog para la Representacin del Conocimiento Dia o fuso (FKRO) 69 4.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . o 69 4.2. Ontolog para la Representacin del Conocimiento Difuso 72 a o 4.2.1. descripcin . . . . . . . . . . . . . . . . . . . . . o 72 4.2.2. Ejemplo . . . . . . . . . . . . . . . . . . . . . . . 73 4.3. Sub-Ontolog para la Representacin del Catlogo Extena o a dido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 4.3.1. Justicacin de la Sub-Ontolog . . . . . . . . . o a 74 4.3.2. Metodolog de Desarrollo . . . . . . . . . . . . . a 76 4.3.3. descripcin de la Ontolog del Catlogo Extendido 87 o a a 4.3.4. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . 102 4.4. Sub-Ontolog del Esquema de Datos Difusos . . . . . . 116 a 4.4.1. Justicacin de la Sub-Ontolog . . . . . . . . . 116 o a 4.4.2. Generacin o Conversiones . . . . . . . . . . . . . 118 o 4.4.3. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . 121 4.5. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . 127 4.5.1. Ventajas e Inconvenientes . . . . . . . . . . . . . 127 5. Arquitectura del Sistema y Aplicaciones 131 5.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . 131 o 5.2. Arquitectura del Sistema . . . . . . . . . . . . . . . . . . 132 5.2.1. Arquitectura de Comunicacin con la Ontolog . 132 o a 5.2.2. Arquitectura de Comunicacin con la BD . . . . . 137 o 5.2.3. Arquitectura de Consulta . . . . . . . . . . . . . 143 5.3. descripcin del Sistema Implementado . . . . . . . . . . 144 o 5.3.1. Propuestas . . . . . . . . . . . . . . . . . . . . . . 144 5.3.2. Bases de Datos Utilizadas . . . . . . . . . . . . . 145 5.3.3. Entorno Web . . . . . . . . . . . . . . . . . . . . 146 5.3.4. Extensin de la Herramienta de Desarrollo de Ono tolog Protg . . . . . . . . . . . . . . . . . . 153 as: e e 5.4. Casos de Uso de la Arquitectura . . . . . . . . . . . . . . 162
ii

5.4.1. Denicin de Datos. Creacin de Esquemas . . . o o 5.4.2. manipulacin de Datos . . . . . . . . . . . . . . . o

163 171

6. Conclusiones y Trabajos Futuros 177 6.1. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . 177 6.2. Benecios de la Propuesta . . . . . . . . . . . . . . . . . 182 6.3. Trabajos Futuros . . . . . . . . . . . . . . . . . . . . . . 184 A. Conceptos Bsicos de Ontolog a as A.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . o A.1.1. Concepto de Ontolog . . . . . . . . . . . . . a A.1.2. Clasicaciones de Ontolog . . . . . . . . . . as A.2. Ingenier de Ontolog a as . . . . . . . . . . . . . . . . A.2.1. Tcnicas de Representacin de Ontolog e o as . . A.2.2. Metodolog de Representacin . . . . . . . . as o A.2.3. Formalismos y Lenguajes en la Representacin o Conocimiento . . . . . . . . . . . . . . . . . . A.2.4. Tcnicas de Manipulacin de Ontolog e o as . . . . . . . . . . . . . . . del . . . . 189 189 189 191 197 197 199 203 216

B. Extensiones Difusas al Modelo Relacional de BD 221 B.1. Modelo Generalizado para Bases de Datos Relacionales Difusas (GEFRED) . . . . . . . . . . . . . . . . . . . . . 221 B.1.1. Fundamentos Tericos de GEFRED . . . . . . . . 221 o B.1.2. Representacin Relacional de un Dominio Generao lizado Difuso: FIRST . . . . . . . . . . . . . . . . 224 B.1.3. Base de Metaconocimiento Difuso (FMB) . . . . . 230 B.1.4. Lenguaje SQL Difuso (FSQL): consulta imprecisa 231 B.2. Extensin Lgica-Deductiva al Modelo de BDRD . . . . 233 o o B.2.1. Fundamentos Tericos para la Representacin del o o Modelo Lgico y Lgico Difuso para Bases de Datos o o Relacionales . . . . . . . . . . . . . . . . . . . . . 233 B.2.2. La Representacin Relacional de las Reglas Geneo ralizadas Difusas: FREDDI Extendido . . . . . . 235 B.2.3. Base de Metaconocimiento Deductivo: Base de Reglas (RB) . . . . . . . . . . . . . . . . . . . . . . 236 B.2.4. Sintaxis Extendida Deductiva de FSQL . . . . . . 238 B.3. Miner de Datos en el Modelo Relacional . . . . . . . . 239 a B.3.1. Ampliacin Terica de GEFRED para el Manejo o o de Mltiples Tipos de Datos (GEFRED*) . . . . 239 u
iii

B.3.2. Representacin de Mltiples Tipos de Datos en el o u Modelo Relacional(FIRST*) . . . . . . . . . . . . B.3.3. Base de Metaconocimiento Difuso*(FMB*) . . . . B.3.4. Ampliacin de FIRST* para el Data Mining . . . o B.3.5. Base de Metaconocimiento Difuso para Miner de a Datos (DMFMB) . . . . . . . . . . . . . . . . . . B.3.6. Sintaxis Extendida para Operaciones de DM: DMFSQL . . . . . . . . . . . . . . . . . . . . . . . . . C. Base de Datos de Suelos C.1. Descripcin del Esquema de la Base de Datos o C.1.1. Descripcin de Clases . . . . . . . . . . o C.1.2. Paso a Tablas: Modelo Relacional . . . C.1.3. Etiquetas Ling usticas para los TD2 . . C.1.4. Relaciones de Similitud de los TD3 . . C.2. Cuerpo de la Base de Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

241 242 245 246 248 251 251 251 253 255 260 270

iv

Indice de guras
1.1. Relacin de la Ontolog con el Entorno . . . . . . . o a 1.2. Interaccin entre el Usuario y el SGBD . . . . . . . . o 1.3. Interaccin entre el Usuario y el SGBD para realizar o operaciones proporcionadas por la ontolog . . . . . a . . . . las . . 4 5 6 12 14 25 30 32 47 49 51 53 56 60 71 74 78

2.1. La Web Semntica, usuarios, y acceso a la informacin . a o 2.2. Comparacin de documentos obtenidos de la web normal o y de la web semntica . . . . . . . . . . . . . . . . . . . a 2.3. Ejemplo de relacin entre las Metaclases y las Instancias o en la representacin mediante ontolog de un esquema o as de BD . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4. Clasicacin de los tipos de datos expresados en SQL4 o dada por Pardede [Par05] . . . . . . . . . . . . . . . . . 2.5. Parte de la Ontolog en UML dada por Calero et al. a [Cal06] del SQL4 . . . . . . . . . . . . . . . . . . . . . . 3.1. Arquitectura de los Servidores Independientes . . . . . . 3.2. Base de Metaconocimiento (MB) . . . . . . . . . . . . . 3.3. Base de Metaconocimiento (MB) con las tablas del catloa go de Oracle c . . . . . . . . . . . . . . . . . . . . . . . 3.4. Servidor Multipropsito . . . . . . . . . . . . . . . . . . o 3.5. Resumen de las acciones ocurridas en la MB en una consulta compleja. Ejemplo DFD1 . . . . . . . . . . . . . . . 3.6. Resumen de las acciones ocurridas en la MB en una consulta compleja. Ejemplo DFD2 . . . . . . . . . . . . . . . 4.1. Relacin de la Ontolog con el Servidor Multipropsito o a o Unicado . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2. Ejemplos de v nculos entre las sub-ontolog del Esquema as y Catlogo para cuatro BDD . . . . . . . . . . . . . . . . a 4.3. Proceso de Desarrollo de la Ontolog del Esquema . . . a
v

4.4. Ontolog en UML del SQL4 de Calero et al. [Cal06] recora tada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.5. Extensin de la ontolog de Pardede et al. [Par05] con los o a datos difusos . . . . . . . . . . . . . . . . . . . . . . . . . 4.6. Clasicacin de Pardede et al. [Par05] recortada . . . . . o 4.7. Clasicacin de Pardede et al. [Par05] recortada con la o inclusin de datos difusos . . . . . . . . . . . . . . . . . . o 4.8. Ontolog de Calero et al. [Cal06] y Pardede et al. [Par05] a del SQL4 y Tipos de Datos Difusos mezclada . . . . . . . 4.9. Especializacin de la clase Columna . . . . . . . . . . . . o 4.10. descripcin de la clase Dominios . . . . . . . . . . . . . . o 4.11. descripcin de las Restricciones Difusas . . . . . . . . . . o 4.12. descripcin de las estructuras para los TD Difusos . . . . o 4.13. descripcin de Ontologa del Catlogo . . . . . . . . . . . o a 4.14. Ejemplo en UML de una BD de Cl nica Veterinaria . . . 4.15. Ejemplo de una Cl nica Veterinaria generada como una Ontologa del Esquema . . . . . . . . . . . . . . . . . . . 5.1. Arquitectura del Sistema General . . . . . . . . . . . . . 5.2. Arquitectura de integracin con un SGBDR con capacio dades FSQL . . . . . . . . . . . . . . . . . . . . . . . . . 5.3. Arquitectura de integracin con un SGBDR con capacio dades funcionales . . . . . . . . . . . . . . . . . . . . . . 5.4. Arquitectura de integracin con un SGBDR sin capacio dades funcionales . . . . . . . . . . . . . . . . . . . . . . 5.5. Arquitectura Integrada . . . . . . . . . . . . . . . . . . . 5.6. Arquitectura de Consulta . . . . . . . . . . . . . . . . . . 5.7. Imagen de la aplicacin web para gestionar esquemas. . . o 5.8. Imagen de la aplicacin web para gestionar esquemas. Foro mulario de conexin para generar un esquema dado en o OWL en una BD MySQL . . . . . . . . . . . . . . . . . 5.9. Imagen de la aplicacin web para gestionar esquemas. Foro mulario de resultado tras ejecutar la generacin de un Eso quema de BD en MySQL c . . . . . . . . . . . . . . . . 5.10. Imagen de la aplicacin web para gestionar esquemas. Script o de generacin de esquemas en FSQL. . . . . . . . . . . . o 5.11. Seleccin del archivo de la ontolog a generar . . . . . . o a 5.12. Resultado de la ontolog generada . . . . . . . . . . . . a 5.13. Imagen de la aplicacin para gestionar esquemas aadida o n a la herramienta Protg . . . . . . . . . . . . . . . . . . e e
vi

80 83 84 84 86 88 90 93 97 100 104 122 133 139 140 141 142 143 147 148 149 150 151 152 155

5.14. Imagen de la aplicacin para gestionar las conexiones con o el esquema en Protg . . . . . . . . . . . . . . . . . . . e e 5.15. Imagen de la aplicacin para abrir el asistente para la geno eracin de un atributo en Protg . . . . . . . . . . . . . o e e 5.16. Imagen de la aplicacin para gestionar esquemas aadida o n a la herramienta Protg . . . . . . . . . . . . . . . . . . e e 5.17. Interfaz de generacin de consultas difusas en FSQL sobre o la herramienta Protg. Establece una comparacin entre e e o atributos . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.18. Interfaz de generacin de consultas difusas en FSQL sobre o la herramienta Protg. Establece una comparacin con e e o Valor Difuso. . . . . . . . . . . . . . . . . . . . . . . . . 5.19. Denicin de Esquemas de BDD en SGBDR Heterogneos o e 5.20. Exportacin de un Esquema de BDD a cualquier SGBDR o 5.21. Unicar Esquemas Complementarios . . . . . . . . . . . 5.22. Unicar Esquemas Compatibles . . . . . . . . . . . . . . 5.23. Incorporar a la Web un Esquema de BDD . . . . . . . . 5.24. Denicin de un Esquema de BDD a partir de cualquier o tipo de Esquema . . . . . . . . . . . . . . . . . . . . . . 5.25. Combinacin de Fuentes Heterogneas . . . . . . . . . . o e 5.26. Consulta a un SBDRD unico . . . . . . . . . . . . . . . . 5.27. Consulta a SGBDRD con el mismo Esquema . . . . . . . 5.28. Consulta a SGBDRD con Esquemas Complementarios . . 5.29. Consulta a SGBDRD con Esquemas Compatibles . . . . 5.30. Consulta a SGBDRD con Esquemas Heterogneos . . . . e A.1. Clasicaciones de Lassila y McGuinness [Las02] y de Ruiz e Hilera [Rui06] . . . . . . . . . . . . . . . . . . . . . . . A.2. Clasicacin genrica de Ontolog basada en la natuo e as raleza de la conceptualizacin . . . . . . . . . . . . . . . o B.1. Posibles Representaciones trapezoidales de una distribucin de posibilidad . . . . . . . . . . . . . . . . . . . . . o B.2. Tipo difuso 1 . . . . . . . . . . . . . . . . . . . . . . . . B.3. Tipo difuso 2 . . . . . . . . . . . . . . . . . . . . . . . . B.4. Tipo difuso 3. Valores que pueden tomar las relaciones de similitud. . . . . . . . . . . . . . . . . . . . . . . . . . . B.5. Distribuciones de posibilidad de los valores Unknown y Undened . . . . . . . . . . . . . . . . . . . . . . . . . . B.6. Estructura relacional de la FMB . . . . . . . . . . . . . .
vii

156 158 159 161 162 164 165 165 167 169 169 170 173 173 174 175 176 193 196 225 226 226 227 228 232

B.7. Catlogo de datos deductivos . . . . . . . . . . . . . . . a B.8. Estructura relacional de la extensin de la FMB para maneo jo de mltiples datos . . . . . . . . . . . . . . . . . . . . u B.9. Estructura relacional de la DmFMB . . . . . . . . . . . . B.10.Estructura relacional de la Base de Metaconocimiento para el DM . . . . . . . . . . . . . . . . . . . . . . . . . . . . C.1. Diagrama de Clases de la BD de Suelos . . . . . . . . . .

237 244 247 249 252

viii

Indice de tablas
3.1. Relacin o 3.2. Relacin o 3.3. Relacin o 3.4. Relacin o 3.5. Relacin o 3.6. Relacin o 3.7. Relacin o 3.8. Relacin o 3.9. Relacin o 3.10. Relacin o 3.11. Relacin o 3.12. Relacin o 3.13. Relacin o 3.14. Relacin o 3.15. Relacin o 3.16. Relacin o 3.17. Relacin o 3.18. Relacin o Extended Tables . . . . . . . . . . . . . . . . Extended Tab Columns . . . . . . . . . . . . . Localizacin . . . . . . . . . . . . . . . . . . . o Estructura . . . . . . . . . . . . . . . . . . . . Fuzzy Object List de la BD de Suelos . . . . . Fuzzy Nearness Def de la BD de Suelos . . . . Fuzzy Label Def en la BD de Suelos . . . . . Fuzzy Col List en la BD de Suelos . . . . . . Fuzzy Aprox Much en la BD de Suelos . . . . Extended Tab Column en la BD de Suelos . . Extended Tables en la BD de Suelos . . . . . DmFsql Project en la BD de Suelos . . . . . DmFsql Col List en la BD de Suelos . . . . . Ded Intensional Catalog de la Bd de Suelos . Ded Int Table Description de la BD de Suelos Ded Rule Description de la BD de Suelos . . . Ded Predicate Description de la BD de Suelos Ded Condition Description de la BD de Suelos . . . . . . . . . . . . . . . . . 50 51 63 63 64 65 65 65 66 66 66 66 66 66 67 67 67 67 81 92 95 96 99 102 104

4.1. descripcin Breve de las Clases de la Ontolog Recortada o a de Calero et al. . . . . . . . . . . . . . . . . . . . . . . . 4.2. Restricciones de los atributos de Fuzzy Domain . . . . . 4.3. Restricciones de los atributos de Discrete Relation y Discrete Denition . . . . . . . . . . . . . . . . . . . . . . . 4.4. Restricciones de los atributos de Label Denition . . . . 4.5. Restricciones de las estructuras de datos que representan valores difusos . . . . . . . . . . . . . . . . . . . . . . . . 4.6. Ontolog importadas en OWL . . . . . . . . . . . . . . as 4.7. descripcin de los valores de las etiquetas ling o usticas relacionadas con el dominio del atributo Age de la tabla Cat
ix

4.8. Relaciones de Similitud del Atributo Character . . . . . 4.9. Instanciacin de la Ontologa del Catlogo del ejemplo de o a la Cl nica Veterinaria . . . . . . . . . . . . . . . . . . . . 4.10. Propiedades de Objeto en la Ontologa del Catlogo del a ejemplo de la Cl nica Veterinaria . . . . . . . . . . . . . 4.11. Propiedades de Tipo de datos en la Ontolog del Catlogo a a del ejemplo de la Cl nica Veterinaria . . . . . . . . . . . 4.12. Instancias de la Ontologa del Catlogo del ejemplo de la a BDD Suelos . . . . . . . . . . . . . . . . . . . . . . . . . 4.12. Instancias de la Ontologa del Catlogo del ejemplo de la a BDD Suelos . . . . . . . . . . . . . . . . . . . . . . . . . 4.12. Instancias de la Ontologa del Catlogo del ejemplo de la a BDD Suelos . . . . . . . . . . . . . . . . . . . . . . . . . 4.13. Propiedades de Objeto en la Ontolog del Catlogo del a a ejemplo de la BDD de Suelos . . . . . . . . . . . . . . . 4.13. Propiedades de Objeto en la Ontolog del Catlogo del a a ejemplo de la BDD de Suelos . . . . . . . . . . . . . . . 4.13. Propiedades de Objeto en la Ontolog del Catlogo del a a ejemplo de la BDD de Suelos . . . . . . . . . . . . . . . 4.14. Propiedades de Tipo de datos en la Ontolog del Catlogo a a del ejemplo de la BDD de Suelos . . . . . . . . . . . . . 4.14. Propiedades de Tipo de datos en la Ontolog del Catlogo a a del ejemplo de la BDD de Suelos . . . . . . . . . . . . . 4.14. Propiedades de Tipo de datos en la Ontolog del Catlogo a a del ejemplo de la BDD de Suelos . . . . . . . . . . . . . 4.15. Correspondencia de los tipos de datos difusos con las estructuras de datos difusas en la ontolog . . . . . . . . . a 4.16. Correspondencia de algunos de los tipos de datos predenidos en la Ontologa del Catlogo con los tipos de a datos base denidos en XML . . . . . . . . . . . . . . . . 4.17. Instanciacin de la Cl o nica Gatos denida en como Ontolog de Esquema . . . . . . . . . . . . . . . . . . . . . a 4.18. Propiedades de Objeto en la Ontolog del Esquema del la a Clinica Veterinaria . . . . . . . . . . . . . . . . . . . . . 4.19. Propiedades de tipos de dato en la Ontolog del Esquema a de la Clinica Veterinaria . . . . . . . . . . . . . . . . . . 4.20. Instanciacin de la BDD Suelos denida en como Ono tolog de Esquema . . . . . . . . . . . . . . . . . . . . . a
x

105 106 107 108 110 111 112 112 113 114 114 115 116 118

119 123 124 124 125

4.21. Propiedades de Objeto en la Ontolog del Esquema de la a BDD Suelos . . . . . . . . . . . . . . . . . . . . . . . . . 4.22. Propiedades de tipos de dato en la Ontolog del Esquema a de la BDD Suelos . . . . . . . . . . . . . . . . . . . . . . A.1. Elementos de una pgina RDF . . . . . . . . . . . . . . . a A.2. Elementos de una pgina RDF Schema . . . . . . . . . . a A.3. Elementos de una pgina OWL . . . . . . . . . . . . . . a B.1. B.2. B.3. B.4. B.5. Representacin para atributos de tipo o Representacin para atributos de tipo o Resumen de FSQL . . . . . . . . . . Resumen de DFSQL . . . . . . . . . Resumen de DMFSQL . . . . . . . . 2 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

126 126 207 208 219 229 229 233 238 250 256 257 257 258 258 258 258 259 259 259 259 259 259 260 260 260 261 261 261 261 261 262 262

C.1. Atributos de la base de datos de color de suelos, agrupados de acuerdo a su semntica . . . . . . . . . . . . . . . . . a C.2. Descripcin de las propiedades la clase Localizacin . . . o o C.3. Descripcin de las propiedades de la clase Estructura . . o C.4. Descripcin de las propiedades de la clase Anal o ticos . . . C.5. Descripcin de las propiedades de la clase Identicacin . o o C.6. Descripcin de las propiedades de la clase Bibliograf . . o a C.7. Descripcin de las propiedades de la clase Color y sus o subclases . . . . . . . . . . . . . . . . . . . . . . . . . . . C.8. Etiquetas ling usticas (Atributo PMEDIA) . . . . . . . . C.9. Etiquetas ling usticas (Atributo TMEDIA) . . . . . . . . C.10.Etiquetas ling usticas (Atributo ALTITUD) . . . . . . . C.11.Etiquetas ling usticas (Atributo PROFUNDI) . . . . . . C.12.Etiquetas ling usticas (Atributo PENDIENT) . . . . . . C.13.Etiquetas ling usticas (Atributo ARENA) . . . . . . . . . C.14.Etiquetas ling usticas (Atributo ARCILLA) . . . . . . . C.15.Etiquetas ling usticas (Atributo CO) . . . . . . . . . . . C.16.Etiquetas ling usticas (Atributo CARBONAT) . . . . . . C.17.Etiquetas ling usticas (Atributo PH) . . . . . . . . . . . C.18.Etiquetas ling usticas (Atributo AGUA) . . . . . . . . . C.19.Etiquetas ling usticas (Atributo FE) . . . . . . . . . . . . C.20.Etiquetas ling usticas (Atributo CEC) . . . . . . . . . . . C.21.Etiquetas ling usticas (Atributo CLASE ES) . . . . . . . C.22.Relaciones de similitud (Atributo FAOREDUC) . . . . . C.23.Cdigos para el atributo FAOREDUC . . . . . . . . . . . o
xi

C.24.Relaciones de similitud (Atributo TIPO HOR) . C.25.Relaciones de similitud (Atributo ORIENTAC) C.26.Relaciones de similitud (Atributo FISIOGRA) . C.27.Relaciones de similitud (Atributo VEGETACI) C.28.Cdigos para el atributo VEGETACI . . . . . . o C.29.Relaciones de similitud (Atributo MATERIAL) C.30.Cdigos para el atributo MATERIAL . . . . . . o C.31.Relaciones de similitud (Atributo GRADO) . . C.32.Relaciones de similitud (Atributo HUE HUME) C.33.Relaciones de similitud (Atributo VALUE HU) . C.34.Relaciones de similitud (Atributo CROMA HU) C.35.Relaciones de similitud (Atributo HUE SECO) . C.36.Relaciones de similitud (Atributo VALUE SE) . C.37.Relaciones de similitud (Atributo CROMA SE) C.38.Relaciones de similitud (Atributo TIPO ES) . . C.39.Cdigos para el atributo TIPO ES . . . . . . . o C.40.Relaciones de similitud (Atributo GRADO ES) C.41.Tabla Color, parte de su contenido . . . . . . . C.42.Tabla Estructura, parte de su contenido . . . . . C.43.Tabla Analticos, parte de su contenido . . . . . C.44.Tabla Localizacin, parte de su contenido . . . . o

. . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . .

262 263 263 263 263 264 265 265 266 266 267 267 268 268 268 269 269 270 270 271 271

xii

Cap tulo 1

Introduccin o
El Entorno y las Bases de Datos Hoy en d encontramos una creciente necesidad de representar ina formacin, manejarla, explotarla y compartirla. Esta necesidad se debe o a la enorme capacidad de acceso a la informacin que tenemos gracias o a las mltiples fuentes que nos la proporcionan, desde los tradicionales u Sistemas de Gestin de Bases de Datos (SGBDs) hasta las ms actuales o a relacionadas con la Web (Internet, Web 2.0, la Web Semntica y la Web a 3.0). Adems dicha informacin se encuentra representada en formatos a o muy diversos, dependiendo del contenido de la misma y del soporte en el que se halla representada y almacenada. Sin embargo aunque las nuevas tecnolog estn facilitando el acceso as a a la informacin gracias a las clasicaciones y bsquedas por contenidos o u semnticos (la web semntica, ontolog anotaciones, etc.), no se debe a a as, olvidar que los sistemas que por excelencia mejor gestionan la informacin son los SGBDs [Cod07] dado que han sido diseados espec o n camente para ello. Estos SGBDs han desarrollado durante los siglos XX y XXI un gran nmero de avances a la hora de representar informacin de muy diu o versa ndole. Se han desarrollado Sistemas de Representacin de Bases de o Datos Relacionales, Orientadas a Objetos o mixtas, Lgicas y/o Deduco tivas, para Miner de datos, de Grandes Volmenes, Transaccionales, a u Multimedia, Temporales, Difusas, etc., todas ellas encaminadas a gestionar de manera eciente cualquier tipo de informacin. o El Modelo Relacional, desde que fue presentado por Codd en [Cod70], se consider como el modelo que ms ecientemente representaba la inforo a macin estructurada [Cod07], y se extendi tan rpidamente que hoy en o o a d a pesar de las mltiples propuestas que han surgido para representar a, u
1

CAP ITULO 1. INTRODUCCION

la informacin, sigue siendo uno de los ms utilizados. Debido a ello, se o a han realizado un gran nmero de extensiones al Modelo Relacional, entre u la que destaca la integracin de la Lgica Difusa al modelo con objeto de o o representar valores imprecisos y exibles [Bos88, Med94b, Gal99]. Sobre dicha extensin se han propuesto otras basadas, por ejemplo, o en la representacin de reglas lgicas sobre una Base de Datos Relacional o o Difusa (BDRD) [Bal84, Bla01] y la posibilidad de realizar deducciones usando mecanismos de inferencia clsicos extendidos. a Otro enfoque para la integracin de ms elementos al Modelo Relao a cional es el de la denominada Segunda Generacin de Miner de Datos o a (DBMining), que propone un Sistema de Miner de Bases de Datos y a Descubrimiento de Informacin (KDDB System). Esta nueva tendencia, o planteada por Imielinski [Imi96] fusiona dos disciplinas, los procesos de miner de datos con las Bases de Datos. Basado en esto, Carrasco et a al. [Car03a] propone la integracin de operaciones de Miner de Datos o a (DM) con una extensin difusa sobre los modelos relacionales de bases o de datos. En este trabajo de tesis se propone una Arquitectura Unicada Multipropsito donde se combinen la gestin de miner de datos [Car03a] o o a con la representacin de informacin imprecisa [Med94b, Gal99] y lgio o o ca [Bla01] para aumentar el potencial de las consultas sobre una base de datos. Con esta arquitectura se permitir aumentar la escalabilidad a del sistema y la capacidad operativa del modelo relacional, de forma que se puedan ejecutar consultas complejas mediante la combinacin de las o operaciones implementadas en el sistema, como puede ser la combinacin o de procesos de miner de datos sobre relaciones denidas sobre reglas a lgicas. o No obstante no todo son ventajas en la unicacin de las diferentes o arquitecturas. La complejidad que puede adquirir el sistema para manipular toda esta informacin hace muy costosa su puesta en marcha. o Dicha complejidad se origina debido a la gran cantidad de estructuras que se necesitan para gestionar los diferentes tipos de informacin y el o gran coste que supone su comprensin para su posterior uso. Esta proo blemtica hace plantearse la viabilidad de llevar este sistema a cabo o a bien realizar algn proceso de ingenier que permita la simplicacin del u a o sistema. Otro inconveniente que surge a la hora de extender los SGBDR con otro tipo de representaciones es el de la estrecha dependencia que tiene cualquier nueva implementacin con el SGBD en la que se est realizano e

do. Hay que tener en cuenta que los SGBD adems de hacer una reprea sentacin particular del lenguaje SQL dependiendo de las estructuras que o implementan, disponen de mecanismos de extensin propios en los que o algunos incluso incorporan capacidades funcionales para poder ejecutar sus programas (como Oracle c con el PL/SQL y PostgreSQL c con el PL/pgSQL). Otros en cambio permiten ejecutar programas en lenguajes de programacin genricos como JAVA o C. Dicha situacin obliga o e o a los implementadores a evaluar si es conveniente realizar una extensin o personalizada para cada sistema (en tanto que se ganar en eciencia) a o utilizar una comn (se ganar en independencia del sistema). En este u a trabajo, tambin se propone una arquitectura unicada capaz gestionar e diferentes SGBDs sean cuales sean sus particularidades. De esta forma, la eleccin sobre la implementacin de la extensin al SGBD elegida no o o o ser determinante para que el sistema no pueda ser integrado con el resto a y su informacin no sea denida o manipulada de forma ajena a dichas o particularidades. Las Ontolog as Por otro lado, nos encontramos con que los esquemas de Bases de Datos no se consideran informacin util en la Web. En un entorno en el o que las pginas Web son indexadas semnticamente gracias a que su cona a tenido se representa mediante ontolog o anotaciones, las pginas que as a representan informacin consultada ad hoc sobre una Base de Datos (se o trata de formularios o interfaces back-end que realizan consultas contra bases de datos bajo demanda), se quedan fuera de esta clasicacin. Con o este mismo problema tambin se encuentran otro tipo de BBDD, tambin e e accesibles al pblico a travs de la web, carentes de un entorno espec u e co para su acceso. La informacin de stas BBDD estar disponible a o e a travs del uso de aplicaciones genricas, como el ISQLPlus c [Ora07]. e e La informacin de los esquemas de dichas BBDD (normalmente descritos o en lenguajes como SQL o UML) ser muy utiles especialmente en caan sos como el segundo, dado que stos datos no pueden ser integrados en e entornos como la Web Semntica. a Actualmente las ontolog se han convertido en el sistema ms usado as a de representacin del conocimiento. Las ontolog [Her02] se estn emo as a pleando en todo tipo de aplicaciones informticas en las que es necesario a denir concretamente el conjunto de entidades relevantes en un campo de aplicacin determinado, as como las interacciones entre las mismas. o Algunas ontolog se crean con el mero objetivo de alcanzar una comas

CAP ITULO 1. INTRODUCCION

prensin del Universo del Discurso pertinente, ya que su creacin impone o o una especicacin muy detallada. Otras en cambio son creadas para un o propsito general que est orientado a la construccin de una base de o a o conocimiento que contenga el conocimiento humano necesario para hacer inferencias. La aparicin de la Web Semntica, como entorno que permite cono a sultar informacin web a partir del contenido semntico que las pginas o a a web contengan, ha contribuido al xito de las ontolog que han sido e as, utilizadas como mecanismo preferido (que no el unico) para representar dicha semntica. Las ontolog por consiguiente pueden ser represena as tadas utilizando lenguajes computacionalmente comprensibles a travs e de la web, permitiendo as que la informacin que en ellas se halla deni o da sea ms universal. a

USUARIOS

PROGRAMAS DE APLICACION

ONTOLOGIA

SGBDDIFUSAS
(Oracle, MySql , PostgreSQL , Sybase , etc.)

Figura 1.1: Relacin de la Ontolog con el Entorno o a

Esto nos lleva a plantear la representacin de la Arquitectura del SGBo DRD Multipropsito en forma de ontolog como solucin al problema o a o de la complejidad. Dicha ontolog permitir la generalizacin y estruca a o turacin de los elementos que componen dicho Servidor Multipropsito, o o siendo a su vez independiente de las particularidades del SGBDR sobre el que estuviera desarrollada, y lo sucientemente clara y genrica para e su manipulacin y posible ampliacin. La ontolog se plantea as como o o a

una capa abstracta que generaliza los conceptos representados a ms baa jo nivel por el SGBD, tal y como muestra la gura 1.1. El usuario nal tendr acceso a la ontolog bien directamente, o bien a travs de alguna a a e herramienta desarrollada para esta tarea. Esta opcin es la ms deseable, o a dado que los lenguajes utilizados para la representacin de ontolog no o as suelen ser fcilmente interpretables por humanos. a La Solucin: una Ontolog para la Representacin del Conoo a o cimiento Difuso Se plantea as el desarrollo una ontolog para la representacin del a o conocimiento difuso, entendiendo por este, aquel conocimiento impreciso representado mediante lgica difusa. Dicha ontolog contendr la o a a denicin de las estructuras y relaciones que permiten denir informao cin imprecisa sobre un SGBDR (Sistema de Gestin de Bases de Datos o o Relacional) genrico, esto es, al margen de las particularidades que puee da tener un SGBDR concreto. La ontolog actuar como interfaz entre a a el usuario y la base de datos haciendo transparente para el usuario la estructura de BD que permite almacenar la informacin difusa (inforo macin imprecisa representada mediante lgica difusa). De esta forma, o o unicamente se mostrar la representacin que hace la ontolog de la a o a informacin del SGBDRD (Sistema de Gestin de Bases de Datos Relao o cional Difuso), tal y como podemos ver en la gura 1.2. De igual manera el usuario nal podr seguir accediendo a la informacin difusa tal y coa o mo ha ido hacindolo, directamente sobre el SGBD Extendido. La unica e diferencia es que con esta propuesta se incrementan las posibilidades de comunicacin con la misma. o

ONTOLOGIA
ADAPTADOR / INTERPRETE DE BD

SGBDR Difuso

Figura 1.2: Interaccin entre el Usuario y el SGBD o

La Ontologa para la Representacin del Conocimiento Difuso, tal y o

CAP ITULO 1. INTRODUCCION

como se ha denominado a este primer prototipo, intentar unicar toda a la representacin del conocimiento difuso en un solo entorno, haciendo o esta informacin portable a cualquier otro medio de representacin, prino o cipalmente, a SGBDRs heterogneos. e Adems con esta representacin se pretende dotar al usuario nal a o de un mecanismo de denicin y manipulacin de de datos que facilite o o la gestin de informacin difusa sobre el cualquier SGBDRD. Por otro o o lado la operacin de consulta tambin se denir para guiar a usuario o e a en la elaboracin de la misma. En la gura 1.3 se muestra como un o usuario puede utilizar una herramienta de consulta que opere contra el SGBDRD (Sistema de Gestin de Bases de Datos Relacionales Difusos) o directamente o bien, realizar el proceso de consulta mediante el uso de la ontolog La diferencia entre ambas reside en que la primera interfaz es a. totalmente dependiente del SGBD contra la que la realiza y la segunda se ayuda de la ontolog para generar la consulta, y no a partir de los a datos que se hayan denidos en el SGBDRD.

ONTOLOGIA

INTERFAZ DE CONSULTA 2

SGBDR Difuso

INTERFAZ DE CONSULTA 1

Figura 1.3: Interaccin entre el Usuario y el SGBD para realizar las operao ciones proporcionadas por la ontolog a

Objetivos Los objetivos de este trabajo de tesis son los siguientes: Plantear una Arquitectura de un SGBDR genrica que permita e combinar diferentes extensiones al modelo relacional, concretamente, para permitir representar informacin imprecisa, lgica y de DM en o o un unico sistema.

Denir una Ontolog para representar el conocimiento difuso rea presentado en un SGBDRD. Proponer una arquitectura del sistema que permita combinar informacin entre varios SGBDRD heterogneos - cada uno con su o e propia representacin de datos y su propio lenguaje en el caso que o permitan capacidades funcionales. Aislar al usuario de las particularidades de representacin de los o SGBD en los que desee almacenar informacin. o Facilitar al usuario la denicin de informacin imprecisa mediante o o mecanismos o interfaces intuitivas. Permitir a los usuarios elaborar consultas en FSQL(Fuzzy SQL), extensin al SQL, para permitir manipular datos difusos sin tener o cuenta las particularidades de dicho lenguaje, las particularidades de representacin de los datos difusos o de los propios SGBDs o Permitir la comunicacin simultnea entre diferentes SGBDRD heo a terogneos para denir esquemas o informacin difusa. e o Permitir la generacin de las clases de catlogo de forma genrica, o a e sin tener en cuenta las particularidades de los sistemas dnde se o representen. Incorporar los esquemas de BD (Difusas) a la Web Semntica. Estua diar la relacin de la ontolog que representa el conocimiento difuso o a de un SGBDRD con el resto de estructuras que forman la web semntica. a Contenidos El contenido de esta tesis esta estructurado de la siguiente manera: En el cap tulo 2 se hace un repaso de algunas de las principales aplicaciones de las ontolog (descritas en detalle en el Anexo A). as Concretamente se estudia la relacin de las ontolog con la Web y o as con los Sistemas de Gestin de Bases de Datos, haciendo un estudio o profundo de las diferentes propuestas que existen sobre esta ultima relacin. Adems se exponen las bases sobre las que se ha fundao a mentado la elaboracin de la Ontolog para la Representacin del o a o Conocimiento Difuso propuesta en esta tesis.

CAP ITULO 1. INTRODUCCION

En el cap tulo 3 se describen brevemente los modelos de bases de datos extendidos que permiten manipular informacin difusa (exo puestos con detalle en el Anexo B). Adems se propone la Arquia tectura de Servidor Multipropsito que combina dichas extensiones o en un unico modelo que permite mezclar todas las operaciones de sarrolladas que utilizan informacin difusa multipropsito. o o En el cap tulo 4 se describe la Ontolog para la Representacin del a o Conocimiento Difuso. Dicha ontolog se plantea como una forma a de solucionar el problema surgido en el proceso de unicacin de o las extensiones al modelo de bases de datos relacionales expuestas en el cap tulo 3. En el cap tulo 5 se establece la arquitectura del sistema para que la ontolog establezca una comunicacin con un SGBDR heterogneo a o e y permitir as la denicin de datos y su posterior manipulacin. o o Dicha arquitectura desemboca en el desarrollo de una interfaz de usuario, que se encuentra descrita tambin en en ste cap e e tulo. El cap tulo 6 termina con las conclusiones del trabajo realizado y las investigaciones futuras que se plantean a continuacin del mismo. o Al nal se incorporan varios anexos: En el Anexo A se muestra un estudio detallado del concepto de Ontolog Este estudio hace un repaso por la denicin de Ingenier as. o a Ontolgica, la clasicacin de las ontolog de las herramientas o o as, existentes para su explotacin, de los lenguajes utilizados para su o representacin y de las diferentes operaciones que se llevan a cabo o con ellas. En el Anexo B se muestra un amplio de resumen de las extensiones a los SGBD clsicos para la representacin y manipulacin de infora o o macin imprecisa, lgica y de algunas tcnicas de miner de datos. o o e a Este resumen va desde el planteamiento del modelo terico hasta o la descripcin de las bases de metaconocimiento que permiten la o puesta en marcha de estos sistemas en el modelo relacional. En el Anexo C se muestra la estructura de datos del ejemplo expuesto a lo largo de este trabajo de tesis.

Cap tulo 2

Ontolog y Bases de Datos as Difusas


2.1. Introduccin o

En este cap tulo se hace un repaso por algunas de las principales aplicaciones de las ontolog en el campo de la representacin de la as o informacin en la actualidad. o Por un lado, se describe el concepto de Web Semntica, analizando a el impacto que tienen las ontolog sobre dicha Web. Se destaca la preas sencia de las Bases de Datos en la Web y las diferentes tcnicas para el e acceso a los datos de las Bases de Datos Difusas (BDD) que existen, para incorporarlas a la Web Semntica. Adems se hace un repaso por el resto a a de tecnolog que estn apareciendo en la Web y que tambin permiten as a e representar informacin con cierta semntica. o a Por otro lado, se trata la relacin que existe entre el concepto de base o de datos y el de ontolog revisando las diferentes tendencias a la hora de a considerar la representacin llevada a cabo por una base de datos como o si fuese una ontolog Se analizarn las diferentes representaciones de a. a BBDD usando ontolog y el uso actual que tienen dichas representaas ciones. Por ultimo en este cap tulo se expondrn dos ontolog una desaa as, rrollada por Pardede et al. [Par05], que clasica los tipos de datos predenidos en el modelo relacional, y la ontolog propuesta por Calero et a al. [Cal05], que modela el ANSI SQL2003 [fSIIT03]. Estas dos ontolog as establecern los cimientos sobre los que se desarrollar la Ontolog de a a a Representacin del Conocimiento Difuso base de esta tesis y expuesta en o
9

10

CAP ITULO 2. ONTOLOG IAS Y BASES DE DATOS DIFUSAS

detalle en el cap tulo 4.

2.2.

La Web Semntica a

A pesar de que la Web ha tra con ella nuevas oportunidades para do intercambiar, compartir, publicar y consultar informacin en la sociedad, o tambin presenta sus limitaciones y desventajas. Por un lado, conforme e ha ido creciendo su extensin y aumentando el nmero de pginas e inforo u a macin accesible a travs de la misma, han ido cambiando las necesidades, o e hacindose cada vez ms importante disponer de buscadores o mecanise a mos de clasicacin o acceso que permitan la obtencin de informacin o o o exacta, cada vez ms cercana a la pregunta, para evitar as las cantia dades ingentes de pginas como resultado. Otro problema de la Web se a encuentra en la carencia de semntica en las respuestas obtenidas tras a una consulta, obteniendo as respuestas imprecisas o errneas [Lau04]. o Adems, la Web necesita representar informacin que pueda ser procea o sada computacionalmente [BL01]. Para ello requiere nuevas tecnolog as que estructuren la informacin disponible como XML, XML-S, RDF(S), o etc. Por contra, HTML la presenta de manera desorganizada y carente de signicado. Sin embargo, en Web clsica, tal y como la conocemos, a resumiendo lo dicho anteriormente: El contenido no puede ser determinado. Las consultas semnticas no pueden realizarse, puesto que las pgia a nas Web no pueden ser interpretadas, y Los agentes inteligentes no pueden obtener informacin signicatio va. La Web Semntica se propone como solucin a todos estos problemas, a o y como muchos investigadores arman [BL01, Gob03], ser la tecnolog a a capaz de hacer los contenidos de la Web comprensibles por humanos y procesables computacionalmente. Mas formalmente, la Web Semntica se a puede denir como el resultado de extender la Web estndar con lenguaa jes, informacin y recursos que nos permitan extraer informacin acerca o o del signicado de los contenidos de la Web automticamente (Bernersa Lee et al. [BL01]). Estos contenidos se encuentran en diferentes formatos, por ejemplo en forma de documentos web, esquemas semiestructurados, o datos dinmia cos [Hen02]. En la Web Semntica se extiende cada fuente de informaa

2.2. LA WEB SEMANTICA

11

cin con una representacin estructurada de su semntica. Existen varias o o a aproximaciones para incluir esta semntica, la ms utilizada, como se ina a dica en [Fin05], son las ontolog aunque tambin se ha propuesto el as, e uso de anotaciones [She05]. Tal y como describimos en detalle en el Anexo A, una ontolog es una a descripcin formal del dominio del discurso para un problema concreto, o y la intencin de la misma es ser compartida entre diferentes usuarios o o aplicaciones. Una de sus ventajas es que puede ser expresada en un lenguaje (la mayor en lgica descriptiva o de primer orden) de tal forma a o que pueda utilizarse para razonar [GP03b, Noy04, Sta04]. Por tanto esta primera aproximacin para incorporar semntica a los o a contenidos de la Web consistir en la incorporacin de la ontolog a la a o a pgina web cuyo contenido est describiendo, bien dentro del cdigo de la a e o web, bien adjuntndolo al resto de los archivos donde se encuentre la misa ma [Fin05]. Sin embargo McCool en [McC06] descubre ciertos problemas con esta solucin (vase gura 2.1): o e La complejidad que adquiere la Web Semntica. a La baja participacin de los usuarios. o El hecho de que en la actualidad exista un nmero muy escaso de u aplicaciones. La complejidad de los lenguajes de descripcin de ontolog o as. La segunda solucin presenta anotaciones acerca del contenido de la o pgina Web y del vocabulario. Esta solucin [McC06] reduce la complejia o dad de la Web Semntica, permite obtener ms rpidos resultados en las a a a consultas, y permite una mayor participacin de los usuarios y desarroo lladores. Sin embargo tambin tiene sus desventajas, no es tan expresiva e como las ontolog a la hora de representar la semntica de una fuente as a de informacin (vase seccin 2.2.2). o e o De cualquier manera, la Web Semntica se mantiene como alternaa tiva a la Web clsica y permite que toda la informacin que en ella se a o encuentra pueda ser consultada y accedida. 2.2.1. Bases de Datos en la Web Semntica a

Una parte importante de la informacin en la Web, la podemos eno contrar en forma de documentos de texto (Word, PDF, txt,...), pginas a HTML, documentos XML, pginas Web dinmicas, contenidos FLASH, a a

12

CAP ITULO 2. ONTOLOG IAS Y BASES DE DATOS DIFUSAS

AGENTES

<<Clie <<Clie html nt>> nt>>

Varias pg. web la ontologa adjunta (html, jsp, owl..) Ontologa incluida en la pg. principal Pgina Web anotada

USUARIOS

PROGRAMAS

WEB SEMNTICA

Figura 2.1: La Web Semntica, usuarios, y acceso a la informacin a o

librer ejecutables, interfaces de programas, bases de datos, formulaas, rios, etc. Incluso podemos encontrar simples datos (registros de datos, tuplas) o metadatos, podemos acceder a bases de datos, o inferir conocimiento a partir de estas (vase la gura 2.2), pero nosotros necesitamos e denir las tecnolog que permitan acceder a toda esta informacin de as o la manera y formato que se requiera en cada uno de los casos. Una pgina dinmica es un tipo de contenido Web que se genera mea a diante la consulta de una base de datos. Para generar un pgina dinmia a ca, suelen utilizarse tecnolog como JSP, ASP, o PHP, para lanzar las as consultas sobre dichas bases de datos. En estas pginas, la semntica a a no puede ser introducida, dado que se trata de un interfaz (front-end ) para la base de datos. Sin embargo, podr describirse semnticamente an a mediante los contenidos de la base de datos a la que ellas acceden [Jur07]. Existen incluso otros tipos de pginas web, que son ms complejas a a an para ser denidas de manera semntica, estas son por ejemplo, las u a interfaces Web genricas para consultar bases de datos. Un ejemplo de e este tipo de pginas es el ISQLPlus (Oracle c ) [Ora07] o el WebinTool a [Hu96] o incluso, aquellas desarrolladas con paquetes de acceso a bases de datos como LISBDB [Eri07]. Estas pginas permiten acceder a la infora macin de bases de datos, pero no pueden ser semnticamente indexadas o a porque sus contenidos no se conocen hasta que no se accede a una u otra base de datos.

2.2. LA WEB SEMANTICA

13

En el contexto de la Web Semntica, y como caso particular de lo exa plicado en la anteriormente, ser interesante poder almacenar la semntia a ca de dichos datos y emplear dicha semntica para su acceso. Por ejemplo a si tratramos de buscar registros de datos sobre una BD concreta o doa minio particular usando ISQLPLUS(Oracle c ) [Ora07], el tener acceso a los esquemas de bases de datos que denen la informacin contenida en o la misma resultar muy util. Tambin ser interesante obtener entre los a e a resultados de una bsqueda: referencias a bases de datos existentes que u contengan entre sus datos informacin que cumpla el criterio de bsqueo u da, referencias a aplicaciones cliente existentes o formularios (una vez que los tenemos semnticamente declarados), etc. Entonces sern los usuarios a a los que deciden que resultados son los que necesitan. Hay propuestas que intentan generar o extraer informacin de bases o de datos relacionales, a partir de estas pginas en HTML, o de las pgia a nas dinmicas. Por ejemplo Astrova [Ast04] construye estos esquemas de a BD relacionales utilizando wrappers (programas para extraer dicha informacin). Otro autor que tambin utiliza wrappers para incorporar la o e semntica de las BDR a la Web es Champin et al. [Cha07] que propone a un herramienta para construir en un lenguaje de la Web Semntica la a informacin de la BDR. o Sin embargo, en las BBDD la dicultad para acceder a ellas est en a funcin del tipo de informacin que representen. Si se trata de BBDD o o Extendidas (como una BD Difusa) entonces su representacin no forma o parte del estndar ANSI [fSIIT99], lo cual implicar que se necesitara a a hacer pblica la informacin acerca de los metadatos que representan la u o dicha informacin especial (por ejemplo la imprecisa), para garantizar el o acceso correcto a los datos almacenados en la BD, tanto por parte de los usuarios como de los agentes que lo intenten [Bla05a, Bla05b]. Para realizar la tarea de publicacin de contenido de una BD en la o Web Semntica, existen numerosas aproximaciones. Una de las ms utia a lizadas consiste en la representacin formal del modelo relacional en foro ma de ontolog la cual acta de interfaz entre el usuario y la BD real. a, u Algunos de los autores que han llevado a cabo esta propuesta son LaBorda et al. [PdL05], Calero et al. [Cal06] o Blanco et al. [Bla05a] que presentan cada uno una interpretacin del ANSI SQL como solucin para que las o o bases de datos sean visibles a travs de la Web (vase para mayor detalle e e seccin 2.3.2). Esta interfaz mantendr separada la representacin de los o a o datos de su almacenamiento, y simplicar la denicin necesaria para a o acceder a la misma. En el caso de las BD Extendidas esta caracter stica

14

CAP ITULO 2. ONTOLOG IAS Y BASES DE DATOS DIFUSAS

es fundamental, dado que proporcionar una denicin pblica de la esa o u tructura especial que tenga la informacin que representen, hacindolas o e mas accesibles y comprensibles al usuario o agente nal. La ontolog a resultante dene las metaclases que denen la estructura de la informacin (el catlogo del sistema) que proporcionan la interfaz de acceso a los o a datos adecuada. Esta ontolog entonces podr integrarse con el resto a a de las estructuras que se encuentran en la Web Semntica, comentadas a con anterioridad. No obstante dicha representacin ser descrita con ms o a a detalle en los cap tulos sucesivos.

WWW compuesta por PAGINAS WEB (HTML, XML )


Web Page File

RESULTADOS DE BSQUEDA TRADICIONAL Enlaces a archivos Enlaces a pg. Web


Enlaces a webs dinmicas

DOCUMENTOS (DOC, XML ,PDF , ..)


Class name Attribute s

.....

Class name

Class name

Attributes

Attributes

RESULTADOS DE BSQUEDA EN LA WEB SEMNTICA BSQUEDA WEB Enlace a archivos Enlaces a pg. Web

ESQUEMAS
<<Form >>

Enlaces a web dinmicas

Pginas Dinmicas

Ontologas Esquemas Interfaces de BBDD

PROGRAMAS , INTERFACES, ... BASES DE DATOS

.....

Figura 2.2: Comparacin de documentos obtenidos de la web normal y de la o web semntica a

2.2. LA WEB SEMANTICA

15

2.2.2.

Hacia donde va la Web

Adems de todo lo expuesto acerca de la Web Semntica, y dado que a a se est hablando de nuevas tecnolog no se puede obviar la nueva tena as, dencia de la Web que est en contraste con la Web Semntica, la Web a a 2.0. Esta tecnolog que ha surgido en paralelo con la Web Semntica, a a est centralizada en los servicios que se presentan en la Web, al contrario a que la Web Semntica que se centra en el contenido de la informacin. a o Es decir, la Web 2.0 aparece para satisfacer al usuario en las nuevas necesidades de comunicacin que van surgiendo, como la mayor interaco cin entre los usuarios, el mayor uso de las redes sociales (blogs, ebay, o del.icious, wikipedia, youtube, myspace, etc.), es decir, que demandan un mayor servicio. Las folksonomias (ser la traduccin en espaol de folka o n sonomy) se corresponderan as a la manera que tiene la Web 2.0 para etiquetar la informacin y as categorizar el contenido. Esta prctica es o a ms sencilla que la generacin de ontolog [Bre07] y evita tener expera o as tos generando la semntica de una web concreta [Sha06a], puesto que son a clasicaciones de contenido mediante etiquetas (tags) que van surgiendo de un trabajo colaborativo de los usuarios de la red. No obstante, los servicios que aporta la Web 2.0 no son incompatibles con la propuesta que da la Web Semntica, todo lo contrario, se complementan tal y como a Ankolekar et al. en [Ank07] o Berners-Lee et al. en [BL06] proponen. Por ultimo, se debe sealar que existen un gran nmero de detrac n u tores de la Web Semntica, por los problemas expuestos anteriormente a resumidos por McCool [McC05]. De entre estos problemas destaca de manera signicativa el escaso nmero de aplicaciones de Web Semntica u a que estn en uso actualmente, son conocidas o populares. Es un hecho a que algunos autores, defensores de la Web Semntica, vaticinan que a la a Web Semntica para su xito total le quedan unos 5 aos de desarrollos a e n [Car07]. Otros, en cambio, calican este movimiento de vaporware, es decir algo que desv esfuerzos hacia un objetivo irreal. De cualquier maa nera, se considera que la Web Semntica se consolidar como la Web 3.0. a a Sin embargo, cabe preguntarse si bien esta nueva web conseguir tria unfar, si aunar esfuerzos con la losof de la Web 2.0, si coexistirn a a a las dos tecnolog en paralelo, o bien si tras estos cinco aos, desapareas n cer como otros tantos intentos de nuevas tecnolog que a pesar de ser a as, grandes ideas no han conseguido cuajar en la industria.

16

CAP ITULO 2. ONTOLOG IAS Y BASES DE DATOS DIFUSAS

2.3.

Ontolog versus Bases de Datos as

El concepto de ontolog en el campo de la ciencia de la computacin a o se ha incorporado con mayor fuerza en las reas de la inteligencia artia cial y de las bases de datos. Concretamente el rea de las bases de datos a siempre ha tratado de modelar la informacin del mundo real, pero preo senta una serie de restricciones, impuestas por el modelo de datos que se elija, para proporcionar la mayor eciencia en el acceso y manipulacin o de la informacin. o De hecho, un gran nmero de estudios en el campo de las bases de u datos han sido recuperados [Mee01a] para ser utilizados en desarrollos muy parecidos en el campo de las ontolog Hay que observar que en as. el campo de las ontolog existen los problemas de heterogeneidad de as, informacin, bsqueda de correspondencias, la combinacin de esquemas, o u o alineamiento, traduccin, mezcla, etc. que tienen mucho parecido, por no o decir que son idnticos a los problemas que surgen entre los esquemas de e Bases de Datos [Ma05, Hai05, Men01, Sta04]. Sin embargo, existe un gran debate abierto en cuanto a la consideracin de una base de datos (el esquema y su estado) como una ontolog o a. Una ontolog esta considerada como una representacin de la realidad a o basndose fundamentalmente en el modelado de la semntica que repa a resenta. Para llevar esto a cabo, utiliza clases, propiedades, instancias, relaciones de agregacin, generalizacin..., y sobre todo restricciones, que o o en la mayor de los casos estn representadas mediante lenguajes lgicos a a o (lgica descriptiva o de primer orden), para poder aadir esa semntio n a ca al modelo. De esta manera una ontolog no basa su representacin a o en cmo la informacin ser almacenada computacionalmente y por tano o a to es independiente del aspecto f sico de su implementacin [Bre04]. De o acuerdo con esto, un esquema de base de datos podr verse como una a ontolog puesto que tambin representan los hechos de mundo real, a, e tienen su propia estructura de representacin, e incluso restricciones que o dan semntica al modelo. Es ms, existen correspondencias directas ena a tre una ontolog y una base de datos, como por ejemplo que una clase a puede ser una tabla, o que una propiedad se corresponde a un atributo, adems de que tambin pueden modelarse relaciones de agregacin, gea e o neralizacin, restricciones, etc. [Unc04] Sin embargo su comparacin no o o es tan trivial. A continuacin veremos las diferencias que existen entre la repreo sentacin de conceptos utilizando Ontolog y BBDD. Se analizarn sus o as a

2.3. ONTOLOG IAS VERSUS BASES DE DATOS

17

ventajas e inconvenientes, comparndolas a travs de los siguientes puna e tos de vista: La semntica o conceptualizacin de la informacin que representan. a o o El mecanismo de representacin de los datos (tuplas/instancias) en o las mismas. El modelo utilizado para la representacin de la informacin. o o La eciencia de uso.
Con respecto a la conceptualizacin de la informacin o o

Los tericos de las ontolog arman que una base de datos, dada o as la estructura de representacin de su informacin y su nalidad, se coo o rresponder con una ontolog de peso ligero (light weight ontology), es a a decir, no ser una ontolog propiamente dicha [GP03b, Bre04, Noy04], a a puesto que carece en su denicin, entre otras cosas, de los axiomas que o permiten realizar inferencias. Se considera que los esquemas de bases de datos estn normalmente destinados a satisfacer los requisitos de una a aplicacin, mientras que las ontolog son fruto de un trabajo conseno as suado y deben ser compartidas entre toda la comunidad [Bre04, Unc04]. Adems destacan que las ontolog no necesitan distinguir obligatoriaa as mente entre los tipos de datos primitivos y complejos, que sus propiedades tienen mucha ms semntica y que no necesitan realizar una normalia a zacin (gracias a todo esto se facilita la unin y comparticin de las o o o mismas). En el rea de las bases de datos, por contra, se considera que el moa delado conceptual en el que est basada su representacin [Spy02, Cul03, a o Mee01b, Rui06] proporciona una descripcin mas rica semnticamente o a que la que da la lgica descriptiva en la que estn basadas la mayor o a a de las descripciones de ontolog No obstante, existen en la actualidad as. representaciones conceptuales de ontolog como las que estn basadas as, a en frames, que son mucho mas intuitivas. Sin embargo, las ontolog as requieren un nivel ms alto de expresividad que el que le pueden dar los a modelos conceptuales. Otros autores, como Jean et al. [Jea06] consideran que los modelos conceptuales no cumplen el criterio de la representacin o de un conocimiento consensuado y la capacidad de ser referenciada la informacin que se representa. Mylopoulos [Myl07] considera que una o ontolog no es un modelo conceptual, puesto que un ontolog se cona a sidera reutilizable y un modelo conceptual lo es en menor grado.

18

CAP ITULO 2. ONTOLOG IAS Y BASES DE DATOS DIFUSAS

De cualquier manera, las desventajas que puedan verse en cuanto a la representacin de la realidad utilizando una base de datos, por su o carencia a la hora de expresar axiomas para dar an ms semntica a la u a a realidad que estn representando, pueden verse resueltas por la incorpoa racin de informacin lgica, gracias al uso de una Base de Datos Lgicoo o o o Deductiva. Es ms, existen hoy en d un gran nmero de Sistemas de a a u Bases de Datos dedicados al tratamiento de informacin de muy diverso o tipo, desde BD Temporales, Espaciales, de Miner de Datos, Multimedia, a Transaccionales, etc. Esto es ms de lo que puede decirse del modelado de a informacin en ontolog que hoy en d esta carente de la posibilidad o as, a de asociar especicaciones temporales o espaciales [Cul03] a las mismas.
Con respecto a los datos que se representan

La representacin de la realidad que hace una ontolog mezcla la ino a, formacin del esquema con los datos o instancias que este esquema pueda o tener. De hecho, no es necesario que la ontolog tenga datos. En cama bio, en una base de datos hay una clar sima separacin entre esquema y o datos. La informacin del esquema se encuentra almacenada como tuplas o en el diccionario de datos, de esta forma tambin puede ser consultada e al igual que los datos en s [Cul03, Unc04]. Gracias a la carencia de esta separacin en las ontolog es posible la denicin de clases que puedan o as, o ser a la vez instancias, exibilidad que jams permitir un modelo de a a bases de datos relacional (un modelo orientado a objetos puro si que lo permitir Sin embargo esta exibilidad tambin traer consecuencias a a). e a las ontolog puesto que no se podr hacer deducciones sobre aquellas as, a ontolog que utilicen dicha funcionalidad. as En cuanto a la incorporacin de las instancias, una ontolog no sigue o a ningn tipo de patrn ni regla [Cul03]. Es ms, en una ontolog la deniu o a a cin de una nueva instancia no requiere que se cumplan las restricciones o impuestas a la misma, son aadidas sin ms. Contrariamente, el mon a delado de una base de datos requiere el cumplimiento de todos los requerimientos denidos sobre la misma para asegurar la integridad de la informacin (algunos autores consideran que el principal motivo de las o BBDD es la integridad de los datos [Unc04]). De hecho, una tupla, en una BD Relacional, no podr ser incluida en la BD si no cumple toa das las restricciones impuestas a la misma, incluyendo las restricciones semnticas del modelo (CHECK Constraints) adems de las propias del a a Modelo Relacional (claves primarias, ajenas, nulos, etc.). Este hecho proporciona al Sistema de Bases de Datos la presuncin de mundo cerrado o

2.3. ONTOLOG IAS VERSUS BASES DE DATOS

19

(aunque para sus detractores [Unc04] supondr una prdida semntica a e a en la representacin de la informacin importante). Para solventar este o o problema en las ontolog se ha de recurrir a los razonadores, que son as, los que determinarn qu instancias son las que pertenecen o no a la a e ontolog donde estn denidas. Por tanto, cada vez que se desee realizar a a dicha comprobacin, habr que lanzar el razonador sobre la ontolog o a a, cosa que en Bases de Datos no es necesario, dado que la informacin es o consistente desde el principio. Evidentemente los razonadores de ontolog sirven adems para poder as a obtener nueva informacin adems de la que ya se encuentra representao a da. Su analog en el campo de las bases de datos se encontrar en los a a lenguajes de consulta como el SQL. La principal diferencia est en que los a razonadores pueden encontrar esta informacin sobre las ontolog indeo as, pendientemente de que tengan instancias denidas en ellas. Al contrario que las bases de datos, que unicamente obtendrn nueva informacin so a o bre la que ya est almacenada en ella, y por supuesto, ser imposible, a a obtener informacin mixta, es decir, de datos y de partes del esquema a o la vez [Unc04]. Por supuesto, el razonamiento taxonmico es otra de las o partes fundamentales de las ontolog as.
Con respecto a la tcnica de modelado e

Tambin habr que tener en cuenta las diferencias que existen en el e a modelo de base de datos utilizado para su representacin. El modelado o lgico de una BD no representa la misma semntica que el modelado o a conceptual de la misma. La serie de limitaciones, dependiendo del modelo que se trate, proporcionar mayores o menores prdidas semnticas a la a e a representacin. As por ejemplo, un esquema entidad-relacin extendido, o o o un diagrama UML, presenta una informacin como las relaciones es-un o que se pierden al transformarse en el modelo relacional. Sin embargo la mayor de estas transformaciones hacen perder muy poca semntica al a a modelo lgico que representan. o En las ontolog estas prdidas tambin ocurren dependiendo del as, e e lenguaje de representacin utilizado. As no ser lo mismo representar o a una ontolog mediante KIF, RDF, OWL (en cada una de sus modalia dades), LOOM o utilizando cualquier herramienta de generacin de ono tolog que haga su propia representacin de la informacin. Adems, as, o o a cada lenguaje propone sus propias restricciones, provocando prdidas e semnticas a la hora de realizar traducciones entre las mismas. Esta a desventaja no ocurre con las Bases de Datos y concretamente en el Mo-

20

CAP ITULO 2. ONTOLOG IAS Y BASES DE DATOS DIFUSAS

delo Objeto-Relacional que utiliza siempre el mismo lenguaje estndar a para su representacin, el ANSI SQL [fSIIT99]. De cualquier modo es o conveniente destacar que OWL esta tomando cada vez ms fuerza en a el campo de la representacin de ontolog gracias a la aparicin de la o as o Web Semntica, pudiendo llegar a convertirse en estndar en un futuro a a no muy lejano.
Con respecto a la eciencia en la representacin o

En cuanto a la ventaja de las bases de datos dada la gestin tan o eciente de la informacin que hacen, ha provocado que esta tecnolog o a est presente en el entorno de las ontolog ya que no es lgico tener e as, o ingentes cantidades de datos almacenadas en forma de archivo de texto en formato OWL, o RDF. Es decir, las instancias donde se encuentra la informacin almacenada, deber estar almacenadas en un entorno o an de bases de datos y ser entonces la ontolog la que quedar como una a a envoltura que permite acceder a esta informacin. En lugar de acceder o al esquema de la BD, ser la ontolog la que proporcione la informacin a a o para poder formular la consulta. Siguiendo esta idea existen numerosas propuestas que permiten acceder a la informacin que se encuentra en una o BD (principalmente relacional debido a su hegemon en el rea de las a a BBDD), a travs de una ontolog de dominio. A continuacin se presenta e a o un gran nmero de estas propuestas, clasicadas en funcin de cmo es u o o utilizada la ontolog para representar o acceder a dicha informacin. a o 2.3.1. Comunicacin entre Bases de Datos y Ontolog o as

La comunicacin entre Bases de Datos y Ontolog slo es posible si o as o los esquemas de BD coinciden de alguna manera con las ontolog que as representan dicha informacin. Para ello han surgido distintas propuestas o que, segn [Vys06] pueden categorizarse en: u
Generar Descripciones de Ontolog y Esquemas de Bases de Datos as utilizando la misma Tcnica de Modelado e

Se trata de propuestas generadas en esquemas conceptuales que pueden ser vlidos tanto para bases de datos como para la denicin de ona o tolog De esta forma una ontolog podr ser traducida en cualquier as. a, a otro lenguaje. Este es el caso de [Bro06], que usa UML para denir ontolog pero es el menos frecuente, dado que la mayor de las repreas, a

2.3. ONTOLOG IAS VERSUS BASES DE DATOS

21

sentaciones de ontolog utilizan un modelo de representacin espec as o co para ellas, lo mismo que las bases de datos.
Generar el Esquema de Bases de Datos a partir de Ontolog as

En este caso, una ontolog ya existente ser la encargada de generar a a el esquema de bases de datos. Esta opcin provoca, segn algunos auo u tores una gran prdida semntica, dado que gran parte de la informacin e a o inherente en la ontolog se pierde en la traduccin. Existen propuestas a o que llevan a cabo este proceso, como la que se encuentra en [Vys06] o en [Gal05b], en las que se implementan procedimientos que automticaa mente generan esquemas de bases de datos a partir de una ontolog en a OWL. Existen otras propuestas como la de El-Ghalayini et al. en [EG06] que propone la obtencin de un modelo conceptual a partir de una ono tolog a.
Extraer o Representar la Descripcin de la Base de Datos en forma o de Ontolog a

Este ultimo caso, consistente en generar una ontolog a partir del a esquema de bases de datos, es el ms desarrollado en la comunidad, a de hecho existen un gran nmero de propuestas de muy diversa u ndole llevndolo a cabo. Este proceso tambin se conoce como ingenier ina e a versa de bases de datos relacionales a ontolog [Ast04]. En l se peras e mitir el acceso a la informacin, esto es, a las instancias almacenadas a o en las bases de datos, a travs de la ontolog Segn Astrova [Ast05], e a. u existen 3 aproximaciones a la hora de hacer esta Ingenier Inversa: a La basada en un anlisis del esquema relacional. Stojanovid et al. a [Sto02] construyen reglas para mapear los constructores en el modelo de BD con su equivalentes constructores en la ontolog Tama. bin Juric y Sckocir [Jur07] proponen unas tablas de mapeo para e generar la ontolog en OWL a partir de un esquema relacional, a sin embargo esta propuesta luego se enriquece semnticamente con a otras fuentes de informacin. Incluso en la propuesta de Champin o [Cha07] se modela formalmente el modelo relacional, estableciendo las correspondencias con OWL para poder implementar una aplicacin que obtenga las ontolog El programa DataGenie [Gen07] o as. desarrollado por Gennari et al. establece mapeos entre la ontolog a y la BD. Existen propuestas que incluso disean un lenguaje pron pio para declarar estos mapeos, como el Web-PDDL [Dou06], o el

22

CAP ITULO 2. ONTOLOG IAS Y BASES DE DATOS DIFUSAS

lenguaje declarativo R20 de Barrasa et al. [Bar03] que representa las correspondencias entre el modelo de BD relacional y una ontolog a basado en la propuesta previa D2R MAP de Bizer [Biz03]. Por otro lado, hay otras propuestas que suben un nivel de abstraccin, ceno trndose en el modelo conceptual de la base de datos relacional (el a entidad relacin), para obtener la ontolog de dominio [Jea06] coo a rrespondiente en OWL. En [Upa05] y [Xu04] se propone incluso una herramienta propia y reglas de mapeo para obtener la ontolog en a OWL. A este nivel tambin se proponen lenguajes para establecer e las correspondencias entre los dos modelos. As a partir de Diagra mas E/R o UML, se propone un nuevo lenguaje para la denicin o de la ontolog llamado el DLR-DB de Lubyte y Tessaris [Lub07]. a, Los basados en un anlisis de los datos. Construyen la ontolog a a basada en un anlisis del esquema relacional (tambin se analizan a e los datos para aadir semntica). Este es el caso de Astrova [Ast04] n a y Tijerino et al. [Tij05], este ultimo, analiza los contenidos de las tablas para obtener una ontolog A travs de los contenidos, podea. e mos descubrir relaciones entre datos y restricciones y, a partir de ellas, descubrir correspondencias con otras ontolog ya realizadas as o bien desarrollar una nueva propia. Otra aproximacin que conso truye una ontolog en OWL de manera semiautomtica que se cora a responde con el contenido de una BD relacional a partir del anlisis a de formularios en HTML la propuesta por Benslimane et al. [Ben06]. Las basadas en un anlisis de las consultas de los usuarios. Como a la de Kashyap [Kas99], que construye una ontolog basada en un a anlisis del esquema relacional. La ontolog se rena con las cona a sultas de los usuarios. Esta ontolog no crea axiomas. a Sin embargo, algunos autores destacan los problemas que tiene este proceso de ingenier inversa [Jur07]. La construccin de una ontolog a o a basada en un anlisis del esquema relacional, arman, puede estar limia tado por la complecin de la informacin de entrada y la correccin de o o o la misma. Dicha armacin se basa en problemas como la falta de inforo macin en los esquemas, la creacin de esquemas no normalizados, las o o prdidas al traducir de los esquemas conceptuales a los relacionales, o e el uso de nombres inapropiados en la representacin de la informacin. o o No obstante, estos problemas no dejan de ser puntuales, y no suponen la mayor parte de las representaciones de bases de datos relacionales que son susceptibles de ser convertidas en ontolog as.

2.3. ONTOLOG IAS VERSUS BASES DE DATOS

23

Existen otras alternativas en la comunicacin entre BD Relacionales o y Ontolog estas consisten en la utilizacin por parte de esta ultima as, o del modelo relacional para poder ser almacenadas. Estas propuestas olvidan la conceptualizacin o realidad que la ontolog representa y que o a deber analizarse y modelarse a la hora de representar informacin en a o una BD, dado que el inters del uso de la BD unicamente subyace en e la representacin de la meta informacin que constituye la ontolog Es o o a. decir, la base de datos, representa la metaontolog clases, propiedades, a: instancias, restricciones, etc, y su tarea ser la gestin eciente de todas a o las ontolog que en ella se encuentren almacenadas. Estas propuestas as reciben el nombre de modelos OBDB (Ontologies Based DataBases) y se denen como los modelos de bases de datos que permiten almacenar la ontologa y los datos en un modelo de datos comn y unico [Jea06]. u Jean et al. [Jea06] propone un modelo que separa la denicin de la o ontolog y la de las instancias. La propuesta de Roldn-Garc et al. a a a [Rol05] propone una herramienta para almacenar ontolog en OWL en as un BD relacional, mediante el uso de archivos XML como archivos de conguracin que podrn ser almacenados en cualquier RDBMS. Pan et o a al. [Pan03] almacena ontolog en un RDBMS de Access, creando una as tabla para cada clase, o propiedad. La jerarqu de clases se almacena en a el sistema utilizando vistas. Otro tipo de propuestas las representa como por ejemplo Sesame [Bro02, Kam07], se proponen una arquitectura desarrollada para un almacenamiento y consulta eciente de datos en RDF y sobre todo independiente de cualquier sistema de almacenamiento. Este modelo propone una API (en Java), que permite acceder a los procedimientos que gestionan la informacin de la ontolog Hay otras o a. muchas propuestas como esta, como la que proporciona JENA [Pro07] permitiendo la interpretacin tambin de ontolog OWL. o e as 2.3.2. Ontolog como Representacin de Modelos de Bases as o de Datos

Otra tendencia que existe es la de generar ontolog que describen as la conceptualizacin de una base de datos. De esta forma, la informacin o o que representan estas ontolog son metadatos, y desde este punto de as vista, pueden ser consideradas estas ontolog como Ontolog de Alto as as Nivel. A partir de la denicin de la ontolog de alto nivel, la denicin o a o de los esquemas como instancias de la ontolog ser un paso sencillo, a a poniendo de esta manera a disposicin del usuario la perspectiva de una o base de datos como si se tratara de una ontolog Existen tambin un a. e

24

CAP ITULO 2. ONTOLOG IAS Y BASES DE DATOS DIFUSAS

gran numero de propuestas sobre esta idea: LaBorda et al. [PdL05] propone Relational.OWL, una ontolog muy bsica que describe el modelo a a de bases de datos relacional con el n de poder compartir informacin o entre bases de datos heterogneas, utilizando OWL-Full para represene tar dicha ontolog En la misma linea que el anterior, Kupfer et al. a. [Kup06] presenta una ontolog en OWL-Lite que denomina ontolog a a abstracta de bases de datos, la cual permite representar un esquema de bases de datos, mediante la instanciacin de dicha ontolog Trinh et al. o a. [Tri06] tambin propone una ontolog llamada OWL-RDBO que repree a senta en OWL los elementos bsicos de una BD relacional y las relaciones a semnticas entre ellos. Calero et al. [Cal05, Cal06] tambin representa el a e modelo relacional de bases de datos de la manera ms completa hasta la a fecha, dado que describe ntegramente en el ANSI SQL 2003 [fSIIT03]. Sin embargo, utilizan una representacin en UML para describirlo, juno to con descripciones en OCL para completar su denicin. En cuanto a o propuestas software concretas existe Ontobase [Yab07], una herramienta que representa los contenidos de una base de datos automticamente, a a travs de la herramienta de representacin de ontolog de Protg. e o as e e En denitiva, podemos considerar entonces una Base de Datos como una ontolog puesto que todas las carencias que pudiera presentar son a, solventables de una u otra manera. Esta propuesta, permite la denicin o de una BD a base de la instanciacin de la ontolog de alto nivel que o a representa la informacin del modelo de bases de datos relacional. Si o se trata dicha informacin tal como es por naturaleza, esto es, como o metadatos, entonces la instanciacin de ciertas clases de dicha ontolog o a deber dar lugar a unas nuevas clases, que representan la informacin del a o esquema de la BD que es en ultima instancia lo que se desea representar. Por ejemplo, cualquier propuesta de ontolog que represente el modelo a relacional de bases de datos, contar con una denicin de Tabla no como a o clase, sino como metaclase, dado que una tabla es la representacin de la o estructura de la informacin. De esta forma, la instancia de la clase Tabla, o por ejemplo, con el concepto de Personas dar lugar a una nueva clase, a la clase Personas, que ser en ultima instancia, la que albergar los a a datos o informacin al respecto de la realidad que representa a travs de o e sus instancias (se corresponder con las tuplas en el modelo relacional). a En la gura 2.3 se puede visualizar este ejemplo, donde el fondo de color destaca la relacin entre las metaclases y las instancias del esquema de o BD generadas. Las principales motivaciones que llevan al modelado del modelo de

2.3. ONTOLOG IAS VERSUS BASES DE DATOS

25

CLASES Tables (metaclase ) Columnas Tipos de datos Esquemas ...

INSTANCIAS

CLASES

INSTANCIAS Juan Pedro


...

Personas Cuentas ...

Personas Cuentas ...

Nombre Edad ...

(ONTOLOGIA DEREPRESENTACION DELMODELO RELACIONAL)

(ONTOLOGIA DELESQUEMA DE BASES DE DATOS)

Figura 2.3: Ejemplo de relacin entre las Metaclases y las Instancias en la o representacin mediante ontolog de un esquema de BD o as

26

CAP ITULO 2. ONTOLOG IAS Y BASES DE DATOS DIFUSAS

bases de datos como una ontolog son las siguientes: a Simplica la visin de una base de datos, dado que presentan el o modelo alejado de una implementacin concreta. o Aporta otra posibilidad de acceso a la informacin almacenada en o una base de datos, adems de la que da el propio RDBMS o las a aplicaciones que la utilicen. Hace visible la estructura de la informacin de una base de datos, o a travs de una representacin estndar como puede ser OWL o e o a RDF. Esto puede resultar util en algunos entornos como la Web Semntica, donde el acceso al contenido semntico de las bases de a a datos es escaso. Permite incluir en la Web Semntica la informacin de los esquemas, a o anotar pginas web dinmicas o sistemas de acceso a BDs. a a Es fcil mantener actualizados los cambios que se producen en la a estructura de una base de datos, puesto que la generacin de la o ontolog es automtica. a a Permite la comunicacin y comparticin de informacin entre bases o o o de datos heterogneas, dado que la representacin de la informacin e o o es independiente de cualquier RDBMS. Permite el establecimiento de relaciones entre diferentes modelos de representacin de datos adems de esquemas relacionales, esto es: o a orientados a objetos, ontolog estructuras XML, esquemas RDFS, as, etc. Permite la gestin homognea de bases de datos distribuidas. o e Enriquece la representacin de la informacin, permitiendo a la ono o tolog generada de Bases de datos relacionarse con otro tipo de a ontolog de dominio, ms ricas en semntica (a travs de tcnias a a e e cas de mapeo o alineamiento), para mejorar as la calidad de la informacin representada. o Permiten representar tipos de datos complejos o diferentes tipos de datos de manera sencilla para el usuario, cuya representacin y o gestin a travs de un RDBMS ser mucho mas costoso para su o e a interpretacin y manipulacin por parte de usuario (dado la estruco o tura de representacin de datos que tienen estos sistemas). o

2.3. ONTOLOG IAS VERSUS BASES DE DATOS

27

2.3.3.

Integracin de Informacin o o

En la actualidad nos encontramos con un gran nmero de ontolog u as que describen cualquier concepto de la realidad. Los contenidos de las ontolog var desde la descripcin de un simple dominio, hasta la as an o descripcin de tareas o metadatos. A su vez, existen ontolog que o as representan la misma realidad o parte de ella. Es ms incluso existen a otros mecanismos de representacin de informacin alternativos a las ono o tolog tambin accesibles y utilizados por los usuarios. Ante toda esta as e cantidad de informacin se impone la necesidad de acceder a la misma, o de forma unicada y transparente, para lo que requiere la utilizacin de o mecanismos de integracin de estructuras de informacin. o o Se han desarrollado un gran nmero de sistemas para permitir inteu grar una amplia variedad de datos provenientes de muy diversas fuentes. La integracin de Ontolog descrita en [Cho06, Ham04, Noy04], es una o as, de las operaciones ms estudiadas, desarrolladas e implementadas dado a el gran nmero de representaciones de este tipo que existen. Sin embargo u el campo de las ontolog no es el unico que necesita utilizar sistemas as de integracin de informacin. Desde que la Web Semntica permite el o o a acceso a fuentes de informacin de muy diversa o ndole (dicha informacin se encuentra representada en diversos formatos, incluso en diferentes o lenguajes) la necesidad de sistemas de integracin cada vez ms sostio a cados se hace ms acuciante. Algunos ejemplos de los diferentes tipos a de esquemas que nos podemos encontrar son: esquemas XML, ontolog as (RDF, OWL), esquemas relacionales (SQL), esquemas orientados a objetos (UML), folksonomias, tesauros, etc. El proceso de integracin de informacin no es simple. George [Geo05] o o resume los diferentes tipos de heterogeneidad que nos podemos encontrar en los esquemas y las dimensiones de integracin, que pueden establecerse o en tres: Integracin del Sistema, representa la heterogeneidad en la plataforo ma donde se representa la informacin, o Integracin del Esquema, representa la heterogeneidad entre esqueo mas. En [Geo05] se identican cinco tareas en este proceso: a) preintegracin, que es cuando se traduce el esquema en forma de moo delo de datos, b) comparacin, que es cuando se identican los cono ictos semnticos, c) ajuste: hace los conictos compatibles para a combinarlos mediante una representacin similar, d) combinacin: o o integra los esquemas, e) reestructuracin: rena el esquema o

28

CAP ITULO 2. ONTOLOG IAS Y BASES DE DATOS DIFUSAS

Integracin Semntica, resuelve las diferencias entre la representacin o a o de los datos conceptuales mediante la determinacin de equivaleno cias entre los constructores del esquema. Aunque la mayor de las aproximaciones para integrar informacin a o estn basadas en tcnicas de integracin de esquemas que provienen de a e o las disciplinas de bases de datos, existen ciertas diferencias entre las ontolog y las bases de datos, como hemos visto en la seccin anterior y as o destacan Kalfoglou y Schorlemmer [Kal03]. Las dos aproximaciones ms a comunes en el proceso de integracin de esquemas son: Vista Local y Vista o Global [Gog05]. La aproximacin de Vista Global consiste en establecer o una representacin de dominio genrica (un esquema global) donde los o e esquemas locales se mapeen con el global (esta tcnica es la ms utilizada e a en BBDD [Apa05]). La aproximacin de Vista Local implica establecer o correspondencias directas entre los diferentes esquemas locales. Existen varias propuestas para establecer la correspondencia entre esquemas y ontolog Por ejemplo, MAPONTO [An04] es una herraas. mienta que utiliza lgica para establecer mapeos entre ontolog y BDs, o as COMA++ [Aum05] herramienta que resuelve los problemas de correspondencias entre los esquemas y las ontolog escritas en diferentes as lenguajes como SQL, W3C XSD u OWL. GLUE [Doa02] u Ontomap [Gal05a] son otros ejemplos de herramientas usadas para la bsqueda de u correspondencias entre esquemas automticas. a En este trabajo, se intentar establecer un marco idneo para ina o tegrar esquemas de bases de datos difusas con el resto de estructuras heterogneas que pueden obtenerse a travs de la Web Semntica. Se e e a han identicado dos dimensiones en este marco: La integracin del sistema, que requerir la integracin de esqueo a o c , MySQL c , Postmas a partir de SGBDs diferentes como Oracle greSQL c , etc. Cada sistema tendr sus propias caracter a sticas que debern ser analizadas para que esta integracin pueda llevarse a a o cabo. La integracin del esquema que permite integrar esquemas heteroo gneos. Estos esquemas pueden representarse utilizando diferentes e lenguajes como SQL, XML u OWL. Esta tarea requiere que sean resueltos algunos conictos, como: conictos de tipo de datos, de escalado de datos, de prdida de datos, etc. [Hai05] e Dadas las caracter sticas espec cas de la ultima dimensin, la inte o gracin semntica ser estudiada una vez que las dos dimensiones previas o a a

2.4. ONTOLOG IAS PREVIAS

29

sean desarrolladas. Cualquiera de las dos aproximaciones, Vista Global o Vista Local, pueden ser vlidas para establecer correspondencias entre a diferentes esquemas. Sin embargo, dada la naturaleza de la informacin o con la que se trabaja, lo ms usual es que se utilice mayoritariamente la a de Vista Local. La representacin de esquemas de BD Difusas en forma de ontolog o a puede establecer un marco idneo donde cualquier esquema local pueo da establecer la correspondencia con dicho esquema que permite la representacin de informacin difusa. Dicha representacin de esquemas o o o ser detallada en los cap a tulos siguientes.

2.4.

Ontolog Previas as

En este apartado se presentan aquellas dos ontolog en las que as est basado este trabajo de investigacin. A partir de ellas y tal y coa o mo marcan las metodolog de generacin de ontolog (realizando una as o as operacin de mezcla y de alineamiento de ontolog o as) se formar una a nueva, objeto de esta tesis. 2.4.1. Ontolog de Tipos de Datos a

Los tipos de datos, tambin denominados tipos base, tipos primitivos e o tipos built-in, han sido descritos por todos los lenguajes de programacin, o sistemas de representacin de datos, que requieren el almaceo o namiento o manipulacin de los mismos. A partir de ellos, se formarn o a otros tipos de datos ms complejos y con mayor capacidad expresiva. a Sin embargo si requerimos la representacin de los tipos de datos base, o en teor simplemente tendr a, amos que irnos a cualquier especicacin de o lenguaje que los utilizara, y obtendr amos un listado con los nombres que tienen asignados y sus caracter sticas principales. El problema viene dado porque cada representacin diere en los tipos de datos que implementa, o incluso algunos nombres son diferentes, como es el caso de lenguajes de programacin como C o Pascal, o SGBDs como Oracle c o MySQL c . o El ANSI SQL hace una distincin de los tipos de datos predenidos, o describiendo cada uno de ellos de manera ligada a la representacin de o datos que se hace en el Modelo Relacional [fSIIT99, fSIIT03]. Pardede et al. [Par05] toma la ultima revisin del SQL , el ANSI SQL 2003 (SQL4) o y hace una clasicacin de los tipos de datos predenidos tal y como se o puede ver en la gura 2.4.

30

CAP ITULO 2. ONTOLOG IAS Y BASES DE DATOS DIFUSAS

SQL Data Types Constructed Type Atomic Composite User-Defined Types Distinct Collecction Array Interval Date Exact Approximate Time Multiset DateTime T.Stamp. Structured

Ref
Predefined Types

Row

Numeric String Boolean BIT BLOB Charact.

Fixed

Varying

Float

Real

Double Precision

Fixed

Varying CLOB.

BigInt SmallInt

Integer

Figura 2.4: Clasicacin de los tipos de datos expresados en SQL4 dada por o Pardede [Par05]

2.4. ONTOLOG IAS PREVIAS

31

Esta clasicacin ser utilizada en este trabajo de investigacin como o a o parte de la ontolog desarrollada para formar una ontolog de reprea a sentacin del conocimiento difuso. o 2.4.2. Ontolog de Descripcin del SQL2003 a o

Siguiendo con el Modelo de Representacin de Datos Relacional, y dao do que el ANSI 2003 [fSIIT03] propone la ultima revisin del estndar, o a Calero et al. en [Cal05, Cal06] propone una ontolog que revisa la especia, cacin de este estndar, utilizando el lenguaje de representacin UML o a o y aadiendo las restricciones necesarias que plantea el modelo utilizando n el lenguaje de restricciones OCL. El diagrama de clases en UML que se presenta en la gura 2.5 muestra la parte de la ontolog de Calero et al. a [Cal05, Cal06] utilizada en este trabajo de investigacin: o La ontolog de Calero et al. [Cal05, Cal06] describe todas las esa tructuras objeto relacionales que presenta el SQL4, aunque no detalla los tipos base predenidos y sin embargo, si que lo hace con los tipos de datos complejos y el resto de estructuras que representa el Modelo Objeto-Relacional.

32

CAP ITULO 2. ONTOLOG IAS Y BASES DE DATOS DIFUSAS


Catalog name : string SQLSchema name : string
1 1..n

1..n

constraints

Domain_Constraint search_condition:string Domain default_option: enum


* 0..1

SchemaObject objectName : string

Constraint isDeferrable :Bool initialConstraintMode :[ effered,inmediate] d

defines

Table isInsertableInto :bool isReferenceable :bool

DerivedTable query_expression: STring is_updatable : Boolean is_simply_ updatable :boolean

View check_option: [cascade, local, none]

TransientTable BaseTable * has columns xor 1..*

xor selfReprences

StructuredType TypedTable *1 (from DataTypes) 0..1

1 1 Constraints 1..*

Asertion search_condition:string

Domain_ hasTypeOf _DataType

Column name: string defaultOption :[user, current_user, current_role, session_user, system_user, current_path, <literal>, <date time value>,< implicy typed value>] ordinalPosition :int isUpadatable :bool isSelfReferencing bool : nullabilityCharacteristic :[not nullable , possibly nullable ] IdentityColumn startvalue :int increment: int maximunvalue :int minimunvalue int : cycle_option: Boolean

TableConstraint

TableCheckConstraint search_condition:string

ReferentialConstraint updateRule [cascade, set_null, set_default, : restrict, no_action] deleteRule : [cascade, set_null, set_default, restrict, no_action] matchOption :[mach full, match partial]
1..n

hasDataType

References

* References 1..n

GeneratedColumn generation_expression: String

UniqueColumn ordinalposition :i nteger 1..n UniqueColumnList


1

UniqueConstraint
1..n

DataTypes
0..1

PrimaryKey

Predefined (Predefined DATA TYPES)

ConstructedType (Constructed Types, describes in Calero et al. work)

UserDefinedType (UserDefinedType , describes in Calero et al. work)

Figura 2.5: Parte de la Ontolog en UML dada por Calero et al. [Cal06] del a SQL4

Cap tulo 3

El problema de la Representacin de Datos o Heterogneos en Bases de e Datos Difusas. Arquitectura de un SGBDR Multipropsito o
3.1. Introduccin o

En este cap tulo se hace un repaso por las diferentes extensiones al modelo de bases de datos relacional que se han propuesto para representar informacin difusa. Dicho repaso culmina con la descripcin en o o profundidad de la extensin difusa al modelo de base de datos relacional o desarrollado por Medina et al. [Med95], denominado GEFRED. Tambin e se describen a continuacin las extensiones realizadas a GEFRED que o permiten manipular estructuras lgicas para realizar deducciones por un o lado, y operaciones de miner de datos sobre un SGBD Difuso por otro. a Estas tres extensiones al modelo de bases de datos relacional clsico, fora man la arquitectura bsica sobre la que se fundamenta este trabajo de a investigacin. o Cada una de las extensiones descritas presentar en primer lugar el a modelo terico sobre el que est basada la arquitectura propuesta. A o a continuacin se presentan los datos que puede representar el modelo y la o estructura necesaria para que dichos datos puedan ser representados (extensin del catlogo del sistema). Y por ultimo, la extensin al lenguaje o a o
33

34

CAP ITULO 3. SERVIDOR MULTIPROPOSITO

de consulta SQL que permitir gestionar la informacin almacenada en a o el SGBD. Es importante destacar que la arquitectura propuesta, FIRST (basada en GEFRED, que permite la representacin de informacin impreo o cisa), sirve como base para la implementacin de las otras dos arquiteco turas desarrolladas, que incluirn, entre sus funcionalidades particulares, a el manejo de datos difusos. Finalmente, se propone como nueva aportacin una ultima extensin o o al SGBD que permita la combinacin de las tareas de gestin de miner o o a de datos y representacin de informacin imprecisa y lgica (las tres exo o o tensiones al SGBD anteriores) a la vez, para aumentar as el potencial , de las consultas. Esta propuesta dene la arquitectura de un Servidor Unicado Multipropsito que permite resolver consultas complejas sobre o una base de datos que soporta todos los tipos de datos descritos anteriormente. Para ello, extiende la Base de Metaconocimiento de tal forma que sea lo sucientemente genrica para permitir la inclusin de las nuevas e o arquitecturas y, por tanto, aumentar la escalabilidad del sistema. Con el Servidor Multipropsito propuesto, tratamos de solucionar el probleo ma de incompatibilidades que existen entre las extensiones anteriormente descritas. Adems, se presenta un ejemplo de cmo funcionar esta proa o a puesta, utilizando una consulta compleja, y qu ventajas e inconvenientes e presenta.

3.2.

Representacin de Informacin Imprecisa en el o o Modelo Relacional

Se han propuesto muchas extensiones al modelo relacional de bases de datos desde que Zadeh ([Zad65]) introdujera el concepto de conjunto difuso, que permiti representar datos difusos. Existen en la literatura o actual, numerosas recopilaciones donde se resumen las diferentes extensiones difusas realizadas al modelo relacional, entre las que destacamos los libros de Ma [Ma05, Ma06], y los trabajos de Chen [Che99], Petri [Pet96], Medina et al. [Med94b] o Galindo et al. [Gal06]. 3.2.1. Antecedentes del Modelo Relacional Difuso

Para la representacin y el tratamiento de informacin imprecisa en o o el mbito de las Bases de Datos Relacionales, se han presentado varios a modelos a lo largo de estos aos. Entre ellos, destacan: n

3.3. EXTENSIONES AL MODELO RELACIONAL

35

Aproximaciones que no emplean la lgica difusa, y que se basan en o el modelo original de Codd [Cod79, Cod86, Cod87, Cod90]. Aproximaciones que usan distribuciones de posibilidad para representar la informacin difusa a nivel de tuplas, como la de Raju and o Majumdar [Raj88]. Este modelo tambin se ha denominado Modelo e Bsico de Bases de Datos. a Aproximaciones que utilizan las relaciones de similitud para representar la informacin difusa, son aquellos desarrollados por Buckles o y Petri [Buc82b, Buc82a], Shenoi y Melton [She89] y Rundensteiner et al. [Run89]. Aproximaciones que usan distribuciones de posibilidad para representar la informacin difusa a nivel de atributo. Algunas de estas o son las de Prade and Testemale [Pra84b, Pra84a, Pra87b, Pra87a], Umano y Fukami [Fuk79, Uma80, Uma82b, Uma82a, Uma94] o Zemankova y Kaendel [Zem84, Zem85]. Aproximaciones mixtas que combinan diferentes tcnicas para ree presentar la informacin imprecisa y conseguir representar el mxio a mo de informacin posible. Estas aproximaciones se basan en la o propuesta de un modelo difuso que combina distribuciones de posibilidad y relaciones de similitud a la vez, como la Base de Datos Difusa Extendida Basada en Posibilidad propuesta en Ma et al. [Ma00], Rundensteiner et al. [Run89] y Chen et al. [Che92], o la extensin hecha por Medina et al. en [Med94b, Med94a] denominada o GEFRED. El Modelo propuesto por Medina et al. en [Med94b, Med94a] se describe con mayor detalle en los apartados siguientes, dado que ha sido utilizado como base de este trabajo de investigacin. o

3.3.

Extensiones al Modelo Relacional para Representar Informacin Imprecisa o

El modelo GEFRED establece las bases de la representacin de datos o difusos en el modelo relacional. A partir del mismo, otras extensiones realizadas ya incluirn la gestin de datos difusos como una parte ms a o a del sistema. Esta frmula la utilizan dos extensiones concretas: una que o

36

CAP ITULO 3. SERVIDOR MULTIPROPOSITO

permite representar informacin lgico-deductiva y otra que realiza opeo o raciones de miner de datos (bsqueda de reglas de asociacin, operaa u o ciones de clustering, etc.) ambas utilizando datos difusos. A continuacin se presentan muy brevemente dichas extensiones, puo dindose consultar con ms detalle en el Anexo B o en las fuentes biblioe a grcas referenciadas. a 3.3.1. Modelo Generalizado para Bases de Datos Relacionales Difusas (GEFRED)

El modelo GEFRED de Medina et al. [Med94a, Med94b, Med95] surge como una integracin de algunas tendencias (vanse trabajos de Prade y o e Testemale [Pra84b, Pra84a, Pra87b, Pra87a], Umano y Fukami [Fuk79, Uma80, Uma82b, Uma82a, Uma94], Bucles y Petri [Buc82b, Buc82a, Buc84, Buc89], Zemankova y Kaendel [Zem84, Zem85]) para resolver el problema de la representacin y consulta de informacin imprecisa en el o o seno del modelo relacional. Dicho modelo dene formalmente una Base de Datos Relacional Difusa (BDD) a travs de las deniciones de los siguientes conceptos: e Dominio Difuso Generalizado: se trata de una extensin del cono cepto de dominio relacional que ampl el rango de valores que un a atributo puede tomar. Entre algunos de estos valores se encuentran: el valor nulo, el valor no aplicable, el valor desconocido, un conjunto de asignaciones escalares o numricas posibles, distribuciones de e posibilidad construidas sobre dominios escalares o numricos, etc. e Relacin Difusa Generalizada: dene una relacin incluyendo el o o concepto de Dominio Difuso Generalizado. Comparadores Difusos Generalizados: extienden el concepto de comparador para incluir las comparaciones entre valores que existen en el Dominio Difuso Generalizado. Operaciones de BBDD: proyeccin y seleccin difusa. o o Las deniciones formales de estos conceptos estn detalladas en la a seccin B.1.1. o
Arquitectura FIRST

A partir de esta denicin formal se propone una representacin cono o creta de la informacin imprecisa, la cual se ha denominado FIRST (deso

3.3. EXTENSIONES AL MODELO RELACIONAL

37

crita en detalle en la seccin B.1.2). Esta representacin plantea una o o estructura de los datos difusos denidos en el Dominio Difuso Generalizado, discriminando entre datos imprecisos sobre un referencial: Ordenado: para ello se establece un mecanismo para representar las distribuciones de posibilidad utilizando aproximaciones a las mismas a travs de representaciones trapezoidales (vase gura B.1 del e e Anexo B) y etiquetas ling usticas. No ordenado: son datos sobre los que se denir una relacin de sea o mejanza para representar su dominio subyacente. Las distribuciones de posibilidad en este tipo de dato denen asignando un grado de pertenencia de cada valor al conjunto de valores del atributo. La gura B.4 del Anexo B muestra los valores que puede tomar dicha representacin. o Adems se permite representar los valores especiales Null, Unknown a y Undened. Resumiendo, en FIRST se denen expl citamente tres tipos de atributos para representar el Dominio Generalizado Difuso: Tipo Difuso 1 : representa datos almacenados de forma precisa que pueden ser consultados de forma imprecisa. Los tipos utilizados son los tipos base propios del SGBDR que se utilice. Tipo Difuso 2 : representa datos imprecisos pertenecientes a un dominio difuso construido sobre un referencial ordenado y que pueden ser consultados de forma imprecisa. Para ello se necesita una representacin especial de estos datos, la cual, utiliza estructuras que o combinan los tipos de datos base proporcionados por el SGBDR. En la tabla B.1 del Anexo B se muestra la estructura necesaria que han de seguir las representaciones de valores: Null, Undened, Unknown, etiquetas ling usticas, valores intervalares, aproximados o triangulares, trapezoidales o clsicos. a Tipo Difuso 3 : representa datos imprecisos pertenecientes a un dominio difuso construido sobre un referencial discreto no ordenado, sobre el que se dene una relacin de similitud y que pueden ser o consultados de forma imprecisa. Para ello, se representan las estructuras de datos: Null, Undened, Unknown, valores simples, y distribuciones de posibilidad descritas en detalle en la tabla B.2 del Anexo B.

38

CAP ITULO 3. SERVIDOR MULTIPROPOSITO

Adems de la representacin de la informacin, se llev a cabo la a o o o implementacin de una serie de comparadores difusos para gestionar este o tipo de informacin y se aadi el concepto de Grado de Cumplimiento o n o de una Condicin o Umbral, para completar la operacin de seleccin. o o o
FMB

Para poder llevar a cabo la representacin de la informacin impreo o cisa, tal y como describe FIRST, en un SGBDR concreto, se propone la creacin de la Base de Metaconocimiento Difuso (FMB). La FMB esta o formada por las relaciones donde se incluye toda la informacin acerca o de la estructura de los dominios y los valores que puede tomar cada atributo difuso. Estas relaciones, descritas con detalle en la seccin B.1.3, se o encuentran brevemente descritas a continuacin: o Fuzzy Col List: contiene los atributos difusos denidos en la BD. Fuzzy Object List: contiene todos los objetos difusos de la BD (por ejemplo, todas las etiquetas denidas en la BDD). Fuzzy Label Def : contiene las distribuciones de posibilidad trapezoidales asociadas a etiquetas ling usticas. Fuzzy Approx Much: contiene los parmetros usados para la coma paracin de valores difusos contenidos en columnas de los Tipos o Difusos 1 y 2. Fuzzy Nearness Def : contiene la relacin de semejanza entre cada o par de valores de un dominio de TD 3. Fuzzy Compatible Col : contiene aquellos Tipo Difuso 3 que comparten dominio. Fuzzy Qualiers Def : contiene el umbral m nimo de satisfaccin o para cada cualicador denido sobre una etiqueta ling ustica. Cada una de estas relaciones contiene una serie de atributos y restricciones que determinan su funcionamiento. En la gura B.6 se puede observar el comportamiento de las mismas de modo grco. a

3.3. EXTENSIONES AL MODELO RELACIONAL FSQL

39

El lenguaje FSQL (Fuzzy SQL) aparece junto con la arquitectura FIRST, para extender el lenguaje que permite gestionar la informacin o imprecisa en un SGBD que soporta dicha arquitectura. Este lenguaje incluye las extensiones del DDL y el DML como se describe en el apartado B.1.4. Adems en la tabla B.3 se encuentra una referencia a todas las a instrucciones extendidas que aporta este lenguaje. Toda la arquitectura FIRST se implement en un SGBDR concreto, o Oracle c utilizando el lenguaje de programacin incrustado PL/SQL, o permitiendo as que la denicin de los operadores y el intrprete del o e lenguaje FSQL (Fuzzy SQL) fuera una parte ms del sistema de reprea sentacin de datos. o 3.3.2. Representacin de Informacin Lgica sobre BDD o o o

Las Bases de Datos Relacionales Lgico Deductivas permiten extraer o informacin a partir de los datos que se encuentran en una BD cualquiera o o representar informacin lgica. Esta funcionalidad se lleva a cabo a o o travs del uso de relaciones especiales (extensivas e intensivas), reglas e lgicas y de motores lgicos (Prolog, Datalog, etc.) que permiten la deo o duccin de informacin. o o El tratamiento de la informacin difusa en una BD Lgica requiere, en o o primer lugar la representacin de dicha informacin difusa en un SGBD. o o Para ello que se utiliza GEFRED como modelo de datos difuso. A continuacin se extiende GEFRED para representar algunos de los conceptos o fundamentales del modelo lgico-deductivo, apareciendo as FREDDI o , [Pon96, Med97]. Dicha extensin, que se encuentra detallada en la seccin o o B.2, se describe brevemente a continuacin: o Relacin Extensiva Difusa, es una relacin Difusa Generalizada o o desde el punto de vista del modelo GEFRED (denicin formal B.7 o localizada en la seccin B.2). o Relacin Intensiva Difusa, que consta de una cabecera que describe o una Relacin Difusa Generalizada, pero el cuerpo ser un conjunto o a de reglas orientadas a la deduccin con datos difusos, que permiten o el clculo de la instancia de la relacin (vase denicin B.8). a o e o Regla Generalizada con Grado de Acoplamiento, ser denida para a poder generar la instancia de las relaciones intensivas difusas. Su

40

CAP ITULO 3. SERVIDOR MULTIPROPOSITO

denicin esta descrita en el apartado B.2, y se corresponde con la o B.6.


Arquitectura FREDDI Extendida

Al igual que pasaba en GEFRED con FIRST, FREDDI [Pon96, Med97] se propone como arquitectura donde se unica el sistema de consulta deductivo con el sistema de consulta difuso ambos construidos sobre un SGBDR. FREDDI propone las siguientes estructuras (descritas con ms detalle a en B.2.2) para representar la informacin lgico-deductiva en un SGBDR: o o Relacin Intensiva: es una relacin normal pero su instancia se calo o cula en funcin de los predicados que intervienen en el cuerpo de o reglas cuando se consulta, o bien es una relacin temporal construo ida en el momento de resolver la consulta. Reglas Lgicas: se representan en funcin de sus predicados y vario o ables, almacenndose en orden y con el grado especicado. a Motor de Inferencia: ser un mdulo, bien interno al SGBDR (si a o este lo permite) o bien externo, implementado en un lenguaje de programacin lgico. o o Las Relaciones Extensivas carecen de representacin especial dado o que se corresponder con las Relaciones Difusas Generalizadas anterian ormente descritas en FIRST.
Base de Metaconocimiento Deductivo. Base de Reglas (RB)

La representacin de la informacin deductiva en una Base de Datos o o Difusa necesitar estar descrita por dos bases de metaconocimiento: a FMB, anteriormente descrita, representa la informacin difusa. o RB o Base de Reglas, proporciona la representacin de las relaciones o intensivas y las Reglas Generalizadas con Grado de Acoplamiento Difuso. La Base de Reglas est compuesta por un conjunto de relaciones que a se describen con detalle en la seccin B.2.3. Sus funciones, atributos, o y restricciones se ilustran en la gura B.7 del Anexo B y se listan a continuacin de forma muy resumida: o

3.3. EXTENSIONES AL MODELO RELACIONAL

41

Intensional Table Description: almacena los predicados intensivos. Rule Description: describe cada una de las reglas como una secuencia de predicados extensivos e intensivos y comparaciones concatenados con el operador de conjuncin. o Predicate Description: describe el orden de las variables en cada uno de los predicados. Comparision Description: describe las condiciones, tipo especial de predicados, que slo poseen dos variables y su tipo es uno de los o siguientes: =, =, , <, , >, FEQ, FGT, FGEQ, FLT, FLEQ, MGT, MLT, NFEQ, NFGT, NFGEQ, NFLT, NFLEQ, NMGT y NMLT. La arquitectura FREDDI Extendida es la que permite exibilizar la representacin de las reglas difusas y aumentar el nmero de comparao u dores difusos tal y como se ve en la gura B.7del Anexo B.
DFSQL

Al igual que ocurre con FSQL, el DFSQL (Deductive FSQL) es el lenguaje de consulta extendido que aade a los predicados descritos en n FSQL aquellos que permiten realizar operaciones deductivas. Se aaden n as sentencias de denicin de datos, como reglas lgicas o relaciones in o o tensivas, y se modican sentencias de manipulacin de datos como la SEo LECT para realizar consultas deductivas. En la seccin B.2.4 del Anexo o B se puede encontrar un resumen de las mismas y referencias a una informacin mas detallada de este lenguaje. o 3.3.3. Ampliacin de GEFRED para la Miner de Datos o a

Antes de realizar tareas de miner de datos, se requiere resolver el a problema de gestionar informacin, cualquiera que sea su forma. Carraso co et al. [Car03a, Car03b] propone la implementacin de un modelo de o BDRD sobre un SGBDR en el que el tratamiento difuso de la diversidad de dominios susceptibles de ser tratados por un sistema de miner a de datos sea resuelto. Para ello se extiende GEFRED, y a continuacin o la arquitectura o interfaz (FIRST) que permite su representacin en el o SGBDR. Una vez representada la informacin, las operaciones de miner o a de datos se describen a travs de una nueva extensin a la arquitectura e o que se ha denominado DmFIRST y que ser descrita ms adelante. a a

42 GEFRED*

CAP ITULO 3. SERVIDOR MULTIPROPOSITO

Para la gestin de la informacin difusa, se utilizar la propuesta de o o a GEFRED, sin embargo, dadas las caracter sticas del modelo de Miner a de Datos se necesita su redenicin para permitir que el concepto de o dominio difuso tenga un sentido ms universal es decir, no restringido a a un dominio concreto, y permitir representar tipos de datos complejos (formados por ms de un atributo clsico). Esta redenicin, que se ha a a o denominado GEFRED* (vase seccin B.3 del Anexo B para mayor dee o talle), viene dada ante la necesidad de realizar tareas de miner de datos a sobre una BDD que requiere operar con tipos de datos ms complejos a que los presentados hasta el momento. Se redenen entonces los conceptos del modelo terico GEFRED (seco cin B.3) para gestionar un nuevo concepto de dominio: el Dominio Difuo so Generalizado Complejo (Denicin B.11, seccin B.3). En este dominio o o se describe cmo cualquier atributo denido sobre el mismo podr tomar o a cualquier valor simple, excluyente o distribucin de posibilidad. o Tambin se encontraran nuevas deniciones para: e Relacin Difusa Generalizada Compleja, Denicin B.12. o o Comparador Difuso Generalizo Complejo, Denicin B.14. o Proyeccin Difusa Generalizada Compleja, Denicin B.15. o o Seleccin Difusa Generalizada Compleja, Denicin B.16. o o Todas estas, se diferencian de las anteriores descritas en GEFRED en el nuevo dominio sobre el que sus datos son denidos.
FIRST*

Carrasco et al. [Car03a, Car03b] tambin proponen FIRST* como una e interfaz que proporciona el acceso a mltiples tipos de datos, denidos u en el modelo GEFRED*, con el objeto de realizar tareas de miner de a datos sobre un SGBDR. Este interfaz se encuentra descrito en el apartado B.3.2 y extiende el modelo FIRST anteriormente descrito. Entre las extensiones que realiza destaca: La inclusin del Tipo Difuso 4 representa a la serie de atributos o clsicos que determinan un Dominio Difuso Generalizado Complea jo y por tanto pueden ser consultados de forma imprecisa. Es un

3.3. EXTENSIONES AL MODELO RELACIONAL

43

supertipo, estar formado por los atributos de datos y si es necea sario, por los atributos de metadatos (que describen el signicado los datos representados en los atributos de datos). Esta arquitectura implementa los Comparadores Difusos Generalizados Complejos, los cuales coneren al usuario la posibilidad de denir sus propios comparadores difusos en funcin del Tipo Difuso o 4 denido. No obstante, esta propuesta no excluye el resto de estructuras descritas en FIRST, por lo que seguirn existiendo los Tipos Difusos 1, 2 y 3 a y el resto de estructuras anteriormente denidas.
FMB*

Tal y como ocurr con la FMB, la FMB* permite describir la ina formacin sobre la estructura de los dominios y los valores que puede o tomar cualquier elemento descrito en GEFRED*. Dado que GEFRED* extiende GEFRED, en la FMB* se incluyen todas las estructuras que ya formaban parte de la base de Metaconocimiento FMB, aadiendo o n modicando aquellas que posibilitan la denicin y tratamiento del Tipo o Difuso 4 (vase con ms detalle en seccin B.3.3 y en gura B.8). Conce a o retamente: Fuzzy Col List: se modica para contemplar el Tipo Difuso 4. Fuzzy Object List: se modica para almacenar los objetos relacionados con el Tipo Difuso 4. DmFSQL Col Col : lista de aquellos atributos de la tabla de la base de datos que forman parte de un dominio difuso generalizado complejo. DmFSQL Label Denition: contiene informacin sobre las etiquetas o ling usticas denidas para los tipos difusos 4. DMFSQL Functions: dene la referencia de las funciones tanto que implementan a los distintos comparadores difusos de los atributos difusos de tipo 4, como las funciones de representacin de los miso mos. DmFSQL Functions Col : contiene la denicin para cada atributo o difuso tipo 4.

44

CAP ITULO 3. SERVIDOR MULTIPROPOSITO

DmFSQL Col Par : contiene la informacin de los parmetros adio a cionales para construir las llamadas a funciones que implica cada tipo difuso 4 respecto a cada comparador.
Miner de Datos en FIRST*: DMFIRST a

En Carrasco et al. [Car03a, Car03b] tambin se propone la implementae cin de una interfaz que permita utilizar FIRST* como base a la aplio cacin de distintas tcnicas de Miner de Datos en el marco del modelo o e a de BDRD ya implementado. Esta interfaz se denomina DMFIRST y permite realizar las operaciones de clustering, caracterizacin, clasicacin o o difusa y bsqueda de dependencias difusas entre atributos (para ms u a detalle vase seccin B.3.4). e o
DMFMB

Dado que las operaciones de miner de datos sobre una BDR son coma plejas se propone denir un nuevo objeto denominado proyecto en el cual se proporcionen los parmetros necesarios para realizar una operacin a o de estas caracter sticas (desde condiciones iniciales, resultados intermedios, y nales). Este nuevo elemento estar descrito en la Base de Metaa conocimiento Difuso para la Miner de Datos, denominada DMFMB a (descrita en detalle en la seccin B.3.5) y engloba las siguientes relao ciones (vase gura B.9): e DmFSQL Project: contiene la informacin general sobre los proyeco tos de Miner de Datos. a DmFSQL Col List: contiene la informacin sobre las distintas columo nas requeridas en el proceso de Miner de datos. a
DMFSQL

Para poder realizar tareas de miner de datos sobre este sistema, a se ha extendido el FSQL con un conjunto de sentencias de denicin o de datos, para crear proyectos de MD (Miner de Datos), y modicado a sentencias de manipulacin de datos para lanzar consultas de MD. Esta o extensin del lenguaje se ha denominado DMFSQL (Data Mining FSQL) o y se encuentra descrita en la seccin B.3.6. o

3.4. UNIFICACION DE LAS ARQUITECTURAS

45

3.4.
3.4.1.

Unicacin de las Arquitecturas o


Visin General del Problema de Unicacin o o

Como se expuso en el apartado anterior, se encuentran desarrolladas tres arquitecturas de bases de datos que permiten gestionar datos y realizar operaciones de muy diversa ndole. Resumiendo estas arquitecturas son: FIRST, que implementa un SBD que permite almacenar imprecisin o en la informacin, o FREDDI*, extiende el SGBD para almacenar datos para realizar deducciones a partir de la denicin de reglas lgicas, que tambin o o e pueden ser difusas, y FIRST* y DMFIRST que mediante un nuevo tipo de datos, permite la realizacin de ciertas operaciones de DM dentro de un SGBD. o Ntese que a partir del desarrollo de la arquitectura FIRST, fueron o desarrolladas las otras dos, aunque siempre desde el punto de vista de cubrir las necesidades que se requer para la puesta en funcionamiento an de cada sistema en particular. De esta forma se dio lugar a soluciones ad hoc que nada ten que ver entre si, excepto por el hecho de que an todas trabajaban con informacin imprecisa, y que podr reutilizar y o an compartir la funcionalidad que proporcionaba la arquitectura FIRST. No obstante, una vez en funcionamiento todas estas arquitecturas independientes sobre un mismo SGBD, se nos plantean las siguientes preguntas: son compatibles los datos que utilizan las diferentes arquitecturas dado que se apoyan sobre la misma implementacin que permite la o gestin de informacin imprecisa?, o o se pueden utilizar reglas lgicas para almacenar cualquiera de los o procesos de miner de datos gestionados en DMFSQL?, a Una relacin intensiva podr ser consultada por un proceso de o a miner de datos?. a

46

CAP ITULO 3. SERVIDOR MULTIPROPOSITO

Como respuesta a estas preguntas, se retoma la reexin de que cada o arquitectura fue desarrollada sin tener en cuenta nada ms que aquello a que fuera necesario para resolver los objetivos espec cos del problema, con lo que se deduce que no existe ningn mecanismo para la combinacin u o de las mismas. Esto es, las operaciones y estructuras denidas por DFSQL son incompatibles con las denidas en DMFSQL. En este apartado se plantea la infraestructura de un servidor unicado que integra las caracter sticas de las arquitecturas anteriormente denidas y que permite combinar sus funcionalidades. Para ello, se estudia la viabilidad de la puesta en marcha de dicha unicacin, planteando o las ventajas e inconvenientes en el desarrollo del sistema [Bla04, Bla05a]. 3.4.2. Sistema Actual

En la Figura 3.1 se muestra la arquitectura del sistema actual donde coexisten en un mismo SGBD las tres arquitecturas anteriormente expuestas. Como se puede observar, hay una interfaz de usuario por cada uno de los clientes que puede relacionarse con el sistema: El Cliente SQL es el cliente por defecto del SGBD. Accede directamente al Ejecutor de Consultas del SGBD para obtener la respuesta. El Cliente FSQL es aquel que permite realizar consultas exibles al sistema, usando datos clsicos o difusos. Accede a la arquitectura a FSQL. El Cliente DFSQL, permite consultar al sistema utilizando estructuras lgicas. Accede a los motores deductivos implementados para o hacer inferencias y permite combinar aspectos lgicos con estruco turas difusas y clsicas. a El Cliente DmFSQL permite realizar operaciones de miner de a datos, difusas o no, deniendo nuevos tipos de datos y extendiendo el FSQL anterior. Cada interfaz esta conectada con su correspondiente arquitectura. Las arquitecturas comparten el mismo analizador lxico y sintctico, pero no e a semntico. El motivo es que la extensin del analizador lxico es muy a o e simple, puesto que consiste en aadir a la lista de tokens permitidos los n

3.4. UNIFICACION DE LAS ARQUITECTURAS

47

necesarios para reconocer los nuevos comandos. El analizador semntico a por el contrario, depender del signicado de cada expresin y por tanto a o su anlisis ser realizado de forma particular en cada una de las arquiteca a turas. Cada mdulo se encargar de traducir la consulta en una o varias o a sentencias en SQL. El acceso a la Base de Datos es comn y se realiza a u travs del Ejecutor de Consultas. e
CLIENTE SQL CLIENTE FSQL CLIENTE DFSQL CLIENTE DmFSQL

DmSQL DFSQL
ANALIZADOR SEMNTICO * ANALIZADOR SEMNTICO **

FSQL
ANALIZADOR SEMNTICO

ANALIZADOR LXICO

ANALIZADOR SINTCTICO

EJECUTOR DE SQL

BASE DE DATOS
MB

RDBMS

Figura 3.1: Arquitectura de los Servidores Independientes

3.4.3.

Arquitectura de un Servidor Multipropsito Unicado o

El problema surge cuando se pretenden combinar las distintas tareas que hace cada arquitectura por separado. As pues, por ejemplo, si en algn momento se quisiera tener almacenada en la base de reglas una que u nos mostrase el resultado de haber calculado una dependencia funcional difusa sobre una relacin, habr que introducirla a mano, y an as su o a u , existencia en el sistema nos resultar extremadamente intil, dado que a u no existen operaciones para explotar esta funcionalidad. Es necesario plantearse cmo extender los diferentes servidores ya o

48

CAP ITULO 3. SERVIDOR MULTIPROPOSITO

implementados para permitir la combinacin de operaciones entre s y o una gestin de datos conjunta. Adems, el sistema deber mantenerse lo o a a sucientemente estructurado para que la incorporacin de nuevas opeo raciones (como puedan ser nuevas tareas de miner de datos, gestin a o de nuevos tipos de datos como por ejemplo el tiempo, etc.) sea sencilla o cuando menos, posible. Es decir, se plantea un nuevo trabajo de ingenier inversa, consistente en redenir y aunar cada una de las ara quitecturas planteadas, dejando las deniciones de datos, y operaciones abiertas a nuevas incorporaciones, generando as un unico sistema esca lable y completo. De esta forma, y utilizando las arquitecturas anteriormente descritas, se propone la infraestructura de un servidor unicado que integra las funcionalidades de cada una de las arquitecturas permitiendo combinarlas entre s (vase [Bla04, Bla05a]). Esta integracin es capaz de procesar e o diferentes tipos de consultas en una misma sentencia. Por ejemplo consultas que permitan deducir con datos difusos y utilizando resultados de un proceso de miner de datos. a A continuacin se describen los cambios que permitirn la unicacin o a o del sistema: Combinacin y extensin de las diferentes Bases de Metaconocimieno o to. Arquitectura unicada que especica la secuencia de procesamiento de una consulta. Se genera un servidor creado espec camente para decidir los mdulos implicados en dicha ejecucin y el orden de o o participacin de los mismos. o
3.4.3.1. Base de Metaconocimiento (MB)

Se ha denominado Base de Metaconocimiento (MB) al conjunto de relaciones del catlogo que almacenan la denicin de los objetos, tipos de a o datos, etiquetas, dominios, etc. utilizados por las diferentes arquitecturas y por el servidor unicado. Est formada por los siguientes subcatlogos: a a FMB: representa tipos de datos difusos, dominios difusos, etiquetas difusas, etc. RB: almacena predicados intensivos y su denicin descrita mediano te reglas lgicas. o

3.4. UNIFICACION DE LAS ARQUITECTURAS

49

FMB*: dene un nuevo tipo de datos capaz de representar texto, XML, objetos, relaciones, etc. y las operaciones que pueden ser aplicadas a este nuevo tipo de datos. DMFMB: almacena informacin acerca de las operaciones de cluso tering, clasicacin, y bsqueda de dependencias funcionales sobre o u datos clsicos o difusos. a Sobre esta nueva estructura relacional se hace necesaria una extensin, dado que las relaciones del catlogo de cada arquitectura son invisio a bles entre s particularidad que elimina cualquier posibilidad de realizar , operaciones conjuntas. En las guras 3.2 y 3.3 y en [Bla04, Bla05a] se muestra como se relacionan las diferentes estructuras del catlogo a partir de la denicin de a o dos nuevas relaciones. Las dos nuevas relaciones permitirn la compartia cin de informacin entre las arquitecturas, y su descripcin se detalla a o o o continuacin: o
FUZZY_QUALIFIERS_ DEF FUZZY_COMPATIBLE_ COL FUZZY_APROX_MUCH FUZZY_NEARNESS_ DEF FUZZY_LABEL_DEF

FUZZY_COL_LIST

FUZZY_OBJECT_LIST FMB DMFSQL_LABEL_DEFINITION DMFSQL_COL_COL DMFSQL_COL_PAR FMB* DMFMB

ALL_TAB_COLUMNS ALL_OBJECTS

EXTENDED_TAB_COLUMNS DMFSQL_FUNCTIONS_COL EXTENDED_TABLES

DMFSQL_FUNCTIONS

DMFSQL_LOG DMFSQL_COL_LIST DMFSQL_PROYECT

Catlogo del Sistema

Catlogo Extendido

DED_INTENSIONAL_CATALOG DED_PREDICATE_DESCRIPTION DED_RULE_DESCRIPTION DED_COMPARISION_DESCRIPTION DED_INT _TABLE_DESCRIPTION DED_LINK_VALUE_SET DED_STACK_INDEX

Base de Metaconocimiento
Base de Reglas

DED_STACK_TYPES

Figura 3.2: Base de Metaconocimiento (MB)

50

CAP ITULO 3. SERVIDOR MULTIPROPOSITO

Extended Tables: almacena las relaciones (clsicas o extendidas) dea nidas en la base de datos que pueden ser usadas en consultas difusas, deductivas o de miner de datos. Aquellas relaciones almacea 1 nadas en All Objects (solo aquellas que hagan referencia a tablas) estn incluidas en esta relacin (conexin (5) de la gura 3.3). De a o o esta forma, esta relacin es una especializacin de All Objects dado o o que todas las relaciones incluidas en ella tienen alguna caracter stica especial de las mencionadas previamente. La tabla 3.1 muestra los atributos de esta relacin y los valores que puede tomar. OBJ# o representa el identicador de la tabla, TYPE indica si la tabla es intensiva (no contiene datos) o extensiva y Orig da informacin acerca o del tipo de datos que dicha tabla contiene o a partir de donde se ha formado.
Tabla 3.1: Relacin Extended Tables o OBJ# Type 0 (Extensiva) 1 (Intensiva) Orig 0 (Datos Clsicos) a 1 (Datos Difusos) 2 (Descripcin de la Regla) o 3 (Datos de DM) 4 (Descripciones de DM)

Extended Tab Columns: proporciona informacin acerca de todos o los atributos (tanto clsicos como extendidos) a los que puede aca ceder el usuario. Esto incluye algunos atributos almacenados en All Tab Columns 2 (conexin (1) de la gura 3.3) y una descripcin o o de stas. Como en la relacin anterior, Extended Tab Columns es e o una especializacin de All Tab Columns puesto que las tuplas que o esta relacin puede referenciar pueden ser atributos difusos descritos o en FIRST, atributos intensivos descritos en FREDDI, atributos usados en procesos de miner de datos, o atributos que pueden almaa cenar informacin temporal o resultados de procesos de miner de o a
Tabla que hace referencia a todas las tablas del sistema. Esta notacin corresponde o unicamente a la tabla del catlogo del SGBD de Oracle c para acceder a todos los objetos a del sistema. Otros SGBDs utilizan otros nombres para referenciar esta tabla. 2 Tabla que hace referencia a todas las columnas del sistema. Esta notacin corresponde o unicamente a la tabla del catlogo del SGBD de Oracle c para acceder a todas las columnas a del sistema. Otros SGBDs utilizan otros nombres para referenciar esta tabla.
1

3.4. UNIFICACION DE LAS ARQUITECTURAS

51

datos. El atributo TYPE de esta relacin (vase tabla 3.2) almaceo e na el tipo de datos que el atributo referenciado puede contener: una regla, un dato difuso, etc., mientras que OBJ# y COL# identican de forma unica el atributo en el SGBD.
Tabla 3.2: Relacin Extended Tab Columns o OBJ# COL# Type 0 (Columna Difusa) 1 (Columna Lgica) o 2 (Columna de DM)

Como ya se ha comentado, estas nuevas relaciones se corresponden con las relaciones especicas del catlogo del sistema SGBD utilizadas para a contener informacin acerca de todas las columnas y tablas denidas en o la base de datos. En esta propuesta las vistas espec cas del SGBDR: c , han sido usadas a modo All Tab Columns y All Objects de Oracle de ejemplo para referenciar a los contenidos de tablas y atributos de los SGBDs. Las conexiones establecidas entre las diferentes arquitecturas y estas dos nuevas relaciones (mostradas en la gura 3.3) son:
FMB

RB

ALL_TAB_ COLUMNS

EXTENDED_ TAB_COLUMNS

EXTENDED_ TABLES

ALL_ OBJECTS

FMB*

Figura 3.3: Base de Metaconocimiento (MB) con las tablas del catlogo de a Oracle c

DMFMB

52

CAP ITULO 3. SERVIDOR MULTIPROPOSITO

Las conexiones 2 y 8 permiten que se relacionen el FMB y el FMB* con Extended Tab Columns ya que stas ampl las deniciones de e an atributos y sus dominios. La conexin 4 permite que la RB se relacione con Extended Tables o ya que FREDDI incorpora nuevas relaciones al sistema. La conexin 3 relaciona RB con Extended Tab Columns porque esta o extensin debe disponer de atributos a partir de otras relaciones. o La conexin 7 permite que DMFMB se relacione con Extended Tabo Columns porque las operaciones de miner de datos se aplican a sobre cualquier tipo de atributos. La conexin 6 permite que DMFMB se relacione con Extended Tables o porque los resultados de sus operaciones tienen que ser almacenadas como nuevas relaciones en la base de datos. La inclusin de estas tablas har el sistema escalable en la forma o a en que permiten una sencilla extensin de la Base de Metaconocimiento o (MB).
3.4.3.2. Arquitectura del Servidor Multipropsito Unicado o

En la gura 3.4 se muestra una propuesta de arquitectura unicada que permite que todo el ujo de informacin pase a travs de un unico o e cliente. El cliente se encarga de recoger todas las consultas por parte del usuario y enviarlas a un servidor unicado de consultas que ser capaz a de identicar el tipo de relaciones implicadas en cada una. El servidor se encarga de analizar la consulta envindola al mdulo correspondiente a o para obtener la solucin. Una vez que la consulta ha sido analizada, o el servidor controlar la ejecucin de todos los mdulos que permitan a o o traducir las partes de las que est compuesta la consulta, e integrar sus e a respuestas. Adems habr otro modulo dentro del servidor, el Planicador de a a Estrategias de Consulta, que planicar el orden en el que las consultas a debern ser ejecutadas de forma que aumente la eciencia del servidor. a La estrategia seguida por este planicador consiste en analizar la consulta compleja (consulta que implica diferentes mdulos para su resolucin) o o y determinar el orden de ejecucin de cada una de las subconsultas ino cluidas en la sentencia compleja.

3.4. UNIFICACION DE LAS ARQUITECTURAS

53

CLIENTE

SERVIDOR
PLANIFICADOR DEESTRATEGIAS DECONSULTAS

DmSQL
ANALIZADOR SEMNTICO **

DFSQL
ANALIZADOR SEMNTICO *

FSQL
ANALIZADOR SEMNTICO

ANALIZADOR LXICO

ANALIZADOR SINTCTICO

EJECUTOR DE SQL

BASE DE DATOS
MB

RDBMS

Figura 3.4: Servidor Multipropsito o

Las modicaciones propuestas por esta arquitectura estn sealadas a n en la gura 3.4 con l neas discontinuas. El proceso de resolucin de una o consulta puede resumirse de la siguiente manera: a 1. El cliente env la consulta al servidor. 2. La consulta se analiza por el servidor utilizando los analizadores lxicos y sintcticos para determinar los mdulos implicados en su e a o resolucin. o o 3. La sentencia se divide, si es necesario, y enviada al mdulo corres-

54

CAP ITULO 3. SERVIDOR MULTIPROPOSITO

pondiente. El Planicador de Estrategias de Consulta planica la ejecucin de las diferentes subconsultas). o 4. Cada modulo analiza semnticamente su parte asignada de la cona sulta y la traduce a una sentencia en SQL. 5. La parte procesada de la consulta original se devuelve al servidor que integra todas las traducciones proporcionas por cada uno de los mdulos implicados construyendo as una unica consulta en SQL o que ser enviada al Ejecutor de consultas SQL, y a 6. El servidor formatea el conjunto de tuplas resultantes proporcionadas por el Ejecutor de consultas SQL antes de enviarlas al Cliente. Como se muestra en la gura 3.4, tanto el servidor como todos los mdulos integrados en la arquitectura necesitan consultar la MB. o 3.4.4. Ejemplo de Resolucin de una Consulta Compleja o

La integracin de las arquitecturas previamente descritas permite la o combinacin de diferentes tipos de consultas y el almacenamiento de o los resultados de las mismas en forma de relaciones, reglas lgicas, datos o calculados, etc. que cualquier otro proceso podr usar con posterioridad. a Este apartado muestra cmo puede relacionarse una operacin de o o miner de datos con la gestin de reglas lgicas difusas. En concreto, a o o este ejemplo muestra cmo una dependencia funcional difusa encontrada o mediante un proceso de miner de datos, puede generar una Regla Gea neralizada Difusa con Grado de Acoplamiento y almacenarla en la base de datos. Dado que se dispone de una Base de Datos Difusos de Suelos descrita en el Anexo C, utilizada a lo largo de este trabajo de tesis para ejemplicar todas las aportaciones realizadas en el mismo, incluyendo esta primera de unicacin de servidores, se plantea el hecho de buso car, si existe, alguna relacin entre los datos que componen esta BDD. o En principio se va a tratar de buscar la existencia de dos dependencias funcionales difusas: La primera dependencia funcional tratar de describir si hay algn a u tipo de relacin entre la Precipitacin Media que tiene el emplazamiento o o del terreno particular y la temperatura media que registra dicho emplazamiento. Ambas caracter sticas que se encuentran descritas en la tabla C.2 Anexo C son difusas, la Precipitacin Media y la Temperatura Media o

3.4. UNIFICACION DE LAS ARQUITECTURAS

55

son atributos de carcter difuso pero basado en un referencial numria e co ordenado (Tipos Difusos 2 ). Los valores de su dominio son etiquetas ling usticas descritas en el Anexo C, tablas C.8 y C.9. La segunda dependencia trata de descubrir si entre la vegetacin que o caracteriza un suelo y el tipo de estructura que tenga dicho suelo existe una relacin. Esta bsqueda versar sobre datos localizados en la tabla o u a C.3. Los atributos Vegetacin y Tipo de Estructura, a partir de ahora o tipo est, son campos de Tipo Difuso 3 descritos a travs de las relaciones e de similitud establecidas entre sus valores de dominio que podemos encontrar en las tablas C.27, y C.38 y C.39 respectivamente. Para la bsqueda de las Dependencias Funcionales Difusas (DFD) u planteadas se ve necesaria la utilizacin de tcnicas de miner de datos o e a que permitan analizar las relaciones Localizacin y Estructura(tablas C.2 o y C.3), concretamente los atributos Tmedia y Pmedia, por un lado y Vegetacin y Tipo de Estructura por otro. Una vez conocido si se cumplen o dichas hiptesis, esto es, la existencia de las DFD que estamos buscando, o stas podrn ser almacenadas en la base de datos como reglas lgicas con e a o grado de acoplamiento de forma que el conocimiento extra no se pierda do sino que se almacene y vaya vericndose con las nuevas inserciones sin a necesidad de ser recalculado. Para buscar la DFD en primer lugar es necesario tener la informacin o almacenada en la base de datos y ms espec a camente, dado el caso que nos ocupa, conocer cmo esta informacin esta almacenada en la Base o o de Metaconocimiento (MB) anteriormente descrita. La gura 3.5 muestra, de manera resumida, la sucesin de acciones o en cuanto a creacin de tablas o insercin de tuplas en la MB para que o o sea posible la ejecucin de la consulta compleja que se ha planteado. La o relacin Localizacin mostrada en la tabla C.2 ha sido almacenada en o o la base de datos utilizando la estructura especial para los datos difusos (descrita en la tablas B.1 y B.2 del Anexo B). Dicha representacin alo macenada en la base de metaconocimiento se encuentra descrita en la tabla 3.3. Adems de la relacin y las tuplas en la base de datos, debe haber a o constancia de la estructura de la informacin difusa que se halla en el o sistema. Las fases 2 a 6 de la gura 3.5 muestran todas las relaciones implicadas en el almacenamiento de esta informacin en la FMB. El o atributo F TYPE de la tabla Fuzzy Col List (tabla 3.8) especica el tipo de dato difuso del atributo almacenado, concretamente: PMedia y TMedia son Tipos de Datos Difuso 2 mientras que Vegetacin y Tipo es o

56

CAP ITULO 3. SERVIDOR MULTIPROPOSITO

Latitud 41045 41135 40883 41082 4103 ...

Longitud

Pmedia baja baja media alta baja ...

Tmedia alta alta media baja alta .... 15. Se describe lasconexiones Ded_Condition_Description 16 Se define la relacin intensiva en Extended_Tables MB Extendida

5478 5598 4649 4657 5705 .....

1 Se crea Relacin Localizacin

14. Se definen los predicados en Ded_Predicate_Description

2. Se definen Atributos Difusos en Fuzzy_Col_List

13. Se describe la regla en Ded_Rule_Description

DFMB

3. Se definen valores en Fuzzy_Object_List

12. Se define tabla intensiva Ded_Int Table_Description _

FMB

4. Se definen las etiquetas en Fuzzy_Label_ Def 5. Se definen Relaciones de Similituden Fuzzy_Nearness_ Def

11 Se define la regla en Ded_Intensional _Catalog

6. Se definen dominio de PMedia y TMedia Fuzzy_Aprox_Much

Se lanzaconsulta SELECT MINING FGLOBAL_DEPENDENCIES y se obtiene regla DFD1(Pmedia, media ):-Localizacion (X,Y)y T (X= 0.6 Pmedia )y (Y= 0.7 Tmedia )

7 Se define la relacin difusa en Extended_Tab_Column MB Extendida

10 Se define los parmetros del proceso de DM en DmFsql_Col_List DmFMB 9 Se define el proyecto de DM en


DmFsql _Project

8 Se define la relacin difusa en Extended_Tables

Figura 3.5: Resumen de las acciones ocurridas en la MB en una consulta compleja. Ejemplo DFD1

es un Tipo de Datos Difuso 3. La relacin de similitud entre los valores de o a Vegetacin y Tipo es estn almacenados en la Base de Metaconocimiento o o en la relacin Fuzzy Nearness Def (descripcin en tabla 3.6). o Las etiquetas ling usticas utilizadas, como la calicacin Alta, o Bao

3.4. UNIFICACION DE LAS ARQUITECTURAS

57

ja estn descritas en la relacin Fuzzy Label Def (descripcin en tabla a o o 3.7) de la MB. La relacin Fuzzy Object List (descripcin en tabla 3.5) o o almacena las etiquetas utilizadas en el atributo Vegetacin y Tipo es y o todas las etiquetas que pueden usarse para describir el valor del atributo PMedia y TMedia. Adems, esta tabla establece un identicador unico a para cada etiqueta, evitando as cualquier confusin. o Todas las relaciones mostradas anteriormente estn referidas unicaa mente a la parte de representacin de informacin difusa, correspondiente o o al mdulo FMB de la MB. Sin embargo, estos datos debern ser denio a dos en las nuevas relaciones de la arquitectura unicada para que puedan ser visibles a todos los sistemas incluidos en el SGBD. De esta forma la relacin Localizacin y Estructura y los atributos que la componen sern o o a denidos tambin en las tablas Extended Tables y Extended Tab Columns e de la MB, correspondientes a los pasos 7 y 8 de la gura 3.5. La relacin o Extended Tab Columns (descripcin detallada en la tabla 3.10) contiene o una referencia a todos los atributos usados difusos en este ejemplo y al tipo de datos que representan (datos difusos). La relacin Extendo ed Tables (detalle en tabla 3.11) mantiene una descripcin de las relao ciones usadas en el ejemplo: hasta ahora unicamente las tablas extensivas recin denidas, Localizacin y Estructura. Los signos - de la tabla 3.11 e o simbolizan que el valor no es relevante en la relacin y por tanto no se o necesita rellenar este campo. Una vez denida la estructura sobre la que se va a operar, se puede iniciar el proceso de denicin de datos para llevar a cabo una operacin o o de DM. Un nuevo proyecto de DM debe denirse sobre la base de datos (especicacin ms detallada en el apartado B.3.2). Este proyecto geneo a ra un conjunto de nuevas tuplas en las relaciones correspondientes a la DMFMB de la MB (pasos 9 y 10 de la gura 3.5). La sentencia que permite denir este proyecto tiene la siguiente forma (vase referencia a la e sintaxis completa en [Car03a, Car03b]): CREATE_MINING PROJECT Localizacion_PRJ ON TABLE Localizacion WITH COLUMNS FOR FGLOBAL_DEPENDENCIES ( { ANTECEDENT Pmedia FCOMP_GLOBAL_DEPENDENCIES FEQ THOLD_ANT 0.6 CONSEQUENT Tmedia FCOMP_GLOBAL_DEPENDENCIES FEQ THOLD_CON 0.7}

58

CAP ITULO 3. SERVIDOR MULTIPROPOSITO

donde Localizacion PRJ es el identicador del proyecto de DM, que mantiene toda la informacin necesaria para llevar a cabo el proceso o de DM, como parmetros, tablas temporales, etc. En concreto el proceso a de bsqueda de dependencias funcionales difusas necesita conocer el tipo u de dependencias difusas que se han de buscar, el grado de acoplamiento de cada atributo, etc. La denicin del proyecto es el primer paso para o comenzar el proceso de DM. La estructura para denir el proyecto en la DmFMB est descrita con detalle en las tablas 3.12 y 3.13. La tabla 3.12 a almacena una especicacin general acerca de la dependencia funcional o difusa propuesta y la tabla 3.13 almacena informacin acerca de cada o una de las columnas que forman parte del proceso de bsqueda. u La dependencia funcional difusa buscada se ha denominado DFD1 y se describe con la siguiente expresin: o 0.6 - 0.7 DFD1 PMedia F EQF EQ Tmedia with condence c and support s El objetivo de esta dependencia funcional consiste, obviamente, en encontrar si la presin en la localizacin de un suelo inuye en la temo o peratura media, donde el grado de acoplamiento para Pmedia es de 0.6 y para Tmedia 0.7. La siguiente sentencia DML permite ejecutar en en servidor de miner de datos la bsqueda de la DFD planteada: a u SELECT_MINING FGLOBAL_DEPENDENCIES Localizacion_PRJ USING T_NORM THOLD_ANT_CON Esta consulta estar formada, en ultima instancia, por un conjunto a de sentencias en FSQL que tendrn una estructura similar a la de la a siguiente (que se corresponde a la ultima sentencia que permite ejecutar esta operacin): o SELECT COUNT(*) FROM Localizacion A1, Localizacion A2 WHERE(A1.NAME<>A2.NAME) AND (A1.Pmedia FEQ A2.Pmedia THOLD 0.6) AND NOT (A1.Tmedia NFEQ A2.Tmedia THOLD 0.7) El soporte y la conanza de la DDF se han calculado con una sentencia similar a la anterior, contando el nmero de apariciones del antecedente u y consecuente. Si el soporte y la conanza son lo sucientemente altos,

3.4. UNIFICACION DE LAS ARQUITECTURAS

59

entonces la DFD ser aceptada y automticamente almacenada en la base a a de datos como una regla lgica. En cambio, si el soporte o la conanza no o son lo sucientemente buenos, entonces o bien la dependencia funcional difusa se rechaza o bien se disminuyen los umbrales de cumplimiento. En el caso en que si se acepte la dependencia, la estructura de la regla lgica ser la siguiente: o a DFD1(Pmedia,Tmedia) :- Localizacion(X,Y) (X =0,6 Pmedia) (Y =0,7 Tmedia) Una vez conocida la estructura de la regla, se procede a su almacenamiento en la base de datos. esto se lleva a cabo a travs de su denicin e o en la RB de MB (pasos del 11 al 15 de la gura 3.5). La sentencia en DFSQL que permite generar esta regla es (vase referencia a la sintaxis e completa en [Bla01, Bla00b]): CREATE INTENSIONAL TABLE DFD1 (Pmedia FTYPE2 (2,3) NUMBER (3,2) Tmedia FTYPE3 ); CREATE RULE FOR DFD1 (Pmedia, Tmedia) AS Localizacion (X SOURCE Pmedia, Y SOURCE Tmedia) AND ( X FEQ Pmedia THOLD 0.6) AND (Y FEQ Tmedia THOLD 0.7)

donde Create Intensional Table inserta una nueva tupla en la tabla 3.14 y crea una nueva relacin DFD1 en la base de datos, por supuesto, sin o tuplas ya que se trata de una relacin intensiva. Este proceso tambin o e incluir la insercin de una tupla en la tabla 3.11 especicando que el a o tipo de relacin almacenada es intensiva (Tab type = 1) (paso 16 de la o gura 3.5). La sentencia Create Rule almacena la estructura de la regla en las relaciones de la RB: 3.15, 3.16, 3.17 y 3.18. Estas cuatro relaciones permiten describir ntegramente la estructura de una Regla Generalizada Difusa con Grado de Acoplamiento: los predicados y variables que la conforman, tal y como se puede ver en la seccin B.2. o Una vez que la regla se ha denido en la base de datos, cada nueva insercin de una tupla en la tabla Localizacion provocar que el siso a tema compruebe si dicha tupla cumple o no la regla DFD1, es decir, si

60

CAP ITULO 3. SERVIDOR MULTIPROPOSITO

sobrepasa el umbral establecido para cada atributo (antecedente y consecuente). Si lo cumple la nueva tupla validar la regla y ser insertada a a en la BD incrementando la conanza y soporte de la regla.

Latitud 41045 41135 40883 41082 4103 ...

Longitud

Pmedia baja baja media alta baja ...

Tmedia alta alta media baja alta .... 15. Se describe lasconexiones Ded_Condition_Description 16 Se define la relacin intensiva en Extended_Tables MB Extendida

5478 5598 4649 4657 5705 .....

1 Se crea Relacin Localizacin

14. Se definen los predicados en Ded_Predicate_Description

2. Se definen Atributos Difusos en Fuzzy_Col_List

13. Se describe la regla en Ded_Rule_Description

DFMB

3. Se definen valores en Fuzzy_Object_List

12. Se define tabla intensiva Ded_Int Table_Description _

FMB

4. Se definen las etiquetas en Fuzzy_Label_ Def 5. Se definen Relaciones de Similituden Fuzzy_Nearness_ Def

11 Se define la regla en Ded_Intensional _Catalog

6. Se definen dominio de PMedia y TMedia Fuzzy_Aprox_Much

Se lanzaconsulta SELECT MINING FGLOBAL_DEPENDENCIES y se obtiene regla DFD1(Pmedia, media ):-Localizacion (X,Y)y T (X= 0.6 Pmedia )y (Y= 0.7 Tmedia )

7 Se define la relacin difusa en Extended_Tab_Column MB Extendida

10 Se define los parmetros del proceso de DM en DmFsql_Col_List DmFMB 9 Se define el proyecto de DM en


DmFsql _Project

8 Se define la relacin difusa en Extended_Tables

Figura 3.6: Resumen de las acciones ocurridas en la MB en una consulta compleja. Ejemplo DFD2

La misma secuencia de operaciones se ha de seguir para calcular la

3.4. UNIFICACION DE LAS ARQUITECTURAS

61

segunda dependencia funcional difusa planteada, que podemos ver en la gura 3.6. En las tablas de la MB descritas, se encuentra especicada cada una de las entradas correspondientes a la creacin de dicha dependencia, o denominada DFD2. Este ejemplo demuestra que una vez unicada la base de datos, las operaciones de cada extensin pueden ser combinadas, hacindola as mas o e operativa. Al igual que ocurre con este ejemplo otro tipo de operaciones pueden realizarse combinando las funcionalidades de los sistemas integrados. En el apartado siguiente se resumen brevemente las operaciones que se pueden realizar sobre esta nueva arquitectura. 3.4.5. Ventajas e Inconvenientes del Servidor Unicado

Una vez diseada la arquitectura unicada aparecen un buen nmero n u de nuevas funcionalidades en el sistema. En general las ventajas del sistema son las siguientes: El incremento del nmero de operaciones y tipos de datos que un u RDBMS difuso (FRDBMS) puede gestionar. Estas operaciones incluyen: Realizar deducciones sobre estructuras resultantes de un proceso de miner de datos. a Realizar operaciones de miner de datos sobre estructuras lgia o cas (como relaciones intensivas). Almacenar resultados de operaciones de miner de datos utia lizando estructuras lgicas. o La conversin de esta arquitectura en una ms escalable, para que o a el sistema pueda incrementar el nmero de operaciones y tipos de u datos. La capacidad de mantener un lenguaje de consulta unicado. La posibilidad de utilizar datos difusos est presente en cada operaa cin del sistema, dado que todas las arquitecturas que forman parte de o l han sido desarrolladas con dicha funcionalidad. e Con objeto de implementar esta arquitectura, el Planicador de Estrategias de Consulta deber ser implementado integramente, mientras a que las arquitecturas iniciales FIRST, FREDDI y DMFIRST, ya desarrolladas estn funcionando actualmente. a

62

CAP ITULO 3. SERVIDOR MULTIPROPOSITO

Por contra, algunos de los inconvenientes que plantea esta arquitectura unicada son: Posible disminucin del rendimiento, dado que hay un gran nmero o u de operaciones a realizar y aumenta la complejidad de las consultas. Aumento en la complejidad del sistema. El sistema debe gestionar un gran nmero de estructuras, por ejemplo las del catlogo y otras u a muchas operaciones y procedimientos. Complejidad del desarrollo. Es muy costoso el proceso de estudio del sistema actual para incorporar nuevos procesos o simplemente la denicin de datos. o Dependencia del SGBD utilizado. Se necesita una implementacin o diferente por cada SGBD utilizado, aunque el planteamiento terico o para el desarrollo del sistema sea el mismo que el planteado en este trabajo. Dichos inconvenientes nos hacen plantearnos la puesta en marcha de este sistema multipropsito. La generacin de una base de metao o conocimiento ms compleja an que la que ya exist al aadir dos nuevas a u a, n relaciones, es un hecho nada deseable. Como tampoco lo es la dependencia que se crea del SGBD de Oracle c . Adems, la solucin propuesta a o puede parecer en un principio una solucin temporal al problema puesto o que la inclusin de nuevos tipos de datos u operaciones aumentar, lgio a o camente, la base de metaconocimiento, convirtindose en una tarea an e u mas tediosa la comprensin de la misma, pudiendo provocar que se vuelo van a generar soluciones parciales, independientes del sistema global. Como solucin a este problema se propone redisear esta nueva arquio n tectura global de tal forma que sea posible la comunicacin del usuario o con la informacin sin la necesidad de emplear muchos recursos en ello, o dejndola adems, abierta a nuevas incorporaciones. El diseo de dicha a a n arquitectura puede realizarse haciendo uso de las nuevas tecnolog que as permiten modelar los metadatos que estructuran informacin, de manera o abstracta e independiente del sistema sobre el que se vaya a desarrollar. Proponemos de esta manera, como solucin a todos estos inconvenientes, o modelar esta arquitectura mediante el uso de ontolog utilizando las as, mismas para servir de interfaz entre el SGBD y el usuario. El estudio de esta propuesta ser el centro de los siguientes cap a tulos de esta tesis.

3.4. UNIFICACION DE LAS ARQUITECTURAS

63

Latitud 41045 41135 4103 41082 40963 41049 ...

Longitud TmediaT Tmedia1 Tmedia2 Tmedia3 Tmedia4 5478 4 0 NULL NULL NULL 5598 4 0 NULL NULL NULL 5705 4 0 NULL NULL NULL 5675 4 0 NULL NULL NULL 5636 4 0 NULL NULL NULL 5578 4 0 NULL NULL NULL ... ... ... ... ... ... ... PmediaT Pmedia1 Pmedia2 Pmedia3 Pmedia4 . . . ... 4 2 NULL NULL NULL ... ... 4 2 NULL NULL NULL ... 2 NULL NULL NULL ... ... 4 ... 4 2 NULL NULL NULL ... ... 4 2 NULL NULL NULL ... 2 NULL NULL NULL ... ... 4 ... ... ... ... ... ... ...

Tabla 3.3: Relacin Localizacin o o

... ... ... ... ... ... ... ...

Latitud 41045 41135 4103 41082 40963 41049 ...

Longitud VegetacionT VegetacionP1 Vegetacion1 5478 3 1 4 5598 3 1 4 5705 3 1 4 5675 3 1 4 5636 3 1 2 5578 3 1 4 ... ... ... ... ... Tipo esT Tipo esP1 Tipo es1 . . . ... 3 1 5 ... ... 3 1 1 ... ... 3 1 7 ... ... 3 1 7 ... ... 3 1 1 ... ... 3 1 8 ... ... ... ... ... ...

Tabla 3.4: Relacin Estructura o

... ... ... ... ... ... ... ...

64

CAP ITULO 3. SERVIDOR MULTIPROPOSITO

Tabla 3.5: Relacin Fuzzy Object List de la BD de Suelos o


OBJ# Localizacion Localizacion Localizacion Localizacion Localizacion Localizacion Estructura Estructura Estructura Estructura Estructura Estructura Estructura Estructura Estructura Estructura Estructura Estructura Estructura Estructura Estructura Estructura ... COL# TmediaT TmediaT TmediaT PmediaT PmediaT PmediaT Vegetacion Vegetacion Vegetacion Vegetacion Vegetacion Vegetacion Vegetacion Tipo es Tipo es Tipo es Tipo es Tipo es Tipo es Tipo es Tipo es Tipo es ... FUZZY ID 0 1 2 0 1 2 0 1 2 3 4 5 6 0 1 2 3 4 5 6 7 8 ... FUZZY NAME baja media lta a baja media lta a 1 2 3 4 5 6 7 1 2 3 4 5 6 7 8 9 ... FUZZY TYPE 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ...

3.4. UNIFICACION DE LAS ARQUITECTURAS

65

Tabla 3.6: Relacin Fuzzy Nearness Def de la BD de Suelos o


OBJ#

Estructura
Estructura Localizacion Localizacion Localizacion Localizacion Localizacion Localizacion Localizacion Localizacion Localizacion Localizacion Localizacion Localizacion Localizacion Localizacion Localizacion Localizacion Localizacion Localizacion Localizacion ...

COL# Tipo es Tipo es Tipo es Orientacion Orientacion Orientacion Orientacion Orientacion Orientacion Orientacion Orientacion Orientacion Orientacion Orientacion Orientacion Orientacion Orientacion Orientacion Orientacion Orientacion Orientacion ...

FUZZY ID1 0 0 0 0 0 0 1 1 1 1 1 2 2 2 2 3 3 3 4 4 5 ...

FUZZY ID2 1 2 3 4 5 6 2 3 4 5 6 3 4 5 6 4 5 6 5 6 6 ...

DEGREE 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 0.4 ...

Tabla 3.7: Relacin Fuzzy Label Def en la BD de Suelos o


OBJ# Localizacion Localizacion Localizacion Localizacion Localizacion Localizacion ... COL# TmediaT TmediaT TmediaT PmediaT PmediaT PmediaT ... FUZZY ID 0 1 2 0 1 2 ... ALFA 0 8.5 14.7 183 490 818 ... BETA 0 10.5 16.9 183 664 905 ... GAMMA 6.5 12.5 21.0 315 731 1287 ... DELTA 8.5 14.7 21.0 490 818 1287 ...

Tabla 3.8: Relacin Fuzzy Col List en la BD de Suelos o


OBJ# Localizacion Localizacion Estructura Estructura ... COL# TmediaT PmediaT Vegetacion Tipo es ... F TYPE 2 2 3 3 ... LEN NULL 1 NULL 1 ... COM Localizacion.Tmedia Localizacion.Pmedia Estructura.Vegetacion Estructura.Tipo es ...

66

CAP ITULO 3. SERVIDOR MULTIPROPOSITO

Tabla 3.9: Relacin Fuzzy Aprox Much en la BD de Suelos o


OBJ# Localizacion Localizacion COL# TmediaT PmediaT MARGEN 4 50 MUCH 10 300

Tabla 3.10: Relacin Extended Tab Column en la BD de Suelos o


OBJ# Localizacion Localizacion Estructura Estructura COL# TmediaT TOrientacion Vegetacion Tipo es COL TYPE 0 0 0 0

Tabla 3.11: Relacin Extended Tables en la BD de Suelos o


OBJ# Localizacion Estructura DFD1 DFD2 TAB TYPE 0 0 1 1 ORIG 1 1 -

Tabla 3.12: Relacin DmFsql Project en la BD de Suelos o


PROJECT NAME OWNER OBJ# Localizacion PRJ OWNER Localizacion Localizacion PRJ OWNER Estructura THOLD CON FGD CONFIDENCE FGD 0.7 c 0.8 c STATUS- THOLDFGD ANT FGD 0.6 0.8 SUPPORT FGD . . . s ... s ...

Tabla 3.13: Relacin DmFsql Col List en la BD de Suelos o


PROJECT NAME Localizacion Localizacion Localizacion Localizacion PRJ PRJ PRJ PRJ COLTYPE A Q A Q COL# TmediaT PmediaT Vegetacion Tipo es FUZZY COMP FGK FEQ FEQ FEQ FEQ THOLDFGD -

Tabla 3.14: Relacin Ded Intensional Catalog de la Bd de Suelos o


ID PRED DFD1 DFD2 MARCADO 1 1 NVARS 2 2

3.4. UNIFICACION DE LAS ARQUITECTURAS

67

Tabla 3.15: Relacin Ded Int Table Description de la BD de Suelos o


Table ID DFD1 DFD2 Rule Id 1 1

Tabla 3.16: Relacin Ded Rule Description de la BD de Suelos o


Table ID DFD1 DFD1 DFD1 DFD2 DFD2 DFD2 Rule Id 1 1 1 1 1 1 Pred Id 2 2 Occ Number 1 2 3 1 2 3 Negated 0 0 0 0 0 0 Type 0 2 2 0 2 2

Tabla 3.17: Relacin Ded Predicate Description de la BD de Suelos o


TableID DFD1 DFD1 DFD2 DFD2 RuleId 1 1 1 1 PredId 2 2 2 2 OccNumber 1 1 1 1 VarId 3 4 3 4 ColId 1 2 1 2 Source Col TmediaT PmediaT VegetacionT Tipo esT

Tabla 3.18: Relacin Ded Condition Description de la BD de Suelos o


TableID DFD1 DFD1 DFD2 DFD2 RuleId 1 1 1 1 PredId OccNumber 2 3 2 3 VarId1 3 4 3 4 VarId2 1 2 1 2 ComOp 6(FEQ) 6(FEQ) 6(FEQ) 6(FEQ) Thold 0.6 0.7 0.8 0.8

68

CAP ITULO 3. SERVIDOR MULTIPROPOSITO

Cap tulo 4

Ontolog para la a Representacin del o Conocimiento Difuso (FKRO)


4.1. Introduccin o

Tal y como se expuso en el apartado 3.4.5, la arquitectura que permite combinar las operaciones de manejo de datos difusos, estructuras lgicas o y tareas de miner de datos en un unico sistema presenta algunos incona venientes. Uno de los ms destacados consiste en la complejidad que el a Servidor Multipropsito Unicado tiene a la hora de gestionar la inforo macin (denir estructuras, relaciones, procesos en el sistema) o ampliar o el sistema incluyendo nuevos tipos de datos u operaciones. Dicha complejidad repercute directamente en el aumento de recursos para la comprensin del funcionamiento del sistema y su consiguiente explotacin. o o Por otro lado, a pesar de que el planteamiento de las arquitecturas se ha tratado de hacer independiente de la plataforma del SGBD en la que se haya implementado, es realmente dif desvincular completamente el cil sistema de la misma puesto que el catlogo de datos y el tipo de datos a con los que se trabaja requieren su presencia. Dado que existen metodolog para la representacin del conocimienas o to que permiten mantener la informacin de un dominio lo sucienteo mente estructurada y clasicada para permitir la independencia de los datos con respecto del sistema de informacin en que sonn representados, o se plantea la denicin de una Ontolog para representar la informacin o a o asociada al Servidor Multipropsito expuesto. Dicha ontolog ser una o a a
69

70

CAP ITULO 4. FKRO

meta-ontolog o una Ontologa Representacional (vase denicin en a e o Anexo A), puesto que conceptualiza los formalismos para representacin o del conocimiento difuso, deductivo, etc. Una ontolog con el objetivo antes mencionado permitir la denicin a a o de la Base de Metaconocimiento en forma de conceptos exclusivamente (usando por ejemplo una jerarqu de clases), en lugar de como se encuena tra planteada actualmente, como un conjunto de relaciones y atributos del catlogo de un SGBD en particular. Dicha denicin adems nos faa o a cilitar el plantear de forma abstracta el tipo de datos que se utilizan a para almacenar informacin de muy diversos tipos (difusa, deductiva, de o miner de datos, etc.) en la base de datos y las restricciones propias que a pueda imponer un SGBD determinado a la hora de denir las relaciones en el mismo. Finalmente esta propuesta de ontolog tambin ser susa e a ceptible de posteriores extensiones de forma inmediata a otros sistemas de representacin de bases de datos difusos como pueden ser el orientado o a objetos, almacenes de datos, etc. La gura 4.1 contextualiza el lugar de la ontolog en nuestra proa puesta de arquitectura de un SGBD multipropsito extendido. Dicha o ontolog acta como interfaz entre el usuario y el SGBD, proporcionana u do as una alternativa al tipo de acceso a la informacin ordinario (esto o es, del usuario a los datos a travs de SGBD directamente). e En este trabajo de tesis se dene la primera versin de sta ontolog o e a que es la correspondiente a la parte de la arquitectura unicada de la gura 3.4 que permite representar y gestionar informacin difusa. Dicha o ontolog permitir denir de forma clara todas las entidades necesarias a a para que el almacenamiento y manipulacin de la informacin difusa sea o o independiente del contexto en que se incluya. La ontolog para la representacin de informacin imprecisa en el Moa o o delo Relacional que se propone se encuentra dividida en dos subontolog as que denen la informacin del esquema de modo distinto: o Sub-Ontolog para la Representacin del Catlogo. Esta a o a ontolog representa la informacin del catlogo del sistema, y su a, o a instanciacin permite la denicin completa de un esquema difuso o o o clsico utilizando el estndar SQL 2003 [Cal06, fSIIT03] extendido a a con la propuesta dada en FIRST [Med95] para la manipulacin de o datos difusos. Se trata de una meta-ontolog puesto que contiene a, metaclases, que permiten a posteriori, denir los datos o tuplas que est representando dicho esquema. e

4.1. INTRODUCCION

71

RDBMS EJECUTOR DE SQL


DATOS
TRADUCTORDE CONSULTAS CATLOGO DELSISTEMA

CLIENTE DE LA BASE DE DATOS

FSQL

DmFQL

DFSQL Diccionario deDatos

Catlogo
Extendido (FMB )

SERVIDOR
MULTIPROPSITO

ONTOLOGIA PARA CLIENTE DE LA


ONTOLOGA LA REPRESENTACION DEL CONOCIMIENTO DIFUSO (FKRO )

INTERFAZDE LA ONTOLOGIA ( I) O

Figura 4.1: Relacin de la Ontolog con el Servidor Multipropsito Unicado o a o

Sub-Ontolog para la Representacin del Esquema de BD a o Difusas. Esta ontolog ser generada a partir de la subontolog a, a a anterior y representa un esquema de BDD (Bases de Datos Difusas) sobre un dominio concreto. Su objetivo es el de aportar la posibilidad de instanciar los datos o tuplas que dicho esquema pueda contener. La ontolog en global se denominar Ontolog para la Representacin a a a o del Conocimiento Difuso (FKRO, Fuzzy Knowledge Representation Ontology) y establece las bases, la representacin de la informacin impreo o cisa, para la representacin a posteriori del resto de la informacin de la o o arquitectura que forma el Servidor Multipropsito descrito en el apartado o 3.4. Dicha ontolog ser descrita utilizando el modelado de datos UML a a

72

CAP ITULO 4. FKRO

para su desarrollo. Una vez descrita, su representacin nal ser impleo a mentada utilizando un lenguaje de denicin de ontolog basado en o as Web, OWL [Bec, Ant03]. La eleccin de este lenguaje de representacin o o viene motivada porque permite que los datos sean comprensibles en este entorno web, adems de que se trata de un lenguaje cada vez ms aceptaa a do y estandarizado que esta produciendo un gran nmero de aplicaciones u nuevas con las que interactuar. La descripcin de las diferentes ontolog o as descritas en este cap tulo se incluyen en el CD que acompaa a este tran bajo.

4.2.
4.2.1.

Ontolog para la Representacin del Conocia o miento Difuso


descripcin o

La Ontologa para la Representacin del Conocimiento Difuso [Bla08b] o dene la informacin difusa que se encuentra representada en una BD o Relacional Difusa. Esta ontolog acta como una interfaz entre el SGBa u DD y el usuario y/o los programas de aplicacin, de tal forma que hace o transparente el modo en que la informacin esta representada en el SGBo DD (mediante el diccionario de datos). La estructura del Modelo Relacional Extendido para la manipulacin o de informacin imprecisa se encuentra representada en la Sub-Ontolog o a del Catlogo Extendido, y por tanto la denicin de una BDD ser reala o a izada a travs de la instanciacin de dicha sub-ontolog olvidando as ree o a, presentaciones particulares que los SGBDs pueden hacer. De esta forma se dene el esquema de la BDD. Sin embargo, cualquier interaccin con o dicho esquema para la manipulacin de los datos de la BDD, requerir de o a su conversin expl o cita a forma de ontolog El proceso de conversin a. o consiste en generar a partir de las instancias de la Sub-Ontolog del a Catlogo Extendido una nueva ontolog denominada de forma genria a, e ca, Sub-Ontologa para la Representacin del Esquema de BDD. Dicho o proceso puede ser automatizado y su resultado, la Sub-Ontolog para la a Representacin del Esquema de BDD correspondiente, permitir la mao a nipulacin de los datos difusos tambin de forma transparente al SGBDS o e en el que se encuentren almacenados. La Ontologa para la Representacin del Conocimiento Difuso, englo o ba ambas sub-ontolog descritas, que tratan de representar la misma as informacin, un esquema relacional de BDD, aunque la manera de repo

4.3. ONTOLOG DEL CATALOGO IA

73

resentarlo diere en gran medida: Mediante la instanciacin de la Sub-Ontolog del Catlogo Exteno a a dido se permite la denicin completa del esquema de datos difusos, o especicando todas las restricciones propias del Modelo Relacional y de la extensin terica para la representacin de datos difuso o o o propuesto en GEFRED. Mediante la generacin de la Sub-Ontolog para la Representacin o a o del Esquema de BDD se permite la comparticin de esquemas de o datos difusos con el entorno, y por supuesto la denicin de datos o (tuplas) sobre la misma. Ambas representaciones son dependientes, es decir, una (la del Esquema) es generada a partir de la otra (la instanciacin del Catlogo) y por o a tanto, deben coexistir las dos al menos en el momento de su generacin. o A su vez, ambas estn vinculadas puesto que comparten las clases a necesarias para representar la informacin (vase seccin 4.4.2 para conoo e o cer los detalles) y por tanto ambas requieren de la importacin de la o Sub-Ontologa del Catlogo Extendido. Asimismo, los datos del dominio a relativos a etiquetas y relaciones de similitud, deben existir tambin en e ambas deniciones, y en mayor medida sobre la Sub-Ontolog para la a Representacin del Esquema de BDD dado que es dnde se han de denir o o los valores de las tuplas. 4.2.2. Ejemplo

En la gura 4.2 se muestra grcamente en qu consiste la Ontolog a e a de Representacin de Conocimiento Difuso en el Modelo Relacional. Coo mo puede observarse, el ncleo fundamental, la Sub-Ontolog del Catlou a a go Extendido permitir representar cualquier BDD (su esquema) mea diante su instanciacin. En el ejemplo se plantean cuatro BDD, la de la o Clnica Veterinaria, otra de Suelos, Caracter sticas de Diamantes, o Liga de Baloncesto. Una vez instanciadas el proceso de Generacin de la Sub-Ontolog o a para la Representacin del Esquema de BDD ser unico para cada BDD. o a Cada uno de los esquemas descritos generar una ontolog de su esquea a ma propio, siguiendo los pasos establecidos en la seccin 4.4. Estas cuatro o Sub-Ontologas para la Representacin del Esquema de BDD, al instan o ciarlas permitirn la insercin de datos (tuplas) referentes a los datos que a o se han modelado en sus esquemas correspondientes.

74

CAP ITULO 4. FKRO


ONTOLOGIA DE REPRESENTACION DEL CONOCIMIENTO DIFUSO EN EL MODELO RELACIONAL (FDTSCHO )
GENERADOR
Ontologa del Esquema: Diamantes Ontologa delEsquema : Clinica Veterinaria

Instancia : Tupla Diamantes

Instancia: Diamantes

Instancia : Clinica Veterinaria

Instancia: Tupla Veterinario

Ontologa del Catlogo Instancia: Tupla Suelos Instancia: Suelos Instancia :


Liga de Baloncesto

Instancia : TuplaJugador

Ontologa del Esquema : Suelos

AUTOMATICO

Ontologa delEsquema: Liga de Baloncesto

Figura 4.2: Ejemplos de v nculos entre las sub-ontolog del Esquema y as Catlogo para cuatro BDD a

4.3.
4.3.1.

Sub-Ontolog para la Representacin del Caa o tlogo Extendido a


Justicacin de la Sub-Ontolog o a

En la representacin de la informacin que existe en una base de o o datos, una parte fundamental de la misma es el esquema de la base de datos, que describe la estructura de la informacin siguiendo un modelo o de representacin determinado. Dado que el Modelo Relacional es el ms o a extendido y usado en el entorno de las Bases de Datos, ser ste el elegido ae para ser representado por la ontolog a. Puesto que se intenta estar lo ms desvinculado de cualquier implea mentacin concreta de un SGBDR, la representacin del estndar ANSI o o a SQL2003 [fSIIT03] nos parece la propuesta ms razonable. En cuanto a la a representacin de informacin imprecisa, muchas propuestas han extendio o

4.3. ONTOLOG DEL CATALOGO IA

75

do al Modelo Relacional en los ultimos aos, tal y como se ha descrito en n el cap tulo 3. El modelo FIRST propuesto por Vila et al. [Med95, Gal99] se plantea en este trabajo dada su completitud en la descripcin de este o tipo de informacin. o Un esquema de bases de datos difusas o clsicas, no deja de ser un a mecanismo de descripcin de la informacin que hay almacenada en la o o BD en forma de tuplas en las relaciones o tablas. En este caso, dicha descripcin o esquema simplemente establecer las restricciones mediante las o a cuales los datos, en ultima instancia, estarn almacenados en la BD. Por a tanto, cuando se habla de esquema de base de datos se debe hablar de metadatos, puesto que los esquemas son la representacin de la estructura o de los datos nales. Sin embargo la denicin de metadatos o esquemas en un Sistema de o Gestin de Bases de Datos cualquiera supone la generacin automtica o o a de las estructuras necesarias para almacenar la informacin. Por ejemplo, o cada vez que se dene una relacin como Jugadores automticamente se o a genera en el SGBD una tabla Jugadores con todas las caracter sticas y restricciones descritas en DDL (lenguaje de denicin de datos) de SQL, o tal y como se muestra a continuacin: o CREATE TABLE Jugadores ( Nombre VARCHAR2(60) NOT NULL PK, Equipo VARCHAR2(30) NOT NULL REFERENCES TEAM(TName), Altura NUMBER(4,2) NOT NULL, ColorPelo FTYPE3 (2) NOT UNDEFINED, FechaNac DATE CHECK (>=1980) CONSTRAINT minHeight CHECK Altura BETWEEN 1.70 AND 2.50) Al realizar esta denicin de los metadatos o esquema de una BD o realmente se estn instanciando las tablas del catlogo o diccionario de a a datos de un SGBDR. En dicho catlogo unicamente se almacena la ina formacin que esta sentencia proporciona, no existen datos referentes a o ningn jugador, unicamente datos referentes a las caracter u sticas de la relacin. o La insercin de un nuevo registro en la tabla Jugadores implica la o creacin de dicha relacin (proceso automtico en un SGBD al ser incluo o a ida su informacin en el Catlogo) y la instanciacin de la misma. o a o Esto no ocurre de la misma manera cuando se representa informacin utilizando ontolog Una ontolog tal y como est denida, esta o as. a, a compuesta por un conjunto de clases, propiedades y restricciones que per-

76

CAP ITULO 4. FKRO

miten describir una realidad concreta. La instanciacin de dicha ontolog o a nos permite denir la informacin que queremos representar basndonos o a en la misma. Es decir, que si nuestra ontolog trata de representar el a estndar ANSI extendido con representacin de datos difusos, su instana o ciacin nos permite denir esquemas tal y como hemos visto en el ejemplo o anterior con la tabla Jugadores. Pero unicamente hasta ah podremos lle gar. Es un hecho que se pueden instanciar cuantos elementos se deseen de una clase, sin embargo una instancia no puede ser instanciada de nuevo para denir mas conceptos asociados con la realidad que representa. Consecuentemente, no podr amos actuar de la misma forma que actuar un SGBD con las estructuras descritas usando DDL (Lenguaje de a Denicin de Datos). Siguiendo con el ejemplo anterior, si denimos en o la ontolog la clase Tabla, e instanciamos la misma con la relacin Jua, o gador, no podr amos volver a instanciar tabla Jugador para almacenar el registro (Juan Lpez, Juventud, 1.99, Castao, 10/7/1985). o n Es por esta razn que la ontolog se considera una meta-ontolog o o a a una Ontolog Representacional, puesto que para solucionar este problea ma se propone la inclusin de metaclases en la denicin de la Ontolog o o a del Esquema difuso. Estas metaclases permitirn que la generacin de a o instancias sobre las mismas generen a su vez nuevas clases que, ya s , podrn ser instanciadas para incluir los datos o tuplas (vase la gura a e 2.3 del cap tulo anterior que ilustra dicha explicacin). o A continuacin se describe la Sub-Ontolog para la Representacin o a o del Catlogo Extendido, a partir de ahora denominada Ontolog del a a Catlogo por motivos de claridad. Se describir cmo se ha construia a o do, las clases que la integran, las metaclases denidas en la misma, y un ejemplo de utilizacin. o 4.3.2. Metodolog de Desarrollo a

Para representar el esquema de una base de datos, debemos plantearnos cmo la informacin de este esquema est estructurada. Para realizar o o a este proceso se ha tomado como analog el catlogo del sistema dado a a por cualquier SGBD, que es el mecanismo que utilizan dichas aplicaciones para poder representar esta informacin. Sin embargo, cada SGBD dene o su propio catlogo de forma unica, por lo que no tendr ningn sentido a a u elegir alguna representacin concreta dada por un SGBD comercial. o Siguiendo con esta analog la propuesta consiste en representar un a, catlogo que permita mantener un registro de toda la estructura de una a

4.3. ONTOLOG DEL CATALOGO IA

77

base de datos relacional desvinculndose de cualquier implementacin a o concreta. Por tanto, la representacin del estndar ANSI SQL2003 es la o a propuesta ms razonable. Calero et al. [Cal05, Cal06] describe a modo de a ontolog dicha representacin (ver seccin 2.4.2) utilizando el lenguaje a o o de modelado UML. La propuesta de Calero carece de la descripcin de los tipos de datos o predenidos, que proporciona el estndar. Dichos tipos de datos, tambin a e se encuentran desglosados a modo de jerarqu de conceptos en el trabajo a de Pardede et al. [Par05], tal y como se ha descrito en la seccin 2.4.1. o Como ya se deni anteriormente, una ontolog debe representar el o a conocimiento compartido y consensuado por un conjunto de expertos acerca de una parcela concreta de la realidad. Partiendo de esta base, y dada la amplia difusin de las ontolog en la actualidad, se estima cono as veniente no comenzar a realizar una ontolog desde cero, sino reutilizar a ontolog que se encuentran ya desarrolladas. Una vez identicadas la as ontolog adecuadas, se proceder a realizar sobre ellas diversos proceas a sos que renamiento y soporte, para dar lugar a la ontolog nal que a contiene toda la informacin que se desea representar [Cor06]. o A continuacin se detalla el proceso para realizar la conceptualizacin o o de la ontolog que en este trabajo se propone. Este proceso est dividido a a en varias etapas que se exponen a continuacin y que pueden verse en la o gura 4.3: 1. Recorte de la ontolog de Calero et al. [Cal06, Cal05]. a 2. Recorte y extensin de la ontolog de Pardede et al. [Par05] con o a los tipos de datos difusos denidos en GEFRED. a 3. Mezcla de la ontolog de Calero et al. [Cal06, Cal05]. recortada con la de Pardede et al. [Par05] extendida. 4. Extensin de la ontolog resultante con la extensin al Modelo Reo a o lacional para denir la informacin imprecisa denida por el modelo o denominado GEFRED y su implementacin, denominada FIRST o (vase seccin B.1.1 del Anexo B). e o

Paso 1. Recorte de la Ontolog de Calero et al. [Cal06] a

Tal y como describe Calero et al. [Cal06], el ANSI SQL 2003 representa una extensin a las versiones anteriores ANSI SQL en tanto que o

78

CAP ITULO 4. FKRO

Ontologa del Estndar ANSISQL2003 Modelo Objeto Relacional

Ontologa de los Tipos de Datos Predefinidos Estndar ANSISQL2003

GEFRED
Tipos de Datos Difusos

Proceso deCorte

Proceso de Corte y Extensin

Ontologa del Estndar ANSISQL2003 Modelo Relacional

Proceso de Combinacin

Ontologa de los Tipos de Datos Predefinidos + Tipos de DatosDifusos FIRST Estndar ANSISQL2003

Ontologa del Estndar ANSISQL2003 Modelo Relacional + Especificacin de los Tipos de DatosPredefinidos

GEFRED Extension al Modelo Relacional para Representar Datos Difusos

Proceso de Extensin y Especializacin

Ontologa para la Representacin del Conocimiento Difuso

Figura 4.3: Proceso de Desarrollo de la Ontolog del Esquema a

4.3. ONTOLOG DEL CATALOGO IA

79

aade al Modelo Relacional la manipulacin de objetos y algunos elen o mentos nuevos de lenguaje Web XML a lo que ya exist (vase [Eis04]). a e El modelo que la Ontolog del Catlogo trata de representar, se centra a a unicamente en el Modelo Relacional, y por lo tanto, la parte orientada a objetos no es un requisito en su representacin. De esta manera la o ontolog de Calero et al. [Cal06] es recortada dejando unicamente las a estructuras necesarias para representar el Modelo Relacional tal y como puede verse en la gura 4.4. Dichas estructuras se describen brevemente en la tabla 4.1 (tambin se encuentran descritas con mayor detalle en e [Cal06]). Tambin se ha eliminado parte de la representacin del Modee o lo Relacional que resulta irrelevante para probar la manipulacin de la o representacin imprecisa. Entre estos recortes se encuentran los tipos de o datos compuestos y otras estructuras que complican el modelo en demas a con respecto a su grado de utilizacin como por ejemplo la representacin o o de las claves candidatas o las columnas generadas por una expresin o (muy utiles en tareas de miner de datos). Este recorte se ha realizado a fundamentalmente para simplicar la representacin de la ontolog en o a este primer prototipo. Sin embargo la inclusin de dichas clases ser algo o a inmediato en las fases de extensin de este trabajo. o
Paso 2. Recorte y Extensin de la Ontolog de Pardede et al. [Par05] o a

La clasicacin de Pardede et al. [Par05] desglosa todos los tipos de o datos base que el estndar ANSI ha ido declarando a lo largo de todas a sus versiones. A este conjunto de datos se propone aadir aquellos que n permiten representar datos difusos sobre una BD y que estn denidos a en el cap tulo B.1.1. Los tipos de datos difusos que aparecern en esta a extensin son (vase seccin B.1.2 para una descripcin ms detallada): o e o o a Tipo Difuso 1 o TD1. Representa datos cuyos valores se basan en un referencial ordenado, pero que pueden ser consultados de forma difusa. Tipo Difuso 2 o TD2. Representa datos cuyos valores se basan en un referencial ordenado, pero pueden ser almacenados y/o consultados siguiendo una distribucin de posibilidad utilizada para representar o datos difusos. Tipo Difuso 3 o TD3. Representa datos cuyos valores se basan en un referencial discreto y en las relaciones de semejanza descritas expl citamente sobre este referencial.

80

CAP ITULO 4. FKRO

SQLSchema name : string 1 1..n SchemaObject objectName : string Table isInsertableInto :bool isReferenceable :bool
has columns

Domain_Constraint search_condition:string

Domain default_option: enum * 0..1

Constraint isDeferrable:Bool initialConstraintMode :[deffered, inmediate] DerivedTable View check_option: [cascade, local, none]

query_expression: STring is_updatable: Boolean 1 is_simply_updatable:boolean BaseTable

1..* defines 1
Constraints

TableConstraint * Predefined PrimaryKey TableCheckConstraint DataTypes name:String UniqueConstraint 1..n search_condition:string

Domain_ hasTypeOf _DataType

Column name: string defaultOption :[user, current_user, current_role, session_user, system_user, * current_path, <literal>, 1..* time <date value>,<implicy typed value>] ordinalPosition :int isUpadatable: ool b isSelfReferencing bool : nullabilityCharacteristic :[not nullable, possibly nullable] *

* *
xor

hasDataType 0..1

1..n

1..n

References

* ReferentialConstraint IdentityColumn startvalue:int increment:int maximunvalue :int minimunvalue: nt i cycle_option: Boolean UniqueColumn ordinalposition : 1..n integer
UniqueColumnList

updateRule:cascade, set_null, [ set_default, restrict, no_action] deleteRule: [ ascade, set_null, c set_default, restrict, no_action] matchOption :[mach full, match partial]
References

Figura 4.4: Ontolog en UML del SQL4 de Calero et al. [Cal06] recortada a

4.3. ONTOLOG DEL CATALOGO IA

81

Tabla 4.1: descripcin Breve de las Clases de la Ontolog Recortada de o a Calero et al.
Clase Superclase SQLSchema SchemaObject Table DerivedTable BaseTable View Domain SQLSchema SchemaObject Table Table descripcin o Representa los esquemas de BD Es cualquier objeto del esquema Es un objeto Relacion El resultado de una consulta Tabla compuesta por atributos Tabla virtual basada en una consulta Conjunto de valores de un atributo agrupado, compuesto de un tipo de datos y restricciones Conjunto de valores representables Tipos de Datos Base Restricciones sobre la BD Restricciones sobre Tablas Restricciones sobre Dominios Restricciones de Negocio (Check Constraint) sobre Tablas Restriccion de Clave Unica Restriccion Referencial Representa la clave primaria Columna o atributo name, defaultOption, ordinalPosition, isUpdatable, isSelfReferencing, nullabilityCharacteristic startVal, increment, maximunVal, minimunVal, cycleOp ordinalPos searchCondition searchCondition Atributos

objectName isInsertableInto, isReferenceable queryExpresion, isUpdatable, isSimplyUpdatable CheckOption defaultOption

SchemaObject

DataType Predened Constraint DataType SchemaObject Constraint

isDeferrable, straintMode

initialCon-

TableConstraint DomainConstraint Constraint TableCheck- TableConstraint Constraint UniqueConstraint ReferentialConstraint PrimaryKey Column TableConstraint TableConstraint UniqueConstraint

updateRule, setDefault, deleteRule, matchOption

IdentityColumn UniqueColumn

Column

Column

Columna que automticaa mente acta como una u secuencia Columna que contiene valores unicos

82

CAP ITULO 4. FKRO

As pues la clasicacin de Pardede et al. [Par05] quedar represen o a tada tal y como se indica en la gura 4.5. En la misma, apartado A, se describe expl citamente dnde entrar la extensin difusa en la clasio a o cacin. En el apartado B se describen con mas detalle los tipos de datos o difusos y su integracin con el resto de la clasicacin de Pardede et al. o o [Par05]. Como podemos observar, slo aquellos datos difusos que se basan o en un referencial numrico se relacionan con el resto de la clasicacin e o (Tipo Difuso 1 y 2), es decir denen expl citamente el referencial en el que se basan. Tal y como ocurre en el paso 1 con la clasicacin de Calero et al. o [Cal06] se propone recortar la clasicacin de Pardede et al. [Par05] exo cluyendo los tipos de datos complejos y dejando unicamente los tipos base, tambin llamados predenidos (para as poder mezclar ambas one tolog en el paso siguiente). Por otro lado, en esta clasicacin tamas o bin se propone un nuevo recorte que excluye los tipos de datos menos e comunes, es decir, mantenemos unicamente aquellos que son ms suscep a tibles de ser implementados en la mayor de los SGBDs del mercado en a este primer prototipo de ontolog tal y como se ve en la gura 4.6. a, Uniendo las diferentes modicaciones a la clasicacin de Pardede et o al. [Par05] la clasicacin quedar tal y como se describe en la gura o a 4.7. La clase FDTOrder es una clase abstracta que agrupa a los tipos de datos difusos que representan valores sobre un referencial ordenado numrico. Ambos tipos de datos (TD1 y TD2 ) debern ser denidos e a por el referencial numrico sobre el que se basan, a travs de la relacin e e o hasDataType y por los atributos margen y much que se usan para la comparacin de valores dentro del dominio difuso. Ambos valores tienen o la cardinalidad establecida a 1, puesto que por cada tipo de dato slo o tienen un valor asociado al mismo.
Paso 3. Proceso de Mezcla

Una vez que disponemos de las diferentes ontolog fuente a partir de as las cuales se va a generar la nueva, el siguiente proceso es el de unicar dichas ontolog usando las partes que tengan en comn para formar as u una ontolog mayor y ms especializada. De esta forma procederemos a a a identicar las partes comunes que ambas ontolog tienen: as La clase DataTypes aparece en la Ontolog Recortada y Extendia da de Pardede et al. [Par05] mostrada en la gura 4.7, de la cual

4.3. ONTOLOG DEL CATALOGO IA

83

SQL Data Types

Predefined Types

Constructed Type

User-Defined Types

Fuzzy Types

String

Boolean

Numeric

Interval

DateTime

Atomic

Composite

Distinct BIT BLOB Charact.

Structured

Date

Time

T.Stamp . Ref

Row

Collecction

Fixed

Varying

Exact

Approximate

Array

Multiset

Fixed

Varying

CLOB.

Float

Real

Double Precision

BigInt

SmallInt

Integer

A)Taxonoma de Pardede &Wenny Rahayu, de los tipos dedatos delSQL4 junto con la inclusin de lostipos de datos difusos.

DataTypes

Fuzzy UserDefinedType Constructed Predefined

Numeric scale : int 1


hasNumericType

FDTOrder * margen: float much: float

FType3 len :int

FType1

FType2

B) Tipos de Datos Difusos relacionados con la taxonoma general de Pardede et al.

Figura 4.5: Extensin de la ontolog de Pardede et al. [Par05] con los datos o a difusos

84

CAP ITULO 4. FKRO

DataTypes

Predefined

DateTime

String

Numeric

Boolean

Date

Time

Exact Char

Approx

Fixed

Varying

Integer

Float

Real

Figura 4.6: Clasicacin de Pardede et al. [Par05] recortada o

DataTypes Predefined 1
hasNumericType

Fuzzy

DateTime

String

Boolean

Numeric

Exact Date Time Char

Approx

FDTOrder * margen : float much: float

FType3 len:int

Fixed

Varying

Integer

Float

Real

FType1

FType2

Figura 4.7: Clasicacin de Pardede et al. [Par05] recortada con la inclusin o o de datos difusos

4.3. ONTOLOG DEL CATALOGO IA

85

depende Predened y Fuzzy que representan los tipos de datos que se van a usar en esta ontolog a. La clase DataTypes aparece en la Ontolog de Recortada de Calero a et al. [Cal06] tal y como se puede ver en la gura 4.4, con la subclase Predened dependiente de ella. Sin embargo dicha clase, carece de la especicacin jerrquica de los elementos que la componen. Adems o a a la clase DataTypes cuenta con el atributo Name, que representa el nombre de del tipo de datos. Dado que las clases especicadas anteriormente coinciden en signicado y nombre, la unicacin de las ontolog es inmediata. Este proceso o as de mezcla incorpora todos los elementos que aparecen en una u otra ontolog de tal forma que se forma una nueva lo ms completa posible tal a, a y como vemos en la gura 1 4.8.
Paso 4. Extensin o de Denicin de Datos Difusos o o

Este proceso consiste en extender la ontolog generada a travs de los a e procesos de recorte y mezcla anteriores, para poder representar informacin imprecisa en el Modelo Relacional representado por dicha ontolog o a (vase gura 4.8). e La extensin de la ontolog consta de varias fases listadas a contio a nuacin y descritas con detalle en las subsecciones siguientes: o Redenicin del concepto Columna para poder englobar aquellas o que contienen datos difusos. Extensin del nmero de restricciones que pueden denirse en el o u Modelo Relacional para englobar aquellas que tengan que ver con datos difusos. Denicin de metaclases necesarias para formar la ontolog de o a datos. Denicin del concepto de Dominio Difuso, junto con la denicin o o de etiquetas ling usticas, valores discretos y relaciones de similitud. Denicin de aquellas estructuras que permiten el almacenamieno to de valores difusos (distribucin posibilidad, estructuras trapeo zoidales, triangulares, intervalares, etc.).
Todas las clases que aparecen en la gura 4.8 se encuentran descritas en los apartados anteriores.
1

86

CAP ITULO 4. FKRO

SQLSchema name : string 1 1..n SchemaObject objectName : string Table isInsertableInto :bool isReferenceable :bool
has columns

Domain_Constraint search_condition:string

Domain default_option: enum * 0..1

Constraint isDeferrable:Bool initialConstraintMode :[deffered, inmediate] DerivedTable View check_option: [cascade, local, none]

query_expression: STring is_updatable: Boolean 1 is_simply_updatable:boolean BaseTable

1..* defines 1
Constraints

TableConstraint * PrimaryKey

Domain_ hasTypeOf _DataType

Column name: string defaultOption :[user, current_user, current_role, session_user, system_user, * current_path, <literal>, 1..* time <date value>,<implicy typed value>] ordinalPosition :int isUpadatable: ool b isSelfReferencing bool : nullabilityCharacteristic :[not nullable, possibly nullable] * *
xor

TableCheckConstraint DataTypes name:String UniqueConstraint 1..n search_condition:string

hasDataType 0..1

1..n

1..n

References

* ReferentialConstraint IdentityColumn startvalue:int increment:int maximunvalue :int minimunvalue: nt i cycle_option: Boolean UniqueColumn ordinalposition : 1..n integer
UniqueColumnList

updateRule:cascade, set_null, [ set_default, restrict, no_action] deleteRule: [ ascade, set_null, c set_default, restrict, no_action] matchOption :[mach full, match partial]
References

Predefined 1
hasNumericType

Fuzzy

DateTime

String

Boolean

Numeric

Exact Date Time Char

Approx

FDTOrder * margen : float much: float

FType3 len: int

Fixed

Varying

Integer

Float

Real

FType1

FType2

Figura 4.8: Ontolog de Calero et al. [Cal06] y Pardede et al. [Par05] del a SQL4 y Tipos de Datos Difusos mezclada

4.3. ONTOLOG DEL CATALOGO IA

87

4.3.3.

descripcin de la Ontolog del Catlogo Extendido o a a

El catlogo de un SGBD nos permite almacenar los metadatos, es a decir, la informacin que representa la estructura de la informacin que la o o BD va a permitir almacenar. Si a este catlogo que ya tenemos propuesto a como ontolog en la gura 4.8, le aadimos la extensin descrita en a n o FIRST (vase seccin B.1.2) que presenta las estructuras para representar e o informacin imprecisa, obtendremos la que hemos denominado Ontolog o a del Catlogo Extendido. a A continuacin se presentan de manera desglosada cada uno de los o cambios que son requeridos en la presente ontolog para obtener dicha a Ontologa del Catlogo Extendido. a
4.3.3.1. Columnas Difusas

En la representacin de la ontolog del estndar SQL4, se debe modio a a car el concepto de Columna para que sea especializado en dos categor as (Columna Base y Columna Difusa), quedando las clases relacionadas con ella de la siguiente manera (vase gura 4.9 para ilustrar las deniciones e siguientes): Columna: es la clase ra representa todas las columnas de la BD. z, Sin embargo esta clase ser considerada como abstracta, y unicaa mente sus subclases debern ser instanciadas. Los atributos de dicha a clase son los mismos que los denidos anteriormente, a excepcin o de la nullabilityCharacteristic (que representa si la clase puede contener valores nulos), que aparecer como atributo en la subclase a Columna Base. Columna Base: s aquella que representa las columnas clsicas en a una BD. Seguir con las mismas relaciones que en la anterior denia cin lo hac la clase Columna, de hecho es este tipo de columna la o a que va a permitir mantener las diferentes restricciones de integridad que exige el Modelo Relacional. El tipo de dato vendr determinado a por la relacin hasDataTypes con los tipos de datos predenidos (no o olvidemos que el resto de tipos de datos compuestos los hemos excluido de esta propuesta) o bien por la relacin denes que relaciona o una columna con un dominio. Aunque no es la ms utilizada en la a denicin de datos, se ha optado por representar esta relacin dado o o que muchos SGBDs la utilizan impl citamente en muchas deniciones (en cualquier caso dicha relacin se describir con ms deo a a

88

CAP ITULO 4. FKRO

Table (described previously)


tablecolumns

ReferentialConstraint (described previously)

1..* Column name: string defaultOption :[user, current_user, current_role, session_user, system_user, current_path, <literal>, <date time value>,<implicy typed value>] ordinalPosition :int * isUpadatable: ool b isSelfReferencing bool :

ReferencedCol

UniqueColumn

IdentityColumn Fuzzy_Column * Base_Column nullabilityCharacteristic : [not nullable, possibly nullable] startvalue:int increment:int maximunvalue :int minimunvalue: nt i cycle_option: Boolean

1..*

hasDataType

xor

defines

* DataType (prev.descr.)

Domain namedom :String

0..1 SQLDataTypes (previously desc) FuzzyDataTypes (previously desc) 1 FDomTypeof Fdefines 1 DomTypeOf * FuzzyDomain 1 0..1 ClassicDomain

Figura 4.9: Especializacin de la clase Columna o

4.3. ONTOLOG DEL CATALOGO IA

89

talle en el apartado siguiente). La denicin del tipo de dato, sea o directamente, o sea a travs de un dominio, slo puede ser una, tal e o y como especica la relacin xor en el diagrama. En cuanto a los o atributos, esta clase es una especializacin del concepto Columna, o contiene todos los de dicha superclase e incluye nullabilityCharacteristic, completando as la lista de atributos que antes representaba Columna en la ontolog del ANSI SQL4 descrita en la seccin ana o terior. Columna Difusa: clase que representa todas aquellos atributos que pueden contener datos difusos o bien ser consultados utilizndolos. a Una columna difusa por denicin slo podr contener datos o bien o o a difusos o bien que sean susceptibles de ser consultados de forma difusa, por tanto, el tipo de datos ser representado por la relacin a o Fdenes. Esta relacin garantiza que una columna difusa est vino e culada con un dominio difuso unicamente, y no en sentido inverso. Es por esta razn que no existe un v o nculo directo a los tipos de datos difusos, ya que cuando se dene un tipo de dato difuso no suele tratarse de un unico valor sino que suele tratarse de un do minio que viene acompaado por deniciones previas de etiquetas n ling usticas o relaciones de similitud entre valores discretos, usados en el proceso de denicin de datos o en consultas. En cualquier o caso, esta relacin ser descrita con ms detalle en el apartado de o a a dominios difusos siguiente. En cuanto a atributos concretos, esta relacin no tendr ms que los heredados por la superclase. No exo a a isten restricciones denidas sobre columnas difusas porque dichas restricciones se establecen sobre los dominios difusos, como ya veremos en el subapartado de dominios y restricciones difusas siguiente.
4.3.3.2. Dominios Difusos

Tal y como se describi brevemente en el prrafo anterior correspono a diente a las columnas, un dominio representa el conjunto de valores y restricciones que un atributo puede contener. Un gran nmero de SGBDs, u dependiendo del tipo de dato que se este deniendo crea dominios en lugar de establecer un v nculo a un tipo de dato predenido, pero de forma invisible al usuario. Cuando se trata de gestionar informacin imprecisa la presencia de o dominios es imprescindible, dado que normalmente a la denicin de un o tipo de dato difuso siempre acompaa un conjunto de valores adems n a

90
Base_Column (prev. described) * * xor

CAP ITULO 4. FKRO

defines

SchemaObject objectName : string

hasDataType

Domain namedom :String Domain_Constraint * search_condition:String

DataType (prev. descr.) 0..1 SQLDataTypes (previously desc) FuzzyDataTypes (previously desc) Fuzzy_Column * * LabelDefinition lname :String lavelVal FType1_ Struct 1
FDomTypeof

1 *

DomTypeOf
FuzzyDomain

1 constraints ClassicDomain 0..1 Fuzzy_Dom_Constraint * value:boolean

1 1 1 1

Fconstraint

FuzzyDataStructures

Fdefines

referencedType2 1 FType2_Struct

referencedType1

DiscreteDefinition 1 DiscreteRelation 1

FType3_Struct relates1 *

Fuzzy_Values

Figura 4.10: descripcin de la clase Dominios o

de los datos numricos predenidos (en el caso que el tipo de dato los e permita). Estos valores suelen venir dados por etiquetas ling usticas ligadas a distribuciones de posibilidad concretas. Por ejemplo: un atributo que describa la altura de una persona, tendr representado mediante etia quetas ling usticas los valores: muy bajo, bajo, mediano, alto, muy alto. Si bien se tratara de un tipo de dato cuyos valores son discretos, estos tambin debern ser denidos previamente, por ejemplo, el color de pelo e a de una persona, vendr denido por las etiquetas: rubio, moreno, casa tao y pelirrojo y las relaciones entre dichas etiquetas. Y no solmente n a se utilizan dichas deniciones para insertar informacin en la BD sino o tambin para consultarla. e Las clases que describen los dominios difusos estn representadas en a la gura 4.10 y se describen a continuacin: o

relates

dname :String 2

4.3. ONTOLOG DEL CATALOGO IA

91

Domain: se trata de una clase abstracta que agrupa los diferentes tipos de dominios que ahora existen en la ontolog el domino bsico a, a (denido por el ANSI SQL) y el dominio difuso. Consta de un atributo, que identica el nombre del dominio del que se trata. Por ultimo cabe destacar que Domain es subclase de Schema Object, ya que es otro de los elementos que forman parte de un esquema de bases de datos. Classic Domain: se trata del dominio clsico, y se corresponde con a la clase Domain de la anterior ontolog Este dominio esta formado a. por la relacin que establece su v o nculo con las diferentes columnas que pueden usar dicha denicin de dominio (denes), la relacin o o que establece el tipo de dato por el que est formado el dominio a (domTypeOf ) que tiene que denirse expl citamente, y aquella que establece las restricciones de integridad de datos que puede denirse sobre el mismo, llamada constraints (estas restricciones se suelen corresponder con la sentencia Check ). Fuzzy Domain: sta clase representa aquellos dominios que involucran datos difusos en su denicin. La unica forma de denir un o tipo de dato difuso y vincularlo a una columna difusa es a travs de e la relacin Fdenes. El tipo de datos difuso asociado al dominio se o establece mediante la relacin FDomTypeOf. A su vez, los domino ios difusos tambin tienen restricciones asociadas a los mismos, el e nmero de restricciones asociadas a un dominio queda determinado u por Fconstraint. Por ultimo, asociadas con los dominios tambin se e encuentran las deniciones de etiquetas ling usticas y valores discretos, sin embargo estas relaciones se describirn en en subapartaa do correspondiente. En la tabla 4.2 se muestran las restricciones denidas sobre las propiedades relacionadas con dicha clase y su descripcin mas detallada. o Tal y como se puede observar, la denicin de los tipos de datos en los o valores clsicos, puede hacerse bien a travs de dominios o bien a travs a e e de un v nculo directo con el tipo de datos en cuestin. En datos difuo sos unicamente se podr realizar a travs de dominios, siendo entonces a e dicha clase la que contendr las referencias a las columnas que estn a a relacionadas con el mismo. Gracias a esta particularidad, las columnas difusas pueden compartir dominios y ahorrarse as deniciones repetitivas de los mismos.

92
atributo Fdenes FDomTypeOf Fconstraint Restriccin o cardinalidad cardinalidad cardinalidad Valor multiple 1 m ltiple u

CAP ITULO 4. FKRO


descripcin o Varias columnas pueden representarse por el mismo dominio difuso A un dominio le corresponde so un tipo lo de datos difuso Sobre un dominio se pueden relacionar mltiples restricciones difusas u

Tabla 4.2: Restricciones de los atributos de Fuzzy Domain

4.3.3.3.

Restricciones Difusas

Los tipos de datos difusos denidos en FIRST (vase seccin B.1.2 del e o Anexo B para ms detalle), tambin pueden incluir restricciones en su a e denicin. Dichas restricciones consisten en la especicacin de qu tipos o o e de valores (estructuras de datos a usar) pueden o no contener los atributos denidos. Para realizar esta especicacin se han creado las siguientes clases o (pueden verse en la gura 4.11): Fuzzy Dom Constraint: clase que agrupa todas las restricciones difusas. Es una clase abstracta, que tiene como atributo a value, que es de tipo booleano y especica si la restriccin est activada o o a no. La restriccin de cardinalidad que existe sobre este valor esta o establecida a 1. Label Constr : signica que la denicin que incluya esta restriccin o o (si el atributo value esta a verdadero) no permitir la inclusin de a o valores que sean etiquetas ling usticas. Crisp Constr : si el atributo value esta a verdadero, implicar que a no se permiten valores Crisp (numricos comunes) en el atributo e que contenga dicha restriccin. o Interval Constr : incluir esta restriccin implica no permitir el uso o de valores intervalares. Trapezoid Constr : no se permitirn valores trapezoidales en aquellos a atributos donde est restriccin tenga un valor de verdadero. a o Appr Constr : los valores aproximados a un nmero concreto no u sern permitidos en aquellos atributos en los que se dena esta a restriccin. o

4.3. ONTOLOG DEL CATALOGO IA

93

Label_Const

Nullability _Const

Crsip_Const

Unknown _Const

Interval_Const Undefined_Const

Appr_Const

Fconstraint 1 FuzzyDomain *

Trapezoid_Const

Fuzzy_Dom_Constraint value:boolean

Constraint (described previously)

Figura 4.11: descripcin de las Restricciones Difusas o

94

CAP ITULO 4. FKRO

Nullability Constr : indica que no se permiten valores nulos en este dominio. Unknown Constr : indica que no se permiten valores desconocidos (unknown) en este dominio. Undened Constr : indica que no se permiten valores indenidos (undened ) en este dominio. Existen otras dos restricciones en la denicin del modelo, son ONLY o LABEL y ONLY LABEL OR UNKNOWN. Estas dos restricciones se forman generando expl citamente las restricciones necesarias para que se cumplan las anteriores, es decir generar una instancia de todas las restricciones a excepcin de la de etiquetas ling o usticas, y/o de valores de unknown. En la ontolog la denicin de las restricciones difusas se realiza a a o travs de la denicin de un dominio usando la relacin FConstraint y e o o no, tal y como se podr plantear a priori, sobre las columnas. A pesar a de que utilizando el lenguaje FSQL [Gal99] las restricciones se vinculan a las columnas, esta decisin se ha tomado debido al hecho de que los o tipos de datos difusos se vinculan a las columnas a travs de dominios, e con lo que resulta ms lgico que sea este dominio el que albergue dichas a o restricciones.
4.3.3.4. Valores Discretos y Relaciones de Similitud

La representacin de valores discretos, nos permite establecer etiqueo tas que no tienen signicado basado en un referencial ordenado, sino que su signicado vendr dado por la relacin que se establece entre las dia o ferentes etiquetas asociadas al mismo dominio. Dicho signicado ser esa tablecido mediante la asignacin de un valor de similitud (establecido o entre 0 y 1) para cada par de valores. Para representar estas etiquetas y las relaciones, se han propuesto dos nuevas clases en la ontolog (tal y como podemos ver en la gura 4.10): a Fuzzy Data Structures: clase abstracta que engloba las estructuras difusas concretas relacionadas con etiquetas como las etiquetas ling usticas y los valores discretos. Discrete Denition: clase que permite representar las etiquetas que tienen un valor semntico asociado, pero no puede ser cuanticado a

4.3. ONTOLOG DEL CATALOGO IA

95

sin una representacin expl o cita de su valor a travs de relaciones e de similitud con otras etiquetas. El valor de esta etiqueta viene representado mediante el atributo de esta clase denominado dname. La relacin referencedType1 permite establecer con qu dominios o e est relacionada la etiqueta que est denida. a a Discrete Relation: esta clase representa como los valores discretos, denidos como instancias de la clase Discrete Denition, son relacionados dos a dos a travs un valor numrico (entre 0 y 1) ese e tablecido con el atributo similarity. El atributo relates es el que permitir establecer que dos etiquetas discretas estn relacionadas a a con un valor dado. Las restricciones sobre las propiedades de objetos de estas clases se describen en la tabla 4.3. Estas clases representan la base del tipo difuso 3 ya que las instancias de las mismas denen todos los valores que este tipo de dato puede representar.
Tabla 4.3: Restricciones de los atributos de Discrete Relation y Discrete Denition
Atributo ReferencedType1 Relates dname Restriccin o cardinalidad cardinalidad cardinalidad Valor 1 2 1 descripcin o Una denicin de discreto, slo puede eso o tar asociada con un dominio difuso Una relacin difusa tiene dos deniciones o de discretos relacionadas Nombre del discreto

4.3.3.5.

Etiquetas ling usticas

En la gura 4.10 podemos ver cmo se ha representado la existencia de o etiquetas ling usticas que representan valores basados en distribuciones de posibilidad (basadas en un referencial ordenado). Las clase Label Denition es la que representa todas las etiquetas mediante su instanciacin. Se les da un nombre a travs del atributo o e lname, se vinculan a dominios difusos mediante la relacin referencedo Type2 y representan un valor mediante una referencia a una distribucin o de posibilidad denida a travs de la relacin labelVal (que conecta dicha e o o a etiqueta con la clase Ftype2 Struct que a continuacin ser descrita). Las restricciones sobre esta clase se describen en la tabla 4.4.

96

CAP ITULO 4. FKRO

Por ultimo dicha clase es subclase de Fuzzy Data Structures, que es una clase abstracta que engloba las estructuras difusas denidas en FIRST (vase seccin B.1.2 del Anexo para ms detalle). e o a
Atributo ReferencedType2 labelVal lname Restriccin o cardinalidad cardinalidad cardinalidad Valor 1 1 1 descripcin o Una denicin de etiqueta, slo puede eso o tar asociada con un dominio difuso Una etiqueta unicamente puede tener aso ciada una distr. posibilidad Nombre de la etiqueta

Tabla 4.4: Restricciones de los atributos de Label Denition

4.3.3.6.

Representaciones de las Estructuras de los Tipos de Datos Difusos

Los valores que los tipos de datos difusos representan deben de ser denidos siguiendo una estructura concreta. Los tipos de datos difusos basados en un referencial ordenado podr representar datos clsicos, an a para lo cual pueden usarse los tipos de datos base, o bien ser distribuciones de posibilidad, pero en este ultimo caso las estructuras que per mitirn almacenar dichos valores deben ser generadas expl a citamente. Dichas estructuras estn descritas con detalle en FIRST (ms detalle en a a la seccin B.1.2 del Anexo B). o La gura 4.12 muestra las estructuras de datos que los tipos de datos difusos pueden soportar para almacenar sus valores. Dichas estructuras estn representadas por las siguientes clases: a FuzzyValues: clase abstracta que agrupa aquellas estructuras de representacin que se necesitan para denir datos que no son los o predenidos y representan datos difusos basados en un referencial ordenado. FType1 Struct: clase abstracta que agrupa aquellos estructuras que unicamente pueden usar los valores que han sido denidos como de Tipo Difuso 1. Null : clase que representa un valor nulo. Esta clase es subclase de FType1 Struct, FType2 Struct o FType3 Struct. Unknown: clase que representa un valor unknown o desconocido. Esta clase es subclase de FType2 Struct o FType3 Struct.

4.3. ONTOLOG DEL CATALOGO IA

97

Trapezoid labelID Interval a:numeric b:numeric * alfa:numeric beta:numeric delta:numeric gamma:numeric

Crisp x:numeric

Approx v:numeric

Label

* LabelDefinition 1 lname :String

labelVal

1 FType2_ Struct Unknown

Undefined

Null Fuzzy_Values FType1_ Struct NumericT val:numeric FType3_ Struct Distr.Poss . 1 *

DiscreteDefinition dname:String 1

Simple
discreteID

* degree:float

Figura 4.12: descripcin de las estructuras para los TD Difusos o

discreteVal

98

CAP ITULO 4. FKRO

Undened : clase que representa un valor indenido. Esta clase es subclase de FType2 Struct o FType3 Struct. NumericT : clase que representa un valor clsico numrico. Para ello a e esta clase cuenta con el atributo val que es de tipo numrico. En e este atributo se almacena el valor numrico deseado mediante su e instanciacin. o FType2 Struct: clase abstracta que agrupa aquellos estructuras que unicamente pueden usar los valores que han sido denidos como de Tipo Difuso 2. Crisp: clase que representa un valor clsico numrico. Para ello a e esta clase cuenta con el atributo x que es de tipo numrico. En e este atributo se almacena el valor numrico deseado mediante su e instanciacin. o Approx : clase que representa un valor aproximado a un nmero conu creto. Tal y como se describe en FIRST, se trata de una distribucin o de posibilidad aproximada. Para ello esta clase cuenta con el atributo v que es de tipo numrico en el que se almacena el valor deseado e mediante su instanciacin. o Interval : clase que representa un valor intervalar. Tal y como se describe en FIRST, se trata de una distribucin de posibilidad ino tervalar. Para ello esta clase cuenta con los atributos a y b que denen los l mites del intervalo que se usan. Trapezoid : clase que representa un valor trapezoidal. Tal y como se describe en FIRST, se trata de una distribucin de posibilidad o aproximada. Para ello esta clase cuenta con los atributos alfa, beta, delta y gamma que denen los limites del trapecio. Label : clase que representa a una etiqueta ling ustica. Dicha clase hace referencia a la clase Label Denition a travs de la relacin e o labelID. FType3 Struct: clase abstracta que agrupa aquellos estructuras que unicamente pueden usar los tipos que han sido denidos como de Tipo Difuso 3. Simple: clase que representa un valor discreto, con un cierto grado de certeza dado por el atributo degree. Dicho atributo slo ser usao a do cuando la clase Simple sea parte de una DistrPoss (clase descrita

4.3. ONTOLOG DEL CATALOGO IA

99

a continuacin). En el resto de los casos su valor carece de inters o e pues se interpreta como 1. El valor de este atributo en el primer caso hace referencia a la denicin previa de valores discretos en la o clase discrete Denition usando el atributo discreteID. DistrPoss: clase que representa un conjunto de valores simples (instancias de la clase Simple) con un valor de certeza en cada uno de ellos (matizados por degree y descritos previamente), a travs de la e relacin discreteVal. o En la tabla 4.5 se muestran las restricciones relacionadas con estas estructuras.
Atributo labelID Restriccin Valor o cardinalidad 1 descripcin o La estructura de un valor label, tiene asociada una denicin de etiqueta (instancia de Lao bel Denition) 1 La estructura de un valor Simple, tiene asociada una denicin de valor discreto (instancia de Diso crete Denition) multiple Una distr. posibilidad, tiene asociada uno o varios valores de instancias de valores Simples

discreteID

cardinalidad

discreteVal

cardinalidad

Tabla 4.5: Restricciones de las estructuras de datos que representan valores difusos

4.3.3.7.

Denicin del Esquema. Metaclases. o

Una vez planteada la Ontologa del Catlogo (podemos verla en la a gura 4.13), nos queda especicar cmo un esquema que representa datos o difusos puede ser denido en la misma.
Metaclases

La Ontologa del Catlogo describe la estructura de la informacin a o que puede ser representada en una BD relacional extendida con informacin imprecisa. Por tanto, al representar la estructura de la cualquier o informacin trabajamos con metadatos. o En ontolog los metadatos son aquellos que permiten especicar as, como la realidad est representada. En este caso, ser metadatos la a an denicin de clase, propiedad, restriccin y cualquier otro elemento que o o

100
SQLSchema name : string

CAP ITULO 4. FKRO


Constraint isDeferrable:Bool initialConstraintMode :[deffered, inmediate] View check_option: [cascade, local, none]

1..*

SchemaObject objectName : string DerivedTable

Table isInsertableInto :bool isReferenceable : bool


tablecolumns

query_expression: STring is_updatable: Boolean is_simply_updatable:boolean 1 BaseTable

1..* Column name: string defaultOption :[user, current_user, current_role, session_user, system_user, current_path, <literal>, <date time value>,<implicy typed value>] ordinalPosition :int * isUpadatable: ool b isSelfReferencing bool : 1
isconstrainedby

TableConstraint *

TableCheckConstraint search_condition2:String

PrimaryKey UniqueConstraint ReferentialConstraint updateRule:cascade, set_null, [ set_default, restrict, no_action] deleteRule: [cascade, set_null, set_default, restrict, no_action] matchOption :[mach full, match partial] * Domain_Constraint * search_condition:String

References

1..n
/const

Fuzzy_Column *

Base_Column nullabilityCharacteristi * c [not nullable , : possibly nullable ] *


ReferencedCol

1..*

hasUniqueCol

Label_Const IdentityColumn startvalue:int increment:int maximunvalue :int minimunvalue int : cycle_option: Boolean

Nullability_Const

UniqueColumn

1..n

constraints

Crsip_Const

Unknown _ Const

Interval_ Const Undefined _Const

hasDataType

Domain DataType (prev. descr.) 1 SQLDataTypes (previously desc) FuzzyDataTypes (previously desc) defines Fdefines * LabelDefinition lname :String labelVal 1 FType3_Struct (prev.desc) 1 0..1 FDomTypeof * 1 namedom :String Appr _Const

xor

DomTypeOf
FuzzyDomain

ClassicDomain 0..1 1 Fconstraint

Trapezoid_Const

Fuzzy_Dom_Constraint * value:boolean

referencedType1

1 1

FuzzyDataStructures

1 DiscreteDefinition dname:String 2 relates1 * DiscreteRelation 1

referencedType2

FType1_ Struct (prev. descr.))

FType2_Struct (prev. desc) Fuzzy_Values

Figura 4.13: descripcin de Ontolog del Catlogo o a a

similarity

4.3. ONTOLOG DEL CATALOGO IA

101

nos permitiera representar algo en la misma (este es el caso de las Ontologas Representacionales). En el caso de la Ontologa del Catlogo del Modelo Relacional se a cuenta con la denicin bsica de una Relacin o Tabla como elemeno a o to fundamental para representar la informacin. Adems de describir la o a estructura y particularidades de una relacin esta deber ser por s miso a ma un elemento que permita la insercin de datos. Por ejemplo y al o contrario que ocurre en un SGBD del Modelo Relacional que al representar una relacin o tabla en el catlogo automticamente obtendr o a a amos relaciones como personas, departamentos, piezas, proyectos, etc., esto no resultar posible hacerlo en una ontolog En ella ocurre que al rea a. presentar estas mismas relaciones en el catlogo denido hasta ahora, se a obtendr unicamente las instancias de las clases de catlogo (de la clase an a Tabla, Columna Base, Columna Difusa, etc.). Por tanto, insertar datos en dichas tablas ser imposible dado que no se puede instanciar una a instancia, que es lo que dichas tablas son en la Ontolog del Catlogo a a tal y como est representada. a En la gura 4.13 vemos como la clase Tablas est sombreada para a especicar que dicha clase es una Metaclase. Esta decisin se ha tomado o para poder representar dichas relaciones (tablas), como lo que verdaderamente son, una representacin de alto nivel de una forma de organizar los o datos. Por consiguiente la denicin de tabla (relacin) deber ser tratao o a da como una metaclase y su instancia genera una nueva clase. Siguiendo con el ejemplo anterior, todas aquellas tablas que hab amos denido como instancias: personas, departamentos, piezas, proyectos, etc. ser ahora an a su vez clases de la ontolog y por tanto podr ser instanciadas, para a, an contener datos. En el apartado 2.3.2 se introduce el concepto de cmo o las metaclases, una vez que son instanciadas, generan a la vez instancias y clases, y cmo estas mismas clases pueden volver a generar una nueva o ontolog dado que representan una realidad diferente a la del catlogo. a a En este caso la realidad que representan dichas instancias ser la del proa pio esquema que se esta representando, por ejemplo, el de la gestin de o una biblioteca, la gestin de una BD multimedia, etc. o
Importacin o

Cuando se desea representar una ontolog cualquiera mediante un a lenguaje concreto, como por ejemplo OWL, se ha de recurrir a las ontolog representacionales que denen los conceptos sobre los que se as representa la informacin. En el caso de OWL se requieren las ontolog o as

102

CAP ITULO 4. FKRO

descritas en la tabla 4.6 para poder utilizar la representacin de datos o que ste lenguaje propone. e En el caso de una BDD se requiere la presencia de la Ontolog del a Catlogo para su correcta denicin. Sobre dicha ontolog se procedea o a, r a denir instancias que representan la BDD deseada. Sin embargo, a la Ontologa del Catlogo es una estructura esttica, es decir, representa a a una realidad y como tal no debe ser modicada, simplemente debe ser utilizada para representar otros conceptos. De esta forma, y al igual que ocurre con las descripciones de la tabla 4.6, la Ontolog del Catlogo no a a se utiliza directamente para generar el nuevo esquema de BDD, puesto que no debe permitirse su modicacin. El proceso consistir en generar o a una nueva ontolog basada en OWL, donde se importa la Ontolog del a a Catlogo, cuyos elementos estarn accesibles y sern instanciables, pero a a a no podrn modicarse, y no formarn parte de la nueva denicin. La a a o nueva ontolog estar entonces denida por un conjunto de instancias y a a clases (dado que existen metaclases en la ontolog que representan un a) esquema de BDD relacional.
Ontolog URL a xsd http://www.w3.org/2001/XMLSchema# descripcin o Tipos de datos base y elementos XML Elementos del esquema de RDFS Sintaxis bsica de a RDF Caracter sticas propias del OWL

rdfs rdf owl

http://www.w3.org/2000/01/rdf-schema# http://www.w3.org/1999/02/22-rdf-syntax-ns# http://www.w3.org/2002/07/owl#

Tabla 4.6: Ontolog importadas en OWL as

La Ontologa del Catlogo se ha denominado fdtscho, y se encuentra a disponible en http://personales.ya.com/fkrowl/fdtscho/fdtscho.owl. Tambin podemos ver el cdigo descrito en el CD que se adjunta a e o este trabajo de tesis. 4.3.4. Ejemplos

A continuacin se mostrar un breve ejemplo de como un esquema o a de BDD puede ser denido en la Ontolog del Catlogo mediante la a a instanciacin del mismo. Vamos a plantear el esquema de BDD que se o

4.3. ONTOLOG DEL CATALOGO IA

103

muestra en gura 4.14 y cuyo esquema lgico en FSQL2 [Bla03b] se o expone a continuacin: o CATS ( CatID INTEGER PK, CatName STRING (20), Age FTYPE2 (1,2) FLOAT (1) NOT UNKNOWN, Weigh FTYPE1 (0.4,2.0) FLOAT (2), Character FTYPE3 (3) NOT NULL, hasBreed (BREED.BreedName) ) BREED( BreedName STRING (100) PK, CharacterB FTYPE3 (3)) VISIT( Date Date PK, Price FLOAT (2), Cat (CATS.CatID) PK) TREATMENT ( illness STRING (200) kind FTYPE3 (2) Date (VISIT.Date) PK, Cat (VISIT.CatID) PK) MEDICINE ( MedicineName STRING (100) PK, dose FTYPE2 (0.5,3) FLOAT (2) ) PRESCRIBE ( Medicine (MEDICINE.MedicineName) PK, Date (TREATMENT.Date) PK, Cat (TREATMENT.CatID) PK) PERIODICAL_TREATMENT ( Date (TREATMENT.Date) PK, Cat (TREATMENT.CatID) PK, duration INTEGER, period INTEGER) SPORADIC_TREATMENT ( Date (TREATMENT.Date) PK, Cat (TREATMENT.CatID) PK, rule STRING (200) )
Delante de cada una de las tablas descritas deber escribirse la sentencia CREATE a TABLE que se ha omitido para claricar la descripcin o
2

104
CATS CatID : Integer CatName : String (20) Age: FType2 (Float) Weigh: FType1 (Float) Character: FType3 BREED hasBreed > BreedName : String (100) CharacterB :FType3

CAP ITULO 4. FKRO

TREATMENT VISIT Date : Date Price: Float illness: String (200) Kind: FType3 prescribe

MEDICINE MedicineName : String (100) dose: FType2 (Float)

PERIODICAL period: Integer duration: Integer

SPORADIC rule: String (200)

Figura 4.14: Ejemplo en UML de una BD de Cl nica Veterinaria

Adems de los datos comunes del esquema, quedan por denir en a detalle de los dominios difusos que forman esta BDD, siendo:

Etiquetas ling usticas utilizadas en el dominio denido para el atributo Age de la tabla Cat. La descripcin de dichas etiquetas, nombre o y tipo de estructura utilizada y valor dado a las mismas se muestra en la tabla 4.7.
Nombre Etiqueta Cachorro(puppy) Joven (young) Adulto (adult) Mediana-Edad (middle-aged) Viejo (old) Tipo de Valor Intervalar Trapezoidal Trapezoidal Aproximado Trapezoidal Valor 0-1 1-1,4-4-5 2-3-6-10 5 7-8-13-15

Tabla 4.7: descripcin de los valores de las etiquetas ling o usticas relacionadas con el dominio del atributo Age de la tabla Cat

4.3. ONTOLOG DEL CATALOGO IA 4.3.4.1. Ejemplo 1: Cl nica Veterinaria

105

Valores Discretos relacionados con el atributo Character de la tabla Cat y su relaciones de similitud. Los valores discretos denidos son: Agresivo (Aggresive), Tranquilo (Calm), Inquieto (eager), Indiferente (Indiferent), Carioso (Loving). La relacin de similitud esn o tablecida entre estos valores se describe en la tabla 4.8.
Indiferente Tranquilo Carioso n Inquieto Agresivo Indiferente 1 Tranquilo 0.8 1 Carioso n 0 .3 0.5 1 Inquieto 0.4 0 0.2 1 Agresivo 0.1 0 0.1 0.5 1

Tabla 4.8: Relaciones de Similitud del Atributo Character

Una vez descritos los valores del esquema de bases de datos difusas que se desea denir, se procede a la instanciacin del mismo. Concretamente o se presentan en este ejemplo las instancias generadas para la denicin o completa de las tablas Cat y Breed en la tabla 4.9, ya que el resto de las tablas tienen una denicin similar, y por motivos de claridad es o preferible su exclusin del documento. o Cada una de estas instancias queda denida por los valores que adquieren las propiedades de las clases instanciadas. En la tabla 4.10 se listan las propiedades de objeto ms representativas de las instancias de a Cats y Breed descritas anteriormente en la tabla 4.9. En la tabla 4.11 se describen las propiedades de tipo de datos bsicos, que denen los valores a nales del esquema.
Por ultimo hay que destacar, que todas aquellas instancias de la clase Table (o como subclase Base Table) se convierten a su vez en clases tambin. As pues e tendr amos generadas en el ejemplo descrito una clase: Cats, Visit, Breed, Medicine, Treatment, Sporadic Treatment, Periodical Treatment y Prescribe. 4.3.4.2. Ejemplo 2: BD Suelos

En este ejemplo se propone la utilizacin de una BD Difusa Real, como la o de Suelos descrita en el Anexo C y cuyo esquema se encuentra denido en el apartado C.1.2. Dicha denicin supone la instanciacin de la Ontolog del o o a Catlogo, concretamente de todas aquellas clases que permitan la denicin a o

106

CAP ITULO 4. FKRO

Tabla 4.9: Instanciacin de la Ontolog del Catlogo del ejemplo de la Cl o a a nica Veterinaria
rdf:ID Cats Breed CatID CatName Age Weigh Character CatBreed BreedName CharacterB FDom Age FDom Character FDom Weight DTCatID DTCatName DomAge FDT DomAge DT DomWeigh FDT DomWeigh DT DomCharacter FDT DTBreedName PrimaryKeyCat PrimaryKeyBreed FK Cat Breed Instancia de BaseTable BaseTable UniqueColumn BaseColumn FuzzyColumn FuzzyColumn FuzzyColumn BaseColumn UniqueColumn FuzzyColumn FuzzyDomain FuzzyDomain FuzzyDomain Integer Varying FType2 Float FType1 Float FType3 Varying PrimaryKey PrimaryKey ReferentialConstraint LD MiddleAgedCat Label Denition DT LV Approx MiddleAgedCat LD PupyCat Label Denition DT LV PuPyCat Intervalar LD AdultCat3 Label Denition DT LV AdultCat4 Trapezoid agressiveCat Discrete Denition calmCat5 Discrete Denition rdfs:comment Representa Informacin de los gatos o Especies de Gatos Identicador de gatos Nombre de gatos Edad de gatos (aos) n Peso de gatos (gramos) Cracter de gatos(carioso,amigable,arisco) a n Nombre de gatos Nombre de la especie Carcter de la especie a Dominio para tipo dato difuso Age Dominio para Character Dominio difuso relacionado con Weight Tipo de dato de CatID Tipo de dato de CatName Tipo de dato difuso de FDom Age Tipo de dato de FDom Age Tipo de dato difuso de FDom Weigh Tipo de dato de FDom Weigh Tipo de dato difuso de FDom Character Tipo de dato de BreedName Restriccin de Clave Primaria para Cat o Restriccin de Clave Primaria para Breed o Restriccin de clave ajena para atributo Breed o de la relacion Cats Etiqueta del dominio FDom Age Valor asignado a la etiqueta LD MiddleAgedCat Etiqueta del dominio FDom Age Valor asignado a la etiqueta LD PupyCat Etiqueta del dominio FDom Age Valor asignado a la etiqueta LD AdultCat Valor discreto relacionada con el dominio FDom CatCharacter Valor discreto relacionado con el dominio FDom CatCharacter Relacin entre calmCat e indiferentCat o Restriccin de Valor atrib. Character o Restr. valor Desconocido en atrib. Age

discreterelations 186 Discrete Relation NullabilityConst 15 NullabilityConst UnknownConst 18 UnknownConst

4.3. ONTOLOG DEL CATALOGO IA

107

Tabla 4.10: Propiedades de Objeto en la Ontolog del Catlogo del ejemplo a a de la Cl nica Veterinaria
De Cats Atributo tableColumns rdf:resource CatName, CatID, Age, Weigh, Character,BreedName BreedName, CharacterB DTCatID PrimaryKeyCats DTCatName DTBreedName DTBreedName FDTCatAgeDom Age UnknownConst 18 DTCatAgeDom FDTCatWeighDom Weigh DTCatWeightDom FDTCatCharacterDom Character, CharacterB NullabilityConst 15 Cats CatID Breed BreedName CatBreed PrimaryKeyBreed DT LV AdultCat FDom CatAge Approx 10 FDom CatAge FDom CatCharacter CalmCat, IndiferentCat

Breed CatID CatID CatName CatBreed BreedName FDom CatAge FDom CatAge FDom CatAge FDTCatAgeDom FDom CatWeigh FDom CatWeigh FDTCatWeighDom FDom CatCharacter FDom CatCharacter FDom CatCharacter PrimaryKeyCats PrimaryKeyCats PrimaryKeyBreed PrimaryKeyBreed FK Cats Breed FK Cats Breed LD adultCat LD adultCat LD adultCat LD adultCat7 agressiveCat8 Discrete Relations 189

tableColumns hasDataType hasUniqueConst hasDataType hasDataType hasDataType FDomTypeOf FDenes FConstraints2 hasNumericType FDomTypeOf FDenes hasNumericType FDomTypeOf FDenes FConstraints2 isConstrainedBy hasUniqueCol isConstrainedBy hasUniqueCol referencedCol references labelVal referencedType labelVal referencedType referencedType3 relates

108

CAP ITULO 4. FKRO

Tabla 4.11: Propiedades de Tipo de datos en la Ontolog del Catlogo del a a ejemplo de la Cl nica Veterinaria
De Cats Cats Breed CatID 10 FDomCatAge11 FDTCatName FDTAgeDom FDTAgeDom DTAgeDom FDTWeighDom FDTWeighDom DTWeighDom DTCharacterDom DTBreedName DT LV AdultCat DT LV AdultCat DT LV AdultCat DT LV AdultCat Approx 1012 Discrete Relations 1813 Atributo ObjectName isReferenceable ObjectName nameCol ObjectName lenghStr margen much precision margen much precision len lenghStr alfa beta delta gamma v similarity rdf:datatype xsd:String xsd:bool xsd:String xsd:String xsd:String xsd:int xsd:oat xsd:int xsd:int xsd:oat xsd:int xsd:int xsd:int xsd:int xsd:oat xsd:oat xsd:oat xsd:oat xsd:oat xsd:oat value Cats true Breed ID FDom CatAge 20 1 2 1 0.4 2 2 3 100 2 3 6 10 5 0.8

4.3. ONTOLOG DEL CATALOGO IA

109

del esquema que describe dicha BDD de Suelos. A continuacin se reeja o qu clases han de ser instanciadas, de forma breve, y se ejemplica dicha dese cripcin mediante la exposicin de parte de las instancias que se han generado o o (dado que es inviable mostrar todas las instancias debido a su gran nmero). u La denicin completa de la BDD de Suelos en la Ontolog del Catlogo se o a a adjunta en un CD a este trabajo de tesis. Se instanciarn las clases relativas a la denicin de relaciones (Basea o Table) y atributos (BaseColumn, FuzzyColumn, UniqueColumn). En este ejemplo se expone la instanciacin de la relacin Localizacin y los o o o e atributos: Latitud, Longitud, siograa, tmedia, codigo es. Tambin se denir la relacin Estructura y los atributos: codigo es y grado es. a o Clases relativas a las restricciones de Clave primaria (PrimaryKey). Al denir las tablas se denen sus claves primarias, en el ejemplo que estamos poniendo, Latitud y Longitud en Localizacin y codigo es en Eso tructura. Clases relativas a las restricciones de clave ajena (instancias de Referential Constraint). En el ejemplo que nos ocupa, se asociar codigo es a de Localizacin con la clave primaria de la tabla estructura, esto es, o codigo es de Estructura. Clases relativas a la denicin de etiquetas ling o usticas relacionadas con los Tipos Difusos 2. Clases relativas a la denicin de los valores discretos relacionados con o los Tipos Difusos 3, y las relaciones de similitud que denen a cada uno de estos valores discretos. Clases relativas a los dominios difusos. Clases relativas a la denicin de restricciones difusas. o

110

CAP ITULO 4. FKRO Tabla 4.12: Instancias de la Ontolog del Catlogo del ejema a plo de la BDD Suelos
rdf:ID Localizacion Estructura Latitud Longitud siongraa tmedia codigo es loc codigo es grado es FDom tmedia FDom siograa FDom grado es DTLatitud DTLongitud FDT2 domtmedia DT dom FDT2 FDT3 domsiograa DTcodigo es FDT3 domgrado es PKLocalizacion PKEstructura FK codigo eslocalizacion LD baja tmedia Instancia de BaseTable BaseTable UniqueColumn UniqueColumn FuzzyColumn FuzzyColumn BaseColumn UniqueColumn FuzzyColumn FuzzyDomain FuzzyDomain FuzzyDomain Numeric Numeric FType2 Float FType3 Numeric FType3 PrimaryKey PrimaryKey ReferentialConstraint Label Denition Trapezoid rdfs:comment Denicin de la relacin Localizacin o o o Denicin de la relacin Estructura o o Identicador de Localizacin, coordeo nadas de latitud Identicador de Localizacin, coordeo nadas de longitud Fisiograf del suelo en esta locala izacin o Media de la temperatura Cdigo de la estructura de suelos que o hay en esta localizacin o Identicador numrico de la estructura e Tipo de estructura Dominio para tipo dato difuso tmedia Dominio para siograf a Dominio difuso relacionado con grado es Tipo de dato de Latitud Tipo de dato de Longitud Tipo de dato difuso de tmedia Tipo de dato asociado a los FDT2 puesto que la mayor son Float(2) a Tipo de dato difuso de siograf a Tipo de dato de codigo es Tipo de dato difuso de grado es Restriccin de Clave Primaria para Loo calizacin o Restriccin de Clave Primaria para Eso tructura Restriccin de clave ajena para atrio buto codigo es loc de la relacion Localizacin hacia la relacion Estructura o Etiqueta relacionada con el dominio FDom tmedia. Signica temperatura media baja. Valor asignado a la etiqueta LD baja tmedia Etiqueta relacionada con el dominio FDom tmedia. Signica temperatura media media.

T baja tmedia

LD media tmedia Label Denition

4.3. ONTOLOG DEL CATALOGO IA Tabla 4.12: Instancias de la Ontolog del Catlogo del ejema a plo de la BDD Suelos
rdf:ID T media tmedia LD alta tmedia Instancia de Trapezoid Label Denition Trapezoid DiscreteDenition DiscreteDenition DiscreteDenition DiscreteDenition DiscreteDenition DiscreteDenition DiscreteDenition DiscreteDenition DiscreteDenition DiscreteRelation DiscreteRelation DiscreteRelation DiscreteRelation DiscreteRelation DiscreteRelation DiscreteRelation DiscreteRelation DiscreteRelation DiscreteRelation rdfs:comment Valor asignado a la etiqueta LD media tmedia Etiqueta relacionada con el dominio FDom tmedia. Signica temperatura media alta. Valor asignado a la etiqueta LD alta tmedia Discreto del dominio FDom siograa con valor Llano Discreto del dominio FDom siograa con valor FondoLadera Discreto del dominio FDom siograa con valor Ladera Discreto del dominio FDom siograa con valor Cima Discreto del dominio FDom siograa con valor Meseta Discreto del dominio FDom grado es con valor VeryWeak Discreto del dominio FDom grado es con valor Weak Discreto del dominio FDom grado es con valor Moderate Discreto del dominio FDom grado es con valor Strong Relacin entre Llano y FondoLadera o Relacin entre Llano y Ladera o Relacin entre Llano y Cima o Relacin entre Llano y Meseta o Relacin entre FLad y Ladera o Relacin entre FLad y Cima o Relacin entre FLad y Meseta o Relacin entre Ladera y Cima o Relacin entre Ladera y Meseta o Relacin entre Cima y Meseta o

111

T alta tmedia DD llanosiograf DD aderasiograf DD laderasiograf DD cimasiograf DD mesetasiograf DD VWeaksiograf DD Weaksiograf DD Moderatesiograf DD Strongsiograf discreterelations 35 discreterelations 36 discreterelations 37 discreterelations 38 discreterelations 39 discreterelations 40 discreterelations 41 discreterelations 42 discreterelations 43 discreterelations 44

112

CAP ITULO 4. FKRO Tabla 4.12: Instancias de la Ontolog del Catlogo del ejema a plo de la BDD Suelos
rdf:ID discreterelations 76 discreterelations 77 discreterelations 78 discreterelations 79 discreterelations 80 discreterelations 81 UndenedConst138 UnknownConst137 UnknownConst52 UndenedConst51 NullabilityConst49 TrapezoidConst50 IntervalConst48 CrispConst 47 ApproxConst 46 Instancia de DiscreteRelation DiscreteRelation DiscreteRelation DiscreteRelation DiscreteRelation DiscreteRelation UndenedConst UnknownConst UnknownConst UndenedConst NullabilityConst TrapezoidConst IntervalConst CrispConst ApproxConst rdfs:comment Relacin entre Very Weak y Weak o Relacin entre Very Weak y Moderate o Relacin entre Very Weak y Strong o Relacin entre Weak y Moderate o Relacin entre Weak y Strong o Relacin entre Moderate y Strong o Restr. FDom Restr. FDom Restr. FDom Restr. FDom Restr. FDom Restr. FDom Restr. FDom Restr. FDom Restr. FDom de valor indenido tmedia valor desconocido tmedia valor desconocido siograf de valor indenido siograf de valor nulo siograf de valor trapezoidal siograf de valor intervalar siograf de valor crisp siograf de valor approximado siograf para para para para para para para para para

Tabla 4.13: Propiedades de Objeto en la Ontolog del a Catlogo del ejemplo de la BDD de Suelos a
De Localizacion Latitud Latitud Longitud Longitud Codigo es loc FDom siograf FDom siograf Atributo tableColumns hasUniqueConst hasDataType hasUniqueConst hasDataType hasDataType FDomTypeOf FDenes rdf:resource Latitud, Longitud, siograa, tmedia, codigo es PKLocalizacion DTLatitud PKLocalizacion DTLatitud DTCodigo es PKEstructura FDT3 Dom Fisiograa

4.3. ONTOLOG DEL CATALOGO IA Tabla 4.13: Propiedades de Objeto en la Ontolog del a Catlogo del ejemplo de la BDD de Suelos a
De FDom siograf Atributo FConstraints2 rdf:resource ApproxConst 46, CrispConst 47, IntervalConst 48, TrapezoidConst 50, NullabilityConst 49, UndendedConst 51, UnknownConst 52 FDom siograf FDom siograf FDom siograf FDom siograf FDom siograf FDom siograf FDom siograf tmedia UndendedConst 138, Const 139 DT Dom FDT2 Localizacion Latitud,Longitud codigo es loc PKEstructura Localizacion codigo es, grado es PKEstructura FDT3 grado es grado es Estructura codigo es T Baja tmedia FDom tmedia T media tmedia FDom tmedia T alta tmedia FDom tmedia FDom siograf FDom siograf FDom siograf FDom siograf FDom siograf FDom grado es FDom grado es

113

ApproxConst 46 CrispConst 47 IntervalConst 48 NullabilityConst 49 TrapezoidConst 50 UnknownConst 51 UndenedConst 52 FDom tmedia FDom tmedia FDom tmedia FDT2 Dom tmedia PKLocalizacion PKLocalizacion FK codigo elocalizacion FK codigo elocalizacion FK codigo elocalizacion Estructura Codigo es FDom grado es FDom grado es PKEstructura PKEstructura LD baja tmedia LD baja tmedia LD media tmedia LD media tmedia LD alta tmedia LD alta tmedia DD llano siograf DD FLad siograf DD ladera siograf DD cima siograf DD meseta siograf DD VWeak siograf DD Weak siograf

FConstraints FConstraints FConstraints FConstraints FConstraints FConstraints FConstraints FDomTypeOf FDenes FConstraints2 hasNumericType isConstrainedBy ishasUniqueCol referencedCol references isConstrainedBy tableColumns hasUniqueConst FDomTypeOf FDenes isConstrainedBy ishasUniqueCol labelVal referencedType labelVal referencedType labelVal referencedType referencedType referencedType referencedType referencedType referencedType referencedType referencedType

Unknown-

114

CAP ITULO 4. FKRO Tabla 4.13: Propiedades de Objeto en la Ontolog del a Catlogo del ejemplo de la BDD de Suelos a
De DD Mederatesiograf DD Strong siograf Discrete Relations 35 Discrete Relations 35 Discrete Relations 36 Discrete Relations 36 Discrete Relations 37 Discrete Relations 37 Discrete Relations 38 Discrete Relations 38 Discrete Relations .. Discrete Relations .. Atributo referencedType referencedType relates1 relates2 relates1 relates2 relates1 relates2 relates1 relates2 relates1 relates2 rdf:resource FDom grado es FDom grado es DD llano siograf DD FLad siograf DD llano siograf DD ladera siograf DD llano siograf DD cima siograf DD llano siograf DD meseta siograf ... ...

Tabla 4.14: Propiedades de Tipo de datos en la Ontolog a del Catlogo del ejemplo de la BDD de Suelos a
De Localizacion Estructura latitud longitud tmedia siograa codigo es loc codigo es grado es FDT2 dom tmedia FDT2 dom tmedia DT dom FDT2 FDT3 domsiograa FDT3 domgrado es PKLocalizacion PKEstructura FK codigo eslocalizacion LD baja tmedia T baja tmedia T baja tmedia T baja tmedia T baja tmedia Atributo ObjectName ObjectName NameCol NameCol NameCol NameCol NameCol NameCol NameCol margin much precision len len ObjectName ObjectName ObjectName lname alfa beta delta gamma rdf:datatype xsd:String xsd:String xsd:String xsd:String xsd:String xsd:String xsd:String xsd:String xsd:String xsd:oat xsd:oat xsd:oat xsd:int xsd:int xsd:String xsd:String xsd:String xsd:String xsd:oat xsd:oat xsd:oat xsd:oat value Localizacion Estructura latitud longitud tmedia siograa codigoEs codigoEsLoc gradoEs 4.0 10.0 2.0 1 1 PKLocalizacion PKEstructura FK codigo eslocalizacion baja 0 0 6.5 8.5

4.3. ONTOLOG DEL CATALOGO IA Tabla 4.14: Propiedades de Tipo de datos en la Ontolog a del Catlogo del ejemplo de la BDD de Suelos a
De LD media tmedia T media tmedia T media tmedia T media tmedia T media tmedia LD alta tmedia T alta tmedia T alta tmedia T alta tmedia T alta tmedia DD llano siograf DD aderasiograf DD laderasiograf DD cima siograf DD mesetasiograf DD VWeaksiograf DD Weak siograf DD Moderatesiograf DD Strongsiograf discreterelations 35 discreterelations 36 discreterelations 37 discreterelations 38 discreterelations 39 discreterelations 40 discreterelations 41 discreterelations 42 discreterelations 43 Atributo lname alfa beta delta gamma lname alfa beta delta gamma dname dname dname dname dname dname dname dname dname similarity similarity similarity similarity similarity similarity similarity similarity similarity rdf:datatype xsd:String xsd:oat xsd:oat xsd:oat xsd:oat xsd:String xsd:oat xsd:oat xsd:oat xsd:oat xsd:String xsd:String xsd:String xsd:String xsd:String xsd:String xsd:String xsd:String xsd:String xsd:oat xsd:oat xsd:oat xsd:oat xsd:oat xsd:oat xsd:oat xsd:oat xsd:oat value media 8.5 10.5 12.5 14.5 baja 14.5 16.5 21 21 llano FondoLadera Ladera Cima Meseta VeryWeak Weak Moderate Strong 0.5 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2

115

116

CAP ITULO 4. FKRO Tabla 4.14: Propiedades de Tipo de datos en la Ontolog a del Catlogo del ejemplo de la BDD de Suelos a
De discreterelations 44 discreterelations 76 discreterelations 77 discreterelations 78 discreterelations 79 discreterelations 80 discreterelations 81 UndenedConst138 UnknownConst137 UnknownConst 52 UndenedConst 51 NullabilityConst49 TrapezoidConst 50 IntervalConst 48 CrispConst 47 ApproxConst 46 Atributo similarity similarity similarity similarity similarity similarity similarity value value value value value value value value value rdf:datatype xsd:oat xsd:oat xsd:oat xsd:oat xsd:oat xsd:oat xsd:oat xsd:bool xsd:bool xsd:bool xsd:bool xsd:bool xsd:bool xsd:bool xsd:bool xsd:bool value 0.5 0.3 0.3 0.3 0.3 0.3 0.3 true true true true true true true true true

Como vemos, este ejemplo permite representar un caso real de BDD que se utiliza en la actualidad. En este ejemplo predominan los Tipos Difusos 2, con etiquetas ling usticas asociadas a su dominio y denidas mediante representaciones trapezoidales y los Tipos Difusos 3, con valores que utilizan una unica etiqueta para describir su valor (len=1). Este tipo de representacin es o el ms utilizado dado que es el que los usuarios encuentran ms sencillo para a a describir la realidad.

4.4.
4.4.1.

Sub-Ontolog del Esquema de Datos Difusos a


Justicacin de la Sub-Ontolog o a

Tal y como se describi anteriormente, la Ontolog del Catlogo lo unico o a a que permite es describir los esquemas completamente a modo de instancias, al igual que acta el diccionario de datos en los SGBDs. Sin embargo, no u

4.4. ONTOLOG DEL ESQUEMA IA

117

disponemos de dichos esquemas denidos en forma de clases, como una ontolog unica que representa la realidad. a Al denir metaclases en la Ontolog del Catlogo estamos esbozando una a a segunda ontolog que pretende representar dicho esquema descrito. Sin ema, bargo el generar estas clases simplemente no implica obtener la ontolog necea saria que permite describir la realidad que el esquema est representando segn a u el Modelo Relacional. Y por tanto, tampoco permite que dicha ontolog sea a instanciada para poder denir la informacin que exista acerca de los datos o representados por ese esquema (en el entorno de las BDD, se corresponder a con las tuplas). Nos vemos en la necesidad, por tanto, de denir una nueva ontolog a para tir del esquema descrito mediante la instanciacin de la Ontolog del Catlogo. o a a A esta ontolog la denominaremos a partir de ahora, Ontolog del Esquema a a en lugar de Sub-Ontolog del Esquema de Datos Difusos, por razones de clara idad. Sin embargo, cabe plantearse la funcionalidad de esta Ontolog del Esquea ma que por un lado, representa la realidad de un dominio particular siguiendo los criterios de representacin del Modelo Relacional y por otro, permite insero tar valores en la misma a modo de instancias, tal y como ocurre en el Modelo Relacional con las tuplas. En cuanto a la representacin del esquema como ontolog aporta utilidad o a en tanto que su publicacin en Web, permitir el acceso a la estructura de ino a formacin por parte de usuarios autorizados, o bien ayudar a la comparticin o a o de esquemas de muy diversa ndole (como se plante en el apartado 2.2.1). o La incorporacin de datos en la ontolog como instancias (al igual que o a tuplas en el Modelo Relacional) proporciona una gran utilidad en tanto que facilita al usuario la denicin de la informacin, puesto que lo aisla de las o o particularidades del sistema de almacenamiento o del lenguaje utilizado para su denicin. En cuanto al hecho de usar una ontolog como medio de gestin o a o de grandes cantidades de informacin no se considera el medio ms adecuado o a para hacerlo al contrario de lo que ocurre con un SGBD, puesto que ste ultimo e hace una gestin mas eciente de la informacin que alberga. o o Otra aportacin de esta propuesta es la generacin de consultas (formuo o lacin de las mismas) a travs del entorno intuitivo que la Ontolog del Eso e a quema facilita. De cualquier modo, la Ontolog del Esquema representa el conocimiento a que hay en una BDD de forma accesible a los usuarios y la generacin de la o misma es, como se expondr a continuacin, automtica gracias a la denicin a o a o previa realizada sobre la Ontolog del Catlogo. a a

118

CAP ITULO 4. FKRO

4.4.2.

Generacin o Conversiones o

La Ontolog del Esquema puede ser generada a partir de la denicin del a o mismo en forma de instancia de la Ontolog del Catlogo. De esta forma, se a a comienza dicha ontolog a partir de las clases generadas por las metaclases a (concretamente la metaclase Tables) y se realizan las siguientes acciones para obtener la Ontolog del Esquema completa. a Se genera para cada tabla una propiedad por cada uno de los atributos denidos en ella (atributo tableColumn). El nombre de la propiedad se corresponde con el nombre de la columna asociada a la tabla. Adems, cada una a de estas propiedades tendr cardinalidad con valor de 1, un valor atmico a o indivisible, para cumplir con la normalizacin (Forma Normal 1 ) que dene o el Modelo Relacional. Como rango estas propiedades tienen la estructura de datos correspondiente al tipo de datos para el que ha sido denido en la Ontolog del Catlogo, de tal forma que: a a Si se trata de una columna difusa: Se genera una propiedad de objeto donde el rango se ja dependiendo del tipo de dato que tenga el dominio al que este ligado el atributo. As pues este rango se ja siguiendo la tabla de correspondencias 4.15. Sin embargo, esta denicin de rangos tiene o una excepcin consistente determinada por la existencia de restricciones o difusas sobre el dominio. As pues si sobre el dominio difuso correspon diente existe alguna restriccin difusa, entonces el rango esta limitado o unicamente a aquellas clases en las que se cumpla dicha restriccin, y o no a su superclase (vase la gura 4.11 y la seccin 4.3.3.3 para conocer e o con ms detalle dichas restricciones). a Tipo de Dato Difuso FType1 FType2 FType3 Estructura de FType1 FType2 FType3 Dato Difusa Struct Struct Struct

Tabla 4.15: Correspondencia de los tipos de datos difusos con las estructuras de datos difusas en la ontolog a Si se trata de una Columna Clsica: Se genera una propiedad de tipo de a datos, donde se asocia a cada tipo de dato denido en la Ontolog del a Catlogo un tipo de dato denido en la ontolog representacional. Los a a tipos de datos denidos en la ontolog representacional son los denidos a por el estndar XML en el caso de usar lenguajes de representacin de a o ontolog basados en Web, como OWL o RDF, en otro caso, se vincula as

4.4. ONTOLOG DEL ESQUEMA IA

119

el rango al tipo de datos base que tenga denido el propio lenguaje escogido. T.D. Predenido Boolean Varying Float Integer Date TStamp Time ... Correspondencia con XML http://www.w3.org/2001/XMLSchema#Boolean http://www.w3.org/2001/XMLSchema#string http://www.w3.org/2001/XMLSchema#oat http://www.w3.org/2001/XMLSchema#int http://www.w3.org/2001/XMLSchema#date http://www.w3.org/2001/XMLSchema#datetime http://www.w3.org/2001/XMLSchema#time ...

Tabla 4.16: Correspondencia de algunos de los tipos de datos predenidos en la Ontolog del Catlogo con los tipos de datos base denidos en XML a a El uso de las estructuras de datos difusos que se plantean (vase tabla e 4.15) requiere la utilizacin de la Ontolog del Catlogo, dado que estos datos o a a estn denidos en la misma. Esta ontolog es recomendable que sea importaa a da, y usada de esta forma que no pueda ser modicada (dada su naturaleza como ontolog representacional). Estas estructuras se encuentran denidas en a esta ontolog dado que se utilizan para representar la informacin imprecisa a o necesaria para denir los dominios de los atributos difusos (como las etiquetas ling usticas). Otro v nculo que existe entre la Ontolog de Catlogo y la del Esquema a a reside en la denicin de los dominios difusos del esquema a representar. Una o vez denido el esquema como instancia de la Ontolog del Catlogo, existen a a valores denidos a priori asociados con los dominios difusos, como etiquetas ling usticas y relaciones de similitud entre valores discretos, que a pesar de estar denidos como instancias en esta Ontolog del Catlogo deben esa a tar disponibles para poder ser utilizados en la Ontolog del Esquema recin a e denida. Existen dos alternativas para resolver esta situacin y as permitir el uso o de los datos del dominio. Ambas alternativas contemplan el hecho de que las instancias de la Ontolog del Catlogo se encuentran denidas en un nuevo a a archivo que tiene importada esta ontolog Y que la Ontolog del Esquema a. a se puede generar automticamente a partir de dichas instancias. a La primera consiste en denir en el mismo archivo donde estaban las instancias de Catlogo, la nueva Ontolog del Esquema. Este es el caso a a

120

CAP ITULO 4. FKRO ms habitual y tiene como ventaja que no ser necesario hacer ningn a a u cambio sobre los dominios puesto que ya se encontrar disponibles. an La segunda consiste en utilizar un nuevo archivo para denir la Ontolog a del Esquema, eliminando as el archivo de instancias generado a partir de la Ontolog del Catlogo. En dicho caso habr que importar los valores a a a denidos en los diferentes dominios difusos.

La generacin de la Ontolog del Esquema tambin conlleva algunas desveno a e tajas. Existen restricciones del esquema, que se encuentran denidas (como instancias de la Ontolog del Catlogo) que no pueden tenerse en cuenta en a a la Ontolog del Esquema. Estas restricciones vienen dadas por la naturaleza a propia de la ontolog que estamos representando, tanto por los conceptos a representados, como por el lenguaje de ontolog utilizado, OWL-Full (desas crito en la seccin A.2.3) que conere una exibilidad total para representar o cualquier tipo de informacin. Esta exibilidad que es necesaria para la repo resentacin de Metadatos, implica la misma exibilidad a la hora de denir o cualquier informacin sobre la Ontolog del Catlogo est permitido o no, o a a e como vemos a continuacin: o Es imposible comprobar si existe una coincidencia en la denicin de una o restriccin de clave ajena, entre los atributos referenciados y los atributos o que referencian (este inconveniente no es especialmente relevante dada la imposibilidad de denir claves ajenas, impedimento descrito en el punto siguiente). No es posible restringir los valores que pueden tomar los atributos que son claves ajenas. Es decir, se permitir la insercin de cualquier valor a o en el campo a pesar de que se trate por denicin de una clave ajena o que hace referencia a otro atributo de otra relacin. o No se puede controlar que la denicin de valores discretos en un atrio buto Distr.poss, coincida con el parmetro mximo len que determina el a a nmero mximo de valores que permite denir el dominio. u a Tampoco es posible que restricciones simples sobre los tipos de datos predenidos (como denir una cadena de 20 caracteres, o un otante con 3 decimales) se lleven a cabo. Esto se debe a que se utilizan tipos de datos genricos de OWL sobre los que no existe ninguna limitacin. e o La solucin a estas posibles violaciones de restricciones de integridad o de o negocio sern tratadas en una fase posterior en la que ya intervenga el SGBD. a

4.4. ONTOLOG DEL ESQUEMA IA

121

4.4.3.
4.4.3.1.

Ejemplos
Ejemplo 1: Cl nica Veterinaria

Este ejemplo trata de mostrar el proceso de generacin de una Ontolog del o a Esquema a partir de las instancias de la Ontolog del Catlogo y cmo dicha a a o Ontolog del Esquema permitir denir informacin de tuplas, mediante su a a o instanciacin. Para ello se propone la utilizacin de la ontolog descrita en el o o a ejemplo por la gura 4.14 de la seccin anterior 4.3.4. o Siguiendo el proceso de conversin descrito anteriormente, la Ontolog o a del Esquema de la BDD de la Cl nica Veterinaria que parte con las clases generadas por la metaclase Tabla, tendr la descripcin en UML mostrada en a o la gura 4.15. Como puede observarse dependiendo del tipo de datos de los atributos, se establecen nuevas relaciones en la descripcin del Esquema. As o , las clases van deniendo los atributos en forma de propiedades de objeto o de tipo de datos como se detalla a continuacin: o Todos los atributos clsicos se quedan como propiedades de tipo de dato a en el diagrama UML aparecen como atributos de clase normales. Todos los atributos difusos sin ninguna restriccin denida sobre ellos, o se vinculan directamente a la estructura correspondiente tal y como se establece en la tabla 4.15. Por ejemplo la relacin Weight. o Todos los atributos difusos que contengan alguna restriccin sobre el o dominio difuso, restringen el mbito de las estructuras difusas con las a que estn relacionados para cumplir dicha restriccin. Este es el caso del a o atributo Character y CharacterB de la Tabla Cats y Breed respectivamente, y Age de la Tabla Cats. Character y CharacterB, al compartir dominio comparten la misma propiedad en la que slo permitirn los vao a lores de FType3 Struct a excepcin de Null. En cambio Age no permite o valores Unknown, por tanto todas las estructuras de FType2 Struct son permitidas a excepcin de Unknown. o La instanciacin de la ontolog a partir de aqu es inmediata. Se podrn o a a denir nuevas tuplas sobre el esquema de la BDD como las expresadas a continuacin en lenguaje FSQL obteniendo los siguientes resultados: o INSERT INTO CATS VALUES( "siames") 1, "Kitty", $young, 2.3, $eager,

INSERT INTO CATS VALUES( 2, "Garfield", $3, 1.9, {$indiferent(0.9), $calmado(0.6)}, angora)

122

CAP ITULO 4. FKRO

dose weigh Crisp x:numeric Interval a:numeric b:numeric Approx v:numeric Label VISIT Trapezoid alfa:numeric beta:numeric delta:numeric gamma:numeric FType2_Struct Unknown character Age MEDICINE MedicineName : String (100) Date : Date Price: Float CATS CatID : Integer CatName: String (20) hasBreed > BREED BreedName : String (100) characterB

TREATMENT illness: String (200)

prescribe

Undefined

FType1_ Struct Fuzzy_Values

Null PERIODICAL NumericT val:numeric period: Integer duration: Integer SPORADIC rule: String (200)

FType3_ Struct

Distr.Poss .

Simple degree:float Kind

Figura 4.15: Ejemplo de una Cl nica Veterinaria generada como una Ontolog del Esquema a

4.4. ONTOLOG DEL ESQUEMA IA

123

INSERT INTO BREED VALUES( (0.8), $agresivo (0.5)})

siames, {$inquieto (0.9), $jugeton

INSERT INTO BREED VALUES(angora, $calmado) Como podemos ver, con estas muestras, la insercin de datos implica la o instanciacin de las clases: Cats y Breed y de todas las clases relacionadas con o ellas, tal y como se muestra en la gura 4.15. En la tabla 4.17 se listan todas las instancias generadas para denir estas tuplas, y en las tablas 4.18 y 4.19 se listan los valores y referencias de los atributos que componen los valores de dichas tuplas. Concretamente en la tabla 4.18 se describen los atributos que son de objeto, es decir, que hacen referencia a instancias de otras clases, de esta manera sabremos con qu instancia estarn vinculadas los valores Age, Weight, e a o Character. En cuanto a la tabla 4.19, se describen los valores concretos, como los referentes a CatName o BreedName. Tabla 4.17: Instanciacin de la Cl o nica Gatos denida en como Ontolog de a Esquema
rdf:ID Cats1 Cats2 Breed3 Breed4 Label5 NumericT6 Simple7 Approx8 NumericT9 DistrPoss10 Simple11 Simple12 DistrPoss13 Simple14 Simple15 Simple16 Instancia de Cats Cats Breed Breed Label NumericT Simple Approx NumericT DistrPoss Simple Simple DistrPoss Simple Simple Simple rdfs:comment 1o tupla del ejemplo: instancia de Cats 2o tupla del ejemplo: instancia de Cats 3o tupla del ejemplo: instancia de Breed 4o tupla del ejemplo: instancia de Breed dene la referencia al valor young dene el valor FTD1: 2.3 dene valor Simple eager dene el valor Approximadamente 3 dene valor 1.9 dene valor indiferent(0.9),calmado(0.6) dene el valor Simple indiferente dene el valor Simple calmado dene valor inquieto(0.9),jugueton(0.8) dene el valor Simple inquieto dene el valor Simple jugueton dene el valor Simple calmado

4.4.3.2.

Ejemplo 2: BDD Suelos

Siguiendo con el ejemplo de la BDD real de Suelos, la generacin de la o Ontolog del Esquema de esta BDD a partir de las instancias denidas ana teriormente sobre la Ontolog del Catlogo ha generado una ontolog que a a a

124

CAP ITULO 4. FKRO

Tabla 4.18: Propiedades de Objeto en la Ontolog del Esquema del la Clinica a Veterinaria
De Cats1 Cats1 Cats1 Cats2 Cats2 Cats2 DistrPoss10 DistrPoss10 Breed3 Breed4 DistrPoss13 DistrPoss13 Label5 Atributo Age Weigh Character Age Weigh Character discreteVal discreteVal CharacterB CharacterB discreteVal discreteVal labelID rdf:resource Label5 NumericT6 Simple7 Approx8 NumericT9 DistrPoss10 Simple11 Simple12 DistrPoss13 Simple16 Simple14 Simple15 LD YoungCat

Tabla 4.19: Propiedades de tipos de dato en la Ontolog del Esquema de la a Clinica Veterinaria
De Cats1 Cats1 Cats2 Cats2 Breed3 Breed4 NumericT6 NumericT9 Approx Simple7 Simple11 Simple12 Simple15 Simple16 Simple17 Atributo CatID CatName CatId CatName BreedName BreedName val val v degree degree degree degree degree degree rdf:datatype xsd:String xsd:String xsd:String xsd:String xsd:String xsd:String xsd:Float xsd:Float xsd:Float xsd:Float xsd:Float xsd:Float xsd:Float xsd:Float xsd:Float value 1 Kitty 2 Garleld angora siames 2.3 1.9 3 0.9 0.6 0.8 0.5 -

4.4. ONTOLOG DEL ESQUEMA IA

125

puede ser instanciada para almacenar/gestionar las tuplas de dicha BDD. Algunas de estas tuplas se encuentran denidas en el Anexo C, concretamente en la seccin C.2. o La Ontolog del Esquema de la BD de Suelos ha generado una clase por a cada una de las relaciones denidas. Las propiedades de las mismas se han creado en funcin del tipo de dato que se trate, esto es, propiedades de tipo de o datos, en el caso de que el tipo de dato sea predenido y propiedades de objeto en el caso de que el tipo de datos se dena utilizando un dominio, como en el caso de los difusos. El resto de caracter sticas, como restricciones tambin se e han tenido en cuenta en la denicin de la misma, siempre y cuando puedan o ser aplicables, como por ejemplo, las restricciones difusas y las restricciones de cardinalidad. En la tabla 4.20 se muestran todas las instancias generadas junto con una descripcin de qu representan. Los valores concretos de las tuplas sern repreo e a sentados en las tablas de propiedades, que se dividen en dos: las propiedades de objeto, que hacen referencia a instancias que ya han sido denidas y que pueden verse en la tabla 4.21. Y las propiedades de tipo de dato, que representan valores concretos y que pueden verse en la tabla 4.22. Los valores representados en estas tablas se corresponden con las 2 primeras tuplas descritas en el apartado C.2 del Anexo C. Adems, para seguir con la denicin del esquea o ma de la BDD de Suelos descrito en el apartado 4.3.4.2, slo se visualizarn o a en estas tablas los valores correspondientes a los atributos denidos, esto es, para la tabla Localizacin: latitud, longitud, tmedia, siograf codigo es loc o a, y para la tabla Estructura: codigo es y grado es.

Tabla 4.20: Instanciacin de la BDD Suelos denida en como Ontolog de o a Esquema


rdf:ID Localizacion1 Localizacion2 Estructura3 Estructura4 Instancia de Localizacion Localizacion Estructura Estructura rdfs:comment 1o tupla del ejemplo: 2o tupla del ejemplo: 3o tupla del ejemplo: 4o tupla del ejemplo: instancia instancia instancia instancia de de de de Localizacion Localizacion Estructura Estructura

Este ejemplo es similar al anterior (BDD Cl nica Veterinaria), pero menos rico en variedad de datos a denir. Los valores utilizados en una BD real consisten mayoritariamente en etiquetas ling usticas descritas dado que son ms fciles de utilizar para el usuario nal. El resto de datos son en datos a a numricos de tipo otante o entero. e

126

CAP ITULO 4. FKRO

Tabla 4.21: Propiedades de Objeto en la Ontolog del Esquema de la BDD a Suelos


De Localizacion1 Localizacion1 Localizacion2 Localizacion2 Estructura3 Estructura4 Atributo siograa tmedia siograa tmedia grado es grado es rdf:resource DD ladera siograf DD baja tmedia DD ladera siograf DD baja tmedia DD Weak grado es DD Weak grado es

Tabla 4.22: Propiedades de tipos de dato en la Ontolog del Esquema de la a BDD Suelos
De Estructura3 Estructura4 Localizacion1 Localizacion1 Localizacion1 Localizacion2 Localizacion2 Localizacion2 Atributo codigo es codigo es latitud longitud codigo es loc lontitud longitud codigo es loc rdf:datatype xsd:oat xsd:oat xsd:oat xsd:oat xsd:oat xsd:oat xsd:oat xsd:oat value 1 2 41045 5478 1 41135 5598 2

4.5. CONCLUSIONES

127

4.5.

Conclusiones

Se ha conseguido en este cap tulo describir la Ontolog para la Reprea sentacin del Conocimiento Difuso. Dicha ontolog cuyo objetivo es repreo a, sentar la informacin de una Base de Datos Relacional Difusa, est compuesta o a por dos sub-ontolog de diferente tipo que representan la misma informacin. as o Una primera, se basa en la instanciacin de la Ontolog del Catlogo, ontolog o a a a representacional que describe con exactitud la estructura del catlogo del Moa delo Relacional. Una segunda, denominada de manera genrica Ontolog del e a Esquema, representa en forma de ontolog (no de instancias) la BDD que se a pretende denir. Dicha ontolog podr ser instanciada y por lo tanto denir a a tuplas sobre ella. Gracias a esta denicin podremos aislar la representacin de una BDD del o o modelo de representacin dnde se almacene, a la vez que se le proporcionan o o como valor aadido todas las caracter n sticas que la representacin ontolgica o o aporta, como puede ser su presencia en la Web Semntica. A continuacin a o se describen con detalle las ventajas e inconvenientes que presenta dicha propuesta.

4.5.1.

Ventajas e Inconvenientes

Ventajas La Ontolog de Representacin del Conocimiento Difuso plantea las sigua o ientes ventajas, que se agruparan atendiendo a dos criterios: Con respecto a la naturaleza de la informacin: o Claridad en la Informacin. La informacin imprecisa y el Modelo Reo o lacional quedan representadas a travs de los conceptos fundamentales, e atendiendo en particular a la generalidad de dichos conceptos y a la simplicidad de los mismos. Se trata de evitar que la denicin de la o informacin sea dependiente de una representacin en particular que o o complica la comprensin de los datos. o Independencia del SGBD. La representacin de la ontolog evita la o a relacin directa con el SGBD con el que se est trabajando. Este heo e cho, permite que las particularidades de cada SGBD se obvien en la representacin de una BDD, y se dejen para las tareas de traduccin o o o comunicacin. De esta forma la denicin de una BDD en la ontolog o o a siempre se realizar de la misma manera sea cual sea el recipiente de a dicha informacin. o

128

CAP ITULO 4. FKRO Extensibilidad. Una representacin genrica del modelo relacional difuso o e permite que la extensin del mismo, para representar otros tipos de o datos ms complejos o operaciones, sea ms sencilla. La extensin ser a a o a realizada sobre la ontolog (la capa abstracta) dejando los complejos a detalles de la extensin sobre los SGBD ocultos para los usuarios nales. o Normalizacin. Los datos denidos sobre la ontolog siempre son denio a dos siguiendo el patrn denido en la Ontolog del Catlogo. Por tanto o a a la denicin del esquema de BDD siempre tiene la misma representacin. o o De esta forma ayudar a que cualquier aplicacin que requiera el uso de a o esta informacin slo necesite conocer los detalles de dicha Ontolog del o o a Catlogo. a Automatizacin de la Conversin. Al disear el modelo relacional dio o n fuso utilizando una ontolog con metadatos denidos en la misma, se a establece el vinculo entre el esquema y la informacin del diccionario o de datos. El esquema de BDD denido sobre la Ontolog del Catlogo a a permite una conversin directa a la generacin de una Ontolog propia o o a del Esquema. Dada la naturaleza de la informacin que se encuentra noro malizada y la relacin que existe entre ambas deniciones (ontolog o as) el proceso exacto para poder realizar dicha traduccin esta claramente o determinado y puede ser fcilmente automatizado. a

Con respecto a la interaccin con el entorno: o Estandarizacin. Con la Ontolog del Catlogo se obtiene una plantio a a lla accesible y pblica sobre la que se denen los datos de un esquema u difuso. Cualquier esquema difuso denido utilizndola ser accesible por a a cualquier usuario/programa y compartir la misma representacin que a o otro esquema de las mismas caracter sticas (sea cual sea el lugar donde est almacenado). e Automatizacin. Se puede automatizar la interaccin con el SGBD, es o o decir, establecer una v de comunicacin entre la ontolog y cualquier a o a SGBD y as poder intercambiar informacin. o Publicacin de Datos Difusos. La ontolog de un Esquema de BDD o a relacionales en Web, permite que los usuarios tengan informacin difusa o accesible desde cualquier mecanismo de consulta que lo permita. Publicacin de Esquemas de BDD en Web. La publicacin de la ontolog o o a de cualquier Esquema basado en BDD conere semntica a la informaa cin que no puede ser anotada semnticamente por cualquier otro medio, o a

4.5. CONCLUSIONES

129

dado que la informacin que una BD contiene no se encuentra incluida o en los archivos web. BD Heterogneas. La disponibilidad de una Ontolog del Catlogo genrie a a e ca sobre el Modelo Relacional (con datos difusos) permite la comparticin de informacin entre BBDD de muy diversa o o ndole, puesto que todos los SGBDs comparten la misma denicin del Catlogo descrito en dicha o a ontolog a. Comparticin y otras Operaciones con el Entorno. Se presenta otra nueo va forma de representar informacin utilizando esquemas de BDD meo diante una ontolog Este esquema puede ser compartido y usado por a. otras representaciones que denan la misma realidad o complementaria. Existen (tal y como se describi en el cap o tulo anterior) otros tipos de representacin de esquemas como ontolog que no estn basadas en o as a modelos relacionales, Esquemas de BD, Esquemas XMLs, Esquemas en RDF, folksonom jerarqu de conceptos, etc. Toda esta informacin as, as o necesita mecanismos para permitir su interaccin, pero la publicacin de o o cmo la informacin esta estructurada en dichos esquemas, permite que o o estos mecanismos sean fcilmente denibles. a Inconvenientes Esta propuesta tambin presenta algunas desventajas, tal y como se ve a e continuacin: o Lenguaje inteligible: Por un lado, la representacin de la ontolog en un o a entorno de frames, permite la interpretacin de la misma de forma intuio tiva en la que los conceptos son claramente distinguibles. Sin embargo, tal y como ocurre en este caso, si se utiliza un lenguaje de representacin o web, la interpretacin de la misma se hace tediosa e incluso imposible o dada la ingente cantidad de etiquetas que hacen falta para representar todos los conceptos. Necesidad de una aplicacin para interaccionar con la ontolog Dada o a: la naturaleza del lenguaje de representacin OWL, ininteligible para el o usuario, se hace necesaria una herramienta que permita visualizar y/o editar dicha ontolog de forma intuitiva para el usuario. a Aplicacin para denir /consultar. El proceso de consulta o denicin de o o esquemas requiere de alguna aplicacin espec o ca que permita realizar dicho proceso de manera guiada al usuario. La gestin o denicin de o o

130

CAP ITULO 4. FKRO los datos del esquema en una ontolog requieren una aplicacin para a o permitir tratar la informacin difusa de forma correcta. o Necesidad de una aplicacin para la conversin automtica. Si se desea o o a realizar la automatizacin para la generacin de la Ontolog del Eso o a quema a partir del esquema denido como instancias de la Ontolog a del Catlogo, es necesaria la elaboracin expl a o cita de los procesos que permitan generarla. Comunicacin con los SGBD compleja. La ontolog no almacena los o a datos como nalidad, se tratar de un interfaz que comunica con el a SGBD donde los datos estar almacenados. La comunicacin deber conan o a templar las particularidades de cada SGBDs. As cualquier interaccin o con el SGBD tendr que tener un mdulo que interprete las caracter a o sticas del mismo para poder interaccionar con l. Estas particularidades e sern ampliamente detalladas en el cap a tulo siguiente. Dependencia del programa de denicin de ontolog Dado que es como as. plicado denir de manera manual la ontolog por lo tedioso del lenguaa, je, la generacin de la Ontolog del Esquema requiere el uso de libreo a r y convenciones (JENA [Pro07]) para generar el cdigo en OWL as o automticamente. Esta caracter a stica vuelve dependiente a la ontolog a de las particularidades de la librer escogida o lenguaje utilizado. a

Cap tulo 5

Arquitectura del Sistema y Aplicaciones


5.1. Introduccin o

En este cap tulo se realizar una descripcin de la arquitectura necesaria a o para desarrollar y explotar la Ontolog de Representacin del Conocimiento a o Difuso descrita en el cap tulo anterior. Tal y como se deni anteriormente la Ontolog de Representacin del o a o Conocimiento Difuso esta dividida en dos sub-ontolog as: la Ontolog del a Catlogo y la Ontolog del Esquema que permiten representar la informacin a a o difusa almacenada en una BDD Relacional, a la vez que tenerla disponible en forma de ontolog Para que dicha representacin de informacin se lleve a a. o o cabo se requiere la ejecucin de dos procesos bien diferenciados: por un lado, se o necesita establecer un sistema que permita la representacin de la Ontolog o a del Esquema, y de alguna manera facilitar al usuario la denicin/manipuo lacin de los datos difusos de manera amigable e intuitiva. Por otro lado, o dicha Ontolog del Esquema una vez que se ha desarrollado, se comunica a con el SGBDD correspondiente. Dicha comunicacin no es trivial, dado que o los SGBDDR no comparten la misma forma de representacin de datos, ni o soportan el mismo tipo de lenguaje (cada uno realiza una representacin del o SQL distinta) ni tienen las mismas capacidades funcionales. Para llevar a cabo estos procesos de representacin y manipulacin de ino o formacin difusa a travs del uso de una ontolog y su posterior comunicacin o e a o con un SGBD real se describe la Arquitectura del Sistema. En ella se presenta el ujo de informacin de la Ontolog al SGBD especicando los mdulos ms o a o a representativos que constituyen el sistema y todos los casos que pueden darse en dicha comunicacin. o 131

132

CAP ITULO 5. ARQUITECTURA Y APLICACIONES

Se presentarn tambin, de manera razonada, las diferentes decisiones que a e se han tomado para llevar a cabo la implementacin de dicha arquitectura, o desde herramientas que permitan generar una ontolog hasta las particularia, dades de los diferentes SGBD que permiten representar informacin imprecisa. o Adems se muestra la aplicacin desarrollada, describiendo qu funcionala o e idad aporta y qu herramientas y tecnolog han sido utilizadas en la implee as mentacin de la misma. o Por ultimo, en este cap tulo se realizar un repaso por las diferentes casos a de uso que la arquitectura presenta a la hora de manipular la informacin o imprecisa representada en una BDR destacando, cules se han llevado a cabo a y cules sern fruto de trabajos posteriores a ste. a a e

5.2.

Arquitectura del Sistema

La arquitectura que se propone permite trabajar con informacin imprecisa o desde el momento en que un usuario desea representar/manipular informacin o hasta la representacin de estos mismos datos en un SGBD Relacional Difuso o cualquiera, sean cuales sean sus caracter sticas. En la gura 5.1, se muestra un esquema genrico de la Arquitectura del Sistema. e Esta arquitectura puede dividirse en dos fases dados los diferentes problemas a resolver: la primera fase conduce a la obtencin de la Ontolog del o a Esquema, y se describir en el siguiente apartado como Arquitectura de Comua nicacin con la Ontolog La segunda fase describir los diferentes mecanismos o a. a de conexin con los SGBDs, y se describir como Arquitectura de Comunio a cacin con la BD. o

5.2.1.

Arquitectura de Comunicacin con la Ontolog o a

Tal y como se muestra en la gura 5.1, esta arquitectura permite generar la Ontolog del Esquema. Para ello, se requiere la utilizacin de los siguientes a o mdulos: o Interfaz de Usuario Este mdulo consiste en un entorno amigable que pero mite a un usuario novel la generacin una BD Difusa y la manipulacin o o de los datos almacenados en la misma (esto incluye las BD clsicas tama bin). Adems dicha interfaz debe gestionar tanto la informacin relativa e a o a los metadatos que describen una BDD como los contenidos en ella. Generador de OWL Este mdulo est destinado a generar el cdigo en o a o OWL necesario para la denicin y manipulacin de esquemas difuo o sos utilizando la Ontolog de Representacin del Conocimiento Difuso. a o

5.2. ARQUITECTURA DEL SISTEMA

133

INTERFAZ USUARIO
INTERFAZ CATALOGO INTERFAZ ESQUEMA

ONTOLOGIA DEL CATALOGO

INTERPRETE / GENERADOR DE OWL

ARQUITECTURA PARA LA GENERACION DE LA ONTOLOGA

ONTOLOGIA DEL ESQUEMA

INTERPRETE /ADAPTADOR

BD

SGBDRs
SGBD SGBD SGBD

ARQUITECTURA DE COMUNICACION CON LA BD (descripcin detallada en la figura 5.5 "Arquitectura Unificada ")

Figura 5.1: Arquitectura del Sistema General

134

CAP ITULO 5. ARQUITECTURA Y APLICACIONES Para ello debe proporcionar los procedimientos para leer la Ontolog del a Catlogo y permitir su instanciacin y generar la Ontolog del Esquema a o a derivada de la misma.

Ontolog del Catlogo Este mdulo representa a la Ontolog del Catloa a o a a go (descrita en el cap tulo anterior) cuyo uso es imprescindible para la generacin de la Ontolog del Esquema en cdigo OWL. Todas las o a o representaciones de BDRD en forma de ontolog requieren la incorpoa racin/importacin de esta (meta)ontolog para poder denir y manio o a pular las estructuras de una BDRD. Ontolog del Esquema Ontolog en OWL que describe un esquema de a a BD Difusas. Los dos primeros mdulos requieren de la utilizacin de herramientas softo o ware, que permitan llevar a cabo la funcionalidad que describen. A continuacin se detallan cada uno de estos mdulos. o o 5.2.1.1. Interfaz de Usuario

Uno de los principales motivos que llevan al desarrollo de la Ontolog a para la Representacin del Conocimiento Difuso se basa en la dicultad para o denir informacin imprecisa en un SGBD Extendido. Esta dicultad, que o se incrementa conforme las extensiones al modelo se van incorporando, ha inducido a la generacin de una ontolog que mantenga la denicin de dicha o a o informacin al margen de cualquier representacin concreta de un SGBD. o o De esta forma, la generacin de una interfaz de usuario es un elemento o fundamental en la arquitectura. Las tareas ms bsicas que dicha interfaz a a debe aportar son: Permitir la denicin de un Esquema de BDD a partir de la instanciacin o o de la Ontolog del Catlogo descrita en esta tesis. a a Conectar con un SGBDRD cualquiera para incorporar la informacin o descrita en forma de ontolog La conexin podr realizarse con varios a. o a SGBDRs simultneamente. a Mantener al usuario al margen de los detalles propios de la denicin de o datos difusos, para lo que se requiere que la interfaz sea lo ms intuitiva a posible. Contemplar la opcin de manipular las estructuras del catlogo para los o a casos de SGBD que carezcan de las estructuras para la representacin o

5.2. ARQUITECTURA DEL SISTEMA

135

de datos difusos. Esta opcin debe incluir la posibilidad de extender el o sistema en caso necesario. Como en todos los sistemas software, las decisiones de desarrollo se toman en funcin de la disponibilidad y mtodos de acceso que se desea que la heo e rramienta proporcione, las dos principales alternativas son: Utilizar una herramienta local de desarrollo propio, basada en tecnolog a Web o cualquier otra plataforma (dependiendo del lenguaje usado para su desarrollo) que permita la consulta y manipulacin de la ontolog o a. Usar Herramientas de Gestin de Ontolog que permitan la edicin o as o de la ontolog y su instanciacin. Esta opcin se contempla dado que a o o existen herramientas que permiten su extensin para incorporar nuevas o funcionalidades. Dicha interfaz de usuario se divide en dos, dependiendo del tipo de usuario que va a tener acceso a la misma, y de la informacin que dichas interfaces o estn encargadas de gestionar y que a continuacin se detalla. a o Interfaz de Catlogo a La Interfaz del Catlogo esta destinada a ser utilizada por los administraa dores del SGBD que se deben de encargar de denir las estructuras necesarias en el catlogo del sistema para que la denicin de datos difusos sobre la BD a o sea posible. De esta forma, dicha interfaz debe permitir las funciones de: Generar tablas del catlogo que permitan la denicin de datos difusos. a o Identicar las particularidades de cada SGBD para incorporar dichas tablas del catlogo en el espacio ms adecuado, dependiendo del sistema a a que se trate. Establecer permisos sobre dichas tablas para que los usuarios puedan acceder a ellas. Dependiendo de las particularidades del SGBD en cuestin, incorporar o la funciones de gestin de datos difusos necesarias para el manejo de los o mismos (operaciones de comparacin, interpretacin de consultas, etc.). o o Estas funciones pueden estar incrustadas en el sistema, o bien ser ajenas al mismo, como veremos ms adelante. a

136

CAP ITULO 5. ARQUITECTURA Y APLICACIONES

Para llevar a cabo estas funciones es requisito, en la mayor de los SGBDs, a tener privilegios de administrador, dado que se trata de tablas a incorporar al catlogo del sistema, y que interaccionan con el resto del mismo. No obstante a esto depende del SGBDs en el que se est trabajando. e Esta interfaz slo se utiliza en el proceso de denicin o extensin de un o o o SGBDR comn, para incluirle la funcionalidad de gestionar informacin imu o precisa. Por lo tanto, ser utilizado en una sola ocasin para cada sistema que a o se instale. Interfaz de Esquema La interfaz del esquema, ser la mas utilizada, pues es la encargada de a permitir al usuario realizar las siguientes funciones: Permitir denir el Esquema de BD Difusa o Clsica de manera intuitiva a para el usuario nal. Esto puede llevarse a cabo a travs de asistentes o e formularios sencillos. Permitir la visualizacin del Esquema de BD Difusas de manera intuitiva, o sin necesidad de que el usuario nal tenga que acceder a la BDD para hacerlo, ni de conocer la sintaxis del cdigo OWL. o Permitir la generacin de la Ontolog del Esquema de manera automtica, o a a es decir, que la misma herramienta una vez que tiene denido el esquema en forma de instancias de la Ontolog del Catlogo autogenera las clases a a y relaciones necesarias para que dicho esquema sea a su vez instanciable. Permitir la conexin con SGBD heterogneas, de las que conoce sus o e particularidades, para as poder realizar la denicin de las estructuras o denidas en OWL. Permitir la denicin de datos sobre la Ontolog del Esquema generada, o a es decir, la denicin de las tuplas. o Permitir la generacin de consultas de datos difusos en FSQL a partir o de la ontolog a. Permitir la comunicacin simultnea con SGBDRDs para realizar cualo a quier tarea de denicin o manipulacin a la vez, sin tener en cuenta las o o particularidades de cada sistema. La implementacin nal de estas funciones se describe en los apartados o 5.3.3 y 5.3.4 de este cap tulo.

5.2. ARQUITECTURA DEL SISTEMA 5.2.1.2. Generador de OWL

137

Tal y como se viene expresando en los cap tulos anteriores, el uso del lenguaje de representacin de ontolog de OWL( vase seccin A.2.3 del A) o as e o conlleva tantas ventajas como inconvenientes. Entre los inconvenientes ms a destacables se encuentra el gran coste de desarrollar una ontolog en OWL a de forma manual, dada la naturaleza misma del lenguaje que siendo simple, es muy tedioso a su vez en la representacin de cualquier concepto debido al gran o nmero de etiquetas que necesita para ello. De esta forma, una representacin u o manual de una ontolog en OWL ser un error no slo por el esfuerzo en a a o realizar esta tarea, sino por la alta probabilidad de cometer un error en la misma, hecho que impedir cualquier manejo automtico de la ontolog por a a a cualquier aplicacin a posteriori. o De esta forma, se estima necesaria la utilizacin de herramientas que intero preten ontolog representadas en OWL y que a su vez permitan la denicin as o de nuevos conceptos en dicho lenguaje. Existen dos alternativas para trabajar con OWL: Utilizar librer como JENA, Sesame u OWLAPI (opciones descritas as en el Anexo A). Esta opcin permite incorporar a cualquier programa o de gestin de datos propio, operaciones de manipulacin de cdigo OWL o o o mediante la utilizacin de los mtodos incluidos en dichas librer o e as. Utilizar programas de gestin de ontolog per se. Estos programas proo as porcionan toda la funcionalidad necesaria para denir ontolog de foras ma grca (en su mayor o cuanto menos intuitiva. Adems la mayor a a) a a permiten una gestin integral de las mismas, opcin ms que deseable. o o a Una de las aplicaciones ms populares que ofrecen dicha funcionalidad es a Protg, tambin existen otras como OntoEdit, OntoStudio, etc. (vase e e e e seccin A.2.3.3 para conocer las caracter o sticas principales y referencias a estas herramientas).

5.2.2.

Arquitectura de Comunicacin con la BD o

Los SGBD Relacionales actuales a pesar de representar el mismo modelo de datos, realizan dicha representacin de modos muy diferentes. Existen o diferencias tanto en la denicin del estndar de SQL que implementa cada o a sistema (vase [Gen06]), hasta en la forma para gestionar y representar la e informacin en el mismo, hecho ms que lgico dado que cada sistema tiene o a o denido su propio formato de catlogo para almacenar los metadatos. Adems, a a dependiendo del SGBD de que se trate, incorpora mecanismos de comunicacin o y explotacin del sistema con diferente grado de eciencia, por ejemplo algunos o

138

CAP ITULO 5. ARQUITECTURA Y APLICACIONES

incorporan un lenguaje de programacin incrustado, opcin muy deseable en o o trminos de eciencia y rapidez, mientras que otros simplemente permiten la e comunicacin con lenguajes o programas ajenos al sistema, opcin mucho ms o o a lenta e ineciente. De esta forma, dependiendo del tipo de SGBD Relacional (SGBDR) en el que se quiera implantar la base de datos representada por la ontolog es a, necesario interponer una serie de fases que traduzcan las acciones recogidas de forma impl cita en la ontolog a las sentencias propias de un SGBDR. Dichas a fases se encuentran descritas en [Bla08a] y a continuacin: o

5.2.2.1.

Extensin del SGBDR para Incorporar el FSQL o

La extensin difusa FSQL [Bla03b] del lenguaje relacional SQL permite la o creacin y manejo de estructuras relacionales capaces de contener atributos o con dominios difusos. Un sistema con estas caracter sticas incorpora sus propias estructuras de catlogo para la representacin de los dominios difusos y para la creacin de a o o relaciones con datos difusos. Adems, incorpora el conjunto de funciones necea sarias para gestionar dichas sentencias FSQL. Por ello, parece que carece de sentido la implantacin de la Ontolog para la Representacin del Conocio a o miento Difuso dado que la denicin de datos difusos en este caso se podr o a realizar utilizando directamente las sentencias FSQL, sin entrar en detalles de representacin. o Sin embargo, para implantar las estructuras relacionales contenidas en la Ontolog del Esquema de datos difusos es necesario generar las sentencias a FSQL que creen dichas estructuras en la base de datos, empleando un mduo lo de traduccin como el observado en la gura 5.2. Con esta arquitectura, o traducimos la ontolog al lenguaje FSQL y la sentencia traducida se env a a a la base de datos para su procesamiento (que incluye traduccin a SQL con o capacidades funcionales) y ejecucin. o Existen por tanto dos alternativas diferentes en la extensin de los SGBDR o necesaria para representar dicha informacin imprecisa y que determinarn el o a modo de interpretacin del FSQL. Estas conguraciones son directamente deo pendientes de la capacidad del SGBD para incorporar capacidades funcionales (es decir, que carece de un lenguaje de programacin que le permite la creacin o o de bloques de sentencias para la operacin con datos) como se describe a cono tinuacin. o

5.2. ARQUITECTURA DEL SISTEMA

139

Ontologia del esquema Adaptador FSQL

SQL Ex.
FSQL Ex.

SGDBR
Figura 5.2: Arquitectura de integracin con un SGBDR con capacidades o FSQL

5.2.2.2.

SGBDR con Capacidades Funcionales

La implantacin de un esquema de BDD en un SGBDR que carezca de o la implementacin FSQL pasa por la creacin de las estructuras de catlogo o o a relacional extendido de forma difusa, que permitirn almacenar la informacin a o referente a la ontolog para la representacin de datos difusos. Incorporando a o las relaciones de dicho catlogo, almacenamos la informacin referente a los a o dominios y datos difusos contenidos en la base de datos, haciendo posible el acceso a la informacin desde las funciones y procedimientos que se creen a o tal efecto pero sin depender de la ontolog a. Sin embargo, toda la funcionalidad que incorpora la implementacin del o lenguaje FSQL, vista en el apartado 5.2.2.1, tendr que ser proporcionada en a este caso por una serie de bloques funcionales implementados en el lenguaje procedimental que proporcione la implementacin relacional dada. SGBo c o PostgreSQL c incorporan estas capacidades mediante la DR como Oracle denicin de sus lenguajes procedimentales Oracle R PL/SQL y PG/PLSQL, o respectivos. Si bien proponemos un paso intermedio para la representacin en FSQL o de toda operacin realizada a travs de la ontolog en el caso de este tipo o e a, de sistemas, ser necesaria la traduccin de la sentencia al lenguaje SQL (el a o cual incluir llamadas a funciones que resuelvan los problemas difusos) puesto a

140

CAP ITULO 5. ARQUITECTURA Y APLICACIONES


Ontologa del esquema Adaptador FSQL Adaptador SQL con funciones Ontologa del catlogo

SQL Ex.
Func. Ex.

SGDBR

Figura 5.3: Arquitectura de integracin con un SGBDR con capacidades funo cionales

que el sistema carece de la capacidad de compilar y ejecutar sentencias FSQL. El procesamiento de la sentencia FSQL tiene que ser realizado a nivel del Adaptador a SQL con funciones, mostrado en la gura 5.3, el cual traduce la sentencia FSQL a una sentencia SQL con llamadas a funciones que tendrn que estar almacenadas en la base de datos para su llamada cuando se a ejecute la sentencia SQL traducida. Estas funciones insertadas en el SGBD son las encargadas de realizar operaciones con los datos difusos que en ellas se encuentran representados. 5.2.2.3. SGBDR sin Capacidades Funcionales

En este caso, se implanta el esquema de base de datos contenido en un SGBDR que no incorpora capacidades funcionales, por lo tanto, la base de datos acta como mero recipiente de datos. De este modo, todas las fases del u tratamiento de la sentencia FSQL (traduccin y procesamiento) tendrn que o a ser implementadas en un lenguaje de programacin externo al propio SGBDR. o Este es el caso de SGBDR como MySQL R , en el que se puede proveer el tratamiento de la sentencia FSQL mediante una serie de elementos funcionales programados en Java. Lo cual ralentizar la ejecucin de cualquier operacin a o o que requiriera de esta funcionalidad. En un sistema de este tipo, el elemento denominado Mdulo funcional, o que se muestra en la gura 5.4, tendr que realizar la interpretacin de la a o consulta FSQL y, mediante diversas consultas SQL a la base de datos, obtener conjuntos de datos relacionales (no difusos) a los que aplicar funciones para a

5.2. ARQUITECTURA DEL SISTEMA

141

Ontologa del esquema

Ontologa del catlogo

Adaptador FSQL

SQL Ex.

Mdulo Funcional

SGDBR
Figura 5.4: Arquitectura de integracin con un SGBDR sin capacidades funo cionales

proporcionar la semntica difusa a estos datos y poder operar con ellos. a 5.2.2.4. Arquitectura Unicada

Reuniendo todas las posibilidades de SGBDR vistas en los apartados anteriores, la arquitectura unicada quedar como se muestra en la gura 5.5. a En dicha arquitectura, la ontolog actuar como interfaz abstracta para a a la denicin de datos difusos o clsicos, independiente de cualquier SGBD que o a acte como recipiente de la informacin. Dicha ontolog proporcionar tanto u o a a la denicin de los datos de la BDD, como cualquier peticin de manipulacin o o o sobre los mismos, sin tener en cuenta las particularidades que cada SGBDD tiene en su representacin. o Adems, en la arquitectura separamos por niveles todos los aspectos relaa tivos al lenguaje de consulta de datos difusos en el que nos basamos (como primer paso para la operacin sobre la base de datos) de los aspectos espec o cos relacionados con la implementacin concreta. As pues nos encontramos o con: Primera Fase de Adaptacin al Lenguaje Se utiliza el Adaptador FSQL, o

142

CAP ITULO 5. ARQUITECTURA Y APLICACIONES


Ontologa del esquema Adaptador FSQL Adaptador SQL con funciones Mdulo Funcional Ontologa del catlogo

Adaptacin al lenguaje

Adaptacin a la implementacin

SQL Ex.
FSQL Ex.

SQL Ex.
Func. Ex.

SQL Ex.

SGDBR

SGDBR

SGDBR

Figura 5.5: Arquitectura Integrada

que como se ha especicado anteriormente, permite generar la sentencia de denicin o manipulacin de datos en este lenguaje. o o Segunda Fase de Adaptacin a la Implementacin Entra a formar paro o te las particularidades del SGBD con el que se est trabajando. Por tanto e la sentencia lanzada contra la BDD (en FSQL) ser resuelta en funcin a o de la decisin tomada para extender el SGBDR con capacidad de tratao miento de datos difusos sobre el que ha sido lanzada. En la actualidad, la primera fase de adaptacin al lenguaje se ha desarroo llado tanto a travs de las herramientas generadas en esta tesis para la gestin e o de la ontolog como a travs de la utilizacin de otras herramientas como el a, e o FuzzyQuery2+ [Bla02b]. La segunda fase de adaptacin a la implementacin o o se encuentra ntegramente desarrollada y en perfecto funcionamiento para el SGBDR Oracle c . Esta funcin permite generar cualquier sentencia correcta o en FSQL y posteriormente procesarla automticamente sobre dicho sistema. a Esto es posible gracias a que Oracle tiene capacidades funcionales (PL/SQL) y una implementacin completa, usando dichas capacidades, de las operaciones o para analizar y ejecutar una sentencia FSQL. Como trabajos futuros se propondr la implementacin de las operacioa o nes para analizar y ejecutar una sentencia en FSQL utilizando un lenguaje

5.2. ARQUITECTURA DEL SISTEMA

143

ONTOLOGIA DELCATALOGO

INTERFAZ USUARIO
ONTOLOGIA DELESQUEMA

GENERADOR DE CONSULTA

ARQUITECTURA PARA LA GENERACION DE LA ONTOLOGA DE CONSULTA

INTERPRETE /ADAPTADOR

BD

SGBD

SGBD SGBD

ARQUITECTURA DE COMUNICACION CON LA BD ( xtensin en la e figura 5.5 " Arquitectura Unificada ")

Figura 5.6: Arquitectura de Consulta

de programacin genrico, que est aceptado por la mayor de SGBDR, y o e e a fundamentalmente por aquellos que no dispongan de capacidades funcionales.

5.2.3.

Arquitectura de Consulta

La arquitectura del sistema planteada en el apartado anterior, est disea nada para la denicin de la Ontolog del Esquema y su posterior comuni o a cacin con el SGBDRD correspondiente para su correcta generacin. Incluso o o tambin es vlida en la denicin de datos (tuplas) sobre dicha Ontolog del e a o a Esquema, a travs de la instanciacin del mismo. e o Sin embargo, el ujo de informacin que hay en la misma es unidireccional, o es decir, no permite comunicacin con el usuario nal una vez denido el o mismo. La Arquitectura de Consulta debe establecer las bases para permitir al usuario denir una consulta relacionada con el Esquema sobre el que quiere consultar, de forma transparente al SGBDRD consultado, y devolver al mismo

144

CAP ITULO 5. ARQUITECTURA Y APLICACIONES

los resultados. Es por este motivo que se hace necesaria una modicacin o a la Arquitectura del Sistema previamente propuesta, en el que el ujo de informacin sea bidireccional. o La parte de la Arquitectura de Comunicacin con la BD es idntica a la o e descrita en el apartado 5.2.2 anterior, a excepcin de que las comunicaciones o en esta arquitectura, son tambin bidireccionales. e Por otro lado, con respecto a la Arquitectura de Consulta se hace necesario la denicin de un nuevo elemento en la misma, el Generador de Consulta. o Este Generador conduce a la generacin del cdigo en FSQL requerido para o o poder formar la consulta a partir de los datos descritos en las Ontolog del as Esquema y el Catlogo. a La Ontolog del Esquema es necesaria en tanto que proporciona la estruca tura de informacin que puede ser consultada. Adems, se encuentra denida o a en la misma el dominio de cada uno de los atributos que comprenden el esquema. El conocimiento de dichos dominios por parte del usuario para realizar la consulta es imprescindible cuando se trata de atributos difusos, dado que muchos de los valores permitidos se deben hallar previamente denidos en la ontolog Este ser el caso de los atributos de Tipo Difuso 3, cuyos valores a. a unicamente sern aquellos denidos y relacionados entre ellos expl a citamente. Un ejemplo de este uso ser el de acceder a etiquetas previamente denidas a sobre un atributo en la BDD como Alto, Bajo, Rubio o Moreno para poder realizar una operacin de comparacin. o o Por otro lado, la Ontolog del Catlogo nos permite acceder a las estruca a turas de datos, concretamente las estructuras difusas, necesarias para poder denir los valores sobre los que se van a realizar las comparaciones en dichas consultas. Por ejemplo, nos va a permitir denir un valor Trapezoidal o Aproximado para ser comparado con los que se hallan almacenados en la BDD. La interfaz de usuario debe proporcionar un entorno intuitivo en el que el usuario sea capaz de denir una consulta en trminos difusos sin necesidad de e conocer el lenguaje FSQL. La implementacin de dicha interfaz ser planteada o a de igual manera que se ha descrito para la interfaz de usuario del apartado anterior 5.2.1.1. La funcionalidad cubierta por la herramienta de consulta y la puesta en marcha mediante el desarrollo de una aplicacin se describe con o detalle en el apartado 5.3.4.3.

5.3.
5.3.1.

descripcin del Sistema Implementado o


Propuestas

La utilizacin de la ontolog propuesta en este trabajo de tesis se llevar a o a a cabo a travs del desarrollo de un entorno que permita la denicin y manie o

5.3. DESCRIPCION DEL SISTEMA IMPLEMENTADO

145

pulacin de esquemas de BDRD y su explotacin mediante consultas. Dichas o o implementaciones se describen a continuacin: o Un Entorno Web que permite la gestin de la Ontolog del Catlogo o a a y su comunicacin con diversos SGBDD. A su vez, este mismo entorno o implementa las funciones de gestin de esquemas de BDD (generacin o o y consulta), a travs del uso de ontolog Esta propuesta est descrita e as. a en la seccin 5.3.3. o La Extensin de una Herramienta Integrada de Gestin de Ontolog o o as: Protg, para la generacin de Esquemas de BDD basados en la Ontolog e e o a del Catlogo, denicin de datos sobre la Ontolog del Esquema y para a o a la generacin de consultas sobre la BDD. Esta funcionalidad est descrita o a en el apartado 5.3.4.1 para esquemas, 5.3.4.2 para inserciones y 5.3.4.3 para consultas.

5.3.2.

Bases de Datos Utilizadas

Las bases de datos son un elemento imprescindible en este trabajo de tesis dado que el motivo principal para el desarrollo de la ontolog es permitir a la denicin de Esquemas de Bases de Datos Difusas en cualquier SGBDR o Difuso, con independencia de su implementacin f o sica y particularidades de uso. Por tanto, en la arquitectura del sistema (seccin 5.2.2) cuando se hace o referencia a las bases de datos difusas, se ha de tener en cuenta las particularidades del SGBD para que pueda ser extendido y as manejar datos difusos. La arquitectura se divide en tres casu sticas de conexin con el SGBD, que son o directamente dependientes de la funcionalidad aportada por dichos sistemas. En la implementacin de este trabajo, se propone la utilizacin de un o o SGBD que sea representativo para cada una las diferentes arquitecturas de extensin presentadas. As pues, los SGBDR utilizados son: o Oracle c Este sistema representa a un SGBDR con capacidades funcionales pero que puede tener implantado o no el FSQL en su totalidad (referente a la gura 5.2 y 5.3). De esta manera dispone entre su conjunto de funciones de todas aquellas necesarias para procesar una sentencia en dicho lenguaje y devolver los resultados al usuario de forma legible. Evidentemente tambin su catlogo del sistema se encuentra extendido e a para poder llevar a cabo toda esta funcionalidad. PostgreSQL c Este sistema representa a un SGBDR con capacidades funcionales igual que ocurre con Oracle c . Su lenguaje de programacin o

146

CAP ITULO 5. ARQUITECTURA Y APLICACIONES incrustado PL/pgSQL permite la inclusin de funciones dentro de su siso tema. Sin embargo, no se encuentra implementada ninguna funcionalidad de gestin de datos difusos en este lenguaje en la actualidad. As pues, o sobre PG se puede desarrollar tanto una implementacin especial para o FSQL incrustada en el mismo, o bien una aplicacin genrica a travs o e e de un mdulo ajeno a dicho sistema, tal y como se describe en la seccin o 5.2.2.3.

MySQL c Este sistema representa a un SGBD sin ninguna capacidad funcional. Por tanto, este sistema unicamente puede incorporar las estruc turas del catlogo, pero la ejecucin de sentencias, tanto de denicin a o o como de manejo de datos difusos, debe llevarse a cabo en un modulo externo. Este ser el que se ocupe de lanzar las consultas a la base de a datos en un lenguaje comprensible para la misma, o sea, en SQL, de obtener los resultados, realizar las comparaciones difusas si es pertinente y formatear los datos de salida para mostrarlos al usuario (arquitectura correspondiente con la gura 5.4 y seccin 5.2.2.3). Dicho sistema o requiere la implementacin de su funcionalidad utilizando lenguajes de o programacin externos que sean capaces de comunicarse con la misma, o como es el JAVA, que es el lenguaje utilizado en este trabajo. Es obvio que un SGBD con capacidades funcionales, proporciona un mayor rendimiento en la gestin de informacin imprecisa puesto que todas las funo o ciones u operaciones son ejecutadas en el mismo entorno y por tanto con mayor rapidez. Sin embargo estos sistemas con capacidades funcionales requieren una implementacin propia para la gestin del FSQL, y por tanto un esfuerzo muy o o signicativo para poder ponerlo en marcha. Por otro lado la utilizacin de un lenguaje de programacin genrico como o o e el Java para crear un entorno en el que las funciones sean independientes del SGBD evita la necesidad de adaptar las funciones de gestin del lenguaje o FSQL a cada sistema particular, pero provoca una gran ca del rendimiento, da dado que los datos deben portarse de un lugar a otro continuamente para ser procesados.

5.3.3.

Entorno Web

A travs de un entorno web (vase gura 5.7) se ha pretendido que el e e usuario sea capaz de realizar las funciones bsicas que proponemos en este a trabajo de tesis, esto es, la denicin y manipulacin de esquemas difusos o o sobre un SGBD Extendido. Esta herramienta se desarrolla con el objetivo de permitir comunicar al usuario con los diferentes SGBD sin necesidad de instalar en su computadora ms que un simple navegador web. a

5.3. DESCRIPCION DEL SISTEMA IMPLEMENTADO

147

Figura 5.7: Imagen de la aplicacin web para gestionar esquemas. o

A continuacin se describe brevemente la funcionalidad propuesta en el o entorno: Generacin de un esquema de BDD sobre un SGBD con capacidad de o almacenamiento de difusos (es necesario tener denida la FMB en el SGBDR correspondiente). Ser requisito que dicho esquema se encuena tre previamente descrito como instancias de la Ontolog del Catlogo en a a OWL. Los pasos para realizar esta operacin pueden verse en la gura o 5.8 y consisten en proporcionar al sistema el archivo en OWL y a continuacin rellenar los campos de un formulario para conectar con la BD o deseada (en este caso MySQL c ). A continuacin se obtendr un ino a forme del estado en el que se ha realizado la operacin. En la imagen 5.9 o puede observarse el resultado de realizar la operacin sobre un SGBDR o Oracle c y el resultado de la operacin sobre el SGBDR a travs de la o e herramienta sqlplus. Generacin del script o conjunto de sentencias de denicin del esquema o o de BDD deseado en lenguaje FSQL o SQL para su almacenamiento en forma de archivo. Esta opcin se corresponde al botn Ver Cdigo de la o o o gura 5.8. El resultado de dicha ejecucin tendr el resultado mostrado o a en la gura 5.10 si la opcin seleccionada es mostrar el cdigo FSQL. o o Generacin de la FMB sobre un SGBDs que no tengan esta extensin ya o o incorporada. Esta opcin consiste en la generacin automtica de las eso o a

148

CAP ITULO 5. ARQUITECTURA Y APLICACIONES

Figura 5.8: Imagen de la aplicacin web para gestionar esquemas. Formulario o de conexin para generar un esquema dado en OWL en una BD MySQL o

5.3. DESCRIPCION DEL SISTEMA IMPLEMENTADO

149

Figura 5.9: Imagen de la aplicacin web para gestionar esquemas. Formulario o de resultado tras ejecutar la generacin de un Esquema de BD en MySQL c o

150

CAP ITULO 5. ARQUITECTURA Y APLICACIONES

Figura 5.10: Imagen de la aplicacin web para gestionar esquemas. Script de o generacin de esquemas en FSQL. o

5.3. DESCRIPCION DEL SISTEMA IMPLEMENTADO

151

Figura 5.11: Seleccin del archivo de la ontolog a generar o a

tructuras del catlogo para permitir almacenar datos difusos. El proceso a de denicin de esta estructura es similar al descrito anteriormente para o denir un esquema, dado que habr que insertar los datos en un fora mulario para establecer la conexin con el SGBDR correspondiente. En o este caso, sin embargo, habr que introducir las claves de administrador, a puesto que se van a utilizar elementos del catlogo. Esta opcin permite a o adems la generacin del script que genera dicha FMB en SQL. a o Generacin de la Ontolog del Esquema nal, a partir de la denicin o a o inicial del esquema de BDD a travs de la instanciacin de la Ontolog e o a del Catlogo. Este proceso devolver como resultado una nueva ontolog a a a que puede ser instanciada para insertar la informacin relativa a las tuo plas. El proceso consistir en la seleccin en primer lugar de la ontolog a o a que se desea generar, como se puede ver en la gura 5.11 y a continuacin se obtiene la ontolog resultante y un resumen de la conversin, o a o como se puede ver en la gura 5.12.

152

CAP ITULO 5. ARQUITECTURA Y APLICACIONES

Figura 5.12: Resultado de la ontolog generada a

5.3. DESCRIPCION DEL SISTEMA IMPLEMENTADO

153

Visualizacin de la Ontolog del Esquema de forma intuitiva para el o a usuario, que no debe de necesitar entender ni SQL, ni OWL para conocer el conjunto de elementos que se encuentran denidos en la ontolog a. Esta opcin permite ver de manera conjunta todos los elementos ms o a representativos del esquema, dada la Ontolog del Catlogo en la que a a est basada. a Visualizacin del contenido de las tablas de la FMB. o Visualizacin de las tablas de la BDD incluyendo la descripcin de los o o elementos que componen a las mismas. Cabe destacar que este entorno Web permite la conexin con los SGBDs o descritos en la seccin 5.3.2, denidos por su representatividad (Oracle c , o PostgreSQL c y MySQL c ). La extensin a otros sistemas de gestin, como o o puedan ser MS Access c , MS SQLServer c , SyBase c , Paradox c , etc. es inmediata dado que se han desarrollado las interfaces necesarias para facilitar la misma. Por otro lado, esta herramienta no aporta ningn mecanismo para denir u la ontolog No obstante, esto no supone ninguna desventaja en tanto que se a. podr utilizar cualquier entorno de denicin o manipulacin de ontolog en a o o as OWL, que como se describe en el Anexo A, seccin A.2.3.3 existen en gran o nmero y aportan muy diversa funcionalidad. u Todos los mdulos/procedimientos que gestionan la generacin de ono o tolog y la traduccin de los elementos de la ontolog a la BD se han as o a desarrollado utilizando el lenguaje de programacin JAVA. Concretamente, o la gestin de las ontolog se ha llevado a cabo a gracias al uso de las librer o as as para la gestin de OWL de JENA. A su vez, la herramienta web ha utilizado la o tecnolog JSP para poder llamar a los procedimientos que realizan las tareas a anteriormente descritas.

5.3.4.

Extensin de la Herramienta de Desarrollo de Ontolog o as: Protg e e

Anteriormente se ha visto como podemos establecer la comunicacin eno tre la Ontolog de Representacin de Conocimiento Difuso y diferentes SGBa o DRDs a travs de un entorno Web. Sin embargo esta opcin presenta la desvene o taja de que no aporta ningn mecanismo para denir la ontolog Adems, u a. a sigue existiendo el problema de la complejidad en la denicin de esquemas o difusos, aunque en menor medida ya que ahora dichos esquemas son denidos a travs de una ontolog y no directamente sobre un SGBDRD concreto. Por e a ello se hace necesario el desarrollo de una herramienta que permita al usuario

154

CAP ITULO 5. ARQUITECTURA Y APLICACIONES

denir y manipular de forma intuitiva la informacin difusa, adems de poder o a tener acceso a ella del mismo modo. Se propone as la extensin de una herramienta de gestin integral de o o ontolog como Protg. La eleccin de esta herramienta concreta viene dada as e e o por los siguientes criterios: Permite utilizar dicho entorno para denir una ontolog completamente a sin necesidad de incluir ninguna extensin. o Permite utilizar metadatos. Permite la denicin y utilizacin de ontolog importadas y hace una o o as gestin eciente de las mismas. o Tiene una interfaz visual cmoda e intuitiva. o Est mpliamente extendida, probada y aceptada entre la comunidad a a cient ca. Hace una representacin del OWL genrica, comprensible y portable a o e otros entornos de gestin. o Permite extender su entorno con otras implementaciones que hacen uso de la representacin de ontolog que proponen. La extensin del eno as o torno puede realizarse de muy diversas formas, todas bien documentadas, entre la que destacamos la utilizacin de extensiones (plug-ins) que es la o utilizada en este trabajo. Por todas estas razones se ha propuesto la triple extensin de la herrao mienta dado que ha de realizar tres tareas bien diferenciadas: La de denicin y manipulacin de la informacin de esquemas de bases o o o de datos difusas y su correspondiente conexin y exportacin a los SGBo o DRDs seleccionados. La de insercin de datos difusos (o clsicos) sobre la ontolog y su o a a posterior denicin sobre los SGBDRDs seleccionados. o La de ayuda a la generacin de consultas difusas en FSQL a travs del o e uso de la ontolog a. La extensin de este entorno se ha realizado utilizando el lenguaje de proo gramacin JAVA, que es en el que est desarrollada la herramienta de Protg. o a e e

5.3. DESCRIPCION DEL SISTEMA IMPLEMENTADO

155

Figura 5.13: Imagen de la aplicacin para gestionar esquemas aadida a la o n herramienta Protg e e

5.3.4.1.

Gestin de Esquemas de Datos Difusos en Protg o e e

Esta aplicacin incluida en la herramienta Protg tiene el aspecto visual o e e de una pestaa ms en la misma, tal y como podemos ver en la gura 5.13, y n a aporta la siguiente funcionalidad: Gestionar y visualizar los elementos ms representativos de un Esquema a de Base de Datos difusas: Tablas, Atributos, Tipos de Datos, Dominios Difusos, Restricciones, Etiquetas Ling usticas (bajo un referencial ordenado o no ordenado). Estos elementos son visualizados a travs de e cuadros de texto cuyo contenido var dinmicamente dependiendo de la a a seleccin de la estructura de datos que se realice. Estos cuadros, adems o a de permitirnos visualizar las caracter sticas de cada uno de los elementos seleccionados, nos permiten aadir nuevos elementos o eliminarlos. Esta n opcin es la correspondiente parte central de la gura 5.13. o Gestionar la conexin con los SGBDRD y permitir el mantenimiento de o

156

CAP ITULO 5. ARQUITECTURA Y APLICACIONES

Figura 5.14: Imagen de la aplicacin para gestionar las conexiones con el o esquema en Protg e e

dichas conexiones de forma simultnea para poder realizar operaciones a en paralelo (opcin correspondiente a la zona superior izquierda de la o gura 5.14). Exportar la Ontolog del Esquema a los SGBDRDs cuyas conexiones a se encuentren establecidas. Este proceso ser realizado de manera sia multnea con todos los SGBDRDs que se encuentren abiertas. Esta opa cin se encuentra localizada en la zona inferior izquierda de la gura o 5.13. Exportar el cdigo fuente o script correspondiente a la creacin del eso o quema denido a travs de la ontolog a un archivo. Dicho script puede e a obtenerse en FSQL o SQL dependiendo de la preferencia del usuario. Adems dicho script contendr las particularidades del SGBDR seleca a cionado. Esta opcin se encuentra localizada en la zona inferior izquierda o de la gura 5.13.

5.3. DESCRIPCION DEL SISTEMA IMPLEMENTADO

157

Generar la Ontolog del Esquema a partir de su denicin previa sobre a o la Ontolog del Catlogo (esta funcin tambin se aportaba de igual a a o e modo en el entorno web). Esta opcin ser llamada a partir del botn o a o situado en la zona inferior izquierda de la gura 5.13. Asistir al usuario en la generacin de los elementos ms representativos o a de un Esquema de BDD, mediante la utilizacin de asistentes guiados. Se o encontraran asistentes para generar: tablas, atributos, etiquetas ling usticas y relaciones de similitud, restricciones y dominios. Las llamadas a los asistentes se har a travs de los botones situados en la zona central an e izquierda de la gura 5.15. 5.3.4.2. Denicin de Datos Difusos en Protg o e e

En la herramienta Protg se ha incorporado una nueva pestaa, tal y como e e n podemos ver en la gura 5.16, que permite la denicin de datos imprecisos o a travs del uso de una Ontolog del Esquema concreta. Dicha extensin a la e a o herramienta dispone de las siguientes opciones: Visualizar el contenido de cada una de las relaciones o tablas de la Ontolog del Esquema en forma de tabla dinmica. a a Cargar todas las instancias denidas en la Ontolog del Esquema, a la a tabla dinmica para facilitar su visualizacin. a o Permitir la insercin de nuevas tuplas a la ontolog a travs de un o a e entorno tabular donde la informacin pueda ser denida de forma rpida. o a Para facilitar dicha tarea se describen, a travs de una leyenda las cae racter sticas de denicin de cada tipo de dato debajo de la tabla de o insercin. o Facilitar al usuario el acceso a los datos del dominio difuso. Dicha funcionalidad consiste bsicamente en proporcionar de manera dinmica las a a etiquetas ling usticas asociadas a los atributos difusos de tipo 2 o 3, en caso que las requieran, para denir los valores que componen la tupla. Gestionar la conexin los SGBDRD y permitir el mantenimiento de o dichas conexiones de forma simultnea para poder realizar operaciones a en paralelo. Dicha interfaz se encuentra localizada en la zona izquierda de la pantalla y es similar a la presentada en la gura 5.14). Exportar los datos denidos en Ontolog del Esquema a los SGBDRDs a cuyas conexiones se encuentren establecidas. Este proceso ser realizado a

158

CAP ITULO 5. ARQUITECTURA Y APLICACIONES

Figura 5.15: Imagen de la aplicacin para abrir el asistente para la generacin o o de un atributo en Protg e e

5.3. DESCRIPCION DEL SISTEMA IMPLEMENTADO

159

Figura 5.16: Imagen de la aplicacin para gestionar esquemas aadida a la o n herramienta Protg e e

160

CAP ITULO 5. ARQUITECTURA Y APLICACIONES de manera simultnea con todos los SGBDRDs que se encuentren abiera tas. Exportar el cdigo fuente o script correspondiente a la creacin de las o o tuplas denidas a travs de la ontolog Dicho script puede obtenerse en e a. FSQL o SQL dependiendo de la preferencia del usuario. Adems dicho a script contendr las particularidades del SGBDR seleccionado. a

5.3.4.3.

Generacin de Consultas en FSQL en Protg o e e

La interfaz de consulta de Bases de Datos Difusas desarrollada a travs e del entorno de Protg permite desarrollar una consulta sobre datos difusos en e e lenguaje FSQL a travs de un entorno guiado e intuitivo. Para ello proporciona e al usuario la informacin necesaria para realizar la consulta en funcin de los o o datos que dispone gracias la ontolog que describe el esquema de BDD sobre a el que se desea consultar. Esta extensin de Protg tiene un desarrollo similar a las anteriores, tal o e e y como podemos ver en la gura 5.17, y aporta la funcionalidad descrita a continuacin: o Realiza consultas clsicas o difusas. a Consulta sobre un nmero cualquiera de relaciones. u Incluye un nmero indeterminado de condiciones. u Permite la posibilidad de negar una condicin. o Identica qu tipo de comparadores existen en funcin del atributo que e o se trate (sea clsico o difuso). a Permite realizar comparacin de atributos o valores. o Permite realizar comparaciones con valores difusos incluidos en los dominios difusos. Permite la denicin de nuevos valores difusos con los que realizar una o comparacin. o Permite asignar un grado de certeza a la condicin que utilice atributos o difusos. Permite negar una condicin. o

5.3. DESCRIPCION DEL SISTEMA IMPLEMENTADO

161

Figura 5.17: Interfaz de generacin de consultas difusas en FSQL sobre la o herramienta Protg. Establece una comparacin entre atributos e e o

162

CAP ITULO 5. ARQUITECTURA Y APLICACIONES

Figura 5.18: Interfaz de generacin de consultas difusas en FSQL sobre la o herramienta Protg. Establece una comparacin con Valor Difuso. e e o

La consulta generada ser traducida al lenguaje FSQL y posteriormente a a travs del botn Ejecutar podr ser lanzada al SGBDRD que interprete dicho e o a lenguaje a travs de la utilizacin de la herramienta FuzzyQuery [Bla02b]. e o En la gura 5.17 se visualiza cmo puede establecerse una condicin entre o o atributos, y en la gura 5.18 se muestra una comparacin difusa entre un o atributo y un valor del dominio del atributo.

5.4.

Casos de Uso de la Arquitectura

La denicin de esta arquitectura para realizar la conexin semntica entre o o a la denicin de una Base de Datos Relacional Difusa y una ontolog permite o a llevar a cabo la realizacin de mltiples operaciones que sin su combinacin o u o

5.4. CASOS DE USO DE LA ARQUITECTURA

163

no hubiesen sido posibles. A continuacin se van a detallar todas las aplicaciones o casos de uso que o dicho modelo de representacin de datos presenta, diferenciando el tipo de o datos que se representa y la operacin que realizan. o Adems se detallar qu casos de uso estn implementados y cuales de a a e a ellos no, especicando el proceso que se requiere llevar a cabo para dicha implementacin. Los casos de uso que no se encuentran implementados en o este trabajo de tesis, se establecen como trabajos futuros, tal y como puede verse en el cap tulo siguiente.

5.4.1.
5.4.1.1.

Denicin de Datos. Creacin de Esquemas o o


Interaccin con otros Esquemas de BD o

El trabajo de denicin de un Esquema de BD Difusas, es el ms imo a portante en el proceso de denicin de un sistema de informacin de estas o o caracter sticas y se obtiene siguiendo los pasos descritos en la arquitectura. Dicho Esquema, una vez seguidos estos pasos, se obtendr en dos formatos a diferentes, uno como esquema SQL o FSQL dependiendo de la vista en que lo queramos obtener, y otro como ontolog denida en el lenguaje OWL (coma prensible para la Web). Gracias a este doble formato las posibilidades de denicin e interaccin o o de un esquema de bases de datos con el entorno se multiplican de forma exponencial, ya que la representacin del esquema en forma de ontolog se ve libre o a de dependencias con los SGBDR en donde se pudieran hallar almacenados. A continuacin se detallan los diferentes casos que se pueden presentar entre los o diferentes SGBDRD gracias a esta propuesta. Denir un Esquema de BDD en SGBDR Heterogneos Es posie ble, una vez denida la Ontolog del Esquema de BD, que dicho esquema a sea denido en cualquier SGBDR con capacidades Difusas, siendo indiferente el SGBDR comercial de que se trate, ya que las particularidades del mismo son transparentes al usuario. La gura 5.19 ilustra dicha aplicacin. Para lleo var sto a cabo es necesaria la denicin de la ontolog y posteriormente su e o a declaracin en el SGBDR tal y como se describe en este cap o tulo. Esta operacin es la ms sencilla y habitual para denir cualquier BDD y o a uno de los principales objetivos alcanzados en este trabajo. Exportar un Esquema de BDD a cualquier SGBDR Es posible, gracias a la utilizacin de la Ontolog del Esquema el portar esquemas de BD o a entre diferentes SGBDR. Dicho proceso implica la exportacin del esquema o

164

CAP ITULO 5. ARQUITECTURA Y APLICACIONES

SQL Server

DB2

ONTOLOGA DELESQUEMA

PostgreSQL

SyBase

...

SGBDRs Oracle MySQL

Figura 5.19: Denicin de Esquemas de BDD en SGBDR Heterogneos o e

denido en un SGBDR concreto al formato de instancias de la Ontolog del a Catlogo descrito en la arquitectura y a continuacin el proceso de denicin a o o del mismo en cualquier otro SGBDRD distinto. Ni siquiera har falta su traa duccin a forma de Ontolog del Esquema. La gura 5.20 muestra el proceso o a de forma grca. a Este proceso es habitual en las migraciones de BD, a otros sistemas ms a actuales o simplemente a otros SGBDS comerciales. Esta operacin requiere o implementar el proceso de convertir una BDD a Ontolog del Catlogo (funa a cionalidad que actualmente habr que hacer de forma manual y que se deja a planteada como un trabajo futuro). o Unicar Esquemas Complementarios Esta aplicacin consiste en la posibilidad de Unicar Esquemas denidos o distribuidos en diferentes SGBDs y cuya informacin representada no coincide en contenido semntico puesto que o a representan realidades diferentes. En la gura 5.21 puede observarse cmo el o esquema nal ser una unin de los esquemas iniciales. a o Este proceso suele ser utilizado para aunar BDD diferentes en un mismo entorno. Se lleva a cabo a travs del uso de una ontolog que contiene denidos e a todos los conceptos de las BDDs de origen. Dicha ontolog unir las reprea a sentaciones de las BDDs en forma de instancias de la Ontolog del Catlogo. a a A partir de la ontolog que une los esquemas, se genera bien otro SGBDRD a con la estructura nal o bien, se trabaja directamente con la misma. Unicar Esquemas Compatibles Esta ultima opcin es la ms compleja o a de las anteriores y la unica cuya puesta en marcha no ser inmediata. Se trata a de combinar dos SGBDRD que contiene conceptos semnticamente similares. a

5.4. CASOS DE USO DE LA ARQUITECTURA

165

SGBDR
CUALQUIERA

INSTANCIAS DE LA ONTOLOGA DEL CATLOGO

SQL Server

DB2

PostgreSQL

SyBase

...

SGBDRs Oracle MySQL

Figura 5.20: Exportacin de un Esquema de BDD a cualquier SGBDR o

SGBDR Cualesquiera ESQUEMA A ESQUEMA B

INSTANCIAS DE LA ONTOLOGA DELCATLOGO A

INSTANCIAS DE LA ONTOLOGA DELCATLOGO B

ESQUEMA A+B

SGBDR Cualquiera

Figura 5.21: Unicar Esquemas Complementarios

166

CAP ITULO 5. ARQUITECTURA Y APLICACIONES

Para llevar a cabo esta unicacin se requiere de la utilizacin de operaciones o o sobre ontolog que permitan la identicacin de correspondencias entre conas o ceptos, tal como se ve en la gura 5.22. Este tipo de operaciones denominados genricamente de mezcla, bsqueda de correspondencias o alineacin, se han e u o descrito en el apartado A.2.4 y son complejas y costosas, debido a los mltiu ples parmetros que han de ser tenidos en cuenta para identicar y relacionar a conceptos representados en esquemas diferentes que var desde conictos de an tipos de datos, de nombres, de semntica, etc. (vase [Ma06] para conocer ms a e a detalles sobre la problemtica del unicado de esquemas). a Este proceso suele usarse para compartir informacin entre SGBDRD que o se encuentren distribuidas y compartan informacin o bien entre SGBDRD o diferentes que contengan informacin en comn. Un ejemplo de uso podr o u a consistir en disponer de una BDD Universitaria con informacin acadmica o e de sus alumnos, y otra BDD de Jugadores de Ftbol, con informacin acerca u o de las caracter sticas y resultados de cada uno los jugadores. Una combinacin o de ambas bases de datos permitir extraer informacin acerca, por ejemplo, a o del rendimiento acadmico del jugador en funcin de su val como deportista, e o a o sacar cualquier otra conclusin a travs del uso de tcnicas de miner de o e e a datos. Para realizar esta operacin se necesita obtener la Ontolog del Esquema o a de cada BDD y aplicar las operaciones anteriormente mencionadas sobre los conceptos representados en las mismas. Este caso de uso implica el desarrollo de un gran nmero de aspectos tericos y se incluye como uno de los trabajos u o futuros de esta tesis. 5.4.1.2. Interaccin con Esquemas del Entorno o

La informacin contenida en un esquema de BD incorpora todo el conoo cimiento necesario para describir una parte de la realidad. Es por esto que se considera comparable un esquema de BD, a cualquier ontolog de reprea sentacin de un dominio, a cualquier modelos de datos orientados a objetos, o esquema en XML, folksonom u otro modo de representacin de la realidad a, o que sea computacionalmente comprensible (lase apartado 2.3). e De esta forma, un Esquema de BDD no solamente interacciona con otros Esquemas de BDDs a travs de los SGBDRD, sino que tambin puede hacerlo e e con otras representaciones encontradas en otros entornos, compartiendo la riqueza semntica de los conceptos que representa. Para ello la representacin a o del Esquema de BDD en forma de ontolog (en OWL) es un arma excelente, ya a que es formato aceptado por la amplia mayor de la comunidad que representa a conocimiento en la Web (lugar dnde se puede encontrar la mayor de las o a representaciones de datos anteriormente expuestas).

5.4. CASOS DE USO DE LA ARQUITECTURA

167

SGBDRs Cualquiera

ESQUEMA

ESQUEMA

INSTANCIAS DE LA O. CATLOGO

INSTANCIAS DE LA O. CATLOGO

ONTOLOGA
DELESQUEMA A

ONTOLOGA
DELESQUEMA B

OPERACIONES SOBRE ONTOLOGAS: matching, alignment, merging, etc.

ONTOLOGA

DELESQUEMA A+B

ESQUEMA A+B

SGBDR Cualquiera

Figura 5.22: Unicar Esquemas Compatibles

168

CAP ITULO 5. ARQUITECTURA Y APLICACIONES

Sin embargo, dada la naturaleza heterognea de las estructuras de infore macin que existen y con las que se puede interaccionar, las operaciones que o pueden realizarse con nuestra propuesta de representacin estn supeditadas a o a la incorporacin de herramientas que permitan la traduccin de los diferentes o o formatos a uno comn comprensible por todas para que puedan interaccionar. u Una solucin puede consistir en el uso de OWL dada la amplia aceptacin o o que tiene este lenguaje de representacin. As las operaciones que pueden reao , lizarse con la Ontolog del Esquema de un BDD y el resto del entorno son a muy similares a las descritas anteriormente para los SGBDRDs, como vemos a continuacin: o o Publicacin de un Esquema de BDD Esta operacin consiste en aportar o al entorno, fundamentalmente Web, un nuevo tipo de informacin que pueda o enriquecer a la comunidad: un esquema de BDD. Dichos esquemas proporcionan una representacin de la realidad que puede ser procesable computao cionalmente y por consiguiente usada por agentes, usuarios u otros sistemas de gestin del conocimiento para, por ejemplo, acceder a travs de herramientas o e de consulta a la informacin deseada gracias a que la estructura de la informao cin est disponible. La gura 5.23 trata de ilustrar el proceso que lleva esta o a publicacin del esquema de BDD. o Denir y publicar una BDD utilizando la Ontolog del Esquema es un a proceso inmediato (operacin descrita en [Bla07]). Sin embargo, traducir a o otros formatos requerir la elaboracin de los traductores pertinentes (mbito a o a que no compete a este trabajo de tesis). Denicin de Esquemas de BDD a partir de un Esquema Cualquiera o Esta operacin trata de incorporar a un modelo de BD Relacional Difuso un o esquema no relacional. Para realizar este proceso, ser necesario la generacin a o de la Ontolog del Esquema a partir de los conceptos obtenidos de cualquier a otro tipo de representacin. En la gura 5.24 se muestra el sentido del ujo o de informacin. Una vez obtenida la Ontolog del Esquema ser traducida a o a a instancias de la Ontolog del Catlogo y a continuacin al SGBDRD corresa a o pondiente. Esta herramienta puede ser muy util en aquellos casos en los que la cantidad de informacin a representar sea demasiado grande, y se determine que un o SGBDR har una gestin mas eciente de la misma. a o Esta operacin requiere la implementacin de traductores que representen o o la estructura de datos pertinente en una Ontolog del Esquema adecuada. Su a desarrollo se pospondr para trabajos futuros. a

5.4. CASOS DE USO DE LA ARQUITECTURA

169

SGBDR

ONTOLOGA DELESQUEMA

Ontologias Semantic Web

Figura 5.23: Incorporar a la Web un Esquema de BDD

SGBDR

SGBDR

INSTANCIAS DE LA ONTOLOGA DEL CATLOGO

ONTOLOGA DELESQUEMA

HERAMIENTA DE
CONVERSION

Ontologias Semantic Web Web 2.0 Folksonomias

XML Schemas

Figura 5.24: Denicin de un Esquema de BDD a partir de cualquier tipo o de Esquema

170

CAP ITULO 5. ARQUITECTURA Y APLICACIONES

SGBDRs

SGBDR

INSTANCIAS DE LA ONTOLOGA DEL CATLOGO

ONTOLOGA DELESQUEMA

HERAMIENTA DE UNIFICACION

Ontologias Semantic Web

XML Schemas Web 2.0 Folksonomias

Figura 5.25: Combinacin de Fuentes Heterogneas o e

Combinacin de Esquemas a partir de Fuentes Heterogneos Se o e plantea la posibilidad de generar un Esquema a partir de esquemas provenientes de fuentes heterogneas, tal y como puede verse en la gura 5.25. Para e realizar esta operacin es necesario adems de la traduccin de los difereno a o tes esquemas a un lenguaje comn, como podr ser el OWL, un mecanismo u a de interpretacin de conceptos, tal y como ocurr en el proceso de Unicar o a Esquemas Compatibles descrito en el subapartado anterior. Dicho mecanismo debe identicar los conceptos representados en los diferentes esquemas, resolviendo los posibles conictos que puedan darse. Este proceso es costoso y complejo, pero en la actualidad es un problema muy estudiado en el mbito a de la combinacin de ontolog o as. La utilidad de esta operacin reside en la posibilidad de obtener una ono tolog nueva a partir de diversas fuentes de informacin con independencia a o de la estructura que las describa. Esta nueva representacin en forma de Ono tolog del Esquema de una BDRD permite adems de la gestin eciente de a a o los datos que forman parte de los mismos en un SGBDR, compartir informacin entre fuentes de datos heterogneas a travs de una unica representacin o e e o de datos. La posibilidad de representar informacin imprecisa aporta exibilidad a o la hora de resolver conictos en el proceso de unicacin de conceptos. Sin o embargo, dada la complejidad de esta tarea se plantea su desarrollo como un trabajo futuro.

5.4. CASOS DE USO DE LA ARQUITECTURA

171

5.4.2.

manipulacin de Datos o

En las BBDD, tanto la estructura de la informacin como la informacin o o en s cobran la misma importancia. A pesar de que el valor de la informacin o se obtiene a travs de los datos almacenados, la obtencin del conocimiento e o posterior depender de la correcta organizacin de los mismos. De este modo, a o la representacin de los datos en la BDD juega un papel fundamental. o A pesar de que una ontolog no es el mecanismo ms adecuado para mania a pular la informacin, dado que los SGBDs hacen una gestin ms eciente de o o a la misma, las ontolog permiten la denicin de dicha informacin en forma as o o de instancias. Si se pretende realizar las mismas operaciones de manipulacin o de datos sobre las ontolog que sobre un SGBDR entonces se requiere una as descripcin del esquema de datos fcilmente legible para el usuario, aislando o a al mismo de cualquier detalle de implementacin donde dicha informacin este o o almacenada, para permitirle realizar las tareas de insercin y consulta. Es por o esto que una Ontolog del Esquema que represente la informacin descrita en a o un SGBDRD aporta una gran utilidad para desarrollar esta tarea. 5.4.2.1. Insercin de Datos o

A continuacin se analizan las operaciones que aporta la Ontolog del o a Esquema aporta a la hora de manipular la informacin imprecisa almacenada o en un SGBDRD. Estas operaciones son las referentes al proceso de insercin o de datos (INSERT en SQL) en los SGBDRDs . o a Denicin de Datos Esta operacin consiste en utilizar la ontolog coo mo plataforma para denir una nueva tupla de datos. Dicha tupla de datos ser denida mediante la instanciacin de la Ontolog del Esquema corresa o a pondiente. Una vez denida dicha informacin, se har el traspaso de la misma o a al SGBDRD deseado utilizando las herramientas que proporciona la arquitectura. Esta operacin suele utilizarse cuando el nmero de datos a insertar no es o u muy elevado (para lo cual se utilizar scripts). Tambin puede resultar interean e sante si se mantienen copias simultneas de la BDD en diferentes plataformas a SGBDs, tal y como se mostraba en la gura 5.19. Esta operacin si ha sido implementada en este trabajo. o Exportacin de Datos a otros SGBDS Al igual que ocurr con los o a esquemas, vase la gura 5.20, los datos tambin pueden ser portados de un e e SGBDRD a otro diferente. La migracin de la informacin contenida en la miso o ma a travs del uso de la ontolog puede ahorrar mucho esfuerzo en el proceso e a

172

CAP ITULO 5. ARQUITECTURA Y APLICACIONES

puesto que evita la elaboracin de cheros que busquen las incompatibilidades o entre los sistemas origen y destino. Para llevarse a cabo es requisito que el sistema pueda generar una ontolog a partir de un SGBDRD (competencia a no incluida en este trabajo). Insercin de datos a partir de fuentes heterogneas Esta operacin o e o consiste en incluir datos a un SGBD a partir de otras fuentes, posiblemente encontradas en la Web. Esta operacin consistir en primer lugar en la adaptacin o a o del esquema donde estn los datos en origen al modelo de Ontolog del Esa a quema de la arquitectura. A continuacin la insercin de datos en el mismo o o ser perfectamente compatible. a Los inconvenientes que se pueden encontrar a la hora de realizar esta operacin residen en la adaptacin de un Esquema cualquiera al modelo de Ontolog o o a del Esquema adoptado en nuestro sistema. Dicha operacin puede tener dos o casu sticas: Que la BDD u Ontolog del Esquema correspondiente no exista previaa mente. Para lo cual no existir ningn problema, puesto que el proceso a u consistir simplemente en crear el Esquema en primer lugar, a partir de a dicha fuente, tal y como se describe en el subapartado anterior Denicin de Esquemas de BDD a partir de un Esquema Cualquiera (gura o 5.24), y a continuacin transportar los datos entre plataformas. o Que la BDD u Ontolog del Esquema correspondiente exista previa amente. Este proceso requiere la operacin de unicacin de esqueo o mas, descrita en el subapartado, Combinacin de Esquemas a partir de o Fuentes Heterogneos (gura 5.25). e Ninguna de estas dos alternativas se ha desarrollado en este trabajo de tesis, y queda planteada como trabajo futuro. 5.4.2.2. Consulta

Consulta a un unico SGBDRD Es la operacin de consulta comn, que o u en lugar de realizarse directamente a travs del SGBDR utilizando el lenguaje e FSQL, se realiza a travs de la ontolog (vase gura 5.26). Ser esta ultima la e a e a que proporcione el cdigo en OWL necesario para que la fase correspondiente o de la Arquitectura de Consulta lo traduzca en dicho lenguaje FSQL y lo lance al SGBDRD correspondiente. Esta operacin realizada a travs de la ontolog es independiente de las o e a restricciones que imponga el SGBDRD a la hora de realizar la consulta, ya que dicha consulta se genera utilizando el cdigo OWL de la Ontolog del Esquema o a

5.4. CASOS DE USO DE LA ARQUITECTURA

173

ONTOLOGIA DEL ESQUEMA

GENERADOR DECONSULTA

SGBDRs

Figura 5.26: Consulta a un SBDRD unico

ONTOLOGIA DELESQUEMA A
SGBDR 1 BDD A SGBDR 2 BDD B SGBDR 3 BDD C

GENERADOR DECONSULTA

Figura 5.27: Consulta a SGBDRD con el mismo Esquema

y a travs de una aplicacin de traduccin ser el Interprete o Adaptador del e o o a SGBD el encargado de resolver estas cuestiones. Esta tarea se resuelve en este trabajo de tesis.

Consulta entre SGBDRD con el mismo Esquema Esta operacin se o dar en entornos cuyos datos estn repartidos en diferentes plataformas SGBa a DRD pero que comparten el mismo Esquema de Informacin, tal como se ve o en la gura 5.27. La consulta a travs de la Ontolog del Esquema permitir e a a conectar con todos los sistemas cuya informacin se desea obtener y devolver o a usuario de forma transparente el resultado en un unico formato. Este caso ser muy fcilmente tratable puesto que su desarrollo no tiene a a ningn coste computacional a excepcin de la unin del resultado dado por la u o o consulta en los sistemas particulares donde ha sido lanzada.

174

CAP ITULO 5. ARQUITECTURA Y APLICACIONES

ONTOLOGIA
DEL ESQUEMA A+B+ C
SGBDR 1 BDD A SGBDR 2 BDD B

GENERADOR
DECONSULTA

SGBDR 3 BDD C

Figura 5.28: Consulta a SGBDRD con Esquemas Complementarios

Consulta entre SGBDRD con Esquemas Complementarios Esta casu stica se dar en consultas que desean buscar informacin sobre sistemas a o que contienen informacin complementaria. Este es el mismo caso expuesto o en el subapartado anterior Unicar Esquemas Complementarios ilustrado en la gura 5.21. En dicho caso, unicamente ser necesario la generacin de la a o consulta utilizando la Ontolog del Esquema que engloba cada uno de los a esquemas involucrados. En la gura 5.28 se ilustra dicha operacin. o o Consulta entre SGBDRD con Esquemas Compatibles En esta ocasin se desea consultar informacin sobre varios esquemas que contienen informao cin comn o similar. Este hecho obliga a desarrollar una ontolog unicada o u a donde existan conceptos que comparten el mismo signicado (tal y como se vio en el apartado Unicar Esquemas Compatibles ilustrado en la gura 5.22 y en este caso en la gura 5.29. Una vez los esquemas han sido adaptados y generada una unica Ontolog del Esquema que aune a las participantes en a la consulta, la consulta podr ser realizada y el resultado devuelto al usuario a nal. Dicha operatividad supone un gran costo dada la complejidad y naturaleza del problema, tal y como especicamos en el anterior apartado y se plantea como un trabajo a realizar en un futuro. Consulta al Entorno de Esquemas Heterogneos Esta operacin proe o pone la consulta de informacin a cualquier esquema fuente de datos, sin imo portar que sea relacional o contenga datos difusos. En este caso, y tal y como se describi para la Combinacin de Esquemas a partir de Fuentes Heterogneas o o e descrita en la gura 5.25 se considera necesaria, una primera adaptacin a o

5.4. CASOS DE USO DE LA ARQUITECTURA

175

ONTOLOGIA DEL ESQUEMA UNIFICADA

SGBDR 1 BDD A SGBDR 2 BDD B SGBDR 3 BDD C

GENERADOR DECONSULTA

Figura 5.29: Consulta a SGBDRD con Esquemas Compatibles

ontolog en OWL de las distintas fuentes y una posterior generacin de una a o Ontolog del Esquema comn en las que se hallen identicados todos los elea u mentos comunes encontrados en las mismas y las correspondencias entre los diferentes elementos comunes. Vase la gura 5.30 para ilustrar dicha operae cin. o Esta propuesta es la ms completa de todas pero la puesta en marcha de a este problema ser comparable a la construccin de un buscador Web, y ser a o a un problema inabordable para ser resuelto en el mbito de este trabajo de a tesis.

176

CAP ITULO 5. ARQUITECTURA Y APLICACIONES

SGBDOOs SGBDRs

INSTANCIA
ONTOLOGIA DE CONSULTA

ONTOLOGIA DELESQUEMA

Ontologias Semantic Web

XML Schemas Web 2.0 Folksonomias

Figura 5.30: Consulta a SGBDRD con Esquemas Heterogneos e

Cap tulo 6

Conclusiones y Trabajos Futuros


6.1. Conclusiones

Extensin de los Sistemas de Gestin de Bases de Datos Relao o cionales


Los Sistemas de Gestin de Bases de Datos en la actualidad estn siendo o a extendidos continuamente. El aadir la gestin de informacin imprecisa a los n o o mismos no supone un gran coste, tal y como se ha probado en numerosos modelos. Sin embargo, extender el SGBDR para incrementar el nmero de u operaciones con dicha informacin imprecisa no es un proceso tan comn. o u En este trabajo se ha propuesto de manera terica una Arquitectura Mulo tipropsito para la unicacin de extensiones realizadas a SGBDR Difusas. o o Dicha arquitectura se ha basado concretamente en dos extensiones: la que permite deducir sobre informacin difusa, y la que aade tcnicas de mio n e ner de datos sobre un SGBD difuso. Las extensiones planteadas con este a propsito hab sido implementados ad hoc, teniendo en cuenta, unicamente, o an los parmetros planteados a priori, y obviando el hecho de que ambas propuesa tas se basaban en el mismo modelo terico GEFRED y arquitectura FIRST, o provocando as una incompatibilidad entre sistemas innecesaria. La Arquitectura Multipropsito propuesta permite aumentar en gran parte o la operatividad de la Base de Datos Difusa, en el sentido de que hace posible la combinacin de operaciones deductivas y de miner de datos mediante el o a uso de cualquiera de las estructuras denidas en las mismas. As es posible la , ejecucin de operaciones de diversa o ndole como el uso de reglas lgicas para o almacenar resultados de miner de datos (DM), o el uso de tablas intensivas a 177

178

CAP ITULO 6. CONCLUSIONES Y TRABAJOS FUTUROS

para hacer clculos de DM, etc. que aumentan en gran medida la capacidad a de consulta del sistema. Pero la unicacin de dichas extensiones devuelve como resultado una aro quitectura de SGBD sumamente compleja, dado que adems de las relaciones a del catlogo necesarias para la representacin de cada arquitectura, la comua o nicacin entre ellas requiere de la inclusin de otras nuevas. Lo que provoca a o o priori un alto coste de recursos en la tarea de comprensin del sistema. o Adems, sobre cada implementacin de la arquitectura se establecen resa o tricciones propias del SGBD sobre el que ha llevado a cabo, ya que cada SGBD tiene su propia estructura del catlogo, restricciones de acceso, particularidaa des de lenguaje que implementa, etc. Dichas restricciones establecen un vinculo nada deseable con el sistema concreto. Este es el caso de las implementaciones que ya se encuentran desarrolladas, que utilizan Oracle c como SGBDR y PL/SQL para la implementacin de su funcionalidad. Dicho sistema no es o portable y unicamente puede ser usado para esta plataforma. Todos estos problemas han desembocado en un proceso de ingenier ina versa consistente en buscar soluciones que faciliten la compresin del sistema, o para hacer menos dicultosa la tarea de denicin de informacin sobre el o o mismo. La solucin encontrada se basa en el uso de Ontolog o as.

Uso de una Ontolog para Representar BD Difusas a


La utilizacin de ontolog es una prctica que actualmente esta dando o as a resultado en el campo de la inteligencia articial a la hora de representar el conocimiento de forma sencilla y portable. Dicha metodolog consiste en una a representacin jerrquica de un Universo del Dominio concreto que permite al o a usuario utilizar, compartir y representar el conocimiento de forma comprensible. Dicho conocimiento puede consistir tanto en un campo espec co, como en la representacin de metaconocimiento que dene las estructuras que permiten o establecer las caracter sticas de la informacin que va a ser almacenada. o Por otro lado, hoy d gran parte de la informacin disponible, y la gran a o mayor de las aplicaciones se utilizan a travs de la Web, estando as dispoa e nibles en cualquier lugar y momento sin necesidad de instalar nada ms que a un simple navegador. La Web Semntica, un nuevo entramado de servicios de a Internet, consiste en dotar de semntica a cada contenido encontrado en la a misma y utiliza principalmente ontolog para acometer dicho propsito. as o De esta forma las ontolog han cobrado la suciente relevancia para as generar un gran nmero de lenguajes (casi estandarizados), herramientas de u desarrollo y servicios asociados a las mismas, convirtindose as en el principal e , mecanismo de representacin del conocimiento utilizado en la actualidad. o En este trabajo se ha propuesto una Ontolog Representacional como a

6.1. CONCLUSIONES

179

solucin a los problemas surgidos en la Arquitectura Multipropsito. De esta o o forma, la representacin de la arquitectura en forma de ontolog permite aiso a lar de una representacin de informacin vinculada a un SGBDR concreto y o o adems, generaliza los conceptos modelados en arquitectura, simplicando su a representacin y posibilitando a su vez que cualquier usuario sea capaz de ino terpretar la informacin sin necesidad de ser un experto del modelo relacional. o Evidentemente, el proceso de representacin del Servidor de BDD Multio propsito Unicado debe pasar por una serie de fases. En concreto, se han o diferenciado tres: una primera para la representacin de la informacin difusa, o o la segunda para la representacin de la informacin lgica-deductiva, y por o o o ultimo la representacin de las diferentes estructuras de datos y tcnicas que o e permiten realizar tareas de miner de datos sobre un SGBD. a El trabajo que se ha presentado en esta tesis aborda la primera fase. Dicha fase, que consiste en el modelado de la informacin imprecisa, ha permitio do comprobar la viabilidad de esta propuesta, identicando las dicultades encontradas y las herramientas o metodolog de representacin ms idneas. as o a o

Ontolog para la Representacin del Conocimiento Difuso a o


La Ontolog para la Representacin del Conocimiento Difuso, como se a o ha denominado, ha simplicado el proceso de representacin de informacin o o difusa hacindolo ms sencillo e intuitivo. La jerarqu de clases que forma e a a la ontolog ha permitido la diferenciacin clara de cada elemento de infora, o macin: atributos, relaciones, dominios de atributos, etiquetas ling o usticas, valores discretos, y sobre todo, los tipos de datos bsicos o clsicos han podia a do ser denidos de forma genrica e independiente del entorno en el que son e representados. El inconveniente encontrado en la ontolog se halla en la gran disociacin a o que existe entre el proceso de denicin de estructuras, y el proceso de denio cin o insercin de informacin. Dicha disociacin, que en sistemas de bases o o o o de datos es apenas perceptible, en la ontolog se maniesta de forma que es a necesario denir por un lado la estructura de la informacin, tablas, atribuo tos, dominios, restricciones de datos, restricciones de tipos de datos, etc. en forma de instancias. Y, por otro lado, un conjunto de nuevas clases generadas a partir de las deniciones anteriores, que permitan la insercin de las o tuplas de informacin a travs de su instanciacin. La representacin de la o e o o estructura de la informacin se ha denominado Ontolog del Catlogo. Esta o a a metaontolog representa toda la estructura del modelo relacional extendida a para la representacin de datos difusos. Por otro lado, la representacin de una o o BD concreta, descrita en forma de instancias de dicha Ontolog del Catlogo a a se denomina Ontolog del Esquema en el momento en que dichas instancias a

180

CAP ITULO 6. CONCLUSIONES Y TRABAJOS FUTUROS

se convierten en clases y atributos y permiten ser instanciables para as poder contener la misma informacin contenida en las tuplas de una BDD. o El problema reside en que la denicin de dichas clases (a pesar de utilizar o una metaontolog tiene que ser expl a) cita y realizarse de manera manual en gran parte del proceso. Otro problema encontrado consiste en que dicha disociacin provoca que la denicin de un gran nmero de restricciones sobre las o o u estructuras no sea aplicable en las clases generadas para el almacenamiento de la informacin en la ontolog Dichas restricciones (como las que permiten o a. la insercin de valores unicos, nulos, de clave primaria, de clave ajena, o de o tipos de datos) no se pueden mantener o establecer en la ontolog (dada la a naturaleza de la misma), y pueden provocar un gran problema en la integridad de la informacin. Este problema puede ser resuelto de forma parcial mediante o el uso de razonadores para encontrar incompatibilidades en la denicin de la o informacin. o Otra solucin para reducir el nmero de restricciones consiste en el desao u rrollo de un mtodo que permite la generacin automtica de la Ontolog del e o a a Esquema a partir de su denicin sobre la Ontolog del Catlogo. Este proceso o a a intenta incluir en la Ontolog del Esquema basada en OWL el mayor nmero a u de restricciones, como: restriccin sobre el tipo de dato que puede contener un o atributo, restriccin sobre el nmero de valores asociado a un atributo a uno o u solo, restriccin sobre los valores que un tipo difuso 3 puede contener, etc. Sin o embargo, la mejor solucin est a posteriori, cuando la estructura generada es o a trasladada a un SGBD real, siendo los mecanismos de integridad implementados por el propio SGBD los encargados de velar por el cumplimiento de dichas restricciones. De cualquier forma, y a pesar de esta desventaja, la representacin de la o arquitectura unicada a travs de una unica ontolog permite demostrar la e a viabilidad de una representacin de nuevos tipos de informacin de una forma o o ms simple que la que proporcionan los SGBD y cmo, a travs de un interfaz a o e adecuado, la denicin de la misma puede llevarse a cabo de forma efectiva y o sencilla para el usuario.

Herramientas para la explotacin de la Ontolog o a


Se debe tener en cuenta que la creacin de la Ontolog para la Repreo a sentacin del Conocimiento Difuso consiste bsicamente en una ayuda en el o a proceso de denicin de la informacin, considerado como el ms costoso. A o o a este proceso habr que aadir el de ayuda a la elaboracin de consultas sobre a n o datos difusos en un SGBD Extendido. Para ello se han desarrollado una serie de aplicaciones:

6.1. CONCLUSIONES

181

Herramienta para denir estructuras del Catlogo: esta herramienta basaa da en tecnolog web, permite la denicin de las estructuras necesarias a o para permitir el almacenamiento de BDD en cualquier SGBD. En la misma interfaz se permite hacer una consulta del contenido del catlogo. a Herramienta para denir esquemas de BDRD: esta herramienta permite denir esquemas de BDRD de manera guiada al usuario que no tiene por qu conocer las particularidades del sistema donde dicha informae cin vaya a ser almacenada. Incluso el usuario puede ser ajeno a las paro ticularidades del lenguaje de ontolog gracias al uso de asistentes que as, permitan realizar las correspondientes deniciones basndose en la ona tolog Esta herramienta est implementada mediante tecnolog web, a. a as y tambin como extensin a la herramienta de gestin integral de one o o tolog Protg. Adems permite la gestin de los esquemas a travs de as e e a o e la ontolog de manera simultnea con varios SGBDR. a a Herramienta de consulta sobre esquemas de BDRD: esta herramienta permite guiar la consulta sobre un esquema de BDD que se encuentra representado en forma de ontolog Dicha interfaz de consulta propora. ciona independencia del lenguaje de consulta necesario para manipular datos difusos (y por consiguiente a las estructuras especiales que este tipo de informacin requiere). El resultado ser una sentencia en FSQL o a que podr ser lanzada sobre un SGBD que soporte dicha funcionalia dad a travs del uso de herramientas como el FuzzyQuery2+ [Bla02b]. e Est desarrollada como extensin de la plataforma Protg. a o e e Herramienta de denicin de datos: esta herramienta ayuda al usuario o a denir tuplas de una BDD a travs del uso de su correspondiente One tolog del Esquema. Dicha herramienta permite visualizar de manera a intuitiva las instancias de la Ontolog del Esquema y volcarlas al SGBa DRD correspondiente de manera directa. A su vez tambin permitir coe a municarse con diversos SGBDRD heterogneos de manera simultnea. e a Est desarrollada como extensin de la plataforma Protg. a o e e La utilizacin de herramientas a travs de Web evita al usuario la necesio e dad de instalar otro tipo de aplicaciones para denir la informacin sobre un o SGBDR concreto, adems de incorporar la posibilidad de usarlas en remoto. a Sobre la utilizacin de la herramienta Protg para desarrollar las aplicao e e ciones se ha argumentado mucho a lo largo de este trabajo. Resumiendo, se trata de un entorno que facilita la incorporacin de nuevas operaciones a su o entorno, a su vez aporta un gran nmero de bibliotecas de funciones y mtou e dos para gestionar las ontolog representadas sobre dicha herramienta. Por as

182

CAP ITULO 6. CONCLUSIONES Y TRABAJOS FUTUROS

otro lado, presenta una interfaz intuitiva, una representacin eciente de las o ontolog en diversos lenguajes que, junto con otras caracter as sticas hacen que la herramienta sea una de las ms conocidas y extendidas de la comunidad. a En cuanto a la eleccin del lenguaje para la representacin de la ontolog o o a, se ha seleccionado OWL-Full debido a que permite denir metadatos. A su vez, es el ms extendido gracias a sus otras dos representaciones de naturaleza a ms restrictiva (OWL-DL y OWL-Lite) y a que est orientado a la web. Graa a cias a estas cualidades dicho lenguaje es implementado por un gran nmero de u herramientas que bien trabajan con el, bien son capaces de importarlo o exportarlo. Todas estas ventajas lo convierten en la opcin ms atractiva para llevar o a a cabo la representacin de la Ontolog de Representacin del Conocimiento o a o Difuso.

6.2.

Benecios de la Propuesta

Gracias a las propuestas planteadas en este trabajo, el Servidor Multipropsito y la Ontolog para la Representacin del Conocimiento Difuso, se o a o han obtenido una serie de ventajas. Dichas ventajas, resumidas a continuacin, o se encuentran clasicadas en funcin de los benecios proporcionados por la o propuesta terica o por la implementacin realizada de la misma. o o Ventajas Provenientes de la Propuesta Terica o La extensin de un SGBDR para manipular datos imprecisos y otro tipo o de operaciones de forma conjunta, tal y como se ha propuesto con la Arquitectura Multipropsito, permite multiplicar las posibilidades de exo plotacin de la informacin difusa sobre un SGBDR a la vez que conere o o al sistema una mayor escalabilidad. La denicin de la Ontolog de Representacin del Conocimiento Dio a o fuso ha permitido denir una interfaz entre el SGBDRD y el usuario de tal forma que, aisla al esquema de BDD y al mismo usuario de las representaciones particulares que hacen los diferentes SGBDR en los que la informacin es representada. o El uso de la Ontolog de Representacin del Conocimiento Difuso sima o plica al usuario el proceso de denicin de datos difusos, puesto que o lo aisla de las particularidades de representacin que tienen los datos o difusos. El uso de la Ontolog de Representacin del Conocimiento Difuso para a o representar un esquema de BD permite portar dicha representacin a o

6.2. BENEFICIOS DE LA PROPUESTA cualquier SGBD Relacional.

183

Se puede publicar la estructura de un esquema de BD en Internet simplemente con su representacin en forma de ontolog y acceder a la o a, informacin de dicha base de datos utilizando interfaces genricos de o e c. consulta como el ISQLPlus Una ontolog que representa a una BD Relacional permite representar a semnticamente una interfaz web que carezca de dicha semntica asocia a ada, debido a que sus datos se obtienen gracias a una consulta realizada a travs de un formulario Web. La ontolog estar incluida en el sitio e a a web dnde se encuentre dicho formulario. o El uso de Ontolog del Esquema permite, mediante mecanismos de as unicacin y bsqueda de correspondencias, intercambiar informacin o u o entre fuentes de datos heterogneas (desde diferentes esquemas almacee nados en SGBDs hasta esquemas con diferente tipo de representacin al o margen del modelo relacional). La ontolog propuesta permite extender la representacin de los SGBa o DD con otras operaciones o estructuras, de forma sencilla e intuitiva, dada la generalidad con la que representa la informacin en este medio. o Ventajas Provenientes de la Implementacin de la Ontolog o a La propuesta de la Arquitectura de Comunicacin Unicada, que eso tablece la comunicacin entre el usuario con la ontolog y los SGBDRD, o a contempla todas las alternativas en el proceso de denicin de informao cin de una BDD sean cuales sean las caracter o sticas del SGBDR sobre el que dicha BDD vaya a ser denida. La utilizacin de una interfaz web para manipular la ontolog del Catloo a a go/Esquema permite al usuario utilizar un simple navegador para operar sobre las mismas adems de ejecutar los procesos de denicin en remoto. a o La eleccin de Protg como entorno para desarrollar la herramienta de o e e denicin de Bases de Datos Difusos, aporta los benecios propios que o tiene dicho entorno (interfaz colaborativa, intuitiva, extensible, etc.) a las utilidades implementadas aadidas a dicha herramienta. n La herramienta de consulta facilita al usuario la denicin de una cono sulta en FSQL. As el usuario no tiene la necesidad de conocer las par ticularidades de este lenguaje. Esta consulta slo podr ser utilizada o a

184

CAP ITULO 6. CONCLUSIONES Y TRABAJOS FUTUROS sobre SGBDRD que dispongan de la implementacin que interprete este o lenguaje de consulta extendido. La interfaz de denicin de esquemas proporciona asistentes que gu al o an usuario a la hora de denir un esquema de bases de datos, simplicando as el proceso adems de aislar a dicho usuario de los detalles espec a cos de representacin de datos difusos. o La interfaz web de denicin de estructuras del catlogo permite reo a presentar las estructuras de datos que necesita un SGBDR cualquiera para almacenar datos difusos. Dicha interfaz permite esta denicin de o manera inmediata y remota. La interfaz de insercin de datos facilita el proceso de insercin de las o o instancias denidas en la Ontolog del Esquema a la BDD, en caso a de ser necesario. Adems facilita la denicin de las tuplas, aislando al a o usuario de las particularidades de representacin de los datos difusos o o del lenguaje FSQL. La herramienta de denicin de esquemas o insercin de datos permite o o conectar simultneamente a varios SGBDR, y por tanto realizar dichas a operaciones de forma paralela. La interfaz web permite visualizar el esquema denido sobre la Ontolog a del Catlogo en OWL de forma estructurada y comprensible al usuario a (ignorando detalles de sintaxis que complican su interpretacin). o La generacin automtica de la Ontolog del Esquema a partir de las o a a instancias de la Ontolog del Catlogo facilita al usuario el trabajo de a a denicin de la misma adems de incluir de manera automtica un gran o a a nmero de restricciones en dicha ontolog que facilitan la tarea de manu a tener la integridad de la informacin. o

6.3.

Trabajos Futuros

A continuacin se exponen algunas propuestas de trabajos futuros que suro gen a ra de este trabajo de tesis, que dada su naturaleza y carcter novedoso, z a se encuentran en gran nmero. Dichas propuestas se basan en extensiones a u este trabajo con el objetivo de ampliar los mecanismos de representacin y o gestin de informacin imprecisa, o en introducir mejoras a alguno de los obo o jetivos alcanzados en la misma evaluadas a partir de los resultados obtenidos. Las propuestas se clasicarn en funcin del objeto u operacin a extender: a o o

6.3. TRABAJOS FUTUROS Con Respecto a la Ontolog a

185

La Extensin de la Ontolog de Representacin del Conocimiento dio a o fuso para permitir representar informacin lgica para deduccin sobre o o o los SGBDD. Para ello, deber establecerse una aproximacin a la reprea o sentacin de reglas lgicas con grado de acoplamiento difuso y los cono o ceptos de tablas intensivas y su interrelacin con las estructuras que o permiten representar el resto de informacin del modelo relacional y dio fuso. La Extensin de la Ontolog de Representacin del Conocimiento Difuso o a o para permitir representar datos con un dominio complejo. La denicin o de dicho tipo de datos, permitir la posterior denicin de las estruca o turas necesarias para integrar operaciones de miner de datos sobre un a sistema de informacin. Para llevar sto a cabo ser necesario ampliar el o e a tipo de informacin que puede representarse en la ontolog y el l o a mite de dominios que puede denir un atributo. Adems, las operaciones de a miner de datos que se pueden realizar sobre el sistema debern ser a a denidas sobre la ontolog junto con sus parmetros y restricciones, as a al igual que se hace a travs del concepto de proyecto propuesto en la e extensin del SGBD, DmFirst. o Desarrollo de una Ontolog de Consulta que represente la informacin a o implicada en dicha consulta, proveniente de la Ontolog del Esquema, a y las operaciones que intervienen en la misma. Esta ontolog se fora mar a partir de una operacin de proyeccin sobre la Ontolog del a o o a Esquema, de esta forma se obtiene una sub-ontolog de la Ontolog a a del Esquema origen donde las instancias de la misma pueden ser los resultados de la ejecucin de la consulta. Dicha Ontolog de Consulta o a permitir independizar la consulta de la herramienta donde se est ejea e cutando, convirtindola as en portable a cualquier entorno donde pueda e ser realizada y evitando vincular la misma unicamente a sistemas de modelado relacional. Con Respecto a la Implementacin o Desarrollo de una herramienta que implemente los asistentes para la generacin de esquemas de BDD a travs de la Web como alternativa o e a la utilizacin de la herramienta Protg. De esta manera se indepeno e e diza esta funcin de la representacin particular que hace Protg de las o o e e ontolog y del requerimiento de su instalacin para poder acceder a as, o dicha funcionalidad.

186

CAP ITULO 6. CONCLUSIONES Y TRABAJOS FUTUROS Desarrollo de una herramienta de Consulta utilizando un entorno Web como alternativa a la herramienta desarrollada en Protg. e e Desarrollo de una herramienta de Insercin de datos sobre la Ontolog o a del Esquema utilizando un entorno Web como alternativa a la herramienta desarrollada en Protg. e e

Con Respecto a su Relacin con el Entorno. Casos de Uso. o Desarrollo de un mecanismo que permita establecer las correspondencias entre una Ontolog del Esquema cualquiera en forma de instancias de a la Ontolog del Catlogo. Este proceso ser el inverso al visto en esta a a a tesis y conducir a una inmediata traduccin de una Ontolog del Esa o a quema proveniente de cualquier fuente a un SGBDRD. Por ejemplo, este proceso sirve para que cualquier ontolog de la Web pueda ser denida a de manera inmediata en un SGBDRD siempre y cuando se establezca la correspondencia entre dicha ontolog y la Ontolog del Catlogo. Una a a a vez denida la ontolog original como instancias de la Ontolog del a a Catlogo, el proceso de comunicacin con el SGBDRD es inmediato. a o Estudiar y desarrollar una herramienta para realizar el proceso de importacin de un esquema establecido en un SGBDRD concreto en forma o de instancias de la Ontolog del Catlogo. Esta herramienta permitir a a a Exportar un Esquema de BDD a cualquier SGBDR. Implementacin de operaciones que permitan la Unicacin de Ontolog o o as del Esquema. Se trata de estudiar y desarrollar algn mecanismo de u identicacin de elementos de Ontolog del Esquema diferentes que o as representen conceptos similares. Si dicha identicacin es positiva, se o deben establecer reglas para denir las correspondencias ente conceptos similares (por ejemplo: cambios de formato, rango, escala, etc.). Desarrollar la operacin de unicacin de esquemas compatibles de SGBo o DR heterogneas. Esta operacin, descrita en el apartado 5.4, consiste en e o combinar dos SBDRD que representen conceptos similares. Para ello se utilizarn procesos de identicacin de correspondencias entre conceptos a o representados a travs de las Ontolog del Esquema correspondientes. e as Una vez identicadas, realizar el proceso de mezcla de las mismas. Denicin de Esquemas de BDD a partir de un esquema cualquiera. o Consiste en desarrollar una herramienta capaz de realizar el proceso de denicin de un esquema cualquiera (un esquema XML, una folksonom o a o una Ontolog cualquiera) en forma de instancias de Ontolog del a a

6.3. TRABAJOS FUTUROS

187

Catlogo. Para ello primero debern convertirse en una Ontolog del a a a Esquema y a partir de este momento hacer la identicacin de elemeno tos (proceso descrito en el objetivo anterior). Una vez en este estado, se proceder a la implantacin de dicho esquema en el SGBDRD corresa o pondiente. Combinacin de Esquemas a partir de Fuentes de Datos Heterogneas. Se o e trata de un caso de uso descrito el apartado 5.4, que pretende realizar una representacin comn para cualquier esquema incorporado en la Web y o u de esta forma hacer toda la informacin compatible entre s Para llevar o . a cabo esta operacin se requieren por un lado traductores de esquemas o cualesquiera a Ontolog del Esquema y por otro, la implementacin de as o herramientas para la unicacin de Ontolog que representen conceptos o as similares. El resto de los casos de uso descritos en la seccin 5.4, que no han sido o implementados en este trabajo de tesis, son combinaciones de las operaciones que acaban de ser descritas como trabajos futuros en este apartado. Por tanto, el desarrollo de cada uno de los casos de uso descritos en dicha seccin 5.4, se o consideran trabajos futuros. Con respecto al Servidor Multipropsito o Desarrollo de una biblioteca de funciones y mtodos en un lenguaje de e programacin ampliamente aceptado (como Java o C) implementando o las capacidades funcionales para la gestin de datos difusos necesarias o para que cualquier SGBDR que no disponga de esta funcionalidad de manera interna, pueda utilizar datos difusos y el lenguaje FSQL. De esta manera se le conferir al sistema propuesto independencia del SGBDR a sobre el que se desee implantar. En el caso en que se desee ganar en eciencia lo conveniente ser realizar una implementacin concreta para a o cada SGBDR que incluya un lenguaje incrustado propio para la gestin o de sus datos. Extensin de la librer anterior para gestionar el Servidor SGBDRD o a Multipropsito. o Otras Propuestas Extensin del concepto de ontolog para aadir imprecisin en la denio a n o cin de algunos trminos, esto es, una Ontolog Difusa. Este concepto o e a

188

CAP ITULO 6. CONCLUSIONES Y TRABAJOS FUTUROS puede ser util sobre todo en ontolog generadas por procesos de uni as cacin (merging) en los cuales los conceptos alineados puede que no o coincidan semnticamente al ciento por ciento. a Desarrollo de un modelo de representacin para almacenar ecienteo mente la informacin que se encuentra denida sobre Ontolog de o as Dominio OWL cualquiera en un SGBDR Difuso. Dichas representaciones, denominadas OBDB, son las utilizadas en la actualidad por las herramientas de representacin de Ontolog (Protg, JENA, Sesame, o as e e etc.) para almacenar las ontolog y sus instancias de las mismas en as forma de BD, pero sin tener en cuenta las particularidades de la informacin representada. Un almacenamiento eciente de dicha informacin o o aportar una mayor eciencia a la hora de trabajar con esos datos. a

Apndice A e

Conceptos Bsicos de a Ontolog as


A.1. Introduccin o

Han surgido muchas deniciones del concepto de Ontolog a partir de su a, aparicin como nueva tcnica de representacin del conocimiento en el campo o e o de la tecnolog de la informacin. Algunas de ellas las podemos encontrar a o recopiladas en trabajos como el de Gmez-Prez et al. [GP03a] donde se eno e cuentra un estudio muy detallado de los diferentes tipos de ontolog que as existen, y propone una metodolog para el desarrollo de las mismas, Agarwal a [Aga05] hace un repaso por la aparicin del concepto de ontolog desde su sigo a nicado losco hasta el actual en el campo de la Ingenier del Conocimiento o a o Sharman et al. [Sha06b] que revisa el concepto de ontolog desde su aparia cin, hasta las diferentes aplicaciones que tienen en la actualidad, planteando o una visin actual de las mismas. o En este anexo se hace un repaso del concepto de ontolog desde sus a, deniciones ms conocidas, las diferentes metodolog que existen para su a as desarrollo, los formalismos y lenguajes ms utilizados para representarlas, o a incluso las herramientas ms comunes que permiten su denicin. Adems se a o a repasan conceptos bsicos acerca de las operaciones que se pueden realizar con a las ontolog que permitirn aclarar al lector acerca de las posibilidades de as a manipulacin de las mismas. o

A.1.1.

Concepto de Ontolog a

El concepto de ontolog no es nuevo, proviene del campo de la losof y as a es una disciplina que se suele identicar con la Metaf sica general e indica que 189

190

APENDICE A. CONCEPTOS BASICOS DE ONTOLOG IAS

la ontolog estudia lo que es en tanto que es y existe [Wik07, Aga05, Sha06b, a Cor06]. En las reas de la Inteligencia Articial, la Ingenier del Software y las a a Bases de Datos, de manera independiente concluyeron que la representacin o del conocimiento era importante para la evolucin de las mismas. As aunque o , cada una de estas disciplinas de la Ciencia de la Computacin (CC) repreo sentaba el problema de la representacin del conocimiento de diferente maneo ra, puesto que cada una de estas, est interesada en un problema espec a co, los investigadores elaboraron una representacin vlida para una parte espec o a ca de la realidad. De esta forma aparece el concepto de ontolog en el campo a de la CC adquirido como una nueva forma de representar los elementos del mundo real, y tomando este nombre como analog a su signicado losco. a o Ya en los 80, John McCarthy propuso, en el campo de la Inteligencia Articial, el concepto de una ontolog de entorno como aquella compuesta a no slo por una lista de conceptos de un problema, sino tambin de sus sigo e nicados en el contexto. Desde entonces, las ontolog se han asociado con as la representacin de conceptos. A continuacin, muchas otras deniciones de o o Ontolog surgieron en este campo de la Inteligencia Articial y la Ciencia de as la Computacin como la que dio Neches et al. [Nec91] denindola como los o e trminos y relaciones bsicas que componen el vocabulario de cualquier rea e a a tanto como las reglas para combinar los trminos y relaciones que denirn e a las extensiones de este vocabulario. A partir de esta denicin Guarino y Gio aretta [Gua95] clarican el uso de la palabra ontolog que es denida como: a un sistema conceptual informal, un informe semntico conceptual, una especia cacin de una conceptualizacin, una representacin de un sistema concepo o o tual mediante la teor lgica, el vocabulario usado por una teor lgica y a o a o una especicacin de una teor lgica. Gruber [Gru93] dene una ontolog o a o a como una especicacin formal de una conceptualizacin, y Borst [Bor97] exo o tiende esta denicin estableciendo ontolog como una especicacin formal o a o de una conceptualizacin compartida. Posterior a esto, Swartout et al. [Swa96] o volver a extender esta denicin de ontolog como una estructura jerarquizaa o a da de un conjunto de trminos para describir un dominio que puede usarse e como el esqueleto de una base de conocimiento. Studer et al. [Stu98] no crea una nueva denicin, sino que toma la denicin de Borst et al. y explica los o o conceptos relevantes de la misma: 1. Formal se reere a que es entendida computacionalmente. 2. Especicacin expl o cita quiere decir que se denen expl citamente los conceptos, propiedades, relaciones, funciones, restricciones y axiomas. 3. Compartida signica que el conocimiento representado ser consensuado. a

A.1. INTRODUCCION

191

4. Conceptualizacin signica el hecho de que una ontolog debe ser un o a modelo abstracto y a la vez representar una visin simplicada de algn o u fenmeno del mundo real el cual queremos denir o representar. o Esta denicin de Studer et al. [Stu98] es quiz la ms clara de todas las o a a expuestas y una de las ms referenciadas en la literatura actual, pero exisa ten otras muchas, tambin muy referenciadas como la propuesta por Gruber e [Gru93] o la de Guarino [Gua95] que, obviamente, son muy similares a la expuesta anteriormente. En resumen y tal y como establece Agarwal [Aga05], una ontolog no es a ms que una manifestacin de un conocimiento compartido de un dominio, a o que es aceptado por un grupo de agentes, y tal acuerdo facilita una correcta y efectiva comunicacin del signicado, que conduce a otros benecios como la o interoperatividad, reutilizacin y comparticin. o o

A.1.2.

Clasicaciones de Ontolog as

Las ontolog pueden representar el conocimiento acerca de realidades de as muy diversa ndole. Es por este motivo que no existe un consenso en cuanto a la clasicacin de las mismas dependiendo del contenido de la materia que o representen. As encontramos clasicaciones atendiendo al modo en que estas , estn representadas o la naturaleza de la realidad que representan como podee mos ver en resmenes hechos por Gmez-Prez et al. [GP03a], Dang Bui Bach u o e [Bac07] y Agarwal [Aga05] donde encontramos resumidas algunas de estas clasicaciones A continuacin, se expone un resumen de las ms signicativas, o a organizadas segn los autores, y el criterio de clasicacin. u o Atendiendo al lenguaje usado para implementar las ontolog o la riqueza as, semntica de las mismas, se encuentran tres clasicaciones en la literatura a (resumidas en la gura A.2): Uschold y Gruninger [Usc96] distinguen cuatro tipos de ontolog depenas diendo del lenguaje usado para implementarlas. Estas son: Ontolog as muy informales, si estn escritas en lenguaje natural, Ontolog semia as formales, si estn expresadas en una forma restringida y estructurada del a lenguaje natural, Ontolog formales, si estn denidas en un lenguaas a je denido formalmente, y Ontolog rigurosamente formales, si estn as a denidas en un lenguaje con una semntica, una teor y unas comproa a baciones formales con propiedades como la completitud. Lassila y McGuiness [Las02] consideran las ontolog como de mayor o as menor peso(light-heavy weight) de acuerdo con la riqueza semntica a con la que representan la realidad. Esto vendr dado por la cantidad a

192

APENDICE A. CONCEPTOS BASICOS DE ONTOLOG IAS de estructuras utilizadas para representar el conocimiento expresado en ellas. Por tanto, sern consideradas ontolog de peso ligero (inclua as so algunos autores no las considerar como ontolog propiamente an as dichas) aquellas que consistan simplemente de un vocabulario o incluso que lleguen unicamente a la representacin de la realidad utilizando o la estructura es-un de manera informal. A partir de la representacin o formal de una jerarqu es-un, hasta llegar a representar restricciones a de todo tipo (inverso de, es parte de o no se encuentra en el conjunto, etc.) se tratar entonces de ontolog con un cierto peso, hasta llegar a as al mximo nivel correspondiente a la categor de ontolog pesadas. a a as En la gura A.1 se presenta dicha clasicacin con mayor detalle. o

Zhang [Zha07] no llega a clasicar las ontolog realmente hace un repaso exas haustivo por las diferencias entre las ontolog y el resto de sistemas de as representacin t o picos. La clasicacin queda establecida en: las listas de o trminos, compuestas por diccionarios y vocabularios controlados, las lise tas jerrquicas, compuestas por esquemas de clasicacin y taxonom a o as, y las listas de relaciones, compuestas por tesauros, y ontolog as. Resumiendo, segn Ruiz e Hilera [Rui06], cualquier ontolog pertenecer a u a a una de las siguientes categor segn la riqueza de estructura interna: as u Vocabulario controlado: Formado por una lista nita de trminos e Glosarios: Listas de trminos con sus deniciones en lenguaje natural e Tesauros: Se diferencian de las anteriores en que ofrecen semntica adia cional a los trminos, incluyendo sinnimos. e o Jerarqu Informales: Son jerarqu de trminos que no se corresponden as as e a subclases estrictas. Jerarqu Formales: En este caso existe la relacin es-un entre las insas o tancias de una clase y su correspondiente superclase (para explotar el concepto de herencia). Marcos (Frames): Son ontolog que incluyen clases y propiedades que as pueden heredarse por otra clases en niveles inferiores de una taxonom a formal es-un. Ontolog con restricciones de valor: Incluyen restricciones de valor. as Ontolog con restricciones lgicas genricas: Son las mas expresivas as o e permiten especicar restricciones entre los trminos de la ontolog use a ando lgica de primer orden. o

A.1. INTRODUCCION

193

Clasificacin de Lassila and McGuinness [Las02] LIGHTWEIGHT ONTOLOGIES Vocabularios/Controlados

Clasificacin de RuizeHilera [Rui06]

Vocabularios Controlados Terminos/Glosarios Glosarios

Thesauros

Tesauros

Relaciones " es-un" informales

Jerarquas Informales

Relaciones " es-un" formales

Jeraquas Formales

Instancias Formales

Frames( propiedades )

Marcos

Restricciones de Valores Ontologas con restricciones de Valor Restriccines lgicas generales Ontologas con restricciones genricas lgicas Relaciones Disjuntas, Inversas ,Es parte de .... HEAVYWEIGHT ONTOLOGIES

Figura A.1: Clasicaciones de Lassila y McGuinness [Las02] y de Ruiz e Hilera [Rui06]

194

APENDICE A. CONCEPTOS BASICOS DE ONTOLOG IAS

Atendiendo a la naturaleza de la conceptualizacin, podemos encontrar los o siguientes tipos de ontolog (en la gura A.2 se presenta una clasicacin muy a o simplicada de las propuestas siguientes): Steve et al. [Ste98] existen tres tipos fundamentales de ontolog las de as, dominio, en las que se representa el conocimiento especializado pertinente de un dominio o sub-dominio, como la medicina, las aplicaciones militares, la cardiolog etc. Las ontolog genricas, en las que se rea, as e presentan conceptos generales y fundacionales del conocimiento como las estructuras parte/todo, la cuanticacin, los procesos o los tipos de objeo tos. Por ultimo las ontolog representacionales, en las que se especican as las conceptualizaciones que subyacen a los formalismos de representacin o del conocimiento, por lo que tambin se denominan meta-ontolog o e as ontolog de alto nivel. as a o Guarino [Gua98] Es la ms concreta y clara propuesta de clasicacin de ontolog ya que diferencia unicamente cuatro tipos de ontolog las as, as: Ontolog de Alto Nivel, las de Dominio, las de Tareas y por ultimo las as Ontolog de Aplicacin. Esta ultimas son aquellas que se crean para as o describir una actividad o tarea espec ca, como por ejemplo la venta de un producto, o el diagnstico de una enfermedad y las ontolog o as creadas para una aplicacin espec o ca. Adems Guarino, describe las a dependencias que existen entre estas categor as. as: as Mizoguchi et al. [Miz95] Propone cuatro tipos de Ontolog Las ontolog de Contenidos, entre las que se encontrar las ontolog que represenan as tan los dominios, las tareas, o bien conocimiento en general. Las ontolog de Comunicacin (Tell&Ask) que permiten compartir conocias o miento, las de Indexado, que permite recuperar informacin y las Metao Ontolog u Ontolog de representacin del Conocimiento, que son las as as o que describe la estructura de la ontolog en si. a van Heisjt et al. [vH97] Estos autores son los primeros en establecer los dos niveles para la clasicacin de ontolog que se han especicado o as previamente(dependiendo del contenido o de la riqueza semntica de a la informacin que representan). Atendiendo a la categorizacin que se o o est tratando, dividen las ontolog en dos grandes grupos: aquellas que a as representan la cantidad y el tipo de estructura (Son las Ontolog de as Representacin del Conocimiento, las Ontolog de Informacin (BD) o as o y los Lexicons), y por otro lado, aquellas que representan el objetivo de la conceptualizacin, es decir, la Ontolog de Dominio, de Aplicacin, o as o de Representacin o Genricas. o e

A.1. INTRODUCCION

195

Fensel [Fen04] Establece la clasicacin en: Ontolog de Sentido Comn o as u (ofrecen un conocimiento general del mundo), Ontolog Representaas cionales (representan conceptos que expresan conocimiento en un enfoque orientado a objetos o marcos). No pertenecen a ningn dominio u en particular. Las Ontolog de Dominio, las Ontolog de Mtodos y as as e Tareas (estas ultimas ofrecen una terminolog especica para de mto a e dos resolutivos o para tareas espec cas). Jurisica et al. [Jur99] establece la clasicacin de ontolog como: Ono as tolog Estticas, que son aquellas que describen cosas que existen y as a sus relaciones. Ontolog Dinmicas: que son aquellas que describen as a aspectos del mundo que pueden cambiar con el tiempo. Ontolog Inas tensionales: Describen motivaciones, intenciones, objetivos, creencias, elecciones, etc. relacionadas con agentes. Ontolog Sociales: Describen as estructuras organizativas, redes, interdependencias, etc. o as Gomez-Perez et al. [GP03a] realiza una clasicacin de las ontolog basndose en las clasicaciones expuestas por los anteriores autores. Esta a propuesta establece taxonom muy rica en matices, que incluso permite a establecer unos niveles de usabilidad/reusabilidad de las ontolog deas pendiendo del nivel donde se encuentren clasicadas las mismas. As pode mos encontrar una clasicacin en la que las ontolog de alto nivel que o as describ Guarino ahora se desglosan en tres tipos: Ontolog de Repa as resentacin, Ontolog Generales y Ontolog de Alto Nivel. A contino as as uacin y aumentando el nivel de usabilidad, podr o amos hallar las Ontolog de Dominio y Tareas al mismo nivel, pero desglosando ambas as a la vez dada la generalidad de las mismas: las Genricas estar en e an primer lugar, a continuacin las de Dominio, y las ultimas y menos reo utilizables, ser las de Aplicacin. an o a Sharmen et al. [Sha06b] se centra en la web semntica para clasicar las ontolog as, en 4 categor as: las Meta-ontolog (las que describen los as lenguajes), las Ontolog de Alto Nivel exhaustivas (expresan el conoas cimiento global, como WordNet, Cyc, ...), las Ontolog de Dominio as Espec co Sistemtico (describen un dominio espec a co pero de manera general), y las Ontolog Especializadas Simples. as Al igual que en el caso anterior Ruiz e Hilera [Rui06] hacen un resumen de todas estas propuestas, armando que cualquier ontolog estar incluida en a a una de las siguientes categor as: Ontolog de Representacin del Conocimiento: Es aquella que reprea o senta las primitivas para formalizar el conocimiento bajo un paradigma

196

APENDICE A. CONCEPTOS BASICOS DE ONTOLOG IAS

ONTOLOGIAS DE ALTO NIVEL o GENERICAS

ONTOLOGIAS de REPRESENTACION Ontologas de Dominio, Tareas, de Aplicacin, deContenidos, de Mtodos...

METAONTOLOGIAS

Figura A.2: Clasicacin genrica de Ontolog basada en la naturaleza de o e as la conceptualizacin o

concreto de representacin del conocimiento. o Ontolog Genrica o Comn: Es aquella que representa el conocimiento a e u de sentido comn reutilizable en diferentes dominio. Por ejemplo: evenu tos, espacio, tiempo, etc. Ontolog de Alto Nivel: Describen conceptos muy generales que se as pueden relacionar con las bases de cualquier ontolog a. Ontolog de Dominio: Son ontolog reutilizables de un dominio paras as ticular. Ontolog de tareas: Describen un vocabulario relacionado con algunas as actividades genricas. Proporcionan un un vocabulario sistemtico de e a trminos usados para resolver problemas que pueden o no pertenecer al e mismo dominio. Ontolog de Tareas de un Dominio: Igual que la anterior, pero slo as o usable en un dominio. Ontolog de Mtodos: Son deniciones de conceptos relevantes y sus as e relaciones, aplicables a procesos de razonamiento diseados espec n camente para llevar a cabo una tarea particular. Ontolog de Aplicacin: Dependen de las aplicaciones. Suelen extender as o y especializar el vocabulario de una ontolog de dominio o tareas para a una aplicacin particular. o

A.2. INGENIER DE ONTOLOG IA IAS

197

A.2.

Ingenier de Ontolog a as

Desde su aparicin las ontolog han sido una de las ramas ms imporo as a tantes en el rea de las Ciencias de la Computacin. Se ha desarrollado toda a o una plataforma alrededor de las mismas, desde tcnicas, metodolog y aplicae as ciones que han formado lo que hoy en d se conoce como Ingenier Ontolgica a a o (Ontological Engineering). Tal como Gmez-Prez et al. describi en [GP03b] o e o o Sharman et al. en [Sha06b], la Ingenier Ontolgica se reere al conjunto a o de actividades que concierne al proceso de desarrollo de ontolog el ciclo as, de vida de las ontolog y las metodolog as as, herramientas y lenguajes que permiten construir las mismas. A continuacin resumiremos brevemente algunas tcnicas, metodolog y o e as aplicaciones relacionadas con las ontolog para ofrecer una imagen resumida as de este campo de estudio. En el trabajo de Cardoso [Car07] se puede encontrar un anlisis detallado de cada uno de los elementos que forman parte de la a ingenier ontolog ms populares en la actualidad. a a a

A.2.1.

Tcnicas de Representacin de Ontolog e o as

Cualquier formalismo que permita representar ontolog deber permitir as a representar los conceptos y las relaciones que existen entre estos. Para ello existen diversas propuestas que clasicaremos segn el modo de representar la u informacin y que podemos encontrar resumido en [Sha06b]: o Marcos y lgica de Primer orden Gruber [Gru93] propone utilizar maro cos (frames) y lgica de primer orden. Su propuesta utiliza clases, relao ciones, funciones, axiomas formales e instancias. Las clases son los conceptos relevantes y se organizan en taxonom las relaciones, represenas, tan diferentes tipos de asociaciones entre los conceptos en un dominio. Las funciones son un caso especial de relaciones. Los axiomas formales son sentencias que son siempre ciertas, y se usan para generar conocimiento y vericar la consistencia de la ontolog y por ultimo las insa, tancias se utilizan para representar los elementos o individuos de las ontolog as. o Lgica Descriptiva Baader et al. [Baa04] proponen utilizar Lgica Descripo tiva para representar las ontolog La lgica descriptiva es un formaas. o lismo de la lgica que se divide en dos ramas: los TBox y los ABox. Los o primeros contienen las deniciones de conceptos y roles, tambin llamae dos conocimiento intensional. Los ABox contienen las deniciones de los individuos, y se denominan conocimiento extensional. Se usan tres elementos para representar estas ontolog los conceptos, que representan as,

198

APENDICE A. CONCEPTOS BASICOS DE ONTOLOG IAS las clase de objetos, los roles, que describen las relaciones entre los conceptos y los individuos, que representan las instancias de las clases. Los conceptos y los roles se especican basndose en un conjunto de trminos a e pre-existentes y constructores cuyos elementos se mezclan para obtener cualquier tipo de lenguaje DL. Los conceptos primitivos son aquellos cuya especicacin no necesita basarse en otros conceptos, pero si sobre o condiciones que los individuos deben satisfacer. Los conceptos derivados, son aquellos cuya especicacin esta basada en otro concepto, del cual o hereda alguna propiedad. Los individuos representan una instancia de los conceptos y sus valores.

Tcnicas de Ingenier del Software Tcnicas como el Lenguaje de Moe a e delado Unicado (UML) permiten representar ontolog aunque existan as, varios autores que deenden que dicho lenguaje es demasiado pobre para ello (vase seccin 2.3). De esta manera dichas ontolog ser clasie o as an cadas como de peso ligero segn la taxonom de Lassila y McGuiness u a [Las02]. Si a este lenguaje se le aade el lenguaje de restriccin de objen o tos (OCL), dichas ontolog se convertir mas ricas semnticamente as an a hablando y por tanto mas pesadas segn la anterior clasicacin. Los u o diagramas UML se usan para representar los conceptos donde cada clase representa un concepto. Las taxonom ser las relaciones de generalias a zacin y la relaciones binario ser las relaciones de asociacin. o an o

as Modelado Conceptual Alternativa para representar ontolog basada en el modelado conceptual [GP03b], usualmente se relacionada con la representacin de bases de datos usando, por ejemplo, diagramas Entidado Relacin. En estos diagramas, los conceptos se representan mediante o entidades, que tienen atributos, que son a su vez propiedades del concepto. Estos atributos tienen un nombre y un tipo. Las relaciones entre los conceptos se representan mediante las relaciones del E/R, que tienen cardinalidad y permiten expresin, no slo para relaciones de asociacin, o o o sino tambin de generalizacin, que crea las taxonom de los concepe o as tos. Los axiomas formales, pueden representarse usando restricciones de integridad. El UML tambin entrar dentro de esta clasicacin dada e a o la gran capacidad expresiva que tiene. Sin embargo, un gran nmero de u autores no consideran estas tcnicas las ms apropiadas para represene a tar una ontolog como describe Ruiz e Hilera en [Rui06] o podemos a, analizar con ms detalle en la seccin 2.3. a o

A.2. INGENIER DE ONTOLOG IA IAS

199

A.2.2.

Metodolog de Representacin as o

Al igual que ocurre con cualquier elemento software, o base de datos, una ontolog debe ser construida atendiendo a algn tipo de metodolog que a, u a permita establecer los criterios a seguir hasta su denicin completa. o Las metodolog de la ingenier ontolgica necesitan seguir tres activias a o dades fundamentales [GP03a, GP03b]: Actividades de gestin de Ontolog Esta actividades incluyen la oro as. ganizacin en la tarea de ingenier de la ontolog o a as. Necesita denir mecanismo de control y pasos para asegurar la calidad. Actividades para el proceso de desarrollo de ontolog Entre estas acas. tividades estn la eleccin del entorno de desarrollo, el estudio de viaa o bilidad. Adems, en ella se desarrollan los procesos de conceptualizar, a formalizar e implementar la ontolog y nalmente, la generacin de a, o unas gu para el mantenimiento, generacin de instancias, uso y evoluas o cin de la misma. o Actividades de Soporte. Entre ellas estn las de adquisicin, evaluacin, a o o integracin, unin, compatibilizacin, y conguracin. Estas actividades o o o o se llevan a cabo durante las actividades de desarrollo y gestin de las o ontolog as. A continuacin se presentaran las metodolog de diseo de ontolog o as n as ms signicativas de los ultimos tiempos. Existen comparativas de dichas a metodolog en las siguientes referencias bibliogrcas [Sha06b, Sur04, Sur06, as a GP03b, hom06]. Cyc, esta metodolog se extrajo gracias a la existencia de un proyecto a que consiste en la creacin de una la ontolog o aCyc [Len95] que trata de representar toda la realidad del universo (Ontolog de Alto Nivel ). a Ms all de xito o fracaso de la misma, se han extra las tareas ms a a e do a signicativas a travs dicho proceso de generacin: en primer lugar, la e o extraccin manual del conocimiento general o de sentido comn, en seo u gundo lugar, la codicacin manual guiada por herramientas que utilizan o el conocimiento almacenado en la base de conocimiento Cyc. En tercer lugar, la extraccin del conocimiento. o Proyecto Enterprise Ontology. Uschold and King [Usc95] establecen las siguientes gu a la hora de crear una ontolog identicar el propsito as a: o de la ontolog construir la ontolog mediante la captura de los cona, a ceptos y la relaciones de la ontolog la codicacin de la misma usando a, o

200

APENDICE A. CONCEPTOS BASICOS DE ONTOLOG IAS un lenguaje formal, y la integracin de la misma con otras ontolog o as preexistentes. Por ultimo habr que evaluar la ontolog a a. TOVE. Gruninger and Fox [Gr95] desarrollaron una metodolog para u a implementar la ontolog basada en preguntas de competencia. Consiste a en seis pasos: 1o Identicar los escenarios, 2o elaborar preguntas informales sobre el tema, en lenguaje natural (servir para establecer las resa tricciones), 3o especicar la terminolog usando lgica de primer orden. a o o Escribir las preguntas formalmente, usando la terminolog formal. 5o 4 a especicar axiomas utilizando lgica de primer orden. 6o especicar los o teoremas de completitud. DOGMA [Jar02]. Este mtodo basado en las bases de datos consiste e en descomponer expl citamente los recursos ontolgicos en bases de ono tolog que consisten en hechos simples llamados lexons y acuerdos onas tolgicos del tipo: reglas y restricciones. Meersman et al. [Jar] pretenden o con este modelo demostrar que los modelos conceptuales de la informacin son completamente vlidos para representar ontolog o a as. Usan diagramas en ORM para denir la realidad. Amaya [KAC05]. Establece la posibilidad de reutilizar el conocimiento. Tiene tres etapas: la primera es la de especicar la aplicacin para o identicar el contexto y los elementos que queremos representar. La segunda es el diseo preliminar basndose en las categor de alto nivel n a as relevantes. Los elementos identicados en la etapa anterior se usarn coa mo entrada a la ontolog de alto nivel para obtener una visin global a o del modelo. Durante este proceso es posible establecer la reutilizacin o de una ontolog ya existente. La tercera etapa es renar y estructura la a ontolog mediante la especializacin de trminos para obtener el diseo a, o e n denitivo con la mxima modularizacin. a o CommonKADS [Sch99]. No es una metodolog en s misma para el desaa rrollo de ontolog Cubre varios aspectos en el campo de la gestin del as. o conocimiento, desde su denicin hasta la implementacin de sistemas o o de informacin. o Methontology [GP03a, GP03b]. Esta metodolog se plantea como una a de las ms completas, formulada para el desarrollo de ontolog hasta a as la fecha. Esta inspirada en las metodolog de desarrollo del software, as no obstante, contempla todas las casu sticas que puedan darse en el proceso de desarrollo de una ontolog Esta metodolog sigue las tres a. a actividades fundamentales para la representacin de ontolog anterioro as

A.2. INGENIER DE ONTOLOG IA IAS

201

mente descritas y divide el proceso de modelado de conocimiento en las ocho fases siguientes: 1. Construir el glosario de trminos. e 2. Construir la taxonom de conceptos. a 3. Construir los diagramas de relaciones ad hoc para identicar las relaciones ad hoc entre los conceptos de la ontolog y los conceptos a de otras ontolog as. 4. Construir un diccionario de conceptos, que contendr los conceptos a de dominio, sus relaciones, sus instancias y sus clases, y los atributos de instancia. 5. Describir con detalle cada relacin binaria ad hoc que aparece en el o diagrama. 6. Describir en detalle cada atributo de instancia que aparece en el diccionario de conceptos. 7. Describir en detalle cada atributo de clase que aparece en el diccionario de conceptos. 8. Describir cada constante, que especica la informacin relativa al o conocimiento del dominio. Mtodo SENSUS [Kni94]. Este mtodo consiste en construir el esquelee e to del dominio de una ontolog comenzando a partir de una ontolog a a muy grande, e ir recortando aquellos trminos irrelevantes para la one tolog que se propone. Los procesos principales en esta metodolog son: a a 1o identicar las semillas, 2o unir manualmente los trminos semilla a e SENSUS, 3o aadir las rutas obtenidas, 4o aadir nuevos trminos de n n e dominio, 5o aadir subrboles completos, que dependen de las semillas n a encontradas. On-To-Knowledge (OTK) [Sur04]. Esta metodolog tiene en cuenta si a la ontolog ser utilizada para futuras aplicaciones. Esta metodolog a a a al igual que muchas otras, se divide en dos grandes fases: el proceso de denicin de la estructura (Knowledge Meta Process), y el proceso de o gestin o manejo de la misma (Knowledge Process). La primera fase es la o que permite denir la ontolog consiste en los siguientes pasos: 1. Estua dio de viabilidad, consiste en identicar los problemas y oportunidades, las aplicaciones, herramientas y las personas, 2. El arranque, que consiste en capturar los requerimientos en un documento de especicacin de o documentos (ORSD) y crear una descripcin de la ontolog semiformal, o a 3. El renamiento, se realiza cuando se rena la descripcin semiformal o

202

APENDICE A. CONCEPTOS BASICOS DE ONTOLOG IAS de la ontolog se formaliza y se crea un prototipo, 4. Evaluacin, en a, o este paso se evala la tecnolog los usuarios y la ontolog 5. La apliu a, a), cacin y Evolucin. La segunda fase comprende los pasos de creacin de o o o conocimiento e importacin de documentos y metadatos, extraccin y o o acceso al conocimiento, etc. IDEF5 [KBS]. Construyen una ontolog tratando de catalogar los dea scriptores (como un diccionario de datos) y creando un modelo del dominio (construido por estos descriptores). Consiste en tres tareas bsicas: a 1) catalogar los trminos, 2. capturar las restricciones que existen sobre e estos trminos y el dominio y 3. construir un modelo que puede generar e las sentencias descriptivas apropiadas. As una ontolog ser similar a a a un diccionario de datos que incluyen tanto la gramtica como el modelo a de comportamiento del dominio. HCOME [Kot06]. Esta metodolog esta centrada en el papel que tienen a los desarrolladores de ontolog en el proceso de creacin. Aparece deas o bido a las carencias que tienen en este aspecto el resto de ellas. Identica tres fases principales: 1. Especicacin, dene objetivo, mbito, requerio a mientos y equipo, 2. Conceptualizacin, etapa de adquisicin de conocio o miento (importar, consultar ontolog de alto nivel, consulta a expertos) as y Desarrollo y Mantenimiento de la misma (improvisar, unir, gestionar, comparar versiones,aadir documentacin, etc.), 3. Explotacin, usa y n o o evalua la ontolog Esta metodolog soporta el desarrollo de ontolog a. a as de forma descentralizada. Por un lado se permite desarrollar una ontolog de forma personal, utilizando versiones, ontolog de alto nivel, a as uniendo ontolog o mapeando trminos. En segundo lugar permite meas e diante un espacio compartido discutir acerca de las decisiones tomadas [Kot04]. . HOLSAPPLE [Nic05]. Metodolog propuesta para el trabajo colaboa rativo. Soporta la creacin de una ontolog esttica, que es propuesta o a a inicialmente y extendida mediante la retroalimentacin (feedback ) de un o grupo de expertos. Utiliza cuestionarios para llevar a cabo esta retroalimentacin. o UPON (Unied Process for ONtology building) [Hol02]. Basado en el desarrollo de ontolog utilizando UML. Las fases c as clicas que propone son: 1. identicacin de requerimientos, 2. anlisis, 3. diseo y concepo a n tualizacin, 4. implementacin, 5. testeo la cobertura del dominio de o o aplicacin. o

A.2. INGENIER DE ONTOLOG IA IAS

203

DILIGENT [Cas07, Sur06]. Esta metodolog de generacin de ontolog a o a trata de suplir la carencia de otras en el proceso de compartir o discutir durante el proceso y ser adaptable a cualquier cambio. Existen las siguientes fases: 1. construccin, 2. adaptacin local, 3. anlisis, 4. revisin o o a o y 5. adaptacin local. o Hsemann y Vossen en [H05] proponen una metodolog para repreu u a sentar ontolog basndose en la fase de diseo de bases de datos tradias a n cionales. Esta metodolog trata de suplir la carencia de un estndar en a a este aspecto. El proceso de diseo consiste en una fase de anlisis de n a requisitos, un diseo conceptual, lgico y por ultimo f n o sico. En el caso de las ontolog el proceso para construir una metodolog ha as, a ido surgiendo a ra de la construccin de las mismas. Se han observado tres z o diferentes generaciones de metodolog para ontolog [Rib06], a partir de su as as aparicin sobre el ao 1995. La primera generacin intenta comprender como o n o las ontolog son construidas, entre ellas podemos encontrar la metodolog as a TOVE, SENSUS, Cyc y la ENTERPRISE. La segunda generacin considera o que la especicacin, conceptualizacin, integracin e implementacin ya es un o o o o requisito durante todo el ciclo de vida, y en ella estn METHONTOLOGY, a Amaya, DILIGENT, HOLSAPPLE. OTK y HCOME. Esta ultima tambin e puede estar incluida en la ultima generacin que es la que incorpora conceptos o como reusabilidad y gestin de la conguracin. Tambin en los ultimos aos o o e n METHONTOLOGY, podr considerarse de esta ultima generacin, ya que a o ha incluido estos aspectos en su denicin [Cor06]. o A pesar de todas estas metodolog propuestas, an sigue existiendo el as u profundo convencimiento de que no hay ninguna metodolog estndar o ama a pliamente aceptada para los constructores del conocimiento [Rib06, H05]. u Esto se hace ms evidente en el campo de la Web Semntica donde los dea a tractores de estas metodolog son ms numerosos. De hecho, existe un alto as a porcentaje de desarrolladores de ontolog que no siguen ninguna metodolog as a [Car07]

A.2.3.

Formalismos y Lenguajes en la Representacin del Coo nocimiento

Existen numerosos formalismos y lenguajes que permiten representar el conocimiento (vase [Gae06, GP03b, Sha06b, Par04]) que puede estar denido e utilizando diversas tcnicas de representacin, como por ejemplo: Tripletas e o objeto-atributo-valor, hechos inciertos, marcos (frames), hechos difusos, reglas, redes semnticas, etc.. Cada uno de estos formalismos utilizan unos recursos a diferentes para representar la informacin. Este hecho hace que no todos los o

204

APENDICE A. CONCEPTOS BASICOS DE ONTOLOG IAS

lenguajes puedan representar la misma informacin, ni el mismo grado de o semntica de dicha informacin. Elegir el lenguaje de representacin idneo a o o o es crucial, por lo tanto, para representar la realidad de la manera que ms se a adapte a nuestro problema. Los lenguajes o formalismos que nos permiten representar el conocimiento pueden clasicarse en tres grupos [Gae06, Ech07b]: Lenguajes Basados en Lgica Los lenguajes basados en lgica parten de o o una sintaxis y semntica bien denida que detallan perfectamente la fora ma de construir sentencias y razonamientos sobre ellas. Entre los lenguajes basados en lgica podemos encontrar: o Lgica Proposicional, que consiste en la denicin de proposiciones o o y los valores de verdad que cada una tiene asociados. Se inere informacin a travs de la generacin de proposiciones ms complejas o e o a y los operadores de AND, OR, IMPLIES, EQUIVALENCE. Lgica de Primer Orden, ampl la anterior, aadiendo dos operao a n dores ms, el cuanticador Universal y el Existencial . Adems a a los s mbolos pueden representar constantes, variables, predicados y funciones. KIF, lenguaje lgico basado en lgica de primer orden que fue creao o do con el objetivo de actuar como interlingua entre diferentes formalismos y lenguajes de representacin. KIF dispone de su propia o sintaxis y algunos aadidos semnticos sobre la lgica de primer n a o orden. Lgica Descriptiva. Son las mas relacionadas con el desarrollo de las o ontolog tal como se usan en la actualidad en la Web Semntica. as a La lgica descriptiva se basa en representar el conocimiento utilizano do por una una terminolog o vocabulario del dominio (TBOX) a y por otra un conjunto de armaciones (ABOX). Se pueden construir y existen razonadores que permiten razonar sobre las TBOX y ABOX, pudiendo determinar por ejemplo si el contenido de la TBOX es factible, o qu relaciones estn incluidas en otras. e a Lenguajes Basados en Marcos (Frames) Estos lenguajes son similares a los lenguajes de programacin orientados a objetos, en el sentido de o que representan el conocimiento utilizando clases (marcos), atributos, objetos y relaciones, y utilizan relaciones de generalizacin y especializao cin para representar la organizacin jerrquica de los conceptos. Es o o a importante mencionar que muchos de los lenguajes basados en marcos se pueden considerar como una sintaxis diferente de la lgica de primer o

A.2. INGENIER DE ONTOLOG IA IAS

205

orden y que por lo tanto no ofrecen ms expresividad que ella. Esto a implica, por otro lado, que tengan representaciones equivalentes en el lenguaje KIF visto en un punto anterior. La mayor de las herramientas a de denicin de ontolog utiliza estos lenguajes. o as Lenguajes Basados en Reglas Estos lenguajes han sido durante mucho tiempo posiblemente los ms usados de todos, principalmente debido a a su estrecha relacin con los Sistemas Expertos utilizados en Inteligencia o Articial. Estos lenguajes son fciles de entender debido a su sencillez a conceptual y a su paralelismo con las estructuras de control ms simples a utilizadas en programacin. Una de las tendencias ms recientes pasa o a por mezclar los conceptos de marcos y reglas, como en el caso de Jess, para disponer de lenguajes que permitan reunir la informacin de cada o concepto y asociar a alguno de sus slots conjuntos de reglas. Este tipo de lenguajes han recibido tambin un fuerte impulso a partir de la aparicin e o de la Web Semntica, ya que que se piensa en ellos como herramientas a para denir servicios web. A.2.3.1. Lenguajes de Representacin de Ontolog o as

Una vez denidos cada uno de los formalismos se har un breve repaso por a los lenguajes ms utilizados para representar ontolog [GP03a, Dui00, Su02, a as Sha06b]. Estos lenguajes aparecen a continuacin clasicados atendiendo a la o naturaleza de la informacin que representan: o Lenguajes usados tradicionalmente para la especicacin de Ontolog o as, entre estos encontramos: CycL, que usa lgica de primer orden, Loom, o que usa lgica descriptiva, Ontolingua que se basa en marcos y en Kif, o F-Logic, CML, OKBC, OCML, estn basados en Marcos tambin. a e Lenguajes de Web estndar para representar ontolog en la Web Sea as mntica. Estos lenguajes son RDF, RDFS, DAML+OIL y OWL. En a general, todos estn basados en lgica descriptiva y en los lenguajes a o basados en marcos. Existe un lenguaje muy reciente, el WSML (Web Service Modeling Language) que describe los servicios de la Web Semna tica usando formalismos lgicos, y que est ganando en popularidad. o a Otros lenguajes Web, creados para la especicacin de ontolog como o as XOL (utiliza sintaxis XML y OKBC), SHOE (basado en macos y reglas), y OIL ( basado en marcos) Las ontolog pueden representarse utilizando cualquiera de estos formaas lismos, incluso podr amos aadir dos ms como: n a

206

APENDICE A. CONCEPTOS BASICOS DE ONTOLOG IAS Modelos conceptuales para representar Bases de Datos. En estos formalismos, podr amos incluir las bases de datos relacionales y las bases de datos orientadas a objetos (SQL, Modelos E-R, ..) Modelos de representacin del Software. En este formalismo incluiremos o el UML como mximo exponente. a

Sin embargo, no todos los lenguajes conducen a la generacin de ontolog o as pesadas y los dos ultimos formalismos, concretamente, son ms pobres segn a u algunos autores (ver apartado 2.3) a la hora de representar semntica en la a informacin dada la naturaleza de la informacin que estn destinadas a reo o a presentar. Las restricciones en este tipo de formalismos vendrn ligadas al a uso de alguno de los lenguajes anteriores, como el uso de reglas o lgica para o completar la semntica de los mismos. a Adems de todos estos lenguajes, otros mecanismos de representacin de a o ontolog han surgido al margen de estos. Son las herramientas de repreas sentacin de ontolog descritas en el apartado A.2.3.3. Estas herramientas, o as adems de ayudar a la hora de representar una ontolog denen su propio a a, modelo de datos cuando denen la informacin que dicha ontolog describe. o a De esta forma, la representacin de la ontolog est sujeta a la modelizacin o a a o que estas herramientas hacen. Sin embargo la gran mayor introducen la a opcin de exportar o traducir la realidad que representan en alguno de los o lenguajes ms populares, como OWL, KIF, RDF, etc. a A.2.3.2. Lenguajes Estndar de Web para Representar Ontolog a as

La incorporacin, y en algunos casos aparicin de estos lenguajes en la o o web surgi como necesidad de incluir signicado a los documentos web estruco turados que, representados en HTML o XML, carec del mismo para ser an procesados computacionalmente. A continuacin expondremos brevemente las caracter o sticas de los lenguajes ms comnmente utilizados para la representacin de ontolog a u o as, sobre todo en la Web [Cha99, GP03b, Ech07a]. Dichos lenguajes se han convertido en estndares, gracias a la propuesta y aceptacin por parte de la W3C1 a o [w3c06]. RDF - Resource Description Framework RDF [Cha01, W3C99] es un marco de trabajo o framework para describir e intercambiar metadatos, por tanto, no es un lenguaje unicamente, sino que es en s mismo un modelo de datos. Est construido en base a las reglas siguientes: a
1

Sitio web: www.w3c.com

A.2. INGENIER DE ONTOLOG IA IAS

207

Recursos: Cualquier cosa que puede tener un URI, esto incluye a todas las pginas web, los elementos individuales de un documento XML, etc. a Propiedades: Es un recurso que tiene un nombre y que puede usarse como una propiedad, por ejemplo el autor o el t tulo. Sentencias: Consisten en la combinacin de un recurso, una propiedad y o un valor. Estas tres partes se conocen como sujeto, predicado y el objeto de la sentencia. Otros elementos de la denicin de una pgina RDF estan brevemente o a descritos en la tabla A.1. Tabla A.1: Elementos de una pgina RDF a Elemento Descripcin o rdf:Statement Reicacin: Cuando se construyen seno tencias utilizando otras sentencias rdf:RDF Cada documento RDF al estar basado en XML debe estar bien formado (Well-Formed RDF ) y tener este elemento ra z. Espacio de Nombres http://www.w3.org/1999/02/22-rdfsyntax-ns# rdf:Description Declaracin de Recursos. Se usa como o valor del atributo una referencia URI rdf:about Se reere al recurso que esta fuera del documento rdf:ID Se reere al recurso si esta dentro del documento rdf:datatype Usado para Valores de Datos si el valor no es un literal rdf:resource Especicacin de un Recurso como un o Valor de Propiedad rdf:type Declara instancias rdf:Bag, rdf:Seq, y rdf:Alt Elementos contenedores Las deniciones se pueden anidar

208

APENDICE A. CONCEPTOS BASICOS DE ONTOLOG IAS

RDF Schema Es una extensin semntica de RDF [w3c06, Bac07]. La primera versin o a o fue publicada en Abril de 1998 por la W3C, la ultima versin se publico en o 2004. Los archivos RDFS son archivos RDF que tienen la misma estructura y sintaxis que la que se usa en RDF. A pesar de que aparece para enriquecer al anterior, ya que el RDF slo es o capaz de representar instancias y las relaciones entre las mismas. No puede representar ni siquiera la estructura ms fundamental de las ontolog como a as, son las clases, o hacer taxonom as. El RDF(S) incorpora constructores que permiten especicar los elementos que muestra la tabla A.2. Tabla A.2: Elementos de una pgina RDF Schema a Elemento Descripcin o rdfs:Class Denicin de clases o rdfs:SubclassOf Denicin de Jerarqu o as rdfs:subPropertyOf Especicacin de o jerarqu as de propiedades rdfs:domain Especicacin de dominio en las o propiedades rdfs:range Especicacin de rangos en las o propiedades rdfs:seeAlso, Comentarios rdfs:isDenedBy, rdfs:comment, rdfs:label Espacio de Nombres http://www.w3.org/1999/02/22-rdfsyntax-ns. El RDF(S), no es demasiado expresivo, slo permite la representacin de o o conceptos, taxonom de conceptos y relaciones binarias. Concretamente, el as RDF(S) no puede expresar [Bac07]: El mbito local de las propiedades. Por ejemplo, podemos decir que un a profesor puede ensear a un estudiante, pero no podemos especicar que n un asistente slo puede ensear a un estudiante no graduado. o n Clases Disjuntas. Combinacin booleana de clases, por ejemplo, que un HombreBelga en o una interseccin de un Belga y un Hombre. o Restricciones de cardinalidad.

A.2. INGENIER DE ONTOLOG IA IAS Caracter sticas de las propiedades, como la transitividad..

209

El OWL solventa estos problemas, manteniendo la compatibilidad con el RDF(S). OWL o OWL Web Ontology Language Lenguaje de Ontolog para la Web(OWL) [Ant03, Bac07, Bec07a] es un as lenguaje de etiquetado semntico para publicar y compartir ontolog en la a as web. Se trata de una recomendacin del W3C, y puede usarse para representar o ontolog de forma expl as cita, es decir, permite denir el signicado de trminos e en vocabularios y las relaciones entre aquellos trminos. OWL es una extensin e o del lenguaje RDF y emplea las tripletas de RDF, aunque es un lenguaje con ms poder expresivo que ste [Ech07a]. a e El OWL est diseado para usarse cuando la informacin contenida en los a n o documentos necesita ser procesada por programas o aplicaciones, en oposicin o a situaciones donde el contenido solamente necesita ser presentado a los seres humanos. OWL surge como una revisin al lenguaje DAML-OIL y es mucho o ms potente que ste. a e Al igual que OIL, OWL se estructura en capas que dieren en la complejidad y puede ser adaptado a las necesidades de cada usuario, al nivel de expresividad que se precise y a los distintos tipos de aplicaciones existentes como motores de bsqueda, agentes, etc. u OWL propone tres tipos de lenguaje, puesto que identica tres tipos de aplicaciones que el usuario puede desarrollar. As aparecen los tres tipos de OWL, ordenados de mayor a menor complejidad: 1. OWL-Full. Desarrollado para aplicaciones que requieren mucha expresividad y libertad en la sintaxis RDF. As pues es un conjunto que englo ba a todos los dems lenguajes (RDF, OWL-DL,OWL-LITE). Permite a incluso la re-denicin del meta esquema del lenguaje mismo. Un doco umento en RDF es equivalente a un documento OWL-FULL en cuanto a validez. Es muy exible, pero nunca se podr razonar utilizando este a lenguaje. 2. OWL-DL. Usado para aplicaciones que requieren expresividad y completitud, y la habilidad del razonamiento. Comparte parte del lenguaje de OWL-Full, pero restringe el uso de algunas primitivas. Por ejemplo: las propiedades de Objetos y de tipos de datos estn disjuntas, as que a no pueden compartir propiedades. No existen restricciones de cardinalidad sobre propiedades transitivas. Adems los axiomas deben estar bien a formados.

210

APENDICE A. CONCEPTOS BASICOS DE ONTOLOG IAS

3. OWL-LITE. Desarrollado para aplicaciones que requieren simplicidad y rapidez en la ejecucin. Es un subconjunto de OWL-DL y es el ms o a utilizado por las herramientas de construccin de ontolog OWL-LITE o as. prohibe el uso de los atributos: owl:oneOf, owl unionOF (excepto en los constructores de clases y clases que tengan nombre tras la interseccin), o owl:complementOf, owl:hasValue, owl:disjointWith, owl:DataRange. Un documento en OWL contiene los elementos resumidos en la tabla A.3. A.2.3.3. Herramientas de Ontolog as

El establecer una metodolog y un lenguaje de representacin de ona o tolog no es suciente para manipular las mismas. Es necesaria la creacin as o de herramientas que faciliten al usuario o al desarrollador dicha manipulacin. o Es por este motivo que se han desarrollado un gran nmero de herramienu tas al respecto. Estas herramientas pueden clasicarse siguiendo dos criterios diferentes: El mecanismo de representacin en el que estn basadas, o la o a nalidad que tengan las mismas. En cuanto al primer criterio nos encontramos con (para mayor detalle ir a Gmez-Prez et al. [Cor06]): o e Herramientas que se corresponden o representan directamente utilizando un lenguaje de representacin de ontolog (OilEd, RdfEdit, SWOOP, o as etc.) Herramientas integradas, cuya caracter stica principal es tener una arquitectura extensible y su representacin del conocimiento es independiente o de cualquier lenguaje (Protege, WebOde, OntoEdit, etc.). Dependiendo de la nalidad que tengan estas herramientas, se han clasicado en (clasicacin extendida a la dada por Gmez-Prez [GP03b]): o o e Herramientas de desarrollo o representacin de ontolog o as. Herramientas de evaluacin de ontolog o as. Herramientas de integracin y alineamiento de ontolog o as. Herramientas para anotar ontolog as. Herramientas de consulta e inferencia. Herramientas de evolucin y versionado. o Herramientas de generacin de ontolog (learning tools). o as

A.2. INGENIER DE ONTOLOG IA IAS Herramientas de integracin con bases de datos. o

211

Las herramientas de representacin de ontolog permiten la denicin o as, o de las mismas siguiendo el ciclo de vida de desarrollo. Estas herramientas, se caracterizarn por la capacidad para seguir una metodolog concreta, o bien a a seguir cada una de las opciones del ciclo de vida de una ontolog desde la a, denicin de la ontolog creacin de instancias, traduccin a un lenguaje de o a, o o representacin formal y mantenimiento. La mayor de estas herramientas se o a basan el el formalismo de representacin de marcos (frames). o A continuacin se presentan las herramientas de representacin de ono o tolog ms conocidas. Entre las herramientas que se exponen, estn aquellas as a a que unicamente se crean para poder editar o denir ontolog en un lenguaje as determinado y herramientas que son una herramienta de construccin de ono tolog en s mismas que guian al usuario en la elaboracin de las mismas. as o Un resumen ms detallado de estas herramientas lo podemos encontrar en a cualquiera de estas referencias [Dui00, Su02, GP03a, You06] y en las propias pginas de descarga de cada una de ellas. a Protg [atSUSoM06, Knu]. Esta herramienta tiene su propio modelo e e de representacin de ontolog no obstante, proporciona mecanismos o as, para importar y exportar ontolog en los lenguajes ms comunes de as a representacin. Es una herramienta que trabaja en modo local y la ino formacin se puede guardar en documentos de texto o en una base de o datos. Protege incluso aporta una herramienta especial para trabajar directamente con ontolog de tipo OWL. Adems, permite que toda as a la comunidad incorpore nuevas aplicaciones a la herramienta mediante la creacin de extensiones o plug-ins, para ello pone a disposicin de los o o usuarios una API que gestiona su propio modelo de datos. Esta herramienta, permite manipular cualquier aspecto de la ontolog incluyendo a, la denicin de metadatos. Adems incluye opciones para permitir el o a trabajo colaborativo. Actualmente es la herramienta l der con un 68.2 % de usuarios [Car07]. WebODE [otTUoMS07, Arp01].Herramienta que permite representar ontolog tambin siguiendo su propio modelo de representacin de datos. as e o Dichas ontolog sern almacenadas en una base de datos. Proporciona as a herramientas para importar y exportar ontolog en lenguajes estndar as a como OWL, y RDF. No soporta la gestin de metadatos. Se usa a travs o e de un navegador Web y permite gestionar casi todas las fases del desarrollo de una ontolog concretamente se basa en la metodolog methona, a tology.

212

APENDICE A. CONCEPTOS BASICOS DE ONTOLOG IAS OntoEdit [Ont07a]. Herramienta de edicin de ontolog que apoya el o as desarrollo y mantenimiento de las mismas utilizando medios grcos en a un entorno web. Esta herramienta representa grcamente las ontolog a as, las almacena y posteriormente manipula en una base de datos relacional. Su interfaz permite incorporar plugins y exporta a la mayor de lenguaa jes de ontolog Est basado en la metodolog On-To-Knowledge. as. a a KAON [Obe04, Obe03]. Editor de ontolog para su creacin y manteas o nimiento, a travs de un navegador web. Slo representa RDF(s). Almae o cena la informacin en una base de datos. o WebOnto [Uni07a]. Representa las ontolog usando una interfaz grca as a a travs de la web usando de diagramas. Permite el trabajo colaborativo e pero no permite crear o modicar metadatos. Dispone en abierto de una base de ontolog para reutilizar. as OilEd [Bec07b]. Editor de ontolog que usa el lenguaje OIL (precursor as del OWL). No es una herramienta que permita desarrollar todo el proceso de vida de desarrollo de una ontolog pero permite denir axiomas, a, importar y exportar a la mayor de los lenguajes conocidos. a OntoLingua [Uni07d]. Permite realizar trabajo colaborativo, navegar, crear, editar, modicar, utilizar y reutilizar ontolog a travs de un as e navegador web. Dispone tambin de librer e as. Chimaera [Uni07b]. Software que guia al usuario para crear y mantener ontolog distribuidas a travs de la web. Su objetivo principal es el de as e combinar ontolog y analizar una o varias. Soporta la carga de bases de as conocimiento en diferentes formatos, resolviendo conictos de nombres, permite navegar entre ontolog editar trminos, etc. as, e DL-Workbench [Org07]. Plataforma de edicin de ontolog que consta o as de tres mdulos: una API para denir los metamodelos (que describen o los formalismos ontolgicos), una interfaz para denir ontolog basadas o as en los metamodelos (implementado como una extensin (plug-in) de la o plataforma Eclipse). El ultimo mdulo personaliza la interfaz de usuario. o Usa el lenguaje DAML+OIL, permite la gestin de varias ontolog y la o as, integracin de las mismas con otros datos en una aplicacin distribuida o o o independiente. OntoStudio [Ont07b]. Herramienta de desarrollo de ontolog profesionas al y que da soluciones basadas en la administracin de ontolog Basado o as. en un diseo modular que soporta la incorporacin de extensiones (plugn o ins). Utiliza el Eclipse como entorno. Incorpora herramientas para hacer

A.2. INGENIER DE ONTOLOG IA IAS

213

correspondencias con documentos, archivos y aplicaciones. Tiene editor de reglas. Soporta visualizacin, y tiene interfaz Web. o WSMO Studio [wg08] Entorno que permite representar ontolog para as la Web Semntica.Admite extensiones (plug-ins) y esta implementado a para el entorno Eclipse. Adems esta orientado a la creacin de servicios a o en la Web Semntica, generar anotaciones, etc. a POWL [Aue07], Plataforma de desarrollo de la Web Semntica. Editor a para generar ontolog en OWL y RDF, permite trabajo colaborativo as y desarrollo distribuido de ontolog Es una solucin de cdigo abierto as. o o basada en Web. Apollo [Uni07c]. Editor de ontolog que las organiza las ontolog as as jerrquicamente.Permite incluir plugins. Representa la informacin utia o lizando el lenguaje OCLM, y CLOS unicamente. No exporta a ningn u lenguaje. Todos las herramientas anteriores son entornos de gestin de ontolog como as pletos y generalistas, que con mayor o menor funcionalidad permiten realizar un gran nmero operaciones bsicas en el proceso de desarrollo de las misu a mas. Existen otras herramientas que cubren solamente algunos aspectos de este proceso de desarrollo (por lo que siguen encajando en la clasicacin de o Herramientas para el Desarrollo de Ontolog as). Podemos encontrar en este nuevo grupo desde simples editores, traductores a otros lenguajes, o clientes para incluir contenidos en la Web Semntica, entre otras. A continuacin se a o muestran algunas de estas herramientas, Como editores encontramos: RDFedt. Permite generar documentos RDFS. IsaViz. Permite generar ontolog en RDFS, mediante interfaz visual, y as grcos. a OntoLingua. Permite realizar trabajo colaborativo, herramientas de tutor librer y ontolog reutilizables. Se usa a travs de un navegador a, as, as e Web. ICOM. Herramienta que puede usarse para la representacin de conocio miento en una base de datos o en una ontolog Representa la informaa. cin usando XML o UML. o k-Innity. Slo representa ontolog en RDF con un editor grco. Alo as a macena la informacin en una BD. o

214

APENDICE A. CONCEPTOS BASICOS DE ONTOLOG IAS OntoSaurus. Representa la informacin en el lenguaje LOMM. Tiene una o interfaz web pero no tiene visualizacin grca. No exporta en lenguajes o a web. SWOOP. Herramienta que permite representar-visualizar ontolog en as OWL. Lleva incluido un programa que valida la especie de OWL con la que se trabaje. Amaya. Es un editor web, para crear ontolog Proporciona un espacio as. para la colaboracin y permite representar lenguajes web como RDF, y o otros.

Como traductores: DOE. Herramienta que permite exportar e importar varios formatos. No tiene interfaz de usuario. Medius VOM. La representacin de ontolog se realiza mediante dio as agramas UML, permite importarlas y exportarlas en lenguajes Web estndar. a LinkFactory. No tiene interfaz, pero permite soporte multiusuario, exportar e importar en los lenguajes web estndar. Almacena la informacin a o en una BD. Como clientes de la Web Semntica: a DBIN. Es un cliente que permite construir y publicar, un espacio semntia co personal donde hay reglas denidas por el usuario, mtricas de cone anza y ltros. Permite la generacin de anotaciones. o Schema Web. Directorio de esquemas en RDF, OWL, etc. para que los desarrolladores trabajen con RDF. Proton, plataforma creada para realizar anotaciones semnticas, indexaa do y recuperacin de informacin. Desarrollo para la ontolog KIMO, o o a incluida en el proyecto KIM. Existen otro tipo de herramientas para la gestin/representacin de ono o tolog as, como Sesame, Inkling, rdfDB, Redland, JENA y Cerebra, que son herramientas para almacenar ontolog y consultarlas. Algunas de estas, inas cluso proporcionan una API, que permite utilizar sus propios mtodos para e desarrollar una herramienta propia de gestin. La mayor de estas APIs pero a miten manipular ontolog denidas en un lenguaje como RDF(S) u OWL. as

A.2. INGENIER DE ONTOLOG IA IAS

215

Algunas de estas interfaces son Sesame [Kam07], JENA [Pro07] o OWLAPI [Bec07a]. Sin embargo las herramientas de representacin de ontolog ms geneo as a ralistas, tienen la ventaja con respecto a otros mecanismos de representacin, o como los lenguajes, la facilidad de uso, de aprendizaje gracias a la intuitividad de la herramienta, la posibilidad de visualizacin de la informacin en o o forma de diagramas, o de manera organizada, la posibilidad de la denicin o de las ontolog a travs de una interfaz visual y de marcos. Estas ventajas, as e convierten en favoritos estos mecanismos a la hora de denir ontolog con as, respecto a aquellos que consisten en la denicin de las mismas utilizando un o editor de texto para representar la informacin en el lenguaje de denicin o o pertinente. Herramientas como Chimaera, FCA-merge y iPROMPT (Protege), OntoBuilder, OntoStudio (KAON2) se usan para unicar ontolog o integraras las, entrar dentro de las consideradas Herramientas de Integracin y Alinan o eamiento. Las Herramientas de Anotacin son aquellas que se usan para anotar ono tolog las mas conocidas son AeroDamL, COHSE, MnM y OntoAnnotate, as, SMORE, etc. Adems de todas estas herramientas, existen otro conjunto de ellas que pera miten razonar o deducir informacin representada en las mismas, algunas de o estas herramientas son: Racer, FaCT ++, F-OWL, Pellet, Jena, OWLJessKB, etc. Con respecto a las Herramientas para la Evaluacin, usadas para validar o la consistencia de la ontolog existen algunas pginas web como la de Wona, a derWeb [Bec07c] y otras herramientas como ODEval, u OntoManager [Har05]. Las Herramientas para Generar Ontolog ser aquellas que a partir as an de una informacin ya existe (ya sean textos, esquemas, BD) nos permiten o generar una nueva. Con respecto a textos, podemos encontrar: Asium, LTG, OntoLearn, SOAT, TextStorm, Text-to-Onto, TERMINAE, Camaleon, etc. (Un resumen ms detallado se encuentra en et al. [GP04]). La generacin de a o ontolog utilizando una BD estar detallada en la seccin 2.3. as a o Las Herramientas de Evolucin y Versionado, sirven para representar aqueo lla parte de la realidad que est continuamente cambiando y es necesaria ena tonces, una buena gestin de las versiones que se van obteniendo de la misma. o Gmez-Prez et al. en [Cor06] hace un repaso por las herramientas ms popuo e a lares en este mbito, como el plugin KAON [Obe03] y el algoritmo PromptDi a implementado en la API con el mismo nombre. Adems tambin existen en a e algunas herramientas de propsito general que controlan el versionado de las o detalladas previamente.

216

APENDICE A. CONCEPTOS BASICOS DE ONTOLOG IAS

En cuanto a las herramientas que permiten la Interaccin con BBDD, son o tan numerosas y estn tan relacionadas con la temtica de esta investigacin a a o que se pueden encontrar de forma detallada en la seccin 2.3. o

A.2.4.

Tcnicas de Manipulacin de Ontolog e o as

Alrededor del concepto de ontolog existen un gran nmero de operaa, u ciones, que permiten la manipulacin de las mismas, de tal forma que puedan o relacionarse entre ellas, denir nuevas, compartir informacin, extender su o denicin, renarla, etc. Todas estas tcnicas, que forman parte de la ingenier o e a ontolgica, tienden a resultar confusas, y a veces en la literatura se no deja o claro cual es su funcin. A continuacin se har un repaso por todas ellas para o o a claricar el uso de estos trminos en este trabajo [Ehr07]: e Mapeo (Mapping ) Trata de relacionar conceptos similares o relaciones de diferentes fuentes usando relaciones de equivalencia [Car07]. Es la ms a utilizada, puesto que su uso fundamentalmente es la consulta de diferentes ontolog Un mapeo entre ontolog representa una funcin entre as. as o las mismas. La ontolog original no se cambia pero se aaden acciones a n adicionales de mapeo que expresen los conceptos, relaciones o instancias en trminos de la ontolog secundaria. Estos mapeos se almacenan en e a un lugar diferente y podrn usarse slo en una direccin. El uso t a o o pico de un mapeo es en una consulta sobre una ontolog que se reescribe a y maneja sobre otra ontolog Las respuestas entonces son mapeadas a. de nuevo. Mientras que la alineacin identica la relacin entre las ono o tolog los mapeos se centran en la representacin y la ejecucin de las as, o o relaciones para una cierta tarea. Tiene ciertas similitudes con el concepto de correspondencia como veremos a continuacin. o Correspondencia (Matching) Proceso de buscar relaciones o correspondencias entre entidades en diferentes ontolog Estas correspondencias, as. a veces se denominan mapeos en algunos textos [Euz07]. La diferencia ms signicativa con el proceso de Mapeo es que el mapeo es como a una alineacin pero que esta orientada y dirigida, o sea que mapea las o entidades de una ontolog a al menos otra entidad de otra ontolog a a, tambin puede verse como una coleccin de reglas de mapeo todas orie o entadas en una direccin. o Integracin (Integrating ) Consiste en juntar, extender o especializar una o ontolog usando otras que hay disponibles. Es decir, para integrar una a o ms ontolog tienen que ser utilizadas para formar una nueva. Los a as conceptos originales son adoptados, y posiblemente extendidos, pero su

A.2. INGENIER DE ONTOLOG IA IAS

217

origen se mantiene (por ejemplo a travs del espacio de nombres). Las e ontolog son integradas, no estn completamente mezcladas. Este conas a cepto se utiliza fundamentalmente si las ontolog provienen de diferenas tes dominios. A travs de la integracin, la ontolog nal, cubrir un e o a a dominio mayor. Las operaciones ms comunes en esta prctica son la a a unin y la interseccin. o o Mezcla (Merging ) Toma diferentes ontolog del mismo campo y crea una as nueva unicada. En este caso, la nueva ontolog reemplazar a las oria a ginales. Esto requiere de una adaptacin y extensin considerable. Los o o elementos individuales de las ontolog originales se presentan dentro de as la nueva ontolog pero no pueden volver a sus fuentes. El alineamiento a, es un paso previo a esta tcnica, puesto que detecta la coincidencia de e elementos. Alineacin (Alignment) , consiste en traer dos o ms ontolog en un o a as consenso mutuo y hacerlas consistentes y coherentes. Es decir, dadas dos ontolog alinear una ontolog con otra signica que para cada entidad as, a (concepto, relacin o instancia) en la primera ontolog trataremos de o a, encontrar una entidad correspondiente que tenga el mismo signicado en la segunda ontolog Es entonces un Alineamiento una relacin de a. o igualdad uno-a-uno [Ehr07]. a Mediacin (Mediation) Es el nivel ms alto para conciliar diferencias eno tre ontolog heterogneas con el objetivo de conseguir la interoperacin as e o entre las fuentes de datos anotadas con ellas y las aplicaciones que usan estas ontolog La mediacin incluye el descubrimiento y la especias. o cacin de alineamientos ontolog adems del uso de estas alineaciones o as, a para ciertas tareas como el mapeado para una reescritura de una consulta y la transformacin de la instanciacin. Adems el termino mediacin o o a o incluye la mezcla de ontolog as. a as Combinacin (Combining ) Es cuando dos o ms ontolog diferentes se o utilizan para una tarea en la que su relacin mutua es relevante. La o relacin de combinacin puede ser de cualquier tipo, no unicamente de o o identicacin. Adems no se da informacin acerca de como se establece o a o la relacin. o Transformacin (Transformation) Cuando se transforma una ontolog o a su semntica cambia para hacerla compatible con los nuevos propsitos. a o Por ejemplo, las relaciones entre las entidades de la primera ontolog y a aquellas de la segunda se aaden a la primera. n

218

APENDICE A. CONCEPTOS BASICOS DE ONTOLOG IAS

Traduccin (Translating ) Este es el caso de traducir una ontolog repreo a sentada en un lenguaje a otro. La semntica debe ser preservada, aunque a cambia la sintaxis. Versionado (Versioning) Es el proceso de ir aplicando modicaciones a una ontolog e ir guardando los resultados parciales que se van obteniendo. a Conciliacin (Reconciliation) Es el proceso que permite armonizar los o contenidos de dos o ms ontolog a as, t picamente requiere cambios en uno de los lados incluso en los dos. En este caso no se combinan las ontolog sino que co-evolucionan. La conciliacin de ontolog puede ser as, o as llevada a cabo con el propsito de mezclar dos ontolog o bien hacerlas o as independientes. a Recortado (Pruning ) Es el proceso de recortar partes de una ontolog para formar una nueva ms especializada. A veces, se parte de una ona tolog ms genrica o de alto nivel, y a partir de la misma se van rea a e alizando operaciones de poda para obtener la ontolog adecuada a la a realidad que se desea representar. a, e Aprendizaje(Learning ) Es el proceso de obtener una ontolog a travs de mtodos o herramientas, de forma automtica o semiautomtica. Las e a a fuentes de datos de las cuales se puede extraer una ontolog aplicando a tcnicas de aprendizaje, son textos, esquemas, contenidos web, bases de e datos, etc.

A.2. INGENIER DE ONTOLOG IA IAS

219

Tabla A.3: Elementos de una pgina OWL a Elemento Descripcin o Prejo xmlns:owl Espacio de Nombres http://www.w3.org/2002/07/owl# owl:class Identicador de clase. En OWLFULL es igual que rdfs:class) owl:oneOf enumeracin de individuos o owl:allValuesForm, Restriccin de valores en un o owl:someValuesFrom, propiedad owl:cardinality, Restriccin de Cardinalidad en o owl:minCardinality, una propiedad owl:maxCardinality owl:intersectionOf, owl:unionOf, Descripciones que usan expreowl:complementOf siones booleanas owl:subClassOf, Axiomas de Clases owl:equivalentClass, owl:disjointWith owl:ObjectProperty Propiedades de objeto owl:DatatypeProperty Propiedades de tipo de datos owl:equivalentProperty, Axiomas de propiedades para las owl:inverseOf, relaciones entre propiedades owl:equivalentProperty owl:FucntionalProperty y Axiomas de propiedades para la owl:InverseFuctionalProperty cardinalidad owl:SymmetricProperty y Axiomas de propiedades para carowl:TransitiveProperty acter sticas lgicas o owl:sameAs, owl:dierentFrom Especican la identidad de los individuos rdfs:Literal Tipos de datos:literales owl:OneOf tipos de datos enumerados owl:versionInfo, rdfs:label, Propiedades de anotacin o rdfs:comment, rdfs:seeAlso, rdfs:isDenedBy owl:imports, owl:priorVersion, Propiedades de la ontolog a owl:backwardCompatibleWith, owl:incompatibleWith

220

APENDICE A. CONCEPTOS BASICOS DE ONTOLOG IAS

Apndice B e

Extensiones Difusas al Modelo Relacional de BD


B.1. Modelo Generalizado para Bases de Datos Relacionales Difusas (GEFRED)

A continuacin se expone brevemente los fundamentos planteados en GEFRED. o

B.1.1.

Fundamentos Tericos de GEFRED o

Representacin de Datos Imprecisos o


Denicin B.1. Sea D un dominio de discurso, P(D) el conjunto de diso tribuciones de posibilidad denidas sobre D, entre las que se incluyen aquellas que describen los valores DESCONOCIDO y NO APLICABLE. Consideremos tambin el valor NULL. El dominio difuso generalizado se dene como e DG donde DG P(D) NULL. Un dominio difuso generalizado es un conjunto formado por elementos que pueden ser: 1. un escalar (por ejemplo, Comportamiento = bueno, que se representa mediante la distribucin de posibilidad {1/buena}), o 2. un nmero (por ejemplo, Edad = 27, que se representa mediante la disu tribucin de posibilidad {1/27}), o 3. un conjunto de asignaciones escalares posibles (por ejemplo, Comportamiento = {bueno, malo}, que se representa por la distribucin de posio bilidad {1/good , 1/bad }), 221

222

APENDICE B. EXTENSIONES AL MODELO DE BDR

4. un conjunto de asignaciones numricas posibles (por ejemplo, Edad = e {20, 21}, que se representa mediante la distribucin de posibilidad {1/20, o 1/21}), 5. una distribucin de posibilidad construida sobre un dominio escalar (por o ejemplo, Aptitud = {0,6/buena, 0,7/mala}), o e 6. una distribucin de posibilidad construida sobre un dominio numrico (por ejemplo, Edad = {0,3/20, 0,5/21}, nmeros difusos o etiquetas u ling usticas), u 7. un nmero real en en intervalo [0, 1], que se reere al grado de acoplamiento (por ejemplo, Calidad = 0,9), 8. un valor DESCONOCIDO con distribucin de posibilidad {1/u : u o U }, 9. un valor NO APLICABLE con distribucin de posibilidad {0/u : u o U }, 10. un valor NULL con distribucin de posibilidad o NULL = {1/UNDEFINED, 1/NULL} Denicin B.2. Una Relacin Difusa Generalizada, R, es un par de conjuno o tos (H, B), denidos como sigue: H es el conjunto llamado cabecera y describe la estructura de la relacin o mediante un conjunto de ternas atributo-dominio-compatibilidad (donde el ultimo es opcional), H = {(AG1 : DG1 [, CAG1 ]), . . . , (AGn : DGn [, CAGn ])} donde a cada atributo Aj , le subyace un dominio difuso generalizado, no necesariamente distinto, Dj , j [1, n]. Cj es el llamado atributo de compatibilidad y toma valores en [0, 1]. B es el conjunto llamado cuerpo y est formado por una serie de tuplas a generalizadas difusas distintas, donde cada tupla est compuesta por un a conjunto de ternas atributo-valor-grado (donde este ultimo es opcional), B = {{(AG1 : di1 [, ci1 ], . . . , (AGn : din [, cin ])}} con i = 1, . . . , m y donde m es el nmero de tuplas de la relacin, d u o ij representa el valor del dominio que toma la tupla i sobre el atributo Aj y cij es el grado de compatibilidad asociado a este valor.

B.1. GEFRED

223

Los operadores de comparacin tienen que ser exibilizados de modo que o sea posible comparar dos valores que no son exactamente iguales. Denicin B.3. Sea U el dominio de discurso considerado. Se llama como parador extendido a cualquier relacin difusa denida sobre U y expresada o como sigue: : U U [0, 1] (ui , uj ) a con ui , uj U y a [0, 1]. Denicin B.4. Sea U un dominio de discurso, D un dominio difuso cono struido sobre el mismo y un comparador extendido denido sobre U . Consideremos una funcin denida como sigue: o : D D [0, 1] (d1 , d2 ) [0, 1] Se dice que es un comparador difuso generalizado sobre D inducido por el comparador extendido , si cumple: (d1 , d2 ) = (d1 , d2 ), d1 , d2 U donde d1 y d2 representan las distribuciones de posibilidad {1/d1 } y {1/d2 } inducidas, respectivamente, por los valores d1 y d2 .

Manejo de Datos Imprecisos


Denicin B.5. Sea R una relacin difusa generalizada como la de la denio o cin B.2 y X un subconjunto de H denido como sigue: o x H, x = {(As : Ds [, Cs ]) : s S, s S ; S, S {1, . . . , n}} Entonces, se llama proyeccin difusa generalizada de R sobre X, y se nota o por PX (R), a una relacin difusa generalizada de la forma: o PX (R) = HP = X BP = {(As : dis [, cis ])} (B.1)

donde s S, s S y S, S {1, . . . , n}. Denicin B.6. Sea R una relacin difusa generalizada como la de la denio o cin B.2, a D una constante, un comparador difuso generalizado y o un umbral de cumplimiento. Entonces, se llama seleccin difusa generao lizada sobre la relacin R inducida por compuesto con a y el atributo o

224

APENDICE B. EXTENSIONES AL MODELO DE BDR

Ak , k {1, . . . , n} y cualicada por , y se nota por S (Ak ,) (R) a la a relacin difusa generalizada de la forma: o HS = {(A1 : D1 [, CA1 ]), . . . , (An : Dn [, CAn ])} S (Ak ,) (R) = BS = {{(A1 : dr1 [, cr1 ], . . . , (Ak : drk [, crk ]), (B.2) a . . . , (An : drn [, crn ])}} con crk = (drk , a) (B.3)

donde r = 1, . . . , m con m el nmero de tuplas de la seleccin. u o

B.1.2.

Representacin Relacional de un Dominio Generalizado o Difuso: FIRST

Representacin de la Informacin Imprecisa o o


Los elementos que forman parte del tratamiento impreciso pueden ser representados de diversas maneras. De ese modo, una distribucin de posibilidad o normalizada puede representarse mediante parbolas, hiprbolas, etc. Sin ema e bargo, la implementacin FIRST [Med94a, Gal99] y su servidor de consultas o imprecisas, construidos sobre el modelo GEFRED [Med94b], asume la representacin trapezoidal descrita por cuatro puntos que se muestra en la gura o B.1. Esta simplicacin se explica en funcin de la contradiccin que supone o o o representar datos intr nsecamente imprecisos mediante distribuciones de posibilidad denidas de forma altamente precisa, que adems aaden el factor del a n incremento del coste computacional. Datos difusos o con tratamiento difuso Los valores que pueden formar parte de un dominio generalizado difuso pueden dividirse en dos grupos: 1. Datos precisos: tambin llamados crisp o clsicos. Segn se muestra en e a u la gura B.2 y dado que lo que se almacena son datos clsicos, el almaa cenamiento depender directamente de la capacidad de representacin a o del SGRBD sobre el que se aplique la implementacin. o e 2. Datos imprecisos: tambin llamados fuzzy o difusos. Se corresponden con datos de dos subtipos recogidos en las guras B.3 y B.4: Datos imprecisos sobre un referencial ordenado: que engloban a todos aquellos datos descritos mediante una distribucin de posibilio dad construida sobre un conjunto referencial discreto o continuo ordenado (con una relacin de orden denida). A este tipo pertenecen o

B.1. GEFRED

225

0 a b g d A) Forma Trapezoidal 1

gd a b C) Forma Intervalar

0 bg B) Forma Triangular a d

Figura B.1: Posibles Representaciones trapezoidales de una distribucin de o posibilidad

los valores de tipo 6 que aparece en la denicin de dominio difuso o generalizado B.1 (pgina 221). Para su representacin recurriremos a o a: o Distribucin de Posibilidad Trapezoidal: cuya funcin de perteneno cia viene descrita por cuatro puntos [, , , ] que se muestran en la gura B.1 apartado A. Aquellos valores que estn en el e intervalo [, ] pertenecen al conjunto difuso descrito por la distribucin trapezoidal con grado de pertenencia 1. o Etiqueta ling ustica: estos se reeren a un concepto impreciso introducido por Zadeh [Zad75] denido mediante una distribucin o de posibilidad. Valores Aproximados: sea n un valor del dominio subyacente, el concepto impreciso aproximadamente n se construye a partir de un valor llamado margen el cual nos permite constru-

226

APENDICE B. EXTENSIONES AL MODELO DE BDR

... 150

165

190

Valores Almacenados Valores Consultados

Bajo Mediano

Aprox . 1.65 Alto Muy Alto

Figura B.2: Tipo difuso 1

0 0
... 150 165 190

Valores Consultados y Almacenados Valores Consultados y Almacenados

Bajo

Alto

Aprox . 1.65

Figura B.3: Tipo difuso 2

B.1. GEFRED

227

0 0.3 0,8 Simpatico Agradable 0.7 Reservado 0.1 0.5 Desagradable Consultado yAlmacenado

Figura B.4: Tipo difuso 3. Valores que pueden tomar las relaciones de similitud.

ir una distribucin de posibilidad triangular de la forma [n o margen, n, n, n + margen], como se muestra en la gura B.1. Intervalos de posibilidad: los unicos valores que pertenecen al con junto difuso con grado 1 son aquellos del dominio subyacente que estn en el intervalo [n, m], por lo que se representa mediana te una distribucin con los siguientes parmetros [n, n, m, m] o a que se puede ver en la gura B.1 apartado C. Esta representacin permite asumir la extensin que Grant [Gra80] hace o o del modelo relacional para representar valores intervalares como valor posible de un atributo. Datos imprecisos con analog sobre referencial no ordenado: que a engloban a todos aquellos datos difusos cuyo dominio subyacente es un conjunto discreto no ordenado sobre el que se dene una relacin o de semejanza o similitud entre cada par de valores del mismo. Los datos que pueden representarse en este grupo son: a Escalares Simples: este tipo est representado por una unica pareja de datos en la que el unico valor de posibilidad es {1/d}, lo que quiere decir que el unico valor posible es d con grado de posibilidad 1 (normalizacin). o Distribucin de Posibilidad sobre Escalares: este tipo se le asocia o una representacin del tipo {(p1 , d1 ), . . . , (pn , dn )} en la que a o cada valor del dominio subyacente se le asigna un grado de pertenencia al conjunto difuso. Hay que proporcionar una representacin para los tres valores especiales o Null, Unknown y Undened cuyas distribuciones de posibilidad se ven en la gura B.5.

228

APENDICE B. EXTENSIONES AL MODELO DE BDR


UNKNOWN 1 1 UNDEFINED

Figura B.5: Distribuciones de posibilidad de los valores Unknown y Undened

Para recoger todos los valores que se pueden formar parte de un dominio generalizado difuso Medina [Med94b], y Galindo [Gal99] posteriormente, plantearon tres tipos de atributos en su implementacin FIRST del modelo o GEFRED, sobre el sistema gestor relacional de bases de datos Oracle R . A grandes rasgos, estos atributos son: Tipo difuso 1: representa datos precisos que pueden ser consultados de forma imprecisa. Tipo difuso 2: representa datos imprecisos pertenecientes a un dominio difuso construido sobre un referencial ordenado y que pueden ser consultados de forma imprecisa. Tipo difuso 3: representa datos imprecisos pertenecientes a un dominio difuso construido sobre un referencial discreto no ordenado, sobre el que se dene una relacin de similitud, y que pueden ser consultados de o forma imprecisa. En el Modelo Relacional los atributos toman valores en dominios de valores atmicos (enteros, reales, cadenas de caracteres, caracteres, . . . ) que son o las unidades m nimas de informacin. Dicho modelo no especica los domino ios, pero cualquier Sistema Gestor de Bases de Datos construido sobre este paradigma (excepcin hecha de aquellos que poseen caracter o sticas de orientacin a objetos, que no es nuestro caso) usa unicamente valores atmicos. o o En el caso de los atributos de tipo difuso 1, no es necesaria ninguna estructura adicional para la representacin de valores, ya que no es la representacin o o lo que se exibiliza, sino la consulta.

B.1. GEFRED

229

En el caso de los atributos de tipo 2 y tipo 3, no es slo la consulta la que o se exibiliza, sino tambin la representacin de valores. Galindo propone en e o [Gal99] una estructura para la representacin de atributos de los tipos 2 y 3, o que pueden verse en las tablas B.1 y B.2.
Tipos de valor DESCONOCIDO NO DEFINIDO NULL CLASICO ETIQUETA INTERVALO[n, m] APROX(d) TRAPEZOIDE[, , , ] Atributos de tabla para valores de tipo difuso 2 FT F1 F2 F3 F4 0 NULL NULL NULL NULL 1 NULL NULL NULL NULL 2 NULL NULL NULL NULL 3 d NULL NULL NULL 4 FUZZY ID NULL NULL NULL 5 n NULL NULL m 6 d d margen d + margen margen 7

Tabla B.1: Representacin para atributos de tipo 2 o En la tabla B.1, el atributo F T almacena el tipo de valor y los atributos F 1, F 2, F 3 y F 4 se usan para almacenar los parmetros de cada valor. Los a valores NULL que aparecen en esta tabla representan valores inaplicables.
Tipos de valor DESCONOCIDO NO DEFINIDO NULL SIMPLE DISTRIBUCION Atributos de tabla para valores de tipo difuso 3 FT FP1 F1 . . . FPn Fn 0 NULL NULL . . . NULL NULL 1 NULL NULL . . . NULL NULL 2 NULL NULL . . . NULL NULL 3 p d . . . NULL NULL 4 p1 d1 . . . pn dn

Tabla B.2: Representacin para atributos de tipo 3 o En la tabla B.2, el atributo F T almacena el tipo de valor y los pares de atributos (pn , dn ) representan que el valor dn del dominio tiene un grado de posibilidad pn . Los valores NULL que aparecen en esta tabla representan valores inaplicables. De este modo, cuando se quiera representar un atributo de tipo 2 en una relacin, sern necesarias cinco atributos de tipo bsico. Para representar un o a a atributo de tipo 3, sern necesarias 2 n + 1 atributos de tipo bsico, donde a a n es el nmero de valores que forman el dominio en cuestin. u o Comparadores difusos generalizados En la literatura pueden encontrarse diversos mtodos de comparacin de nmero difusos, los cuales pueden e o u

230

APENDICE B. EXTENSIONES AL MODELO DE BDR

clasicarse en dos categor los que usan una funcin que va del conjunto as: o del nmeros difusos a un conjunto ordenado y los que usan relaciones difusas u para el proceso de comparacin. Las primer tipo pertenecen a las propueso tas recogidas en [Ada80, Yag78, Yag81]. Sobre el segundo tipo se encuentran diferentes aproximaciones en [Bal79, Bas77, Del88, Dub83]. GEFRED permite representar una amplia variedad de comparadores, sin embargo FIRST se centra en 15 comparadores, mostrados en la gura B.7 y se aplican a valores de dominios difusos construidos sobre referenciales ordenados. Un desarrollo de todos ellos y su signicado se desarrolla en [Gal99]. Grado de cumplimiento de una condicin: umbral El grado de cumplimo iento de una consulta que implique comparadores difusos generalizados pertenece al intervalo [0, 1]. Sin embargo, el umbralizar una consulta permite hacer poda de todos aquellas tuplas que no superen dicho grado de cumplimiento. En el caso de un mecanismo de deduccin orientado a tuplas, el grado o obtenido desde el comienzo del clculo de predicados de una regla sometido a a un umbral puede ayudar a realizar una poda importante durante la exploracin o de las posibilidades.

B.1.3.

Base de Metaconocimiento Difuso (FMB)

Toda la informacin adicional sobre la estructura de los dominios y los o valores que puede tomar cada atributo construido sobre un dominio generalizado difuso, as como cualicadores para el acceso a estos atributos constituye lo que se conoce como Base de Metaconocimiento Difuso. En la gura B.6 se describen el diagrama de clases de dicha base de metaconocimiento. Las relaciones que constituyen dicha estructura tienen la siguiente nalidad: FUZZY COL LIST: contiene la lista de aquellos atributos de tabla de la base de datos que son susceptibles de tratamiento difuso. Cada atributo queda descrito en esta por una referencia a la tabla a la que pertenecen (OBJ#) y columna en la que se almacenan (COL#), el tipo difuso de la u o columna (F TYPE), el nmero de valores de la distribucin de posibilidad si se trata de un atributo de tipo difuso 3 (LEN) y un comentario acerca del atributo (COM). FUZZY OBJECT LIST: almacena los objetos difusos que pertenecen al dominio del atributo en cuestin. Cada uno de los objetos estn repreo a sentados por la tabla y columna a cuyo dominio pertenecen (OBJ# y COL#), un identicador (FUZZY ID), un nombre (FUZZY NAME) y un tipo de objeto (FUZZY TYPE).

B.2. EXTENSION LOGICA-DEDUCTIVA AL MODELO DE BDRD

231

FUZZY LABEL DEF: contiene informacin sobre las distribuciones de o posibilidad trapezoidales que se asocian a etiquetas ling usticas. Cada una de ellas est descrita por la tabla y columna a cuyo dominio a pertenece (OBJ# y COL#), la etiqueta a la que se asocia (FUZZY ID) y los parmetros que la denen , , y . a FUZZY APPROX MUCH: contiene los parmetros margen y much para a cada atributo de tipo difuso 1 o 2 los cuales se usan para la comparacin o de valores dentro del dominio difuso. Para cada columna (OBJ#,COL#) se almacenan dos atributos (MARGEN, MUCH). FUZZY NEARNESS DEF: contiene los valores de similitud entre cada par de valores posible en el dominio discreto de valores escalares que se asocia a un atributo de tipo difuso 3. A cada par de valores posible (FUZZY ID1, FUZZY ID2) del dominio discreto de escalares de un atributo de tipo difuso 3 (OBJ#, COL#) hay asociado un grado de compatibilidad (DEGREE). FUZZY COMPATIBLE COL: contiene informacin sobre aquellos atrio butos de tipo difuso 3 que comparten dominio con otro atributo difuso del mismo tipo, de modo que no sea necesario volver a denir todos los valores de dicho dominio y sus grados de compatibilidad. Para cada atributo difuso de tipo 3 que comparte dominio discreto de escalares con otro atributo (OBJ#1, COL#1) se almacena la referencia al atributo con el que comparte dominio (OBJ#2, COL#2). FUZZY QUALIFIERS DEF: contiene el umbral m nimo de satisfaccin o para cada cualicador (QUALIFIER) denido sobre una etiqueta ling ustica (FUZZY ID) que pertenece al dominio de un atributo difuso (OBJ#, COL#).

B.1.4.

Lenguaje SQL Difuso (FSQL): consulta imprecisa

Una vez denido el dominio generalizado difuso es necesario ampliar los lenguajes relacionales que gestionan estos dominios as como las relaciones en el seno del modelo relacional. En nuestro caso, nos centraremos en una ampliacin del lenguaje SQL. o La extensin del SQL para permitir la representacin de datos difusos o o comprende tanto el Lenguaje de Denicin de Datos (DDL) como el Lenguaje o de Manipulacin de Datos (DML), dando lugar a la creacin y extensin de o o o las sentencias que se exponen en la tabla B.3. Esta sintaxis puede verse con detalle en [Bla00b, Bla00a, Bla01].

232

APENDICE B. EXTENSIONES AL MODELO DE BDR

FUZZY_LABEL_DEF OBJ#: NUMBER( FK ) COL#: NUMBER( FK ) FUZZY_ID: NUMBER(3)( FK ) ALFA: NUMBER BETA: NUMBER GAMMA: NUMBER DELTA: NUMBER

FUZZY_QUALIFIERS_DEF OBJ#: NUMBER( FK) COL# : NUMBER( FK) FUZZY_ID: NUMBER(3)( FK ) QUALIFIER: NUMBER(3)

FUZZY_OBJECT_LIST OBJ#: NUMBER( FK) COL#: NUMBER( FK) FUZZY_ID: NUMBER(3) FUZZY_NAME: VARCHAR2(30) FUZZY_TYPE: NUMBER(1)

FUZZY_COL_LIST OBJ#: NUMBER COL#: NUMBER F _TYPE: NUMBER(1) LEN: NUMBER COM: VARCHAR (100)

FUZZY_NEARNESS_DEF OBJ#: NUMBER COL#: NUMBER FUZZY_ID1:NUMBER(3)(FK ) FUZZY_ID2:NUMBER(3)(FK ) DEGREE: NUMBER(2)

FUZZY_APROX_MUCH OBJ#: NUMBER( FK ) COL#: NUMBER( FK ) MARGIN:NUMBER MUCH: NUMBER

FUZZY_COMPATIBLE_ COL OBJ1#: NUMBER(FK) COL1#: NUMBER(FK) OBJ2#: NUMBER(FK) COL2#: NUMBER(FK)

Figura B.6: Estructura relacional de la FMB

B.2. EXTENSION LOGICA-DEDUCTIVA AL MODELO DE BDRD Tabla B.3: Resumen de FSQL Tipo DDL DDL DDL DDL DDL DDL DDL DDL DDL DML DML DML Sentencia Create Table Create Label Create Nearness Alter Table Alter Label Alter Nearness Drop Table Drop Label Drop Nearness Select Insert Delete

233

Descripcin o Crea una relacin difusa o Crea una etiqueta Crea los valores de un dominio difuso tipo 3 Cambia la denicin de una relacin difusa o o Cambia la denicin de una etiqueta o Cambia la denicin de un dominio difuso tipo 3 o Borra de una relacin difusa o Borra de una etiqueta Borra de un dominio difuso de tipo 3 realiza consultas difusas inserta tuplas en una relacin difusa o borra tuplas de una relacin difusa o

B.2.
B.2.1.

Extensin Lgica-Deductiva al Modelo de BDRD o o


Fundamentos Tericos para la Representacin del Moo o delo Lgico y Lgico Difuso para Bases de Datos Relao o cionales

La teor de bases de datos esta muy ligada con la Lgica, especialmente a o a la hora de construir consultas, denir vistas o restricciones de integridad [Gal84]. Sobre las bases de datos deductivas se pueden denir dos tipos de relaciones bsicas [Bla01]: a Relacin Extensiva en el sentido del Modelo Relacional Clsico consisten o a en un par de conjuntos (R,r ) donde R es un conjunto de atributos que dene la estructura de la relacin y r es un conjunto de tuplas que dene o el contenido de la relacin. o Relacin Intensiva se trata de un par de conjuntos (R,I ) donde R es el o conjunto de atributos que denen la estructura de la relacin e I es un o conjunto de frmulas lgicas, denominado Generador de Instancias, que o o permite obtener el contenido de la relacin. o Las reglas en el Generador de Instancias I tienen una estructura diferente dependiendo de si se trata del caso clsico o difuso. Una propuesta para el a esquema de reglas en el modelo clsico deductivo lo introdujo Medina et al. a

234

APENDICE B. EXTENSIONES AL MODELO DE BDR

[Med97] y Blanco et al. [Bla00a]. Se estableci que cada regla en el conjunto I o de la base de datos clsica deductiva tuviera la siguiente estructura: a P (X1 , X2 , . . . , Xn ) Q1 (Y1,1 , Y1,2 , . . . , Y1,n1 ) Q2 (Y2,1 , Y2,2 , . . . , Y2,n2 ) . . . Qm (Ym,1 , Ym,2 , . . . , Ym,nm ) (B.4)

El predicado P, cuyos hechos son calculados, se denomina cabeza de la regla y la frmula lgica a la derecha del :- se denomina cuerpo de la regla (se o o trata de reglas tipo Prolog). Adems, cada regla tiene impuestas las siguientes a restricciones: 1. Cada variable en la cabecera de la regla aparezca por lo menos una vez en el cuerpo de la regla, y 2. Cada variable en el cuerpo de la regla aparezca en el predicado de la cabecera de la regla o en cualquier otro predicado del cuerpo de la regla. Aplicando estos conceptos al modelo relacional extendido difuso GEFRED se extienden algunos de los conceptos expuestos [Bla01, Bla02a, Bla03a, Bla03b]: Denicin B.7. Una Relacin Extensiva Difusa es una Relacin Difusa Geo o o neralizada desde el punto de vista del modelo GEFRED [Med94b], denido en el apartado anterior, es decir, un par (H, B) donde H equivale al esquema o cabecera de la relacin y B es la instancia o cuerpo. o En nuestro caso, nos centraremos en el caso en el que, cuando un valor de dominio acopla con un atributo dentro de una tupla, lo hace con grado 1, es decir, la expresin para la cabeza y el cuerpo de la relacin son: o o H = {(AG1 : DG1 [, CAG1 ]), . . . , (AGn : DGn [, CAGn ])} B = {(AG1 : d1 [, 1]), . . . , (AGn : dn [, 1])} i i (B.5)

Denicin B.8. Una Relacin Intensiva Difusa es un par (H, I) donde: o o H es el conjunto llamado cabecera, que describe la estructura de la relacin como un conjunto jo de ternas atributo-dominio-compatibilidad o (siendo este ultimo opcional), H = {(A1 : D1 [, C1 ]), (A2 : D2 [, C2 ]), . . . , (An : Dn [, Cn ])} donde a cada atributo Aj le subyace un dominio difuso generalizado, no necesariamente distinto, Dj con j [1, n]. Cj es un atributo de compatibilidad que toma valores en el intervalo [0, 1].

B.2. EXTENSION LOGICA-DEDUCTIVA AL MODELO DE BDRD

235

I es el conjunto llamado generador de instancia, que est constituido a por una serie de reglas orientadas a datos difusos, las cuales permiten el clculo de la instancia de la relacin. Estas reglas se desarrollarn en a o a los siguientes apartados del presente cap tulo. La generalizacin de la denicin de regla en el generador de instancias o o I sirve para la representacin de reglas clsicas y adems reglas exibles. En o a a [Bla03a, Bla01] se detalla el proceso de generalizacin de la regla hasta obtener o la Regla Generalizada con grado de acoplamiento que permite la representacin o de dichas reglas para deducir con datos exibles. Denicin B.9. Se llama regla generalizada con grado de acoplamiento a la o regla cuya expresin es la siguiente: o P (X1 , X2 , . . . , Xn , P ) Q1 (Y1,1 , Y1,2 , . . . , Y1,n1 , Q1 ) . . . (Ym,1 , Ym,2 , . . . , Ym,nm , ) Qm Qm con denida como sigue: (= (Xi , Yj,k ), i,j,k ) (= (Yj,k , Yl,p ), j,k,l,p ) i,j,k j,k,l,p j,k,l,p ( j,k,l,p (Yj,k , Yl,p ), j,k,l,p ) (B.7) (B.6)

o donde P es una funcin grado de acoplamiento construida en base a los grados de acoplamiento de las variables y a los grados de acoplamiento de los hechos obtenidos.

B.2.2.

La Representacin Relacional de las Reglas Generalio zadas Difusas: FREDDI Extendido

La arquitectura FREDDI fue propuesto por Medina et al. en [Med97, Pon96, Pon97] como un mecanismo para unicar un sistema de consulta deductivo con un sistema de consulta difuso, ambos construidos sobre un sistema gestor de bases de datos relacional. Este conjunto de relaciones permit ala macenar la denicin de un predicado como una disyuncin de una o varias o o reglas. Cada una de las reglas se den como una conjuncin de predicados a o y comparadores.

Representacin de Informacin Deductiva o o


Una relacin intensiva puede verse como [Bla01, Bla02a, Bla03a, Bla03b]: o Una relacin existente con su propio esquema, pero cuya instancia ha de o ser calculada en funcin de la instancia de los predicados que intervienen o en el cuerpo de sus reglas en el instante de ser consultada, o bien

236

APENDICE B. EXTENSIONES AL MODELO DE BDR Una relacin temporal que se construye en el momento de la consulta y o que no posee entidad ms all del alcance de dicha consulta. a a

Una relacin extensiva, por el contrario, no necesita una representacin o o concreta dado que trata de una relacin ordinaria, o relacin difusa que ya fue o o expuesta en el apartado anterior. La representacin de las reglas lgicas vendr dada por su estructura, dio o a vidindose en sus predicados y variables y almacenando el orden en el que se e encuentran y el grado de acoplamiento que se especique. Por otro lado el motor de inferencia ha de ser un mdulo externo o ino terno SGBDR (dependiendo o no si permite su inclusin en el mismo) que o estar implementado en un lenguaje de programacin lgico. a o o

B.2.3.

Base de Metaconocimiento Deductivo: Base de Reglas (RB)

Tal y como se explic anteriormente, la base de metaconocimiento permite o la representacin de datos de mayor complejidad puedan ser representados en o el modelo relacional. La representacin de la informacin deductiva est foro o a mada por dos bases de Metaconocimiento, la FMB descrita en el apartado B.1.3 y la RB o Base de Reglas que a continuacin se describe, y que permite o la representacin de las relaciones intensivas y las reglas generalizadas con o grado de acoplamiento difuso. Las diversas relaciones que forman parte de la RB aparecen en la gura B.7 en forma de diagrama de clases [Bla01, Bla02a, Bla03a, Bla03b]. Estas tablas tienen el siguiente cometido: INTENSIONAL TABLE DESCRIPTION: almacena los predicados intensivos (TABLE ID) denidos como la disyuncin de reglas Pi (RULEo ID). RULE DESCRIPTION: describe cada una de las reglas Pi (identicada mediante TABLE ID y RULE ID) como una secuencia de predicados extensivos e intensivos y comparaciones concatenados con el operador de conjuncin. Cada predicado puede aparecer negado y puede aparecer o varias veces en la misma regla. El par (PRED ID, RULE ID) identica a la regla descrita, PRED ID establece qu predicado aparece en la e posicin OCC NUMBER de la regla, si est negado o no (NEGATED) o a y su tipo (0 para extensivo, 1 para intensivo y 2 para comparacin). o PREDICATE DESCRIPTION: describe el orden de las variables en cada uno de los predicados Ki . La misma variable puede aparecer ms de a

B.2. EXTENSION LOGICA-DEDUCTIVA AL MODELO DE BDRD

237

DED _COMPARISION _DESCRIPTION TABLE_ID: NUMBER (FK ) RULE_ID: NUMBER (FK ) PRED _ID: NUMBER (FK ) OCC_NUMBER: NUMBER (FK) VAR_ID1: NUMBER VAR_ID2: NUMBER COMP_OP: NUMBER THOLD: NUMBER

domain

DED _TABLE_DESCRIPTION _INT TABLE_ID : NUMBER RULE_ID: NUMBER

0 1 2 3 4 5 6 7 8 9

= <> < > <= >= FEQ FGT FGEQ FLT

DED _PREDICATE_DESCRIPTION TABLE_ID : NUMBER (FK) RULE_ID : NUMBER (FK) PRED _ID: NUMBER (FK) OCC_NUMBER: NUMBER ( FK) VAR_ID: NUMBER COL_ID: NUMBER SOURCE_COL: NUMBER( FK ) DED _RULE_DESCRIPTION TABLE_ID : NUMBER (FK) RULE_ID: NUMBER ( FK) PRED _ID: NUMBER OCC_NUMBER: NUMBER NEGATED NUMBER(1) TYPE: NUMBER(1)

10 11 12 13 14 15 16 17 18 19 20

FLEQ MGT MLT NFEQ NFGT NFGT NFGET NFLT NFLEQ NMGT NMLT

0 1 2

Extensive Intensional Comparision

DED _COMPARISION _DESCRIPTION TABLE_ID : NUMBER RULE_ID : NUMBER PRED _ID: NUMBER OCC_NUMBER: NUMBER VAR_ID1: NUMBER VAR_ID2: NUMBER COMP_OP: NUMBER THOLD: NUMBER (FK) (FK) (FK) ( FK)

Figura B.7: Catlogo de datos deductivos a

238

APENDICE B. EXTENSIONES AL MODELO DE BDR una vez en cada predicado pero varias apariciones se distinguen por su posicin dentro del predicado. Una variable VAR ID ocupa una posicin o o COL ID dentro de un predicado PRED ID que aparece en una posicin o dada OCC NUMBER de una regla RULE ID que dene a un predicado intensivo TABLE ID. COMPARISON DESCRIPTION: describe las condiciones, tipo especial de predicados, que slo poseen dos variables y su tipo es uno de los o siguientes: =, =, , <, , >, FEQ, FGT, FGEQ, FLT, FLEQ, MGT, MLT, NFEQ, NFGT, NFGEQ, NFLT, NFLEQ, NMGT y NMLT. Una condicin compara dos variables (VAR ID1 y VAR ID2), aparece en una o posicin dada (OCC NUMBER) de una regla (RULE ID) que dene a o un predicado (TABLE ID). En nuestro caso, la columna PRED ID no es de utilidad (ya que la condicin queda totalmente identicada por o la posicin que ocupa en la regla) pero se ha mantenido por cuestiones o de uniformidad. La arquitectura FREDDI extendida es la que permite exibilizar la representacin de las reglas difusas y aumentar el nmero o u de comparadores difusos tal y como se ve en la gura B.7.

B.2.4.

Sintaxis Extendida Deductiva de FSQL

Al igual que ocurr con el FSQL, es decir, al lenguaje de manejo exible a para consultar valores precisos e imprecisos, el DSQL: Deductive SQL (o SQL Deductivo), es el lenguaje de consulta que permite realizar deducciones [Bla01, Bla00b]. Este lenguaje permite crear y manipular nuevas estructuras (DDL). En la tabla B.4 se encuentran las cabeceras de estas sentencias. En cuanto a la manipulacin de datos, o DML, se extiende unicamente la funcionalidad de la o sentencia SELECT pero a nivel interno no en la sintaxis (ms detalle en la a sintaxis en [Bla01, Bla02a, Bla03a]). Tabla B.4: Resumen de DFSQL Sentencia Descripcin o Create Intensional Table crea tablas intensivas Create Rule dene y almacena una regla en la BD Delete Rule elimina una regla previamente creada Drop Intensional Table borra una tabla intensiva

Tipo DDL DDL DDL DDL

B.3. MINER DE DATOS EN EL MODELO RELACIONAL IA

239

B.3.
B.3.1.

Miner de Datos en el Modelo Relacional a


Ampliacin Terica de GEFRED para el Manejo de o o M ltiples Tipos de Datos (GEFRED*) u

Se va a proceder a la denicin de GEFRED* que est basado en GEFRED o a (denido en B.1.1) de tal manera que la denicin del dominio difuso generao lizado va a tener un sentido ms universal [Car03a]. Con ello se pretende: a No restringir la denicin a ningn dominio en concreto, o u Formalizar la representacin de tipos de datos complejos en el sentido o de requerir mas de un atributo clsico. a Denicin B.10. Sean una serie de dominios D1 , D2 , ..., Dn , tal que cada Di o (con i= 1,2,...,n) es un dominio atmico en el sentido clsico de las Bases o a de Datos Relacionales y adems esa serie de atributos conjuntamente implica a una caracter stica importante y variable que tiene una entidad. Se dene entonces dominio complejo y se nota como D al dominio descrito por D1 D2 ... Dn siempre y cuando esos dominios D1 , D2 , ..., Dn modelen conjuntamente una caracter stica importante y variable que tiene una entidad Denicin B.11. Sea D un dominio complejo, (D ) el conjunto de diso tribuciones de posibilidad denidas sobre D, entre las que se incluyen aquellas que describen los valores Unknown y Undened. Se considera tambin el vale or Null. el dominio Difuso Generalizado Complejo se dene como DG donde DG (D ) N ull Los atributos que se denan sobre el dominio difuso generalizado complejo podrn tomar cualquier valor simple, excluyente o distribucin de posibilidad. a o Dicho dominio puede implicar tanto dominios precisos, como difusos de cualquier naturaleza, siendo un caso particular los tipos de datos reejados en la denicin B.1. La gestin de los tipos de datos va a ser posible mediante o o la denicin de una serie de operaciones especiales a realizar sobre los eleo mentos del dominio, que permitirn incorporar signicado a la representacin a o de los datos, en denitiva, para que se consiga el objetivo de modelar ms a certeramente la realidad. En cualquier caso, todas estas capacidades de representacin encontrarn en el comparador difuso generalizado complejo (que se o a denir ms adelante), el mecanismo mediante el que modelar su actuacin. a a o Denicin B.12. Una relacin difusa generalizada compleja R es un par de o o conjuntos (H, B), denidos como sigue:

240

APENDICE B. EXTENSIONES AL MODELO DE BDR H es el conjunto llamado cabecera y describe la estructura de la relacin o mediante un conjunto de ternas atributo complejo-dominio complejocompatibilidad (donde el ultimo es opcional), H = {(AG1 : DG1 [, CAG1 ]), . . . , (AGn : DGn [, CA
Gn

])}

donde a cada atributo Aj , le subyace un dominio difuso generalizado cinokehi, no necesariamente distinto, Dj , j [1, n]. Cj es el llamado atributo de compatibilidad y toma valores en [0, 1]. B es el conjunto llamado cuerpo y est formado por una serie de tuplas a generalizadas difusas distintas, donde cada tupla est compuesta por un a conjunto de ternas atributo-valor-grado (donde este ultimo es opcional), B = {{(AG1 : d i1 [, ci1 ], . . . , (AGn : d in [, cin ])}} con i = 1, . . . , m y donde m es el nmero de tuplas de la relacin, d u o ij representa el valor del dominio que toma la tupla i sobre el atributo Aj y cij es el grado de compatibilidad asociado a este valor. Denicin B.13. Sea U el dominio complejo de discurso considerado. Se o llama comparador extendido a cualquier relacin difusa denida sobre U y o expresada como sigue: : U U [0, 1] (ui , uj ) a con ui , uj U y a [0, 1]. Denicin B.14. Sea U un dominio complejo de discurso, D un dominio dio fuso complejo construido sobre el mismo y un comparador extendido denido sobre U . Consideremos una funcin denida como sigue: o : D D [0, 1] (d1 , d2 ) [0, 1] Se dice que es un comparador difuso generalizado complejo sobre D inducido por el comparador extendido complejo , si cumple: (d1 , d2 ) = (d1 , d2 ), d1 , d2 U donde d1 y d2 representan las distribuciones de posibilidad {1/d1 } y {1/d2 } inducidas, respectivamente, por los valores complejos d1 y d2 .

B.3. MINER DE DATOS EN EL MODELO DE BDRD IA

241

Denicin B.15. Se llama proyeccin difusa generalizada compleja de R o o sobre X , y se nota por P X (R ), a una relacin difusa generalizada compleja o de la forma: HP =X P X (R ) = (B.8) B P = {(As : d is [, cis ])} donde s S, s S y S, S {1, . . . , n}. Denicin B.16. Sea R una relacin difusa generalizada compleja como o o la de la denicin B.12, a D una constante, un comparador difuso o generalizado y un umbral de cumplimiento. Entonces, se llama seleccin o difusa generalizada compleja sobre la relacin R inducida por compuesto o con a y el atributo Ak , k {1, . . . , n} y cualicada por , y se nota por o S (A ,a ) (R ) a la relacin difusa generalizada de la forma:
k

H S = {(A1 : D1 [, CA ]), . . . , (An : Dn [, CAn ])} 1 (R ) = B S = {{(A1 : d r 1 [, cr 1 ], . . . , (Ak : d rk [, crk ]), (Ak ,a ) . . . , (An : d rn [, crn ])}} (B.9) crk = (d rk , a )

con

(B.10)

donde r = 1, . . . , m con m el nmero de tuplas de la seleccin. u o

B.3.2.

Representacin de M ltiples Tipos de Datos en el Moo u delo Relacional(FIRST*)

Estructura de los Tipos de Datos


FIRST* [Car03a] es la interfaz que proporciona acceso a mltiples tipos u de datos, denidos en el modelo GEFRED*, con objeto de realizar tareas de miner de datos sobre un SGBDR. FIRST * est basado en la arquitectura a a FIRST que permite la manipulacin de datos difusos, lo que proporciona al o sistema dicha caracter stica tambin. e Dentro de un SGBDR clsico, una serie de atributos del mismo implicarn a a un dominio difuso generalizado complejo si modelan conjuntamente una caracter stica importante y variable que tiene una entidad y adems permiten algn a u tipo de tratamiento difuso. FIRST * aade un nuevo tipo de datos a los tres n que ya se hab denido en FIRST, el tipo difuso 4, que representa a la serie an de atributos clsicos que determinan un dominio difuso generalizado complejo a y que, por tanto, pueden ser consultados de forma imprecisa. Se trata de un supertipo puesto que contiene la denicin de los otros 3, y esta formado por: o

242

APENDICE B. EXTENSIONES AL MODELO DE BDR Atributos de datos que contienen la informacin en s Por ejemplo si o . se trata de representar una distribucin trapezoidal [, , , ] con las o mismas caracter sticas que un tipo difuso 2 estos atributos se corresponder con los F1, F2, F3, F4 (vase tabla B.1) de la representacin de an e o dicho atributo. Atributos de metadatos, contienen informacin que permiten entender o los atributos de datos. Este tipo de atributos no siempre son necesarios. Siguiendo con el ejemplo anterior, este atributo se corresponder con la a columna FT de la tabla B.1 que indica si los atributos de datos contienen un valor Null, Unknown, Undened, un trapecio, etc.

Comparadores Difusos Generalizados Complejos


Para representar un dominio difuso generalizado complejo debe ser posible que los atributos permitan algn tipo de tratamiento difuso. Esto se lleva a u cabo sobre los atributos difusos de tipos 4 mediante la denicin de al menos o uno de los comparadores difusos usados en FIRST. Por tanto el usuario debe denir los comparadores difusos que crea necesarios para cada atributo de tipo 4 del que se vaya a hacer un tratamiento difuso. La semntica del comparador puede ser completamente subjetiva a quien a lo dena o al problema a resolver. Para los comparadores que no tienen un referencial ordenado, los comparadores pueden tener un signicado cualitativo ms que cuantitativo. a Lo unico que es necesario establecer es las restricciones de los comparador difusos para que tengan un signicado coherente para un mismo tipo de datos difuso 4 [Car03a].

B.3.3.

Base de Metaconocimiento Difuso*(FMB*)

Toda la informacin adicional sobre la estructura de los dominios y valoo res que puede tomar cada atributo construido sobre un dominio generalizado difuso complejo constituye lo que se conoce como Base de Metaconocimiento Difuso* (FMB*) [Car03a]. Este toma ms importancia si cabe, en FIRST* a que en el anterior modelo, debido a que va a hacer posible tanto la denicin, o como el tratamiento de los tipos difuso 4. Adems de las estructuras que ya formaban parte de FIRST para el traa tamiento de los tipos de datos difusos 1, 2 y 3, a las cuales se le realizan algunas modicaciones para adaptarlas al modelo. Se aaden nuevas estrucn turas relacionales que posibilitan la denicin y tratamiento del tipo difuso o 4.

B.3. MINER DE DATOS EN EL MODELO DE BDRD IA

243

Las funciones de los comparadores difusos que denen el comportamiento para los distintos tipos de datos difuso 4 son aadidas a la base de FMB*. La n representacin de estas funciones es: o CDEG (A fcomp B, {constanteA1 , constanteA2 , . . . , constanteAn f comp }, {constanteB1 , constanteB2 , . . . , constanteBn f comp }) [0, 1] Las funciones de representacin denen la visualizacin para los distintos o o tipos de datos difuso 4. Su estructura es muy parecida a la de los comparadores, y es la siguiente: FSHOW (A, {constanteA1 , constanteA2 , . . . , constanteAn f comp }) A continuacin se exponen cada una de las tablas de la FMB que han sido o ampliadas para utilizar el tipo difuso 4 : FUZZY COL LIST : contiene la lista de aquellos atributos de tabla de la base de datos que son susceptibles de tratamiento difuso. Aade en el n atributo F TYPE un 4 para los tipos difuso 4. FUZZY OBJECT LIST : almacenan los objetos difusos que pertenecen al dominio de atributo en cuestin. Aaden en el atributo FUZZY TYPE o n un 5 para las etiquetas ling usticas denidas para un tipo de dato difuso 4 en la tabla DMFSQL LABEL DEFINITION El resto de tablas que forman parte unica y exclusivamente de la FMB* y por tanto solo se utilizan para atributos difusos de tipo 4 son (ver gura B.8): DMFSQL COL COL: contiene la lista de aquellos atributos de la tabla de la base de datos que forman parte de, lo que se ha llamado, un dominio difuso generalizado complejo. Este dominio se ha implementado, tanto con atributos de datos, como de metadatos, aunque ambos son denidos de igual forma en esta tabla. Cada uno de estos dominios vendr cualicado por un unico atributo existente en la tabla y denido por a el par: referencia a la tabla a la que pertenecen (OBJ#) y columna en la que se almacenan (COL#). En el resto de tablas de la FMB cada uno de los tipos difusos 4 vendrn caracterizados por este unico atributo. Los a atributos integrantes del dominio complejo vendrn denidos por el par: a referencia a la tabla a la que pertenecen (OBJ#) y columna en la que se almacenan (COL2#). Mediante un atributo adicional, y por cuestiones de implementacin, se establece un orden en cada uno de estos atribuo tos integrantes del dominio complejo (ORDER#). En denitiva, en esta tabla se especica la representacin interna del atributo difuso tipo 4. o DMFSQL LABEL DEFINITION : contiene informacin sobre las etio quetas ling usticas denidas para los tipos difusos 4. Cada una de ellas

244

APENDICE B. EXTENSIONES AL MODELO DE BDR

DMFSQL _LOG SESSIONID : NUMBER INDICE : NUMBER(10) LINEA : VARCHAR2 (2000)

DMFSQL _COL _PAR OBJ #: NUMBER( FK) COL #: NUMBER( FK) FUZZY_COMP : VARCHAR2 (5)( FK) PAR# : NUMBER(2) PAR_VALUE: VARCHAR2 (2000) PAR_TYPE: VARCHAR2 (1)

DMFSQL _LABEL_DEFINITION OBJ #: NUMBER( FK) COL #: NUMBER( FK) FUZZY_ID : NUMBER(3)( FK) ORDER# : NUMBER(2) ( FK) LABEL_VALUE: VARCHAR2 (2000)

DMFSQL _FUNCTIONS_ COL OBJ #: NUMBER( FK) COL #: NUMBER( FK) FUZZY_COMP : VARCHAR2 (5) PKG #: NUMBER( FK) FUN#: VARCHAR2 (100)( FK)

DMFSQL _COL _COL OBJ #: NUMBER( FK) COL #: NUMBER( FK) ORDER# : NUMBER(2) COL2 #: NUMBER DMFSQL _FUNCTIONS FUN# : VARCHAR2 (100) PKG #: NUMBER

Figura B.8: Estructura relacional de la extensin de la FMB para manejo de o mltiples datos u

B.3. MINER DE DATOS EN EL MODELO DE BDRD IA

245

est descrita por la tabla y columna a cuyo dominio pertenece (OBJ# a y COL#), la etiqueta a la que se asocia (FUZZY ID) y los parmetros a que la denen (LABEL VALUE) siguiendo un cierto orden (ORDER#). DMFSQL FUNCTIONS : en esta tabla se dene la referencia de las funciones tanto que implementan a los distintos comparadores difusos de los atributos difusos de tipo 4, como las funciones de representacin de los o mismos. Dichas funciones vienen referenciados por el identicador del paquete (PKG#) y de la funcin dentro del mismo (FUN#). o DMFSQL FUNCTIONS COL: contiene la denicin para cada atributo o difuso tipo 4, prototipado, por la tabla a la que pertenece (OBJ#) y la columna (COL#), y para cada comparador difuso (FUZZY COMP) la funcin que se le asocia, encontrndose sta en el paquete (PKG#) o a e e identicndose de forma univoca (FUN#) dentro del citado paquete. a Los comparadores difusos posibles son los de la gura B.7. Tambin es e posible especicar, mediante esta tabla, la funcin de representacin que o o se quiere usar para el atributo difuso de tipo 4, es decir, como se quiere visualizar el mismo en las sentencias SELECT. Para ello, el campo con el comparador difuso (FUZZY COMP) debe tener el valor FSHOW. DMFSQL COL PAR: contiene la informacin de los parmetros adio a cionales para construir las llamadas a funciones que implica cada tipo difuso 4 respecto a cada comparador. Como se ha comentado, es tremendamente util para la reusabilidad de la codicacin de las funciones o ya implementadas en la FMB. As para un atributo difuso tipo 4 de, terminado (OBJ#, COL#) y para un comparador difuso que implica (PAR VALUE) y en el orden establecido (PAR#), el valor de los parmetros de PAR TYPE tendr valor C para un dominio de tipo a a carcter, N para numrico y D para fechas. a e

B.3.4.

Ampliacin de FIRST* para el Data Mining o

Tcnicas de Miner de Datos Denidas e a


Una vez implementado el Interfaz Difuso para Sistemas Relacionales para el manejo de mltiples tipos de datos (FIRST*), se ha obtenido la impleu mentacin de un modelo de BDRD sobre un SGBDR en el que el tratamiento o difuso de la diversidad de dominios susceptibles de ser tratados por un sistema de Miner de Datos est resuelto. a a Una vez solucionado el problema de gestionar la informacin, cualquiera o que sea un forma, se va proceder a implementar una interfaz que permite utilizar FIRST* como base a la aplicacin de distintas tcnicas de Miner de o e a

246

APENDICE B. EXTENSIONES AL MODELO DE BDR

Datos en el marco del modelo de BDRD ya implementado. Dicha interfaz se denominar DmFIRST y permite realizar las operaciones de [Car00, Car03b, a Car98, Car99]: Clustering: donde se propone una forma de obtencin de la matriz de o distancias de la poblacin. o Caracterizacin: incluye una tcnica que permite especicar el nivel de o e abstraccin al que se quiere describir los datos tal y como se consideraba o deseable en los sistemas de DM. Clasicacin difusa: donde se propone dos formas de obtener la clasio cacin difusa, basndose en los centroides obtenidos tras la caracterio a zacin o usando los vecinos ms cercanos. o a Dependencias difusas entre atributos: donde se propone un concepto de dependencias, llamadas dependencias globales difusas que constituye el marco comn que integra tanto las dependencias difusas como las u dependencias graduales difusas.

B.3.5.

Base de Metaconocimiento Difuso para Miner de Datos a (DMFMB)

Los problemas que producidos al utilizar estos los servidores de FSQL cuando se realizan tareas de DM no se pueden resolver con el uso de sentencias simples en mayor de los casos (y en ultima instancia de SQL). Es por esto a que se introduce un nuevo esquema, dmFIRST que va ha denir un nuevo tipo de objeto que no existe ni en FSQL ni en SQL que se denomina proyecto y que tiene como misin: o Servir de soporte para guardar las condiciones iniciales, resultados intermedios y nales del proceso de DM a realizar. Englobar lgicamente una serie de resultados intermedios, en forma de o tablas, en dicho proceso de DM. Estos resultados intermedios estarn a encaminados a agilizar el proceso de DM iterativo ya que el tener estos datos precalculados har que ante determinados renamientos de los a requerimientos del proceso de DM, la respuesta del sistema sea ms o a menos inmediata. La base de Metaconocimiento dmMB queda formada ahora por la FMB completa de FIRST y unas nuevas estructuras relacionales que posibilitan el tratamiento del objeto proyecto comentado (ver gura B.9):

B.3. MINER DE DATOS EN EL MODELO DE BDRD IA


DMFSQ L_PROYECT

247

DMFSQL _COL _LIST PROYECT _NAME : COL _TYPE : COL #: WEIGHT_ CLU : FUZZY_COMP_ CLU : LOG_ OPER _CLU : ABSTRACTION_LEVEL_ FUZZY_COMP_ CEN : LOG_ OPER _CEN : FUZZY_COMP_ CLA : LOG_ OPER _CLA : WEIGHT_ CLA : FUZZY_COMP_ FGK: THOLD _FGD: VARCHAR2 (50)( FK) VARCHAR2 (1) NUMBER NUMBER(10,9) VARCHAR2 (5) VARCHAR2 (3) CEN : VARCHAR2 (1) VARCHAR2 (5) VARCHAR2 (5) VARCHAR2 (5) VARCHAR2 (5) NUMBER(10,9) VARCHAR2 (5) NUMBER(3,2)

PROYECT _NAME : VARCHAR2 (50) OWNER#: VARCHAR2 (30) OBJ#: NUMBER STATUS_ CLUS : VARCHAR2 (1) NUM _CLUS : NUMBER(4) NUM _REG_TAB: NUMBER(8) NUM _REG_LEVEL: NUMBER(4) NUM _LEVEL_ OPT1 _VILA _H3: NUMBER(4) NUM _LEVEL_OPT_ VILA _ABS: NUMBER(4) NUM _LEVEL_ OPT3 _MED : NUMBER(4) OBJ#_TAB_ CLUS : NUMBER OBJ#_TAB_ CEN : NUMBER STATUS_ FGD: VARCHAR2 (1) THOLD _ANT_ FDG: NUMBER(3,2) THOLD _CON_ FGD: NUMBER(3,2) CONFIDENCE_ FGD: NUMBER(3,2) SUPORT _FGD: NUMBER(3,2) DEF _TABLE_SPACE: VARCHAR2 (500) TRACE_LEVEL: NUM ER(1) PATH_TRACE_FILE: VARCHAR2 (150) NAME_TRACE_FILE: VARCHAR2 (50)

Figura B.9: Estructura relacional de la DmFMB

DMFSQL PROJECT : contiene la informacin general sobre los proyeco tos de DM. Se identica de forma un voca el proyecto y se da un identicativo al propietario. Se establece la tabla de origen de datos (OBJ#) y el estado actual del proceso de clustering especicado en la tabla 9, si el estado es C, entonces se especican el nmero de clusters obtenidos tras u a el proceso (NUM CLUS). STATUS CLUS contendr valor es C se trata de un tipo carcter, si es N de tipo numrico y si es D de tipo fecha. a e u NUM REG TAB, indica el nmero de las en la tabla id tabla orig proyecto, NUM REG LEVEL indica el numero de posibles alfa-cortes que se pueden hacer dentro del dendograma. Los atributos (NUM LEVELopt1 vila h3), (NUM LEVEL opt2 vila abs), (NUM LEVEL opt3 med) almacenan el nivel del dendograma al que se obtiene una particin ptio o ma basado en H3, absoluta y media. Se almacenar un identicativo de a la ultima tabla generada con una particin en concreto de la poblacin o o dentro del proceso de clustering en el atributo OBJ# TAB CLUS, y un identicativo de la ultima tabla de centroides generada, que caracterizan a los distintos grupos existentes en la tabla anterior en OBJ# TAB CEN. STATUS FGD es el estado del proceso de obtencin de DGDs, si su valo or es C se trata de un tipo carcter, si es N de tipo numrico y si a e es D de tipo fecha. THOLD ANT FGD y THOLD CON FGD son los umbrales alfa y beta. CONFIDENCE FGD la conanza obtenida de la

248

APENDICE B. EXTENSIONES AL MODELO DE BDR DGD y el soporte estar en SUPPORT FGD. En DEF TABLE SPACE a estn las especicaciones f a sicas para el almacenamiento de las distintas tablas que se generen como resultado de la ejecucin del proyecto. o TRACE LEVEL, PATH TRACE FILE, NAME TRACE FILE: son de uso interno del servidor para gestionar trazas de ejecucin que tienen coo mo objeto devolver resultados intermedios a aplicaciones cliente, depuracin de errores, etc. o DMFSQL COL LIST : contiene la informacin sobre las distintas columo nas trascendentes para el proceso de DM de la tabla con el origen de datos del proyecto (ID TABLA ORIG PROYECTO). Se identica de manera unica el proyecto de DM con (PROYECT NAME). El atributo (COL TYPE) indica el tipo de procesamiento de DM para la columna (COL#), si su valor es C se trata de Clasicacin, clustering o caraco terizacin, si es A su dominio es el antecedente dentro del mbito de las o a DGDs y si es Q se trata del consecuente dentro del mbito de las DGDs. a En (WEIGHT CLU) se almacena el peso por el que se pondera la columna para clustering. FUZZY COM CLU es el comparador difuso de igualdad (FEQ o NFEQ) que se le va a aplicar a la columna para la obtencin o de la matriz de distancias en el proceso de clustering. En el caso de que el comparador difuso no sea simtrico, se indica en LOG OPER CLU el e operador lgico que se va a usar para obtener una comparacin simtrica o o e dentro del proceso de clustering. (puede ser AND si se quiere usar una T-norma u OR si se quiere usar una t-conorma). FUZZY COM CEN y LOG OPER CEN se usan igual que en el caso anterior, para el clculo de a centroides. FUZZY COM CLA y LOG OPER CLA se utilizan para el proceso de clasicacin y WEIGHT CLA almacena el peso por el que se o pondera la columna para clasicacin. FUZZY COMP FGD es el como parador difuso de la Tabla 7 que se le va a aplicar a la columna para la obtencin de la DGD donde los umbrales alfa y beta se almacenarn en o a THOLD FGD para cada columna del antecedente y consecuente.

Toda la Base de metaconocimiento que permite la utilizacin de tcnicas o e de DM, se encuentra representada en la gura B.10.

B.3.6.

Sintaxis Extendida para Operaciones de DM: DMFSQL

FSQL como se ha mencionado con anterioridad no cumple los requisitos m nimos para ser considerado un lenguaje propiamente de DM. Con objeto de solucionar este hecho, se ha extendido FSQL, crendose el dmFSQL que a resuelve las tareas de DM.

B.3. MINER DE DATOS EN EL MODELO DE BDRD IA


DMFSQL _LOG SESSIONID : NUMBER INDICE : NUMBER(10) LINEA : VARCHAR2 (2000) DMFSQ L_PROYECT

249

FUZZY_OBJECT_LIST OBJ #: NUMBER( FK) COL #: NUMBER( FK) FUZZY_ID : NUMBER(3) FUZZY_NAME: VARCHAR2 (30) FUZZY_TYPE: NUMBER(1)

DMFSQL _LABEL_DEFINITION OBJ #: NUMBER( FK) COL #: NUMBER( FK) FUZZY_ID : NUMBER(3)( FK) ORDER# : NUMBER(2) ( FK) LABEL_VALUE: VARCHAR2 (2000)

FUZZY_ COL _LIST OBJ #: NUMBER COL #: NUMBER F_TYPE: NUMBER(1) LEN: NUMBER COM : VARCHAR (100)

DMFSQL _COL _COL OBJ #: NUMBER( FK) COL #: NUMBER( FK) ORDER# : NUMBER(2) COL2 #: NUMBER

PROYECT _NAME : VARCHAR2 (50) OWNER#: VARCHAR2 (30) OBJ#: NUMBER STATUS_ CLUS : VARCHAR2 (1) NUM _CLUS : NUMBER(4) NUM _REG_TAB: NUMBER(8) NUM _REG_LEVEL: NUMBER(4) NUM _LEVEL_ OPT1 _VILA _H3: NUMBER(4) NUM _LEVEL_OPT_ VILA _ABS: NUMBER(4) NUM _LEVEL_ OPT3 _MED : NUMBER(4) OBJ#_TAB_ CLUS : NUMBER OBJ#_TAB_ CEN : NUMBER STATUS_ FGD: VARCHAR2 (1) THOLD _ANT_ FDG: NUMBER(3,2) THOLD _CON_ FGD: NUMBER(3,2) CONFIDENCE_ FGD: NUMBER(3,2) SUPORT _FGD: NUMBER(3,2) DEF _TABLE_SPACE: VARCHAR2 (500) TRACE_LEVEL: NUM ER(1) PATH_TRACE_FILE: VARCHAR2 (150) NAME_TRACE_FILE: VARCHAR2 (50)

DMFSQL _FUNCTIONS_ COL OBJ #: NUMBER( FK) COL #: NUMBER( FK) FUZZY_COMP : VARCHAR2 (5) PKG #: NUMBER( FK) FUN#: VARCHAR2 (100)( FK)

DMFSQL _COL _PAR OBJ #: NUMBER( FK) COL #: NUMBER( FK) FUZZY_COMP : VARCHAR2 (5)( FK) PAR# : NUMBER(2) PAR_VALUE: VARCHAR2 (2000) PAR_TYPE: VARCHAR2 (1)

DMFSQL _COL _LIST PROYECT _NAME : COL _TYPE : COL #: WEIGHT_ CLU : FUZZY_COMP_ CLU : LOG_ OPER _CLU : ABSTRACTION_LEVEL_ FUZZY_COMP_ CEN : LOG_ OPER _CEN : FUZZY_COMP_ CLA : LOG_ OPER _CLA : WEIGHT_ CLA : FUZZY_COMP_ FGK: THOLD _FGD: VARCHAR2 (50)( FK) VARCHAR2 (1) NUMBER NUMBER(10,9) VARCHAR2 (5) VARCHAR2 (3) CEN : VARCHAR2 (1) VARCHAR2 (5) VARCHAR2 (5) VARCHAR2 (5) VARCHAR2 (5) NUMBER(10,9) VARCHAR2 (5) NUMBER(3,2)

DMFSQL _FUNCTIONS FUN# : VARCHAR2 (100) PKG #: NUMBER

Figura B.10: Estructura relacional de la Base de Metaconocimiento para el DM

Este lenguaje consta de las siguientes partes: El DDL de DmFSQL permitir la consulta y la modicacin de las estructuras en las que se almacenan a o los datos, y va a consiste en las operaciones sobre el proyecto que se muestran en la tabla B.5. El DML de DmFSQL permite la consulta y la modicacin de o los datos almacenados en la base de datos. Bsicamente consiste en extender a e el comando SELECT MINING para que pueda utilizar las distintas tcnicas de DM, que se ven en la tabla B.5. La descripcin completa de la sintaxis o ntegra de estas sentencias puede verse en [Car03a, Car03b].

250

APENDICE B. EXTENSIONES AL MODELO DE BDR

Tipo DDL DDL DDL DDL DDL

DML DML DML

de DMFSQL Descripcin o Crea un nuevo proyecto Modica un proyecto Borra un proyecto Da permiso para la gestin de o un proyecto a un usuario REVOKE MINING Elimina los permisos previamente concedidos para la gestin de un proyecto a un o usuario CLUSTERING Para el proceso de clustering y caracterizacin o CLASIFICATION Para el proceso de clasicacin o FGLOBAL DEPENDENCIES Para la obtencin de depeno dencias globales difusas entre atributos

Tabla B.5: Resumen Sentencia CREATE MINING ALTER MINING DROP MINING GRANT MINING

Apndice C e

Base de Datos de Suelos


C.1. Descripcin del Esquema de la Base de Datos o

La base de datos de suelos describe la informacin acerca de las caraco ter sticas que tienen los suelos recopilada a travs de encuestas realizadas e a agricultores. Esta Base de Datos ha sido desarrollada gracias al proyecto Fuzzy-KIM, un Sistema de Miner de Datos con Ayuda Inteligente basaa do en Tcnicas de Soft-Computing (Plan Nacional I+D), cuya referencia es e CICYT TIC2002-04021-C02-02, llevado a cabo en entre los aos 2002-2005 y n nanciado por el Ministerio de Ciencia y Tecnolog a. La base de datos de suelos, tiene como particularidad que la mayor de a los datos que la componen son de carcter difuso, es decir, los valores de los a diferentes campos, son descritos dependiendo de su contenido, con etiquetas ling usticas o valores discretos sobre un referencial no ordenado. Al realizar la base de datos con este tipo de datos se ha facilitado la tarea de realizar la encuesta al encuestado, dado que este tipo de informacin conere exibilidad o a la hora rellenar datos en el formulario.

C.1.1.

Descripcin de Clases o

A continuacin se describe el diseo conceptual de la BD de suelos. Para o n realizar este diseo se ha utilizado un diagrama de clases de UML, mostrado n en la gura es C.1. Las clases principales de que est compuesta esta BD y a la informacin que representa est descrita a continuacin y en la tabla C.1 o a o donde se especica con ms detalle el contenido semntico de algunos de los a a atributos de esta BD: Localizacin: Describe el lugar exacto del suelo del que se trate y las o caracter sticas propias del suelo en esta localizacin. Los atributos se o 251

252

APENDICE C. BASE DE DATOS DE SUELOS

Localizacin Estructura Codigo_es: numeric Tipo_es:TD3 Clase_es:TD3 Grado_es:TD3 Vegetacion:TD3 Material: TD3 Grado_De: TD3 latitud: numeric longitud : numeric orientacion :TD3 fisiografia :TD3 pendiente:TD3 altitud:TD2 altitud_gr: numeric profundidad:TD2 profundidad_gr:numeric Tmedia:TD2 Tmedia_gr: numeric Pmedia:TD2 Pmedia_gr numeric : Fao:TD3 Fao_Reduc:TD3 Identificacion Cod_Perf: numeric Cod_ecol:numric Cod_hori: numeric

Analiticos codigo_a:numeric Arena: TD2 Arena_gr numeric : Arcilla:TD2 Arcilla_gr: numeric Co:TD2 Co_gr: numeric PH: TD2 PH_gr numeric : Fe: TD2 Fe_gr: numeric Agua_UTITD2 : Agua_gr numeric : CEC:TD2 CEC_gr: numeric Humedad Hue_hume:TD3 value_huTD3 : croma_hu :TD3

Bibliografa Color Codigo_color: Autonumrico biblio:Cadena deTexto autores:cadena de Texto

Seco value_SE:TD3 croma_SE: TD3 hue_SE:TD3

Figura C.1: Diagrama de Clases de la BD de Suelos

encuentran descritos en la tabla C.2. Estructura: Describe las caracter sticas generales de la estructura del suelo. La descripcin de las caracter o stica est en la tabla C.3. a Anal ticos: Describen las caracter sticas anal ticas o composicin del sueo lo. La descripcin de los atributos de esta clase se encuentra en la tabla o C.4. Identicacin: Describe los cdigos de identicacin ecolgicos, de perl o o o o y horizonte relacionados con los suelos. Las propiedades se describen en la tabla C.5. Bibliograf Describe las fuentes que realizaron las encuestas. La coma: posicin de esta clase se describe en la tabla C.6. o Color : Describe el color que tiene el suelo. Las propiedades de esta clase y de sus subclase estn descritas en la tabla C.7. a

C.1. DESCRIPCION DEL ESQUEMA DE LA BASE DE DATOS Humedad : Describe el color que tiene el suelo cundo est hmedo. a a u Seco: Describe el color que tiene el suelo cundo est seco. a a

253

C.1.2.

Paso a Tablas: Modelo Relacional

A partir del diagrama en UML de la gura C.1 obtenemos la siguiente descripcin de tablas del modelo relacional extendido que soporta datos difuo sos. Esta descripcin se representa utilizando los tipos de datos y estructuras o del lenguaje SQL para especicar los tipos de datos y restricciones que hay denidos sobre los datos clsicos, y FSQL para los difusos. a Estructura ( Codigo_es NUMERIC PRIMARY KEY, Tipo_es FTYPE3(1), Clase_es FTYPE3(1), Grado_es FTYPE3(1), Vegetacion FTYPE3(1), Material FTYPE3(1), Grado_de FTYPE3(1), ) Analticos ( Codigo_a NUMERIC PRIMARY KEY, Arena FYTPE2 (10,40) FLOAT (2), Arena_gr NUMERIC(4,2), Arcilla FYTPE2 (5,50) FLOAT (2), Arcilla_gr NUMERIC(4,2), Co FYTPE2 (5,20) FLOAT (2), Co_gr NUMERIC(4,2), PH FYTPE2 (1,10) FLOAT (2), PH_gr NUMERIC(4,2), Fe FYTPE2 (0.5, 2) FLOAT (2), Fe_gr NUMERIC(4,2), Agua FYTPE2 (0.5, 2) FLOAT (2), Agua_gr NUMERIC(4,2), CEC FYTPE2 (5, 20) FLOAT (2), CEC_gr NUMERIC(4,2), ) Identificacin ( o

254

APENDICE C. BASE DE DATOS DE SUELOS cod_perf NUMERIC, cod_ecol VARCHAR(2), cod_hori NUMERIC, PRIMARY KEY (cod_perf,col_ecol,cod_hori))

Bibliografa ( biblio VARCHAR(14), autor VARCHAR(8), PRIMARY KEY (biblio, autor) ) Color ( Codigo_c NUMERIC PRIMARY KEY, hue_hume FTYPE3(1), value_hu FTYPE3(1), croma_hu FTYPE3(1), hue_se FTYPE3(1), value_se FTYPE3(1), croma_se FTYPE3(1)) Localizacin ( o latitud NUMERIC NOT NULL, longitud NUMERIC NOT NULL, orientacin FTYPE3(1) , o fisiografa FTYPE3(1) ONLY LABEL, pendiente FTYPE2(5,20) FLOAT (2) ONLY LABEL, altitud FYTPE2 (0.5, 2) FLOAT (2) , altitud_gr NUMERIC(4,2), profundidad FYTPE2 (0.5, 2) FLOAT (2), profundidad_gr NUMERIC(4,2), Tmedia FYTPE2 (4, 10) FLOAT (2) NOT UNKNOWN NOT UNDEFINED, Tmedia_gr NUMERIC(4,2), Pmedia FYTPE2 (0.5, 2) FLOAT (2), Pmedia_gr NUMERIC(4,2), Fao FTYPE3(1), tipo_hori FTYPE(3), Fao_reduc FTYPE3(1), codigo_es REFERENCES estructura(codigo_es), codigo_a REFERENCES analiticos(codigo_a), codigo_c REFERENCES color(codigo_color),

C.1. DESCRIPCION DEL ESQUEMA DE LA BASE DE DATOS

255

biblio VARCHAR(14), autor VARCHAR(8), cod_perf NUMERIC, cod_ecol VARCHAR(2), cod_hori NUMERIC, PRIMARY KEY (latitud,longitud) FOREIGN KEY (bib lio,autor) REFERENCES Bibliografa(biblio,autor), FOREIGN KEY (cod_perf,cod_ecol,cod_hori) REFERENCES Identificacion(cod_perf,cod_ecol,cod_hori))

Dado que se tratan como claves ajenas en la tabla Localizacin todos los o atributos de las tablas Bibliograf e Identicacin, estas tablas se suprimia o rn de la denicin de la BD. De esta manera tambin se eliminarn de la a o e a denicin de la estructura Localizacin todas las referencias a dichas tablas, o o es decir las claves ajenas a Bibliograf y a Identicacin. a o

C.1.3.

Etiquetas Ling usticas para los TD2

En esta base de datos se han transformado los atributos numricos, nore malmente identicados en la BD por el nombre del atributo seguido de gr, por otros atributos de carcter difuso con el mismo nombre pero sin dicha a extensin. Estos atributos estn denidos bajo un referencial ordenado pero o a los valores que van a contener estarn formados fundamentalmente por etia quetas ling usticas cuyos valores se muestran en las tablas que se describen a continuacin. o Los atributos de la tabla Analiticos, denen sus etiquetas ling usticas dependiendo del atributo en las siguientes tablas: Arena est descrita en la tabla a C.13, Arcilla en la C.14, Co en la C.15, Carbonat en la C.16, Ph en la C.17, Agua Uti en la C.18, Fe en la C.19, CEC en la C.20. Con respecto a la tabla Localizacin encontramos los atributos: PMedia descrita en la C.8, Tmedia o en la C.9, Altitud en la C.10, Profundi en la C.11, pendiente en la C.12. Por ultimo el atributo Clase es en la C.21 en Estructura.

256

APENDICE C. BASE DE DATOS DE SUELOS

Tabla C.1: Atributos de la base de datos de color de suelos, agrupados de acuerdo a su semntica a
Grupo semntico a Estaciones ambientales Atributo Mesoambiente Comentarios Son combinaciones multidimensionales de factores ambientales que denen espacios ms o a menos homogneos de inuencia en el desarroe llo posterior del suelo. A los factores ambientales se les ha denominado factores formadores del suelo. Los factores formadores no forman parte del individuo suelo y no son partes o componentes de su estructura. Son factores ambientales generales, susceptibles de ser medidos, que act an u como agentes causales de los procesos edafogenticos que conducen al desarrollo del suelo. e

Factores formadores

Altitud

Horizontes

Precipitacin media o anual Temperatura media anual Material original Tipo de horizonte

Componentes

% Arena

Expresan las caracter sticas de zonas homogneas dentro del suelo y son resultado nal e de una serie de procesos edafogenticos y de la e actuacin de los agentes (factores) formadores. o Los componentes y propiedades son caracter sticas, morfolgicas o anal o ticas, susceptibles de ser medidas o descritas en cada horizonte; pueden actuar como diagnsticos o del mismo. En el aspecto de la gnesis, las e propiedades son consecuencia de los componentes.

% Arcilla % Carbono orgnico a Propiedades % Hierro libre Value Chroma Hue

C.1. DESCRIPCION DEL ESQUEMA DE LA BASE DE DATOS

257

Tabla C.2: Descripcin de las propiedades la clase Localizacin o o


Atributo latitud longitud orientacin o siograf a pendiente altitud altitud gr profundidad profundidad gr Tmedia Tmedia gr Pmedia Pmedia gr Tipo hori FAO Red Tipo Numrico(11) e Numrico(11) e Categrico o Categrico o Numrico(FDT2) e Numrico e (FDT21 ) Numrico(4,2) e Numrico (FDT2) e Numrico(4,2) e Numrico (FDT2) e Numrico(4,2) e Numrico (FDT2) e Numrico(4,2) e Categrico o Categrico o Descripcin o Posicin geogrca o a Posicin geogrca o a Orientacin del lugar (NSEO) o Fisiograf del lugar (ladera, llano, etc.) a Tipo de pendiente (llano, de escaln, en cueso ta,etc.) Altitud del terreno en valor difuso Altitud del terreno en valor preciso medio Profundidad media efectiva del terreno en valor difuso Profundidad media efectiva del terreno en valor precio Temperatura media anual del lugar en valor difuso Temperatura media anual del lugar en valor preciso Precipitacin media anual del lugar en valor difuso o Precipitacin media anual del lugar en valor preo ciso Tipo de horizonte Descriptores del suelo de la FAO pero reducido el no de variables tras la aplicacin de un proceso o

Tabla C.3: Descripcin de las propiedades de la clase Estructura o


Atributo Codigo es Tipo es Clase es Grado es Vegetacin o Material Grado de Tipo Numrico e Categrico o Numrico (FDT2) e Categrico o Categrico o Categrico o Categrico o Descripcin o Cdigo autonumrico de la tabla o e Tipo de estructura de suelo(granular, migajosa, etc.) Clase de estructura de suelo (na, media, compacta,etc.) Grado de la estructura (frgil, fuerte, etc.) a Tipo de Vegetacin del suelo (bosque, cultivo, reo gad o,etc.) Tipo de material Original del suelo (cido , calcreo, a a roca, etc.) Grado de Erosin del suelo o

258

APENDICE C. BASE DE DATOS DE SUELOS

Tabla C.4: Descripcin de las propiedades de la clase Anal o ticos


Atributo Codigo a Arena Arena gr Arcilla Arcilla gr Co Co gr PH PH gr Fe Fe gr Agua Agua gr CEC CEC gr Tipo Numrico e Numrico (FDT2) e Numrico(4,2) e Numrico (FDT2) e Numrico(4,2) e Numrico (FDT2) e Numrico(4,2) e Numrico (FDT2) e Numrico(4,2) e Numrico (FDT2) e Numrico(4,2) e Numrico (FDT2) e Numrico(4,2) e Numrico (FDT2) e Numrico(4,2) e Descripcin o Cdigo autonumrico de la tabla o e Cantidad de Arena del suelo en valor difuso Porcentaje de Arcilla del suelo en valor preciso Cantidad de Arcilla del suelo en valor difuso Porcentaje de Arena del suelo en valor preciso Cantidad de Carbono Orgnico del suelo en valor dia fuso Porcentaje de Carbono Orgnico del suelo en valor a preciso Cantidad de PH del suelo en valor difuso Porcentaje de PH del suelo en valor preciso Cantidad de Hierro Total del suelo en valor difuso Porcentaje de Hierro Total del suelo en valor preciso Cantidad de Agua Util del suelo en valor difuso Porcentaje de Agua Util del suelo en valor preciso Cantidad de CEC del suelo en valor difuso Porcentaje de CEC del suelo en valor preciso

Tabla C.5: Descripcin de las propiedades de la clase Identicacin o o


Atributo Cod ecol Cod per Cod hori Tipo Numrico e Numrico e Numrico e Descripcin o Cdigo ecolgico o o Cdigo de Perl o Cdigo de horizonte o

Tabla C.6: Descripcin de las propiedades de la clase Bibliograf o a


Atributo biblio autores Tipo Cadena(14) Cadena(8) Descripcin o Identicador del lugar donde se encuentra el lugar de la encuesta Identicador del encuestador

Tabla C.7: Descripcin de las propiedades de la clase Color y sus subclases o


Atributo Codigo Color hue hume value hu croma hu value se croma se hue se Clase Color H medo u H medo u H medo u Seco Seco Seco Tipo Numrico e Categrico o Categrico o Categrico o Categrico o Categrico o Categrico o Descripcin o Identicador del Registro Valor del Hue del Color en entorno h medo u Valor del color de suelo en entorno h medo u Valor del cromado del suelo en entorno h meu do Valor del color de suelo en entorno seco Valor del cromado del suelo en entorno seco Valor del Hue del Color en entorno seco

C.1. DESCRIPCION DEL ESQUEMA DE LA BASE DE DATOS

259

Tabla C.8: Etiquetas ling usticas (Atributo PMEDIA)


Etiqueta Baja Media Alta 183 490 818 183 664 905 315 731 1287 490 818 1287

Tabla C.9: Etiquetas ling usticas (Atributo TMEDIA)


Etiqueta Baja Media Alta 0 8.5 14.7 0 10.5 16.9 6.5 12.5 21.0 8.5 14.7 21.0

Tabla C.10: Etiquetas ling usticas (Atributo ALTITUD)


Etiqueta Baja Media Alta 65 860 1700 65 1341 1940 380 1460 3020 860 1700 3020

Tabla C.11: Etiquetas ling usticas (Atributo PROFUNDI)


Etiqueta Baja Media Alta 2 17 37 2 22 45 12 28 66 17 37 66

Tabla C.12: Etiquetas ling usticas (Atributo PENDIENT)


Etiqueta Flat Gently sloping Sloping Strongly sloping Moderately steep Steep Very steep 0 2 5 10 15 30 60 0 3 6 11 16 31 61 1 4 9 14 29 59 100 2 5 10 15 30 60 100

Tabla C.13: Etiquetas ling usticas (Atributo ARENA)


Etiqueta Baja Media Alta 0.4 30.6 56.4 0.4 40.0 63.9 21.2 48.9 91 30.6 56.4 91

260

APENDICE C. BASE DE DATOS DE SUELOS Tabla C.14: Etiquetas ling usticas (Atributo ARCILLA)
Etiqueta Baja Media Alta 1.31 15.0 33.1 1.31 20.0 40.1 10.0 26.0 69.5 15.0 33.1 69.5

Tabla C.15: Etiquetas ling usticas (Atributo CO)


Etiqueta Baja Media Alta 0 0.57 1.94 0 0.77 2.48 0.37 1.40 19.5 0.57 1.94 19.5

Tabla C.16: Etiquetas ling usticas (Atributo CARBONAT)


Etiqueta Baja Media Alta 0.00 15.75 46.4 0.00 23.3 61.8 8.2 31.0 85.60 15.75 46.4 85.60

C.1.4.

Relaciones de Similitud de los TD3

En cuanto a las variables de Tipo Difuso 3, se han de denir las etiquetas que forman cada una de ellas y la relacin que existe entre dichas etiquetas o mediante tablas de similitud. A continuacin se describe dicha informacin. o o As tendremos en la tabla Estructura: Tipo Es descrita en las tablas en la C.38 y C.39, Grado es en la C.40, Vegetacion en la y C.28, Material en la C.29 y C.30, y Grado de en la C.31. En la tabla Color encontramos: hue hume descrito en la tabla C.32, value hu en la C.33, croma hu en la C.34, hue se en la C.35, value se en la C.36 y croma se en la C.37. Por ultimo en la tabla Localizacin: Orientacin esta descrita en la tabla C.25, siograf en la C.26, o o a tipo hori en la C.24 y fao reduc en las tablas C.22 y C.23

C.1. DESCRIPCION DEL ESQUEMA DE LA BASE DE DATOS

261

Tabla C.17: Etiquetas ling usticas (Atributo PH)


Etiqueta Baja Media Alta 0.37 6.35 7.85 0.37 7.10 8.20 5.60 7.50 8.90 6.35 7.85 8.90

Tabla C.18: Etiquetas ling usticas (Atributo AGUA)


Etiqueta Baja Media Alta 0.06 1.1 2.0 0.06 1.40 2.30 0.8 1.70 8.6 1.1 2.0 8.6

Tabla C.19: Etiquetas ling usticas (Atributo FE)


Etiqueta Baja Media Alta 0.0 1.25 2.9 0.0 1.60 3.7 0.9 2.1 5.70 1.25 2.9 5.70

Tabla C.20: Etiquetas ling usticas (Atributo CEC)


Etiqueta Baja Media Alta 0.26 9.01 25.11 0.26 11.48 33.0 6.54 17.21 53.20 9.01 25.11 53.20

Tabla C.21: Etiquetas ling usticas (Atributo CLASE ES)


Etiqueta Very ne Fine Medium Coarse Very coarse 0 1.0 2.0 5.0 10.0 0 1.25 2.25 5.25 10.25 0.75 1.75 4.75 9.75 20.0 1.0 2.0 5.0 10.0 20.0

262

APENDICE C. BASE DE DATOS DE SUELOS

Tabla C.22: Relaciones de similitud (Atributo FAOREDUC)


F AOREDU C 1 2 3 4 5 6 7 8 9 10 11 12 2 0.3 3 0.3 0.3 4 0.5 0.3 0.3 5 0.3 0.3 0.5 0.3 6 0.3 0.3 0.3 0.3 0.3 7 0.3 0.3 0.3 0.3 0.3 0.3 8 0.3 0.3 0.5 0.3 0.5 0.3 0.3 9 0.5 0.3 0.3 0.5 0.3 0.3 0.3 0.3 10 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 11 0.5 0.3 0.3 0.5 0.3 0.3 0.3 0.3 0.5 0.3 12 0.3 0.5 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 13 0.5 0.3 0.3 0.5 0.3 0.3 0.3 0.3 0.5 0.3 0.5 0.3

Tabla C.23: Cdigos para el atributo FAOREDUC o


Valor Arenosol Cambisol Chernozems Fluvisol Kastanozems Litosol Luvisol Phaeozems Regosol Rendzina Solonchack Xerosol Yermosol clave 1 2 3 4 5 6 7 8 9 10 11 12 13

Tabla C.24: Relaciones de similitud (Atributo TIPO HOR)


T IP O HOR A Ah Ap Bk Bt Btk Bw Bwk C Ah 0.3 Ap 0.3 0.3 Bk 0.3 0.3 0.3 Bt 0.3 0.3 0.3 0.3 Btk 0.3 0.3 0.3 0.3 0.3 Bw 0.3 0.3 0.3 0.3 0.3 0.3 Bwk 0.3 0.3 0.3 0.3 0.3 0.3 0.3 C 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 Ck 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3

C.1. DESCRIPCION DEL ESQUEMA DE LA BASE DE DATOS

263

Tabla C.25: Relaciones de similitud (Atributo ORIENTAC)


ORIEN T AC N NE E SE S SW W NE 0.4 E 0.4 0.4 SE 0.4 0.4 0.4 S 0.4 0.4 0.4 0.4 SW 0.4 0.4 0.4 0.4 0.4 W 0.4 0.4 0.4 0.4 0.4 0.4 NW 0.4 0.4 0.4 0.4 0.4 0.4 0.4

Tabla C.26: Relaciones de similitud (Atributo FISIOGRA)


F ISIOGRA Llano F. lad. Ladera Cima Fondo ladera 0.5 Ladera 0.2 0.2 Cima 0.2 0.2 0.2 Meseta 0.2 0.2 0.2 0.5

Tabla C.27: Relaciones de similitud (Atributo VEGETACI)


V EGET ACI 1 2 3 4 5 6 7 2 0.5 3 0.5 0.5 4 0.2 0.2 0.2 5 0.2 0.2 0.2 0.5 6 0.2 0.2 0.2 0.5 0.5 7 0.2 0.2 0.2 0.5 0.5 0.5 8 0.2 0.2 0.2 0.5 0.5 0.5 0.5

Tabla C.28: Cdigos para el atributo VEGETACI o


Valor Bosque natural Bosque de repoblacin o Matorral alto Herbcea a Matorral bajo degradado Cultivo arbolado Cultivo herbceo a Regad o clave 1 2 3 4 5 6 7 8

264

APENDICE C. BASE DE DATOS DE SUELOS

Tabla C.29: Relaciones de similitud (Atributo MATERIAL)


M AT ERIAL 1 2 3 4 5 6 7 8 2 0.2 3 0.2 0.2 4 0.2 0.2 0.2 5 0.5 0.2 0.2 0.2 6 0.2 0.5 0.2 0.2 0.2 7 0.2 0.2 0.2 0.2 0.2 0.2 8 0.2 0.2 0.2 0.2 0.2 0.2 0.2 9 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0

C.1. DESCRIPCION DEL ESQUEMA DE LA BASE DE DATOS Tabla C.30: Cdigos para el atributo MATERIAL o
Valor Acido coluvial Acido aluvial Acido sobre mat. compacto Acido sobre mat. no compacto Calcreo coluvial a Calcreo aluvial a Calcreo sobre mat. compacto a Calcreo sobre mat. no compacto a Roca volcnica a clave 1 2 3 4 5 6 7 8 9

265

Tabla C.31: Relaciones de similitud (Atributo GRADO)


GRADO Slight Moderate Moderate 0.5 Severe 0.5 0.5

266

APENDICE C. BASE DE DATOS DE SUELOS Tabla C.32: Relaciones de similitud (Atributo HUE HUME)

HU E HU M E 10R 1.25YR 2.5YR 3.75YR 6.75YR 7.5YR 8.75YR 10YR 1.25Y 2.5Y 5Y

1.25YR 2.5YR 0.3 0.3 0.3

3.75YR 0.3 0.3 0.3

6.75YR 0.1 0.1 0.1 0.1

7.5YR 0.1 0.1 0.1 0.1 0.5

8.75YR 0.1 0.1 0.1 0.1 0.3 0.3

10YR 0.1 0.1 0.1 0.1 0.3 0.3 0.3

1.25Y 0.1 0.1 0.1 0.1 0.3 0.3 0.3 0.3

2.5Y 0.1 0.1 0.1 0.1 0.3 0.3 0.3 0.3 0.3

5Y 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1

10Y 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0

Tabla C.33: Relaciones de similitud (Atributo VALUE HU)


V ALU E HU 2 2.5 3 3.5 4 4.5 5 5.5 6 6.5 7 2.5 0.3 3 0.3 0.3 3.5 0.3 0.3 0.3 4 0.3 0.3 0.3 0.3 4.5 0.3 0.3 0.3 0.3 0.3 5 0.3 0.3 0.3 0.3 0.3 0.3 5.5 0.3 0.3 0.3 0.3 0.3 0.3 0.3 6 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 6.5 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 7 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 8 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2

C.1. DESCRIPCION DEL ESQUEMA DE LA BASE DE DATOS Tabla C.34: Relaciones de similitud (Atributo CROMA HU)
CROM A HU 0 0.5 1 1.5 2 2.5 3 3.5 4 5 6 7 0.5 0.3 1 0.3 0.3 1.5 0.3 0.3 0.3 2 0.3 0.3 0.3 0.3 2.5 0.3 0.3 0.3 0.3 0.3 3 0.3 0.3 0.3 0.3 0.3 0.3 3.5 0.3 0.3 0.3 0.3 0.3 0.3 0.3 4 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 5 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 6 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 7 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 8 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2

267

Tabla C.35: Relaciones de similitud (Atributo HUE SECO)


HU E SECO 10R 2.5YR 3.75YR 5YR 6.75YR 7.5YR 8.75YR 10YR 1.25Y 2.5Y 2.5YR 0.1 3.75YR 0.1 0.3 5YR 0.1 0.3 0.3 6.75YR 0.1 0.3 0.3 0.3 7.5YR 0.1 0.3 0.3 0.3 0.5 8.75YR 0.1 0.3 0.3 0.3 0.3 0.3 10YR 0.1 0.3 0.3 0.3 0.3 0.3 0.3 1.25Y 0.1 0.3 0.3 0.3 0.3 0.3 0.3 0.3 2.5Y 0.1 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 5Y 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1

268

APENDICE C. BASE DE DATOS DE SUELOS

Tabla C.36: Relaciones de similitud (Atributo VALUE SE)


V ALU E SE 3 4 4.5 5 5.5 6 6.5 7 7.5 8 4 0.2 4.5 0.2 0.3 5 0.2 0.3 0.3 5.5 0.2 0.3 0.3 0.3 6 0.2 0.3 0.3 0.3 0.3 6.5 0.2 0.3 0.3 0.3 0.3 0.3 7 0.2 0.3 0.3 0.3 0.3 0.3 0.3 7.5 0.2 0.3 0.3 0.3 0.3 0.3 0.3 0.3 8 0.2 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 8.5 0.2 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3

Tabla C.37: Relaciones de similitud (Atributo CROMA SE)


CROM A SE 0 1 1.5 2 2.5 3 3.5 4 4.5 5 6 7 7.5 1 0.3 1.5 0.3 0.5 2 0.3 0.5 0.5 2.5 0.3 0.5 0.5 0.5 3 0.3 0.5 0.5 0.5 0.5 3.5 0.3 0.5 0.5 0.5 0.5 0.5 4 0.3 0.5 0.5 0.5 0.5 0.5 0.5 4.5 0.3 0.5 0.5 0.5 0.5 0.5 0.5 0.5 5 0.3 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 6 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 7 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 7.5 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.5 8 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.5 0.5

Tabla C.38: Relaciones de similitud (Atributo TIPO ES) T IP O ES 2 3 4 5 6 7 8 9 1 0.4 0.4 0.4 0.4 0.2 0.2 0.2 0.2 2 0.4 0.4 0.4 0.2 0.2 0.2 0.2 3 0.4 0.4 0.2 0.2 0.2 0.2 4 0.4 0.2 0.2 0.2 0.2 5 0.2 0.2 0.2 0.2 6 0.2 0.2 0.2 0.2 0.2 7 8 0.2

C.1. DESCRIPCION DEL ESQUEMA DE LA BASE DE DATOS

269

Tabla C.39: Cdigos para el atributo TIPO ES o


Valor Granular Migajosa Subangular blocky Angular blocky Prismatic Platy Rock structure Massive Single grain clave 1 2 3 4 5 6 7 8 9

Tabla C.40: Relaciones de similitud (Atributo GRADO ES)


GRADO ES Very Weak Weak Moderate Weak 0.3 Moderate 0.3 0.3 Strong 0.3 0.3 0.3

270

APENDICE C. BASE DE DATOS DE SUELOS

C.2.

Cuerpo de la Base de Datos

En esta seccin se visualizan algunos de los datos que hay contenidos en la o BD Difusa de Suelos, que pueden ser utiles a la hora de ejemplicar cualquier implementacin desarrollada en esta tesis. A continuacin se muestra el cono o tenido de algunas de estas tablas. El contenido completo de la BD se adjunta en el archivo denominado bdfuzzy que se proporciona con la tesis en formado CD-ROM. Tabla C.41: Tabla Color, parte de su contenido
Codigo c 1 2 5 16 26 28 ... hue hume 10YR 10YR 2,5YR 7,5YR 10YR 10YR ... value hu 3.0 3.0 8 4 2 2 ... croma hu 1 1 0 0 0 0 ... hue se 10YR 10YR 2,5YR 7,5YR 10YR 10YR ... value se 5 5 7 6 3 4 ... croma se 1 1 2 4 3 1 ...

Tabla C.42: Tabla Estructura, parte de su contenido


codigo es 1 2 5 16 26 28 ... tipo es PLATY MIGAJOSA MASSIVE MASSIVE MIGAJOSA SINGLE GRAIN ... clas es FINE VERY FINE grado es WEAK WEAK vegetacion 5 5 5 5 3 5 ... material 3 3 7 7 3 1 ... grado de

MEDIUM ...

MODERATE ...

SLIGHT SEVERE MODERATE ...

C.2. CUERPO DE LA BASE DE DATOS Tabla C.43: Tabla Anal ticos, parte de su contenido
codigo a 1 2 5 16 26 28 ... arena alta alta baja alta alta alta ... arcilla baja baja media baja baja baja ... Co baja media baja baja alta baja ... PH baja baja alta baja baja baja ... Fe alta media alta alta media alta ... Agua media media alta media baja baja ... CEC baja baja baja baja media baja ...

271

Tabla C.44: Tabla Localizacin, parte de su contenido o


latitud longitud orientacin o siograf a pendiente altitud 41045 5478 SW LADERA STEEP baja 41135 5598 NW LADERA STEEP baja 4103 5705 NW LADERA GENTLY SLOPING baja 41082 5675 LLANO FLAT baja media 40963 5636 N LADERA STEEP media 41049 5578 LLANO FLAT baja ... ... ... ... ... ... ... profundidad Tmedia Pmedia Fao Reduc biblio autor ... media baja alta REGOSOL TABERNAS PEREZ ... baja baja alta REGOSOL TABERNAS PEREZ ... media baja alta XEROSOL TABERNAS PEREZ ... baja baja alta XEROSOL TABERNAS PEREZ ... media baja media REGOSOL TABERNAS PEREZ ... media baja alta FLUVISOL TABERNAS PEREZ ... ... ... ... ... ... ... ... codecol codhori codperf codigo es codigo a codigo c ... SE 1 1 1 1 1 ... SE 2 2 2 2 2 ... SE 5 3 5 5 5 ... SE 16 7 16 16 16 ... SE 26 10 26 26 26 ... SE 28 11 28 28 28 ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

272

APENDICE C. BASE DE DATOS DE SUELOS

Bibliograf a
[Ada80] [Aga05] J. M. Adamo. Fuzzy decision trees. Fuzzy Sets and Systems, 4:207219, 1980. P. Agarwal. Ontological considerations in giscience. International Journal of Geographical Information Science, 19(5):501 536(36), May 2005. Y. An, A. Borgida y John Mylopoulos. Rening semantic mappings from relational tables to ontologies. En Val Tannen Christoph Bussler y Irini Fundulaki, editores, Semantic Web and Databases, Second International Workshop, SWDB 2004 , tomo 3372, pginas 8490. Springer, 2004. a A. Ankolekar, M. Krtzsch, T. Tran y D. Vrandecic. The two o cultures: mashing up web 2.0 and the semantic web. En WWW 07: Proceedings of the 16th international conference on World Wide Web, pginas 825834. ACM, New York, NY, USA, 2007. a ISBN 978-1-59593-654-7. G. Antoniou y F. van Harmelen. Handbook on Ontologies in Information Systems, cap tulo Web Ontology Language: OWL, pginas 6792. Springer-Verlag, 2003. a A. S. Aparcio, O. L. M. Farias y N. dos Santos. Applying ontologies in the integration of heterogeneous relational databases. En AOW 05: Proceedings of the 2005 Australasian Ontology Workshop, pginas 1116. Australian Computer Society, Inc., a Darlinghurst, Australia, Australia, 2005. ISBN 1-920-68240-6. J. C. Arperez, O. Corcho, M. Fernandez-Lpez y A. Gmezo o Prez. Webode: a scalable workbench for ontological engineere ing. En K-CAP 01: Proceedings of the 1st international conference on Knowledge capture, pginas 613. ACM Press, New a York, NY, USA, 2001. ISBN 1-58113-380-4. 273

[An04]

[Ank07]

[Ant03]

[Apa05]

[Arp01]

274 [Ast04]

BIBLIOGRAF IA I. Astrova. Reverse engineering of relational databases to ontologies. En Proceedings of the 1st Europan Semantic Web Symposium (ESWS), LNCS , tomo 3053, pginas 327341. 2004. a I. Astrova. Towards the semantic web - an approach to reverse engineering of relational databases to ontologies. En Advances in Databases and Information Systems: 9th East-European Conference, ADBIS 2005 , pginas 111122. September 2005. a

[Ast05]

[atSUSoM06] Stanford Medical Informatics at the Stanford University School of Medicine. Protege. http://protege.stanford.edu/, January 2006. [Aue07] S. Auer. powl. a web based platform for collaborative semantic web development. http://powl.sourceforge.net/overview.php, 2007. D. Aumueller, H. Do, S. Massmann y E. Rahm. Schema and ontology matching with coma++. En SIGMOD 05: Proceedings of the 2005 ACM SIGMOD international conference on Management of data, pginas 906908. ACM Press, New York, a NY, USA, 2005. ISBN 1-59593-060-4. F. Baader, I. Horrocks y U. Sattler. Handbook on Ontologies, cap tulo Description Logics, pginas 128. Springer, 2004. a D. Bui Bach. Import/Export of OWL Ontologies into/from DOGMA. Master of computer science, Vjire Universiteit Brussel. Faculty of Science. Departament of Computer Science. Semantic Technology and Applications Lab, 2006-2007. J. F. Baldwin y N. C. F. Guild. Comparison of fuzzy sets on the same decision space. Fuzzy Sets and Systems, 2:213233, 1979. J. F. Baldwin y S. Q. Zhou. A fuzzy relational inference language. Fuzzy Sets and Systems, (14):155174, 1984. J. Barrasa, O. Corcho y A. G. . Perez. Fund nder: A case study of database to ontology mapping. En In International Semantic Web Conference, number 2870 in Lecture Notes in Computer science,, pginas 1722. Springer-Verlag., 2003. a

[Aum05]

[Baa04]

[Bac07]

[Bal79]

[Bal84]

[Bar03]

BIBLIOGRAF IA [Bas77]

275

S. M. Bass y H. Kwakernaak. Rating and ranking of multipleaspect alternatives using fuzzy sets. Automatica, 13:4758, 1977. S. Bechhofer, F. van Harmelen, J. Hendler, I. Horrocks, D. L. Mcguinness, P. F. Patel-Schneider y L. A. Stein. Owl web ontology language reference. Informe tcnico, W3C. e S. Bechhofer. Api for owl http://owl.man.ac.uk/api/readme.html, 2007. ontologies.

[Bec]

[Bec07a] [Bec07b] [Bec07c] [Ben06]

S. Bechhofer y G.Ng. Oiled. http://oiled.man.ac.uk/, April 2007. S. Bechhofer y R. Volz. Wonderweb owl ontology validator. http://www.mygrid.org/OWL/Validator, 2007. S. M. Benslimane, D. Benslimane, M. Malki, Y. Amghar y H. Saliah. Acquiring OWL ontologies from data-intensive web sites. En ACM, editor, The Sixth International Conference on Web Engineering (ICWE06), pginas 361368. julio 2006. a C. Bizer. D2r map - a database to rdf mapping language. En In 12th Intl World Wide Web Conf , pginas 1722. 2003. a T. Berners-Lee, J. Hendler y O. Lassila. The semantic web. Scientic American, 284(5):2837, May 2001. T. Berners-Lee, W. Hall, J. A. Hendler, K. OHara, N. Shadbolt y D. J. Weitzner. A framework for web science. Foundations and Trends R in Web Science, 1(1), 2006. I. Blanco, J. C. Cubero, O. Pons y M. A. Vila. An implementation for fuzzy relational databases. En G. Bordogna y G. Passi, editores, Recent Research Issues on the Management of Fuzziness in Databases, Studies in Fuzziness and Soft Computing, pginas 183207. Physica-Verlag, 2000. a I. Blanco, N. Mar O. Pons y M. A. Vila. An extension of data n, description language (ddl) for fuzzy data handling. En Larsen, Kacprzyk, Zadrozny, Andreasen y Christiansen, editores, Flexible Query Answering Systems, Recent Advances, Advances in Soft Computing, pginas 5464. Physica-Verlag, 2000. a

[Biz03] [BL01] [BL06]

[Bla00a]

[Bla00b]

276 [Bla01]

BIBLIOGRAF IA I. Blanco. Deduccin en Bases de Datos Relationales Difusas. o Tesis Doctoral, E. T. S. I. Informtica, Universidad de Granada, a Spain, 2001. I. Blanco, M. J. Mart n-Bautista, O. Pons y M. A. Vila. A mechanism for deduction in a fuzzy relational database. En Proceedings of the 9th Information Processing and Management of Uncertainty in Knowledge-based Systems IPMU 2002 Conference, pginas 291298. Annecy, France, July 2002. a I. Blanco, D. Snchez, J.M. Serrano, M.A. Vila y J. Fuzzya queries 2+, una herramienta para la integracin de consultas o exibles, clculo de agregaciones y resmenes, y extraccin de a u o conocimiento. En Actas del XI Congreso Espaol sobre tecn nolog y Lgica Fuzzy (ESTYLF02), pginas 337342. 2002. as o a I. Blanco, M. J. Martin-Bautista, O. Pons y M. A. Vila. A mechanism for deduction in a fuzzy relational database. International Journal of Uncertainty, Fuzziness and KnowledgeBased Systems, 11:4766, September 2003. I. Blanco, O. Pons, J. M. Serrano y M. A. Vila. Deduction in a gefred database using datalog. En International Conference in Fuzzy Logic and Technology EUSFLAT 2003 , pginas 550553. a September 2003. I. Blanco, C. Martinez-Cruz, J.M. Serrano y M. A. Vila. Servidor de bases de datos relacionales difusas para deduccin y o miner de datos. En Actas del XII Congreso Espaol Sobre a n Teconolog y Lgica Fuzzy, pginas 135141. 2004. as o a I. Blanco, C. Martinez-Cruz, J.M. Serrano y M.A. Vila. A rst approach to multipurpose relational database server. Mathware and Soft Computing, 12(2-3):129153, 2005. I. Blanco, C. Mart nez-Cruz, N. Mar y M. A. Vila. About the n use of ontologies for fuzzy knowledge representation. En International Conference in Fuzzy Logic and Technology EUSFLAT 2005 , pginas 106111. September 2005. a I. Blanco, C. Mart nez-Cruz y M. A. Vila. Handbook of Research on Web Information Systems Quality, cap tulo Looking for Information in Fuzzy Relational Databases accessible via the

[Bla02a]

[Bla02b]

[Bla03a]

[Bla03b]

[Bla04]

[Bla05a]

[Bla05b]

[Bla07]

BIBLIOGRAF IA

277

Web, pginas Chapter XVIII,300324. Idea Group Reference, a 2007. [Bla08a] I. Blanco, C. Martinez-Cruz y M. A. Vila. Arquitectura para la integracin de esquemas relacionales difusos basada en ono tolog una aplicacin para la web. En Actas del XIV Congreso as: o Espaol sobre tecnolog y Lgica Fuzzy (ESTYLF08), pginas n as o a 651656. 2008. I. J. Blanco, M. A. Vila y Carmen Martinez-Cruz. The use of ontologies for representing database schemas of fuzzy information. International Journal of Intelligent Systems, 23(4):419 445, February 2008. P. Borst, H. Akkermans y J. Top. Engineering ontologies. Int. J. Hum.-Comput. Stud., 46(2-3):365406, 1997. ISSN 1071-5819. P. Bosc, M. Galibourg y G. Hamon. Fuzzy querying with sql: Extensions and implementation aspects. Fuzzy Sets and Systems, 28:333349, 1988. M. Breu y Y. Ding. Modelling the world: Databases and ontologies. Whitepaper by IFI, Institute of Computer Science, University of Innsbruck , 2004. C. Brewster y K. OHara. Knowledge representation with ontologies: Present challengesfuture possibilities. International Journal of Human-Computer Studies, 65(7):563568, July 2007. J. Broekstra, A. Kampman y F. van Harmelen. Sesame: A Generic Architecture for Storing and Querying RDF and RDF Schema. En I. Horrocks y J. Hendler, editores, The Semantic Web - ISWC 2002. First International Semantic Web Conference, Sardinia, Italy, June 9-12, 2002, Proceedings, tomo 2342 de LNCS , pginas 5468. Springer, 2002. a S. Brockmans, P. Haase y P. Hitzler. A metamodel and uml prole for rule-extended owl dl ontologies. En J. Domingue Y. Sure, editor, The Semantic Web: Research and Applications: 3rd European Semantic Web Conference, ESWC 2006 , tomo 4011, pginas 303316. 2006. a B. P. Buckles y F. E. Petry. Fuzzy Information and Decision Processes, tomo 2, cap tulo Fuzzy Databases and their Applications, pginas 361371. North-Holland, Amsterdam, 1982. a

[Bla08b]

[Bor97] [Bos88]

[Bre04]

[Bre07]

[Bro02]

[Bro06]

[Buc82a]

278 [Buc82b]

BIBLIOGRAF IA B. P. Buckles y F. E. Petry. A fuzzy representation of data for relational databases. Fuzzy Sets and Systems, (7):213226, 1982. B. P. Buckles y F. E. Petry. Extending the fuzzy database model with fuzzy numbers. Information Sciences, 34:145155, 1984. B. P. Buckles, F. E. Petry y H. S. Sachar. A domain calculus for fuzzy relational databases. Fuzzy Sets and Systems, 29:327340, 1989. C. Calero, F. Ruiz, A. Baroni, F. Brito e Abreu y M. Piattini. An ontological approach to describe the sql:2003 objectrelational features. Computer Standards and Interfaces Journal , pginas 128, 2005. a C. Calero y M. Piattini. An Ontological Approach to SQL:2003 , cap tulo Ontological Engineering: Principles, Methods, Tools and Languages, pginas 49102. Springer-Verlag, 2006. a R. A. Carrasco, J. Galindo, M.C. Aranda, J.M. Medina y M.A. Vila. Classication in databases using a fuzzy query language. En 9th International Conference on Management of Data, COMAD98 . 1998. R. A. Carrasco, J. Galindo, M.A. Vila y J.M. Medina. Clustering and fuzzy classication in a nancial data mining environment. En 3rd International ICSC Symposium on Soft Computing, SOCO99 , pginas 713720. 1999. a R. A. Carrasco, J. Galindo, M.A. Vila y J.C. Cubero. Fsql: a tool for obtaining fuzzy dependencies. En 8th International Conference on Information Processing and Management of Uncertainty in Knowledge-Based Systems, IPMU2000 , pginas a 19161919. 2000. R. A. Carrasco. Lenguajes e Interfaces de Alto Nivel para Data Mining con Aplicacin Prctica a Entornos Financieros. Tesis o a Doctoral, E. T. S. I. Informtica, Universidad de Granada, a Spain, 2003. R. A. Carrasco, M. A. Vila y J. Galindo. Fsql: a exible query language for data mining. Enterprise information systems IV , pginas 6874, 2003. a

[Buc84]

[Buc89]

[Cal05]

[Cal06]

[Car98]

[Car99]

[Car00]

[Car03a]

[Car03b]

BIBLIOGRAF IA [Car07] [Cas07]

279

J. Cardoso. The semantic web vision: Where are we? IEEE Intelligent Systems, 22(5):8488, 2007. ISSN 1541-1672. P Casanovas, N. Casellas, C. Tempich, D. Vrandecic y R. Benjamins. Opjk and diligent: ontology modeling in a distributed environment. Articial Intelligence and Law , 15(2):171186, June 2007. ISSN 0924-8463. B. Chandrasekaran, J.R. Josephson y V.R. Benjamins. What are ontologies, and why do we need them? IEEE Intelligent Systems, pginas 2026, January/February 1999. a P. A. Champin. RDF Tutorial . http://www710.univlyon1.fr/ champin/rdf-tutorial/, April 2001. P. A. Champin, G.J. Houben y Ph. Thiran. Cross: An owl wrapper for reasoning on relational databases. En C. Parent, K.D. Schewe, Veda C. Storey y Bernhard Thalheim, editores, ER, tomo 4801 de Lecture Notes in Computer Science, pginas a 502517. Springer, 2007. ISBN 978-3-540-75562-3. G. Q. Chen, j. Vandenbulcke y E. E. Kerre. A general treatment of data redundancy in a fuzzy relational data model. Journal American Society of Information Sciences, 43(3):304311, 1992. G. Q. Chen. Fuzzy Logic in Data Modeling; Semantics, Constraints and Database Desing. kluwer Academic Publisher, 1999. N. Choi, I.Y. Song y H. Han. A survey on ontology mapping. SIGMOD Rec., 35(3):3441, 2006. ISSN 0163-5808. E. F. Codd. A relational model of data for large shared data banks. Communications of the ACM , 13(6):377387, 1970. E. F. Codd. Extending the database relational model to capture more meaning. ACM Transactions on Database Systems, 4:262 296, 1979. E. F. Codd. Missing information (applicable and inapplicable) in relational databases. ACM SIGMOD Record, 15(4), 1986. E. F. Codd. More commentary on missing information in relational databases. ACM SIGMOD Record, 16(1), 1987.

[Cha99]

[Cha01] [Cha07]

[Che92]

[Che99]

[Cho06] [Cod70] [Cod79]

[Cod86] [Cod87]

280 [Cod90] [Cod07] [Cor06]

BIBLIOGRAF IA E. F. Codd. The Relational Model for Database Management, Version 2 . Reading Mass. Addison-Wesley, 1990. E. F. Codd. Relational database: A practical foundation for productivity. ACM Turing award lectures, pgina 1981, 2007. a O. Corcho, M. FernndezLpez y A. GmezPrez. Ontologies a o o e for Software Engineering and Software Technology, cap tulo Ontological Engineering: Principles, Methods, Tools and Languages, pginas 49102. Springer-Verlag, 2006. a N. Cullot, C. Parent, S. Spaccapietra y Christelle Vangenot. Ontologies: A contribution to the dl/db debate. En Isabel Cruz y Vipul Kashyap, editores, First International Workshop on Semantic Web and Databases (VLDB workshop). September 2003. M. Delgado, J. L. Verdegay y M. A. Vila. A procedure for ranking fuzzy numbers using fuzzy relations. Fuzzy Sets and Systems, 26:4962, 1988. A. Doan, J. Madhavan, P. Domingos y A. Halevy. Learning to map between ontologies on the semantic web. En The Eleventh International WWW Conference. Hawaii,, 2002. D. Dou y P. LePendu. Ontology-based integration for relational databases. En SAC 06: Proceedings of the 2006 ACM symposium on Applied computing, pginas 461466. ACM Press, New a York, NY, USA, 2006. ISBN 1-59593-108-2. H. Dubois y H. Prade. Ranking fuzzy numbers in the setting of possibility theory. Information Sciences, 30:183224, 1983. A. J. Duineveld, R. Stoter, M. R. Weiden, B. Kenepa y V. R. Benjamins. Wondertools? a compartive study of ontological engineering tools. International Journal of Human-Cumputer Studies, 52(6):11111133, Jun 2000. P. Echarte. La web semntica. a http://www.lawebsemantica.com/contents/webSemantica/ ontologias4.html, 2007. P. para Echarte. la Tcnicas e representacin o del y lenguajes conocimiento.

[Cul03]

[Del88]

[Doa02]

[Dou06]

[Dub83] [Dui00]

[Ech07a]

[Ech07b]

BIBLIOGRAF IA

281

http://www.eslomas.com/index.php/archives/2006/12/14/ tecnicas-y-lenguajes-para-la-representacion-del-conocimiento/, 2007. [EG06] H. El-Ghalayini, M. Odeh y R. McClatchey. Engineering conceptual data models from domain ontologies: A critical evaluation. CoRR, abs/cs/0601119, 2006. Informal publication. M. Ehrig. Ontology Alignment. Bringing the Semantic Gap.. Springer, 2007. A. Eisenberg, J. Melton, K. G. Kulkarni, J-E Michels y Fred Zemke. Sql: 2003 has been published. SIGMOD Record , 33:119 126, 2004. Ulric Eriksson. Libsbd: Database library for supporting multiple database management. http://siag.nu/libsdb/, January 2007. J. Euzenat y P. Shvaiko. Ontology Matching. Springer, 2007. D. Fensel. Ontologies: Silver Bullet for Knowledge Management and Electronic Commerce. Springer-Verlag, Berlin, 2nd edicin, o 2004. T. Finin, J. Mayeld, A. Joshi, R. S. Cost y C. Fink. Information retrieval and the semantic web. En HICSS 05: Proceedings of the Proceedings of the 38th Annual Hawaii International Conference on System Sciences (HICSS05) - Track 4 , pgina a 113.1. IEEE Computer Society, Washington, DC, USA, 2005. ISBN 0-7695-2268-8-4. International Organization for Standardization (ISO). Information Technology. Database language sql. parts 1 to 4 and 9 to 14. 9075-1:2003 to 9075-14:2003 International Standards, (Standard No. ISO/IEC 9075:2003), September,2003. International Organization for Standardization (ISO). Information Technology. Ansi/iso/iec international standard (is) database language sql part 2: Foundation (sql/foundation). ISO/IEC 9075-2:1999 (E), September, 99. S. Fukami, M. Umano, M. Muzimoto y H. Tanaka. Fuzzy databases retrieval and manipulation language. IEICE Technical Reports, 78(233):6572, 1979.

[Ehr07] [Eis04]

[Eri07]

[Euz07] [Fen04]

[Fin05]

[fSIIT03]

[fSIIT99]

[Fuk79]

282 [Gae06] [Gal84]

BIBLIOGRAF IA D. Gaevic, D. Djuric, V. Devedic y B. Selic. Model driven architecture and ontology development. Springer , 2006. H. Gallaire, J. Minker y J. M. Nicholas. Logic and databases: A deductive approach. Computing Surveys, 16(2):153185, June 1984. J. Galindo. Tratamiento de la Imprecisin en Bases de Datos o Relacionales: Extensin del modelo y adaptacin de los SGBD o o actuales. Tesis Doctoral, Department of Computer Science and Articial Intelligence, University of Granada, Espaa, 1999. n A. Gal, G. Modica, H. Jamil y A. Eyal. Automatic ontology matching using application semantics. AI Mag., 26(1):2131, 2005. ISSN 0738-4602. A. Gali, C.X. Chen, K.T. Claypool y R. Uceda-Sosa. From ontology to relational databases. Shan Wang et all(Eds.): Conceptual Modeling for Advanced Application Domains, LNCS , 3289:278289, 2005. J. Galindo, A. Urrutia y M. Piattini. Fuzzy Databases Modeling, Design and Implementation. Idea Group Publishing, 2006. J. Gennick. SQL Pocket Guide. OReilly, 2006. J. Gennari, M.Nguyen y A. Silberfein. Datagenie. http://protege.cim3.net/cgi-bin/wiki.pl?DataGenie, March 2007. D. George. Understanding structural and semantic heterogeneity in the context of database schema integration. En Journal of the Dept. of Computing, 4, pginas 2944. IEEE Computer a Society, UCLan, May 2005. ISBN 1476-9069. C. Goble. Guest editorial: the semantic web: an evolution for a revolution. Comput. Networks, 42(5):551556, 2003. ISSN 1389-1286. J. A. Goguen. Data, schema, ontology and logic integration. Logic Journal of the IGPL, 13(6):685715, November 2005. ISSN 1367-0751. A. Gmez-Prez, M. Frnandez-Lpez y O. Corcho-Garc o e e o a. Metodologies, tools and languages for building ontologies. where

[Gal99]

[Gal05a]

[Gal05b]

[Gal06] [Gen06] [Gen07]

[Geo05]

[Gob03]

[Gog05]

[GP03a]

BIBLIOGRAF IA is their meeting point? (46):4164, 2003. [GP03b] [GP04]

283 Data and Knowledge Engineering,

A. Gmez-Prez, M. Frnandez-Lpez y O. Corcho-Garc Ono e e o a. tological Engineering. Springer-Verlag New York, Inc., 2003. A. Gmez-Prez y D. Manzano-Macho. An overview of methods o e and tools for ontology learning from texts. Knowl. Eng. Rev., 19(3):187212, 2004. ISSN 0269-8889. J. Grant. Incomplete information in a relational database. Fundamenta Informaticae, 3:363378, 1980. T. R. Gruber. Toward principles for the design of ontologies used for knowledge sharing. Technical Report KSL 93-04, Knowledge Systems Laboratory, Standford University, 1993. M. Grninger y M. Fox. Methodology for the design and evaluau tion of ontologies. En IJCAI95, Workshop on Basic Ontological Issues in Knowledge Sharing, April 13, 1995 . 1995. N. Guarino. Formal ontology, concept analysis and knowledge representation. International Journal of Human and Computer Studies, 43(5/6):625640, 1995. N. Guarino. Formal ontologies and information systems. En Proc. of FOIS98 , pginas 315. 1998. a B. Hsemann y G. Vossen. Ontology engineering form a u database perspective. En S. Grumbach, L. Sui y V. Vianu, editores, ASIAN 2005, LNCS 3818 , pginas 4963. Springera Verlag, 2005. D. Hong Hai. Schema Matching ans Mapping-Based Data Integration. Tesis Doctoral, Interdisciplinary Center for Bioinformatics and Department of Computer Science. University of Leipzig. Germany, 2005. A. Hameed, A. Preece y D. Sleeman. Handbook on Ontologies, cap tulo Ontology Reconciliation, pginas 231250. Springer, a 2004. J. Hartmann, P. Spyns, A. Giboin, D. Maynard, R. Cuel, M. C. SurezFigueroa y Y. Sure. Deliverable d1.2.3 methods for ontola ogy evaluation. document identier: Kweb/2004/d1.2.3/v1.3. Informe tcnico, Knowledge Web Consortium, 2005. e

[Gra80] [Gru93]

[Gr95] u

[Gua95]

[Gua98] [H05] u

[Hai05]

[Ham04]

[Har05]

284 [Hen02]

BIBLIOGRAF IA J. Hendler, T. Berners-Lee y E. Miller. Integrating applications on the semantic web. Journal of the Institute of Electrical Engineers of Japan, 122(10):676680, October 2002. M. C. Prez Hernndez. Explotacin de los crpora textuales e a o o informatizados para la creacin de bases de datos terminolgicas o o basadas en el conocimiento. Estudios de Ling ustica Espaola n (ELiEs), http://elies.rediris.es/elies18/, 2002. C.W. Holsapple y K. D. Joshi. A collaborative approach to ontology design. Commun. ACM , 45(2):4247, 2002. ISSN 0001-0782. Ontology Engineering homepage. http://www.aifb.unikarlsruhe.de/WBS/cte/ontologyengineering/, 2006. J. Hu, D.Nicholson, C. Mungall, A. L. Hillyard y A. L. Archibald. Webintool: a generic web to database interface building tool. En DEXA 96: Proceedings of the 7th International Workshop on Database and Expert Systems Applications, pgia na 285. IEEE Computer Society, Washington, DC, USA, 1996. ISBN 0-8186-7662-0. T. Imielinski y Heikki Mannila. A database perspective on knowledge discovery. Communications of the ACM , 39(11):58 64, 1996. M. Jarrar y R. Meersman. Scalability and knowledge reusability in ontology modeling. citeseer.ist.psu.edu/jarrar02scalability.html. M. Jarrar y R. Meersman. Formal ontology engineering in the dogma approach. En Robert Meersman y Zahir Tari, editores, CoopIS/DOA/ODBASE , tomo 2519 de Lecture Notes in Computer Science, pginas 12381254. Springer, 2002. ISBN 3-540a 00106-9. S. Jean, G. Pierra y Y. AitAmeur. Domain ontologies: A database-oriented analisys. En Proceedings of the Web Information Systems and Technologies (WEBIST2006). April 2006. I. Jurisica, J. Mylopoulos y E. Yu. Using ontologies for knowledge management: An information systems perspective. En Proceedings of 62nd Annual Meeting of the American Society for Information Science (ASISI99), pginas 482496. 1999. a

[Her02]

[Hol02]

[hom06] [Hu96]

[Imi96]

[Jar]

[Jar02]

[Jea06]

[Jur99]

BIBLIOGRAF IA [Jur07]

285

D. Juric y Z. Skocir. Building owl ontologies by analyzing relational database schema concepts and wordnet semantic relations. En The 9th International Conference on Telecommunications. ConTEL 2007 . June 13-15 2007. Espirit Proyect 8145 KACTUS. The http://www.swi.psy.uva.nl/projects/NewKACTUS/ ports.html, April 2005. kactus. Re-

[KAC05]

[Kal03] [Kam07] [Kas99] [KBS] [Kni94]

Y. Kalfoglou y M. Schorlemmer. Ontology mapping: the state of the art. The Knowledge Engineering Review , 18(1):131, 2003. Arjohn Kampman y Jeen http://www.openrdf.org/, 2007. Broekstra. Sesame.

V. Kashyap. Design and creation of ontologies for environmental information retrieval, 1999. Inc. Knowledge Based System. Idef. integrated denition methods. http://www.idef.com/IDEF5.html. K. Knight y S. K. Luk. Building a large-scale knowledge base for machine translation. En Proceedings of the Twelfth National Conference on Articial Intelligence.Seattle.Washington.. AAAI Press, 1994. H. Knublauch. An ai tool for the real world. knowledge modeling with prot`g`. e e Informe tcnico, e http://www.javaworld.com/javaworld/jw-06-2003/jw-0620protege.html. K. Kotis, G. A. Vouros y J. Padilla Alonso. Hcome: toolsupported methodology for collaboratively devising living ontologies. En Christoph Bussler, Val Tannen y Irini Fundulaki, editores, Semantic Web and Databases, Second International Workshop, SWDB 2004,Toronto, Canada, tomo 3372, pginas a 2930. Springer-Verlag, 2004. K. Kotis y A. Vouros. Human-centered ontology engineering: The hcome methodology. Knowl. Inf. Syst., 10(1):109131, 2006. ISSN 0219-1377. A. Kupfer, S. Eckstein, K.Neumann y B. Mathiak. Handling changes of database schemas and corresponding ontologies. En

[Knu]

[Kot04]

[Kot06]

[Kup06]

286

BIBLIOGRAF IA J. F. Roddick, V. R. Benjamins, S. S. Cher, R. H. L. Chiang, C. Claramunt, R. Elmasri, F. Grandi, H. Han, M. Hepp, M. D. Lytras, V. B. Misic, G. Poels, I. Song, J. Trujillo y C. Vangenot, editores, ER (Workshops), tomo 4231 de Lecture Notes in Computer Science, pginas 227236. Springer, 2006. ISBN 3-540a 47703-9.

[Las02]

O. Lassila y D. McGuinness. The role of frame-based representation on the semantic web. dsl-01-02. Informe tcnico, e Knowledge Systems Laboratory. Stanford University. Stanford. California, 2002. H. Lausen y M. Stolberg. Semantic web portals - state of the art survey. Informe tcnico, DERI, digital Enterprise Research e Institute. Technical Report 2004-04-03, April 2004. D.B. Lennat. Cyc: a large-scale investment in knowledge infrastructure. Communications of the ACM , 33(8):3338, 1995. L. Lubyte y S. Tessaris. Extracting ontologies from relational databases.krdb research centre technical report krdb07-4. Informe tcnico, Faculty of Computer Science, Free University of e Bozen-Bolzano, Italy, 2007. Z. Ma, W. J. M., Zhang y W. Y. Ma. Semantic measure of fuzzy data in extended possibility-based fuzzy relational databases. International Journal of Intelligent System, 15(8):705716, 2000. Z. Ma. Fuzzy Database Modeling with XML. Springer, 2005. Z. Ma. Fuzzy Database Modeling of Imprecise and Uncertain Engineering Information. Springer, 2006. R. McCool. Rethinking the semantic web, part i. IEEE Internet Computing, pginas 8688, Nov-Dec 2005. a R. McCool. Rethinking the semantic web, part ii. IEEE Internet Computing, pginas 9396, Jan-Feb 2006. a J. M. Medina. Bases de Datos Relacionales Difusas: Modelo Terico y Aspectos de su Implementacin. Tesis Doctoral, Deo o partamento de Ciencias de la Computacin e Inteligencia Artio cial, E.T.S. de Ingenier Informtica, Universidad de Granada, a a Espaa, 1994. n

[Lau04]

[Len95] [Lub07]

[Ma00]

[Ma05] [Ma06] [McC05] [McC06] [Med94a]

BIBLIOGRAF IA [Med94b]

287

J. M. Medina, O. Pons y M. A. Vila. Gefred. a generalized model of fuzzy relational databases. Information Sciences, 76(12):87109, 1994. J. M. Medina, M. A. Vila, J. C. Cubero y O. Pons. Towards the implementation of a generalized fuzzy relational database model. Fuzzy Sets and Systems, 75:273289, 1995. J. M. Medina, O. Pons, J. C. Cubero y M. A. Vila. Freddi: A fuzzy relational deductive database interface. International Journal of Intelligent Systems, 12:597613, 1997. R. Meersman. Ontologies and databases: More than a eeting resemblance. Information Technology and Management. Ed. Springer , Rome Workshop , Luiss Publications(6):97122, 2001. R. Meersman. Ontologies and databases: More than a eeting resemblance. citeseer.ist.psu.edu/article/meersman01ontologies.html, 2001. E. Mena y A. Illarramendi. Ontology-based query processing for global information systems. Kluwer Academic Publishers, Norwell, MA, USA, 2001. ISBN 0-7923-7375-8. R. Mizoguchi, J. Vanwelkenhuysen y M. Ikeda. Task ontology for reuse of problem solving knowledge. En Mars N (ed) Towards Very Large Knowledge Bases: Knowledge Building and Knowledge Sharing (KBKS95), pginas 4657. University of a Twente, Enschede, The Netherlands, IOS Press, 1995. J. Mylopoulos. Ontologies. http://www.cs.toronto.edu/ jm/2507S/Notes04/Ontologies.pdf, 2007. R.Neches, R. Fikes, T. Finin, T. Gruber, R. Patil, T. Senator y W. R. Swartout. Enabling technology for knowledge sharing. AI Mag., 12(3):3656, 1991. ISSN 0738-4602. A. De Nicola, R.Navigli y M. Missiko. Innovation and Knowledge Economy: Issues, Applications, Case Studies, cap tulo Building an eProcurement Ontology with UPON methodology, pginas 177184. IOS Press, 2005. a N. F. Noy. Handbook on Ontologies, cap tulo Tools for Mapping and Merging Ontologies, pginas 366384. Springer, 2004. a

[Med95]

[Med97]

[Mee01a]

[Mee01b]

[Men01]

[Miz95]

[Myl07] [Nec91]

[Nic05]

[Noy04]

288 [Obe03]

BIBLIOGRAF IA D. Oberle, S. Staab, R. Studer y R. Volz. Kaon server demonstrator. WonderWeb Deliverable D7, 2003. Http://wonderweb.semanticweb.org. D. Oberle, R. Volz, B. Motik y S. Staab. An extensible ontology software environment. En Steen Staab y Rudi Studer, editores, Handbook on Ontologies, International Handbooks on Information Systems, cap tulo III, pginas 311333. Springer, a 2004. Ontoprise. Ontoedit datasheet 2003. http://electronicoce.de/pdf/ontoprise/ontoedit data sheet.pdf, 2007. Ontoprise. Ontostudio. http://www.ontoprise.de/content/ e1171/e1249/index eng.html, April 2007. Oracle. Isqlplus web http://150.214.108.124/isqlplus, January 2007. enviroment.

[Obe04]

[Ont07a] [Ont07b] [Ora07] [Org07]

Open Cascade Organizacion. Dl-workbench. http://projects.opencascade.org/dl-workbench/, April 2007.

[otTUoMS07] Ontological Engineering Group (OEG) of the Technical University of Madrid (Spain). Webode ontology engineering platform. http://webode.dia..upm.es/WebODEWeb/index.html, December 2007. [Pan03] Z. Pan y J. Hein. Dldb: Extending relational databases to support semantic web queries. En Workshop on Practical and Scaleable Semantic Web Systms, ISWC 2003 , pginas 109113. a 2003. WP8 Partners. Deliverable d8.1. state of the art and state of the practice including initial possible research orientations. Informe tcnico, Network of Excellence - Contract no.: IST-508 e 011, 2004. E. Pardede y J. Wenny Rahayu. Impact of new sql standard to database modeling. Encyclopedia of Information Science and Technology. IDEA Publishing, pginas 488494, 2005. a C. Prez de Laborda y S. Conrad. Relational.owl: a data and e schema representation format based on owl. En CRPIT 43: Proceedings of the 2nd Asia-Pacic conference on Conceptual

[Par04]

[Par05]

[PdL05]

BIBLIOGRAF IA

289

modelling, pginas 8996. Australian Computer Society, Inc., a Darlinghurst, Australia, Australia, 2005. ISBN 1-920-68225-2. [Pet96] F. E. Petry. Fuzzy Databases: Principles and Applications. International Series in Intelligent Technologies. Kluwer Academic Publishers, 1996. O. Pons, J. M. Medina, J. C. Cubero y A. Vila. An architecture for a deductive fuzzy relational database. En Z.W. Ras y M. Michaliewicz, editores, Foundations of Intelligent Systems, tomo 1079 de Lectures Notes in Articial Intelligence. Springer, 1996. O. Pons, J. M. Medina, J. C. Cubero y M. A. Vila. Flexible Query Answering Systems, cap tulo A fuzzy deductive relational database. Kluwer Academic Publishers, 1997. H. Prade. Lipskis approach to incomplete information databases restated and generalized in the setting of zadehs possibility theory. Information Sciences, 9:2742, 1984. H. Prade y C. Testemale. Generalizing database relational algebra for the treatment of incomplete/uncertain information and vague queries. Information Sciences, (34):113143, 1984. H. Prade y C. Testemale. Analysis of Fuzzy Information, tomo 2, cap tulo Representation of Soft Constraints and Fuzzy Attribute Values by means of Possibility Distributions in Databases. CRC Press, 1987. H. Prade y C. Testemale. Fuzzy relational databases: Representational issues and reduction using similaruty measures. Journal of American Society for Information Sciences, 38(2):118 126, 1987. HP Labs Semantic Web Programme. Jena/ a semantic web framework for java. http://jena.sourceforge.net/, 2007. K. V. S. V.N. Raju y A. K. Majumdar. Fuzzy functional dependencies and lossless join decomposition of fuzzy relational database systems. ACM Transactions on Database Systems, 13(2):129166, 1988.

[Pon96]

[Pon97]

[Pra84a]

[Pra84b]

[Pra87a]

[Pra87b]

[Pro07]

[Raj88]

290 [Rib06]

BIBLIOGRAF IA R. Ribeiro, F. Batista, J. P. Pardal, N. J. Mamede y H. S. Pinto. Cooking an ontology. En Jrme Euzenat y John Domingue, eo editores, AIMSA, tomo 4183 de Lecture Notes in Computer Science, pginas 213221. Springer, 2006. ISBN 3-540-40930-0. a M.M. Roldn y J. F. Aldana Montes. A tool for storing owl a using database technology. En Bernardo Cuenca Grau, et al. (Eds.). Proceedings of the OWLED 05 Workshop on OWL: experiences and Directions, Galway, Ireland, November 11-12, 2005 , tomo 188, pginas 110. CEUR-Workshop Proceedings, a septiembre 2005. F. Ruiz y J. R. Hilera. Ontologies for Software Engineering and Software Technology, cap tulo Using Ontologies in Software Engineering and Technology, pginas 49102. Springer-Verlag, a 2006. E. A. Rundensteiner, L. W. Hawkes y W. Bandler. On nearness measures in fuzzy relational data models. International Journal Approximate Reasoning, (3):267298, 1989. G. Schreiber y R. de Hoog. Knowledge Engineering and Management: The CommonKADS Methodology. MIT Press, 1999. ISBN 0-262-19300-0. 472 pages. N. Shadbolt, Berners T. Lee y W. Hall. The semantic web revisited. Intelligent Systems, IEEE [see also IEEE Intelligent Systems and Their Applications], 21(3):96101, 2006. R. Sharman, R. Kishore y R. Ramesh. Ontologies: A Handbook of Principles, Concepts and Applications in Information Systems (Integrated Series in Information Systems). SpringerVerlag New York, Inc., Secaucus, NJ, USA, 2006. ISBN 0387370196. S. Shenoi y A. Melton. Proximity relations in the fuzzy relational databases. Fuzzy sets and Systems, 31(3):285296, 1989. A. Sheth, C. Ramakrishnan y C. Thomas. Semantics for the semantic web: The implicit, the formal and the powerful. Journal on Semantic Web and Information Systems, 1(1):118, JanMarch 2005.

[Rol05]

[Rui06]

[Run89]

[Sch99]

[Sha06a]

[Sha06b]

[She89]

[She05]

BIBLIOGRAF IA [Spy02]

291

P. Spyns, R. Meersman y M. Jarrar. Data modelling versus ontology engineering. En SIGMOD Record, pginas 1217. a September 2002. S. Staab y R. Studer. Handbook on Ontologies. Springer, 2004. G. Steve, A. Gangemi y D. Pisanelli. Integrating medical terminologies with onions methodology. http://saussure.irmkant.rm.cnr.it, 1998. L. Stojanovic, N. Stojanovic y R. Volz. Migrating data-intensive web sites into the semantic web. En SAC 02: Proceedings of the 2002 ACM symposium on Applied computing, pginas 1100 a 1107. ACM, New York, NY, USA, 2002. ISBN 1-58113-445-2. R. Studer, VR. Benjamins y D. Fensel. Knowledge engineering: Principles and methods. IEEE Transactions on Data and Knowledge Engineering, 25(1-2):161197, 1998. X. Su y L. Ilebrekke. A comparative study of ontology languages and tools. En CAiSE 2002 , pginas 761765. 2002. a Y. Sure, S. Staab y R. Studer. Handbook on Ontologies, cap tulo On-To-Knowledge Methodology, pginas 117132. Springer, a 2004. Y. Sure, C. Tempich y D. Vrandecic. Semantic Web Technologies, trends and research in ontology-based systems, cap tulo Ontology Engineering Methodologies, pginas 171190. Wiley, a 2006. B. Swartout, R. Patil, K. Knight y T. Russ. Toward distributed use of large-scale ontologies. En the 10th Workshop on Knowledge Acquisition. Ban, Canada, 1996. Y. A. Tijerino, D. W. Embley, D. W. Lonsdale, Y. Ding y G.Nagy. Towards ontology generation from tables. World Wide Web, 8(3):261285, 2005. ISSN 1386-145X. Q. Trinh, K. Barker y R. Alhajj. Rdb2ont: A tool for generating owl ontologies from relational database systems. En AICT/ICIW , pgina 170. 2006. a M. Umano, S. Fukami, M. Mizumoto y K. Tanaka. Retrieval processing from fuzzy databases. Informe tcnico, IECE, Japn, e o 1980.

[Sta04] [Ste98]

[Sto02]

[Stu98]

[Su02] [Sur04]

[Sur06]

[Swa96]

[Tij05]

[Tri06]

[Uma80]

292 [Uma82a]

BIBLIOGRAF IA M. Umano. Freedom-o: A fuzzy database system. En M. Gupta y E. Sanchez, editores, Fuzzy Information and Decision Processes, pginas 339347. North-Holland, Amsterdam, Pub. Comp., a 1982. M. Umano. Fuzzy Information and Decision Processes, cap tulo FREEDOM-0: A Fuzzy Database System, pginas 339347. a North Holland Pub. Co., 1982. M. Umano y S. Fukami. Fuzzy relational algebra for possibilitydistribution-fuzzy-relational model of fuzzy data. Journal of Intelligent Information Systems, 3:728, 1994. M. Unchold y M. Gruninger. Ontologies and semantics for seamless connectivity. SIGMOD Record , 33(4):5864, 2004. Open University. http://kmi.open.ac.uk/projects/webonto/, 2007. Stanford University. Chimaera, April 2007. Stanford University. http://www.ksl.stanford.edu/software/chimaera/, 2007. Chimaera. April Webonto.

[Uma82b]

[Uma94]

[Unc04] [Uni07a] [Uni07b] [Uni07c]

[Uni07d]

Stanford University. Ontolingua. http://www.ksl.stanford.edu/software/ontolingua/, April 2007. S. R. Upadhyaya y P. S. Kumar. Eronto: a tool for extracting ontologies from extended e/r diagrams. En SAC 05: Proceedings of the 2005 ACM symposium on Applied computing, pginas 666670. ACM, New York, NY, USA, 2005. ISBN 1a 58113-964-0. M. Uschold. Towards a methodology for building ontologies. citeseer.ist.psu.edu/uschold95toward.html, 1995. M. Uschold y M. Grninger. Ontologies: principles, methods, u and applications. Knowledge Engineering Review , 11(2):93 155, 1996. G. van Heijst, Ath. Schereiber y BJ. Wielinga. Using explicit ontologies in kbs development. International Journal of HumanComputer Studies, (45):193292, 1997.

[Upa05]

[Usc95] [Usc96]

[vH97]

BIBLIOGRAF IA [Vys06]

293

E. Vysniauskas y L.Nemuraite. Transforming ontology representation from owl to relational database. Information Technology and Control, 35(3A):333343, 2006. W3C Recommendation, http://www.w3.org/RDF/. Resource Description Framework (RDF), february 1999. World wide web consortium. http://www.w3.org/, 2006. ESSI WSMO working group. Wsmo http://www.wsmostudio.org/, January 2008. studio.

[W3C99] [w3c06] [wg08] [Wik07] [Xu04]

Wikipedia. Looking for: Ontology. www.wikipedia.org, December 2007. Z. Xu, X. Cao, Y. Dong y W. Su. Formal approach and automated tool for translating er schemata into owl ontologies. En PAKDD, pginas 464475. 2004. a L. Yabloko y Next Generation Software. Ontobase plug-in for protg. http://www.ontospace.net/pages/3/index.htm, April e e 2007. R. R. Yager. Ranking fuzzy subsets over the unit interval. En Proceedings of CDC , pginas 14351437. 1978. a R. R. Yager. A procedure for ordering fuzzy subsets of the unit interval. Information Sciences, 24:143161, 1981. S. Youn y D. McLeod. Ontology development tools for ontologybased knowledge management. IDea Group, 2006. L. A. Zadeh. Fuzzy sets. Information and Control, 83:338353, 1965. L. A. Zadeh. The concept of a linguistic variable and its application to approximate reasoning. Information Sci., 8:(8) 199248, 301357, (9) 4380, 1975. M. Zemankova y A. Kandel. Fuzzy Relational Databases - A Key to Expert Systems. Verlag TUV Rheinland, 1984. M. Zemankova y A. Kandel. Implementing imprecision in information systems. Information Sciences, 37:107141, 1985.

[Yab07]

[Yag78] [Yag81] [You06] [Zad65] [Zad75]

[Zem84] [Zem85]

294 [Zha07]

BIBLIOGRAF IA J. Zhang. Ontology and the semantic web. En Proceedings of the North American Symposium on Knowledge Organization, tomo 1. 2007.

S-ar putea să vă placă și