Sunteți pe pagina 1din 8

Investigado por: Harold Castaeda Robles Para: Maestra Entornos Virtuales de Aprendizaje 2012

POR QU NECESITAMOS UN NUEVO ESTNDAR PARA LA WEB SEMNTICA?

En la Web Semntica, las computadoras hacen la bsqueda por nosotros. La WebSem permite a los ordenadores buscar conocimiento distribuido a travs de la web, ensamblarlo, y luego tomar acciones basadas en este. Para usar una analoga, la web actual es una plataforma descentralizada para presentaciones distribuidas mientras que la WebSem es una plataforma descentralizada para conocimiento distribuido. RDF es el estndar de la W3C para codificar conocimiento Por supuesto que hay conocimiento en la web actual, pero est fuera de los lmites de los computadores. Considera una pgina de Wikipedia. la cual puede transmitir mucha informacin a lector humano, pero la computadora que muestra la pgina solo ve marcas de presentacin. Los computadores le encuentran sentido a HTML, imgenes, Flash, etc., casi siempre para crear una presentacin para el usuario final. El verdadero contenido, el conocimiento transmitido a los humanos, es opaco a los ordenadores. Lo que significa semntica en la Web Semntica no es que los computadores van a entender el significado de algo, sino que las piezas lgicas del conocimiento pueden ser manipuladas mecnicamente para tiles usos. Ahora imaginemos una nueva web donde el contenido real puede ser manipulado por las computadoras. Por ahora, imagnatela como una web de bases de datos. Un sitio web semntico publica una base de datos acerca de una lnea de productos, con productos y descripciones, mientras otro publica una base de datos de reseas de dichos productos. Un tercer sitio para ms detalle publica una base de datos de productos en existencia. Qu estndar hara ms fcil escribir una aplicacin para engranar las bases de datos distribuidas, con el fin de que un ordenador pudiera ayudar a un usuario a la hora de comprar? No hay ningn impedimento actualmente para que alguien escriba un programa que haga ese tipo de cosas, de la misma manera que

Investigado por: Harold Castaeda Robles Para: Maestra Entornos Virtuales de Aprendizaje 2012

nada impidi que hiciramos intercambio de datos antes de tener a XML. Pero los estndares facilitan la construccin de aplicaciones, especialmente en un sistema descentralizado. Aqu tenemos algunos aspectos a considerar que nos gustara tener en un estndar de conocimiento distribuido: 1. Los archivos en la Web Semntica necesitan poder expresar informacin de manera flexible. La vida no puede ser perfectamente empaquetada en tablas, como en una base de datos relacional, o en jerarquas, como en XML. La informacin acerca de pelculas y shows de TV contenida en el grafo a continuacin es mejor expresada como un grafo:

Por supuesto, no podemos estar dibujando grafos a travs de la web, en vez de eso necesitamos una notacin tabular para dichos grafos. Compara la tabla de abajo con la figura de arriba. Cada fila representa una arista en la figura. La primera columna tiene el nombre del nodo al inicio de la arista. La segunda columna tiene el nombre (o etiqueta) de la arista. La tercera columna tiene el nombre del nodo al final de la arista.

Investigado por: Harold Castaeda Robles Para: Maestra Entornos Virtuales de Aprendizaje 2012

2. Los archivos en la Web Semntica necesitan una manera de relacionarse. Un archivo de precios de productos publicado por un vendedor y un archivo con crticas de esos productos publicados independientemente por un consumidor necesitan tener una forma de indicar que ellos estn hablando de lo mismo. Solo usando los nombres de los productos no es suficiente. Dos productos pueden existir en el mundo llamados El sper limpiador 3000 y queremos eliminar la ambigedad de la WebSem para que los computadores puedan procesar la informacin con certeza. La WebSem necesita identificadores nicos globales que puedan ser asignados de manera descentralizada. 3. Usaremos vocabularios para hacer afirmaciones acerca de las cosas, pero esos vocabularios deben ser capaces de mezclarse fcilmente. Un vocabulario de shows de TV desarrollado por aficionados y un vocabulario de pelculas desarrollado independientemente por cinfilos expertos deben ser capaces de usarse conjuntamente en el mismo archivo, para hablar de las mismas cosas, por ejemplo para afirmar que un actor ha aparecido tanto en shows de TV como en pelculas. Esos son algunos de los requerimientos que RDF (Marco de descripcin de recursos) provee en su estndar, tal y como lo veremos en la siguiente seccin. Antes de ponernos muy abstractos, aqu tenemos ejemplos concretos de RDF de la informacin del grafo anterior, primero en el formato Notation3 (N3), el cual sigue la forma tabular de la codificacin del grafo subyacente:

Y est el formato estndar RDF/XML, el cual puede tener una forma ms intuitiva y es ms explcita en la estructura jerrquica del grafo, pero en la mayora de los casos tiende a oscurecerlo: Ejemplo en RDF/XML

Investigado por: Harold Castaeda Robles Para: Maestra Entornos Virtuales de Aprendizaje 2012

RDF fue originalmente creado en 1999 como un estndar por encima de XML para codificacin de metadatos literalmente, datos sobre datos. Los Metadatos son por supuesto cosas como quien hizo la pgina, cual fue la fecha de una entrada de este blog, etc., informacin que es en algn sentido secundaria en contraste al resto de contenido de la web regular. Desde eso, y quizs despus de la actualizacin de la especificacin en 2004, el alcance de RDF en realidad evolucion en algo grande. Los usos ms excitantes de RDF no son los de codificar informacin acerca de recursos web, sino informacin acerca de relaciones entre cosas del mundo real: Gente, lugares, conceptos, etc.

Introduccin A RDF, Semnticas

El

Standard

De

Bsquedas

A menos que conozcas el Marco de Descripcin de Recursos (RDF), lo mejor es que trates de olvidar lo que ya sabes acerca de el mientras lees el resto de esta seccin. RDF existe como una interseccin de unas cuantas tecnologas diferentes, lo que fcilmente conlleva a pensar que es un formato particular de XML o una herramienta para feeds de blogs. Olvida lo que sabes, aqu esta RDF desde el inicio. RDF es un mtodo general para descomponer conocimiento en piezas pequeas, con algunas reglas acerca de la semntica o significado de esas piezas. El punto es que sea una mtodo tan simple que pueda expresar cualquier hecho, y a la vez tan estructurado que aplicaciones de computadora puedan usar el conocimiento expresado para hacer cosas tiles. Yo digo Mtodo en particular antes que formato, porque uno puede

Investigado por: Harold Castaeda Robles Para: Maestra Entornos Virtuales de Aprendizaje 2012

escribir esas piezas de diferentes formas y an as preservar la informacin y la estructura, tal y como podemos expresar una oracin en diferentes lenguajes humanos o implementar la misma estructura de datos en mltiples lenguajes de programacin. De alguna forma RDF puede ser comparado a XML ya que tambin es diseado para ser simple y aplicable a cualquier tipo de datos. XML es tambin mucho ms que un formato de archivo. Se trata de una base para lidiar con documentos jerrquicos y autocontenidos, sin importar si deben ser guardados en un disco en el formato usual <></>, o mantenidos en memoria y accedidos a travs de una API DOM. Lo que diferencia a RDF de XML es que RDF es diseado para representar conocimiento en un mundo distribuido. Que RDF sea diseado para conocimiento y no para datos significa que RDF es concebido particularmente con significado. Todo lo mencionado en RDF significa algo. Puede ser una referencia a algo en el mundo como una persona o una pelcula, o puede ser un concepto abstracto como ser amigo de alguien ms. Con solo poner tres entidades juntas, el estndar de RDF dice como llegar a un hecho. El significado del triple (John, Bob, el estado de ser amigos) puede ser que John y Bob son amigos. Al poner muchos hechos juntos, se llega a algn tipo de conocimiento. Los estndares construidos por encima de RDF, incluyendo RDFS y OWL, agregan a RDF la semntica para la elaboracin de inferencias lgicas a partir de los datos. Para comparar, XML por si solo no est muy relacionado con el conocimiento. Los nodos de XML no necesitan estar asociados con conceptos particulares y el estndar de XML no indica como derivar un hecho de un documento. Por ejemplo, si tuvieras algunos documentos XML los cuales tienen nodos races en un lenguaje extranjero que tu no manejas, no podras hacer nada til con esos documentos adems de mostrarlos. Los documentos RDF con nodos que no entiendes pueden an ser tilmente procesados porque RDF especifica algunos niveles de conocimiento. Ahora, esto no indica que tu no puedas desarrollar tu propio estndar por encima de XML que diga como derivar hechos en un documento XML, pero encontrars que probablemente has reinventado algo como RDF. El segundo aspecto clave de RDF es que trabaja muy bien para informacin distribuida. Esto es, las aplicaciones RDF pueden juntar archivos RDF publicados por diferentes personas alrededor del Internet y fcilmente aprender de ellos nuevas cosas. Esto lo hace de dos maneras, primero enlazando los documentos que

Investigado por: Harold Castaeda Robles Para: Maestra Entornos Virtuales de Aprendizaje 2012

usen vocabularios comunes, y segundo permitiendo que cualquier documento use cualquier vocabulario. Esto permite una gran flexibilidad al momento de expresar hechos sobre una amplia gama de cosas, basndose en informacin de una amplia variedad de fuentes. RDF provee un mtodo general y flexible para descomponer cualquier conocimiento en piezas pequeas, llamadas triples, con algunas reglas acerca de la semntica (Significado) de esas piezas. La base es romper el conocimiento en bsicamente lo que es llamado un grafo dirigido etiquetado, si conoces la terminologa correspondiente. Cada arista en el grafo representa un hecho, o relacin entre dos cosas. La arista en la figura anterior del nodo edgar_vivar etiquetada starred_in al nodo el_orfanato representa el hecho de que el actor Edgar Vivar protagoniz en la pelcula El Orfanato. Un hecho representado de esta manera tiene tres partes: Un sujeto, un predicado y un objeto. El sujeto es lo que est al inicio de la arista, el predicado es el tipo de arista (La etiqueta) y el objeto es lo que est al final de la arista. Los seis documentos que componen la especificacin de RDF nos dicen dos cosas. Primero, esboza el modelo abstracto, es decir, como usar los triples para representar conocimiento acerca del mundo. Segundo, describe como codificar esos triples en XML. Tomaremos cada sujeto por turnos. RDF no es ms que un mtodo general para descomponer informacin en piezas. El nfasis es general aqu porque el mismo mtodo puede ser usado para cualquier tipo de informacin. El mtodo es este: Expresar informacin como una lista de sentencias de la forma Sujeto-Predicado-Objeto. El sujeto y el objeto son nombres para dos cosas en el mundo y el predicado es el nombre de la relacin entre esas cosas. Puedes mirar los predicados como verbos. As es como descompondra la informacin de mi apartamento en oraciones RDF:

Investigado por: Harold Castaeda Robles Para: Maestra Entornos Virtuales de Aprendizaje 2012

Informacin expresada en sentencias RDF Estas cuatro lneas expresan cuatro hechos, cada lnea es llamada sentencia o triple. Los sujetos, predicados y objetos en RDF son siempre simples nombres para las cosas: Cosas concretas, como mi_apartamento, o conceptos abstractos como has. Esos nombres no tienen estructura interna o significado por si solos. Son como nombres propios o variables No importa que nombre escojas para algo mientras lo uses constantemente. Los nombres en las sentencias RDF se usan para referir o denotar cosas en el mundo. Las cosas que son denotadas por nombres son llamadas recursos (Recordando el uso que se le daba a RDF para metadatos en la web), nodos (De la terminologa de grafos) o entidades. Esos trminos son generalmente sinnimos. Por ejemplo, el nombre mi_apartamento denota mi apartamento actual, el cual es una entidad en el mundo real. La distincin entre los nombres y las entidades que ellos denotan es mnima pero importante porque dos nombres pueden ser usados para denotar la misma entidad. Los predicados son siempre relaciones entre dos cosas. Own (Poseer) es una relacin entre un dueo y su posesin; Has (Tener) es una relacin entre el contenedor y lo contenido; is_in (Estar en) es la relacin inversa entre el contenido y el contenedor. En RDF, el orden del sujeto y el objeto es muy importante. El siguiente aspecto de RDF se sobreentiende, pero quiero dejar todo por escrito: Si alguien se refiere a algo como X en un lugar y X es usado en otro lugar, las dos Xs se refieren a la misma entidad. El apartamento al que me refiero en la primera sentencia, es el mismo del que hablo en las otras tres. Las reglas mencionadas hasta ahora ya nos han llevado mucho ms lejos de lo que podemos imaginar. Dada esta tabla de

Investigado por: Harold Castaeda Robles Para: Maestra Entornos Virtuales de Aprendizaje 2012

sentencias, es posible escribir un simple programa que pueda contestar preguntas como Quin posee mi apartamento? y Que tiene mi apartamento?. La pregunta en si tiene la forma de una sentencia RDF excepto que se considerarn comodines tales como Qu, Quin, etc., Un simple programa de preguntas y respuestas puede comparar la pregunta con cada fila de la tabla . Cada fila que corresponda con el criterio dado ser considerada una respuesta. Aqu est el pseudo cdigo:

Pseudo cdigo para preguntas y respuestas Nota del autor: He desarrollado una pequea prueba de ese programa en Javascript (http://ejemplos.netne.net/). Es un programa bastante sencillo solo para pruebas. Si desean ver el conocimiento, solo vean el cdigo fuente. La computadora no necesita saber que significa has. Esto es, se deja al escritor de la aplicacin escoger los nombres apropiados para las cosas (mi_apartamento) y usar sus propios predicados (own, has). Las herramientas RDF son ignorantes de que significan esos nombres, pero an as pueden procesar tilmente la informacin. (Mostrar ms cosas tiles en breve) Semantizando la Web Primeros pasos hacia la Web del maana http://semantizandolaweb.wordpress.com Autor: Ignacio Ricci.

S-ar putea să vă placă și