Reconocimiento de Patrones y El Aprendizaje No Supervisado

Reconocimiento de patrones y el aprendizaje no supervisado
Jess Cceres Tello Servicios Informticos Profesor del Dpto. Ciencias de la Computacin Escuela Tcnica Superior de Informtica Universidad de Alcal jesus.caceres@uah.es Resumen. Este artculo muestra una introduccin al reconocimiento de patrones entrando ms en detalle en el aprendizaje de sistemas no supervisados los cuales debern, una vez proporcionados todos los tipos de patrones, decidir cul es el que ms se ajusta al sistema en cuestin. Se concluye el artculo analizando los problemas existentes en un sistema de aprendizaje no supervisado como son los sistemas topogrficos en los que coexisten un nmero elevado de patrones lineales.
1 Introduccin
La visin artificial nos permite reducir el problema de una imagen a ciertas formas geomtricas, a partir de ellas podemos analizar el problema e intentar comprender ante qu objeto nos encontramos, principalmente esto se realiza mediante el reconocimiento de patrones. Es una disciplina dependiente de la inteligencia artificial, ya que nos permite, a partir de unos datos la adquisicin de conocimientos, adems los sistemas de reconocimiento de patrones suelen incorporar un mtodo de aprendizaje, normalmente mediante un algoritmo inductivo. Es importante resaltar la necesidad de introducir un mtodo de evaluacin para analizar dicho algoritmo, ya que, en el caso de que dicha evaluacin fuese negativa reducira la eficiencia del algoritmo.
2 Anlisis estadstico
La primera aproximacin al reconocimiento de patrones es simplemente estadstica, es a veces tambin la ms eficiente. Este mtodo consiste en analizar el patrn como una variable aleatoria n-dimensional compuesta por n componentes, x1, x2,..., xn, tales que xi pertenece a Gi para i = 1, 2,..., n.
Figura 1: Ejemplo de espacio de patrones 1
Un patrn se representa como un punto en el espacio de patrones P. El espacio de patrones P es un espacio de dimensionalidad determinada por el nmero de variables consideradas y se define como el conjunto de todos los valores posibles que puede tomar el patrn X, esto es, el producto cartesiano de todos los pares de Gi . La tarea fundamental de un sistema de reconocimiento de patrones (clasificador) es la de asignar a cada patrn de entrada una etiqueta. Dos patrones diferentes deberan asignarse a una misma clase si son similares y a clases diferentes si no lo son. La cuestin que se plantea ahora es la definicin de una medida de similitud entre patrones. En definitiva, se supone que el proceso de adquisicin es biunvoco y continuo. Estas consideraciones sugieren que si las representaciones de dos patrones estn muy cercanas en el espacio de representacin, entonces los patrones deben tener un alto grado de similitud. No obstante, no puede afirmarse tajantemente que a mayor distancia menor similitud ya que la medida (absoluta) de distancia depende de la escala en la que se cuantifiquen las variables asociadas al patrn. Los sistemas de adquisicin introducen cierta distorsin o ruido, lo que produce una variabilidad en la representacin de los patrones. Aunque es posible controlar eficientemente en muchos casos esta distorsin mediante el calibrado de los sistemas de adquisicin de datos, aparece otra fuente de variabilidad por la propia naturaleza de los patrones. Con mucha frecuencia, patrones de una misma clase difieren, incluso significativamente. Un ejemplo sencillo es el de los sistemas de reconocimiento de caracteres OCR que pueden interpretar diversos tipos de letra. Bien, en el caso ms simple, en el que se trata un solo tipo de letra, la variabilidad de los patrones se debe a factores tales como el granulado, el color y calidad del papel o el tipo de tinta empleado.
1
Fuente del grfico: http://www-etsi2.ugr.es/depar/ccia/rf/www/tema1_00-01_www/node6.html.
De lo que se trata es de extraer la informacin relevante a partir de la clasificacin de informacin suministrada por los sensores (datos en bruto). De forma general este problema puede plantearse como sigue. Dado un conjunto de patrones n-dimensionales X = [x1, x2,..., xn]T se trata de obtener un nuevo conjunto (caractersticas) d-dimensionales Y = [y1, y2,..., yd]T donde dn. Esto se consigue con varios mtodos. 1. Reduciendo la dimensionalidad de los datos, si los patrones son de alta dimensionalidad, el coste computacional asociado a la clasificacin puede ser muy alto. Las tcnicas dedicadas a seleccionar las variables ms relevantes se dicen de seleccin de caractersticas y reducen la dimensionalidad de los patrones. 2. Cambiando el espacio de representacin. El objetivo es obtener una nueva representacin de los patrones en la que los agrupamientos aparezcan separados si son de diferente clase y que haya un agrupamiento por clase. Esto puede conseguirse aplicando alguna transformacin sobre los datos originales. Estas transformaciones suelen ser transformaciones lineales y el objetivo suele ser maximizar la varianza, los vectores resultantes del proceso de seleccin o extraccin se denominan caractersticas. A este conjunto se le debe asignar clases, siendo este el objetivo del sistema, las clases idealmente son disjuntas, quedando claramente discriminada la pertenencia o exclusin de un elemento a la clase concreta. La problemtica empieza cuando estos patrones no estn agrupados de manera ideal o en el peor de los casos cuando estn solapados, dando entonces lugar a una problemtica clasificacin dado que para un patrn podemos deducir que pertenece a dos o ms clases. Esto suele resolverse dado que la muestra suele ser multidimensional, lo cual nos permite discriminar en funcin de la relacin de las clases seleccionadas por estos valores, dado que si se adhiere a alguna clase concreta podemos decantarnos por la relacin entre estas. Un apartado importante es el aprendizaje del sistema, pudiendo ser ste supervisado o no supervisado.
3 Aprendizaje no supervisado
El principal problema surge cuando el sistema toma la decisin de elegir un determinado patrn de entre todos los proporcionados. Es el sistema el que debe determinar la clase de la cual se obtiene ese patrn. Otro problema aadido es la toma de decisiones, correctas o no, aqu entra en juego la lgica difusa, en la utilizacin de tcnicas de clustering difuso. El clustering o agrupamiento es el proceso de particionar un conjunto de datos (u objetos) en un conjunto de subclases significativas llamadas grupos (clusters). Un grupo es una coleccin de objetos de datos que son similares a otros y as pueden ser tratados colectivamente como un grupo. El agrupamiento es una forma de clasificacin no supervisada en la que, a diferencia de la supervisada, no se conocen las etiquetas de las clases (no hay clases predefinidas) y puede que tampoco se conozca el nmero de grupos.
Un buen mtodo de agrupamiento produce grupos de alta calidad en los cuales la similitud dentro del grupo es alta y la similitud entre las clases es baja. La medida de similitud se define usualmente por proximidad en un espacio multidimensional. 3.1 Agrupamiento difuso Este mtodo (desarrollado por Dunn en 1973 y mejorado por Bezdek en 1981 ) se utiliza con frecuencia en el reconocimiento de patrones. Se basa en la minimizacin de la siguiente funcin:
Para todo nmero m verdadero mayor de 1, el uij es el grado de la calidad de miembro de xi en el grupo j , xi es el i-ensimo datos medios d-dimensionales, cj es el centro de la d-dimensin del agrupamiento, y ||*|| es cualquier norma que expresa la semejanza entre cualesquiera datos medidos y el centro. La distribucin borrosa se realiza con una optimizacin de la funcin anterior, con la actualizacin del ij y de los centros c j de la calidad del miembro u del grupo.
Esta iteracin parar cuando
donde es un criterio de la finalizacin de la iteracin y su valor estar entre 0 y 1, mientras que k es el paso de la iteracin. Este procedimiento converge a un valor mnimo tambin llamado punto de la silla de montar de Jm. El algoritmo se compone de los pasos siguientes: 1. Inicializar la matriz del ij de U=[u ], U (0) 2. En el k-paso: calcular los vectores de los centros C (k) = [ cj ] con U (k) 3. Actualizar U(k) a U(k+1) 4. Si ||U (k+1) - U (k) ||< entonces PARAR; si no volver paso 2. datos al estn
Segn lo dicho anteriormente, los
limitados a cada agrupacin por medio de una funcin, que representa el comportamiento borroso de este algoritmo. Para esto, se tendr que construir simplemente una matriz apropiada llamada U cuyos elementos sean valores entre 0 y 1, y representar el grado de proximidad entre los datos y los centros de las agrupaciones.
4 Problemtica en los sistemas de aprendizaje no supervisado: Caso Prctico.

Un claro ejemplo de sistema con aprendizaje no supervisado lo constituyen los sistemas topogrficos. Estos sistemas se caracterizan por tener como entrada una Fotografa area y como salida la elaboracin de un mapa. Esto se consigue analizando los patrones y modificando el mapa por su equivalente simblico en el caso de los patrones ms sencillos, los patrones topogrficos puntuales, los cuales representan en los mapas los objetos cartogrficos, cuyos tamaos son menores en relacin con el tamao del territorio, presentado en el mapa. Dependiendo de la escala del mapa, a esta clase de patrones geogrficos pueden pertenecer: ciudades, pueblos, aeropuertos, etc. Entre los problemas de la digitalizacin de los patrones puntuales, se puede plantear un problema particular de reconocimiento de puntos geodsicos y puestos hidrolgicos, los cuales se presentan numerosamente en mapas topogrficos de media escala que se necesitan para la creacin de modelos digitales de relieve. Estos patrones se dibujan en los mapas, como un grupo de smbolos, como formas y/o colores, los cuales representan sus caractersticas constructivas. Los smbolos de puntos geodsicos, generalmente vienen con informacin textual, que indica su nombre registrado y la altura de su punto de referencia. Los smbolos de puestos hidrolgicos tambin vienen con informacin textual estructurada, que contiene el nombre registrado de puesto, la indicacin de altura del agua o la corriente, tipo de depsitos de fondo, etc. Las caractersticas indicadas para los smbolos de patrones, pueden usarse efectivamente para el desarrollo de algoritmos de reconocimiento automtico de patrones puntuales. Otro de los problemas que se pueden plantear es la representacin de patrones cartogrficos lineales, definidos por que el tamao de los cuales, en una direccin es mucho menor que en la otra. Los patrones lineales representan en los mapa; ros, autopistas, fallas tectnicas de la corteza terrestre, etc. Los patrones de este tipo se dibujan en mapas en forma de lneas de diferentes tipos, colores y anchos. Cada elemento puede tener su propio valor informativo. El resultado de la digitalizacin de los patrones lineales debe contener una secuencia de las coordenadas de los arcos, los cuales se aproximan el patrn y, en caso de un reconocimiento posible, los atributos del patrn. La identificacin de los patrones lineales se complica por el hecho de que se dibujan en mapas no solamente con lneas continuas, sino con lneas de una topologa distinta (continuas, discontinuas, doble lnea, etc.) Tambin existe el problema del reconocimiento de las isolneas de la altura de la superficie terrestre. Las isolneas se dibujan en mapas con lneas continuas y trazos del mismo ancho y color. El reconocimiento de las isolneas se complica por el hecho
de que, generalmente, tienen discontinuidades en las cuales se escribe el valor del parmetro correspondiente para una isolnea dada. Estos nmeros se ponen en el mapa con una orientacin definida con respecto a la isolnea marcada. En los lugares de marcacin numrica o de alta densidad de isolneas, una parte de isolneas afines puede desaparecer. Con frecuencia se utilizan dos grupos de isolneas en los mapas: principales y adicionales. Las imgenes de estas ltimas isolneas se diferencian por el tipo de lneas. Las imgenes de las isolneas pueden contener "berg-rayas", o segmentos cortos con longitud fija, los cuales se ponen perpendicularmente a la isolnea misma, con orientacin hacia la disminucin del valor numrico de parmetro Sin embargo, al crear los algoritmos de reconocimiento para sistemas con isolneas, se pueden usar de acuerdo a sus especificaciones geomtricas: las isolneas no pueden cruzarse y cada una es cerrada o comienza y cierra en la frontera de una regin. El resultado de la digitalizacin de isolneas debe contener una secuencia de las coordenadas de los arcos, los cuales aproximan estas lneas, con un restablecimiento mximo posible de los segmentos ausentes en las isolneas y una tabla con los valores del parmetro correspondiente.
Referencias
Juan Carlos Camara. Posibilidades de Websemantico http://www.iua.upf.es/~jblat/material/doctorat/students/jccbis/Web_Sema ntico.htm MNDEZ RODRGUEZ, Eva Mara. RDF: Un modelo de metadatos flexible para las bibliotecas digitales del prximo milenio. http://www.cobdc.org/jornades/7JCD/1.pdf RDF Model Theory.W3C Working Draft 29 April 2002. http://www.w3.org/TR/rdf-mt/#graphsyntax RDF Tutorial. Pierre-Antoine Champin. http://www710.univlyon1.fr/~champin/rdf-tutorial/rdf-tutorial.html Resource Description Framework (RDF): Concepts and Abstract Syntax. W3C Working Draft 08 November 2002. http://www.w3.org/TR/2002/WD-rdf-concepts-20021108/ W3C. Resource Description Framework (RDF). http://www.w3.org/RDF/

Reconocimiento de Patrones y El Aprendizaje No Supervisado

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Reconocimiento de Patrones y El Aprendizaje No Supervisado

Încărcat de

Drepturi de autor:

Formate disponibile

Reconocimiento de patrones y el aprendizaje no supervisado

Figura 1: Ejemplo de espacio de patrones 1

Fuente del grfico: http://www-etsi2.ugr.es/depar/ccia/rf/www/tema1_00-01_www/node6.html.

Esta iteracin parar cuando

Segn lo dicho anteriormente, los

4 Problemtica en los sistemas de aprendizaje no supervisado: Caso Prctico.

S-ar putea să vă placă și