Sunteți pe pagina 1din 8

Mapas Autoorganizados de kohonen

Edgar Richard Polonio Bocanegra


Universidad San Pedro Campus de Chimbote, Richardsmith_libra@hotmail.com

RESUMEN.
Se describe las caractersticas de los mapas auto organizados, su regla de aprendizaje, su algoritmo de
entrenamiento, con la finalidad de resolver problemas de clasificacin.

Kohonen Self-Organizing Maps


ABSTRACT
The characteristics of the self-organizing maps, the rule learning, the training algorithm, in order to
solve classification problems described.

INTRODUCCIN
Los mapas autoorganizados o SOM (SelfOrganizing Maps), tambin llamados redes de
Kohonen son un tipo de red neuronal no
supervisada, competitiva, distribuida de forma
regular en una rejilla de, normalmente, dos
dimensiones. Su finalidad es descubrir la
estructura subyacente de los datos introducidos
en ella. A lo largo del entrenamiento de la red, los
vectores de datos son introducidos en cada
neurona y se comparan con el vector de peso
caracterstico de cada neurona. La neurona que
presenta menor diferencia entre su vector de peso
y el vector de datos es la neurona ganadora (o
BMU) y ella, y sus vecinas vern modificados
sus vectores de pesos. Este tipo de mapas
permiten reducir la dimensionalidad de los
vectores de entrada para representarlos mediante
una matriz de distancias unificada (U-matriz)
generalmente consistente en una matriz 2D, apta
para la visualizacin como una imagen plana.

ESTRUCTURA

Matriz de neuronas: Las neuronas se


distribuyen de forma regular en una
rejilla de dos dimensiones, que pueden
ser rectangulares o hexagonales, en las
que cada neurona puede tener cuatro o
seis vecinos respectivamente.
Espacio de entrada: Los datos de
entrada corresponden a un vector de N

componentes por cada atributo que


queramos comprar, siendo esta
dimensin la misma del vector de pesos

sinpticos asociado a cada una de las


neuronas de la rejilla.
Espacio de salida: Corresponde con la
posicin (2D) en el mapa de cada
neurona.
Relacin entre neuronas: Entre todas
las neuronas hay una relacin de
vecindad que es la clave para conformar
el mapa durante la etapa de
entrenamiento. Esta relacin viene dada
por una funcin.

Ilustracin 1 Estructura de un mapa autoorganizado

Entrenamiento Para cada paso del entrenamiento


(poca) se introduce un vector de datos
correspondiente a una entrada seleccionada
aleatoriamente y se calcula la similitud entre este
vector y el peso de cada neurona. Aplicacin de
SOM a la visualizacin de datos 4 La neurona
ms parecida al vector de entrada ser la neurona
ganadora (Best-Matching Unit BMU).
Generalmente se usa la distancia eucldea para
medir esta similaridad entre pesos sinpticos.
Tras esto, los vectores de pesos de la BMU y sus
vecinos son actualizados de forma que se acercan
al vector de entrada.

APLICACIN

DE SOM A
VISUALIZACIN DE DATOS

LA

Las dos caractersticas descritas anteriormente


hacen especialmente atractivo el uso de SOM
para representacin de datos:

Reduccin de la multidimensionalidad:
Podemos representar conjuntos de
datos de gran nmero de atributos en
mapas 2D.
Asociacin de elementos con atributos
similares: Visualmente podemos ver de
forma rpida como quedan agrupados
elementos que tienen valores prximos
entre s.

Aparte de estas razones a nivel tcnico tenemos


adems muchas ventajas como son:

Facilidad de implementacin: La
implementacin de un sistema SOM es
relativamente fcil y se adapta
perfectamente al modelo de procesado
en paralelo por lo que es tambin muy
fcilmente optimizable.
Abstraccin de los datos de entrada:
Los SOM son totalmente transparentes
a la naturaleza de los datos de entrada,
tan solo se limitan a comparar vectores
de entrada con los pesos sinpticos de
las neuronas de la rejilla. Esto hace que
pueda ser usado en gran variedad de
problemas sin tener necesidad de
cambiar la aplicacin base.
Facilidad de integracin con otras
tcnicas: Esta tcnica se puede
compaginar con otras tcnicas de
obtencin de conocimiento como
pueden ser las redes bayesianas
realizando un preprocesado del
conjunto de datos.

Recientemente se est produciendo un


crecimiento del uso de mapas SOM gracias a su
potencia y facilidad de uso para trabajar en
campos como la estadstica. Adems una vez
obtenida el mapa, la representacin no tiene por
qu limitarse a una rejilla rectangular, como se
puede apreciar en la siguiente imagen.

Ilustracin 2 Ejemplo de uso de SOM en aplicaciones


estadsticas

APRENDIZAJE NO SUPERVISADO
Los algoritmos de clasificacin no supervisados
son aquellos que no requieren etiquetado de cada
uno de los vectores de entrada; se suelen llamar
tambin algoritmos auto-asociativos, porque
asocian entradas a ellas mismas. Una buena
explicacin de estos algoritmos se halla en la
FAQ de redes neuronales.
El tipo ms comn de algoritmos de aprendizaje
o clasificacin no supervisada son los algoritmos
de anlisis de grupos o clustering; estos
algoritmos tratan de dividir las muestras del
conjunto de entrada en una serie de grupos con
caractersticas comunes. Un algoritmo debe
descubrir cules son estos clusters, pero tambin
cules son las caractersticas que define ese
cluster y cuntos clusters hay; pero ste ltimo es
un problema que no tiene solucin fcil.
Dentro de las redes neuronales, uno de los
mtodos no supervisados ms comunes es
precisamente el SOM, pero hay otro mtodo
denominado aprendizaje hebbiano que usa una
red monocapa, con pesos conectando las entradas
a las salidas, y aumentarndo el valor de los pesos
que unen a dos neuronas si se activan a la vez, y
disminuir el valor si se activan de forma
diferencial. Una red hebbiana se puede disponer
en una sola capa o varias: las entradas se
propagan a la capa interna, y a la salida, y tras la
propagacin, se cambian los pesos de la forma
indicada. El aprendizaje hebbiano equivale a un
anlisis de componentes principales de las
entradas, segn ha sido probado recientemente.

Una red neuronal supervisada tal como el


perceptrn multicapa se puede convertir en no
supervisada usando las entradas como salidas; de

esta forma, la capa interna extraer los


componentes principales de las entradas, y se
podr usar, por ejemplo, como memoria
asociativa; o bien, analizando las activaciones de
la capa interna, se pueden asignar diferentes
grupos (clusters) a las entradas: los patrones de
entrada/salida que provoquen unos patrones de
activacin similares pertenecern al mismo
grupo.
Los mtodos no supervisados se suelen usar en lo
denominado anlisis de datos exploratorio, es
decir, en una fase del anlisis de los datos,
cuando no se sabe de antemano cules son los
grupos naturales que se forman, y se quiere
visualizar la abundancia y la relacin que hay
entre los grupos "naturales"; se puede decir que
una de sus principales aplicaciones es la
visualizacin de datos multidimensionales,
porque un algoritmo no supervisado acta como
una proyeccin de un espacio multidimensional
a otro de dimensiones visualizables. Tambin se
pueden usar como fase inicial de algoritmos de
aprendizaje supervisados: un algoritmo como el
k-medias o el mismo SOM se pueden usar para
inicializar algoritmos de aprendizaje supervisado
tales como el LVQ (Learning Vector
Quantization). [1]

ARQUITECTURA EN RED
En general, el algoritmo SOM considera una
arquitectura en 2 capas: por una parte tenemos
una red de nodos de aprendizaje (de la que nos
importa la relacin de distancias que hay entre
ellos) junto con un conjunto de vectores de
entrenamiento, de forma que todos los elementos
de la primera capa estn conectados con todos los
elementos de la segunda capa. Para los
propsitos bsicos que necesitamos en este
ejemplo trabajaremos con una distribucin 2D
del SOM, tal y como muestra la siguiente figura
(la red de aprendizaje viene representada por
nodos rojos, y los vectores de entrenamiento
vienen representados en verde).

Cada nodo tiene un posicin topolgica


especfica (que suele estar asociada a las
coordenadas (x,y)) y contiene un vector de pesos
de la misma dimensin que los vectores de
entrenamiento. Es decir, si cada vector, V, de
entrenamiento tiene dimensin n, cada nodo
tendr un vector de pesos, W, de dimensin n.

ALGORITMO DE APRENDIZAJE
A grandes rasgos, ya que no hay vector objetivo
al que aproximarse, lo que se hace es que, en
aquellas zonas en las que la red tiene nodos con
pesos que coinciden con vectores de
entrenamiento, el resto de nodos de su entorno
tienden a aproximarse tambin a ese mismo
vector. De esta forma, partiendo de una
dstribucin de pesos inicial (normalmente
aleatorios), el SOM tiende a aproximarse a una
distribucin de pesos estable. Cada una de estas
zonas que se estabiliza se convierte en un
clasificador de propiedades, de forma que la red
se convierte en una salida que representa una
aplicacin de clasificacin. Una vez estabilizada
la red, cualquier vector nuevo estimular la zona
de la red que tiene pesos similares.
De forma ms detallada, los pasos que se siguen
para el proceso de entrenamiento son:

Ilustracin 3 La red de aprendizaje viene representada


por nodos rojos, y los vectores de entrenamiento
vienen representados en verde

Cada nodo se inicializa con un peso


(aleatorio). Normalmente, vectores
en [0,1]n,
Se selecciona al azar un vector del
conjunto de entrenamiento.
Se calcula el nodo de la red que tiene el
peso ms similar al vector anterior, que
notaremos como Best Matching
Unit (BMU). Para ello, simplemente se
calculan las distancias eucldeas entre
los vectores W de cada nodo y el vector
de entrenamiento (por motivos de
eficiencia, no se aplica la raz cuadrada
al clculo de la distancia eucldea, cosa
que no afecta para calcular el mnimo).
Se calcula el radio del entorno de
BMU. Este radio comenzar siendo
grande (como para cubrir la red
completa) y se va reduciendo en cada
iteracin.
Cada nodo del entorno de BMU ajusta
su peso para parecerse al vector de
entrenamiento seleccionado en el paso
2, de forma que los nodos ms cercanos
al BMU se vean ms modificados.

Repetir desde el paso 2 (el nmero de


iteraciones que se considere necesario).

La frmula que establece el radio en funcin de


la iteracin (que hace que vaya disminuyendo,
pero no linealmente) es:
r(t)=r0et
donde r0 es el radio inicial (habitualmente, el
radio de la red, es decir, uno suficiente para
cubrir en el primer paso todos los nodos) y una
constante que permite hacer que el radio sea muy
pequeo cuando llegamos a la iteracin mxima:
=Tiempo_de_Entrenamientolnr0
La siguiente figura muestra el efecto de ir
reduciendo paulatinamente el radio del entorno,
donde se marcan los nodos que se veran
afectados si el nodo BMU es el nodo amarillo:
[2]

Ilustracin 4 La siguiente figura muestra el efecto de


ir reduciendo paulatinamente el radio del entorno

LOS MAPAS AUTOORGANIZADOS


APLICADOS A LA BIBLIOMETRA.
La Bibliometra es una disciplina que estudia los
aspectos cuantitativos de la informacin
registrada, para ello se han creado una serie de
modelos estadsticos que aportan datos
numricos sobre el comportamiento de la
actividad cientfica. Tambin se han adaptado
modelos de otras disciplinas para facilitar los
anlisis y representar los resultados desarrollados
a partir de la Bibliometra. Los mapas autoorganizados (SOM) o modelo de Kohonen
(basado en las RNA) es una de estas
herramientas. En los estudios mtricos la
aplicacin de las redes neuronales, y
especficamente los SOM, estn asociados en lo
fundamental con la clasificacin de informacin,
o sea, la formacin de cluster y su representacin
en mapas bidimensionales de conceptos y ms
especficamente con el descubrimiento de
informacin (data mining). Este ltimo
vinculado con la recuperacin de la informacin

con "ruido" e incompleta o con el tratamiento de


informacin que incluye diferentes tipos de datos
(nmeros, texto, registros estructurados, etc.).
Los SOM facilitan que el conocimiento tcito se
haga explcito, a partir de la extraccin no-trivial
(a partir de los datos) de conocimientos
implcitos potencialmente tiles desconocidos
previamente. Se podrn encontrar patrones o
estructuras en el conocimiento tcito. [3]
Las investigaciones bibliomtricas, a travs de la
utilizacin de las redes neuronales, incursionan
en:

la seleccin de variables.
clasificacin de
informacin
formacin de cluster.
regresin.
relaciones entre variables.
cambios y desviaciones.
representacin de las variables.

Lo anterior se puede ejemplificar a partir de


algunas aplicaciones prcticas relacionadas con
la evaluacin de pginas web [8] y trabajos
relacionados con la clasificacin de revistas en
un determinado campo temtico [9]. Se conocen,
adems, investigaciones relacionadas con la
minera de textos (text mining) sobre todo
aplicado a la asociacin de palabras o co-word.
En todos estos ejemplos se utiliza como variante
de las RNA el modelo de los mapas
autoorganizativos (self-organizing map, SOM).
En un anlisis, realizado por los autores sobre el
tema, se examinaron cerca de 56 documentos
sobre redes neuronales aplicadas al anlisis de
informacin, con ello se constato que la mayora
utilizaban el modelo SOM como herramienta de
estudio. (2, 7, 8,12,16). Un ejemplo de SOM
podra ser.el estudio de una temtica
determinada, para este caso en un mapa cada
documento (artculo de revista, podra ser una
patente, una tesis, etc.) va a ocupar un lugar en el
espacio, en funcin de su contenido temtico.
Cada rea del mapa va a Sotolongo, G.; Guzmn,
MV. Aplicaciones de las redes neuronales. El
caso de la bibliometra. Ciencias de la
Informacin. (preprint) 2001; 32(1):27-34. 10
reflejar un contenido especfico y los tpicos van
variando levemente a lo largo del mismo. Las
diferentes tonalidades indican la densidad de
documentos, cuanto ms oscura ms documentos
se encuentran. Este uso frecuente de los SOM
quizs se deba a lo amigable de la interfaz de los
mapas para los usuarios finales y a la diversidad
de sus utilidades prcticas, estas representaciones
son vlidas para poder identificar, adems de los

desarrollos temticos antes mencionados,


relaciones entres reas temticas y publicaciones,
alianzas estratgicas y caractersticas de la
cooperacin. Permite, tambin, visualizar los
avances tecnolgicos que tienen lugar en un
perodo, conocer la evolucin de una tecnologa
a travs del tiempo e identificar campos
emergentes. En el acpite anterior se mencion al
Visc
automatizado el modelo SOM. Este sistema es
utilizado por un equipo de trabajo del Instituto
Finlay para elaborar mapas cientficotecnolgicos.

industrial. El objetivo es identificar posibles


competidores, alianzas estratgicas, dependencia
tecnolgica, etc. Se escogi para el primer
ejemplo la representacin de la situacin
tecnolgica de la Neisseria meningitidis.3 Las
diferentes instituciones en la primera hoja de sus
patentes hacen referencias a otras patentes, a
partir de estos datos se puede inferir el impacto
que produce una tecnologa o institucin en otra.
Con el objetivo de determinar la dependencia
tecnolgica entre instituciones, se realiz un
anlisis de citas, estas formaron los cluster que
aparecen en la figura.

Ilustracin 5 Funcionamiento del Viscovery SOMine

El punto de partida, para el uso de esta


herramienta, es la entrada de un conjunto de
datos numricos (datos multivariables, variables,
nodos ). Estos datos necesitan ser
preprocesados con el objetivo de organizarlos
en forma de matrices. Los datos son convertidos
hasta obtener una informacin visual en forma de
mapa, para ello se aplica un nmero de tcnicas
de evaluacin como coeficientes de correlacin
entre variables o factores discriminantes [4, 13,
14]. Los mapas sern amigables a la vista del
usuario final, en ellos se identificarn
dependencias entre parametros, cluster y grficos
que facilitarn diferentes predicciones o el
proceso de monitoreo.

APLICACIONES:
Se estima que a pesar de las limitaciones
tcnicas, las redes neuronales aplicadas a la
Bibliometra constituyen un campo de
investigacin muy prometedor. Un ejemplo es
presentado a continuacin. La disciplina
muldidisciplinar de las redes neuronales es
aplicada en esta seccin, donde se asume a la
produccin de los documentos de patentes como
indicador de la capacidad de desarrollo

Ilustracin 6 Posicin tecnolgica de las instituciones


segn las citaciones.

El mapa tecnolgico presentado en la figura


anterior representa a tres cluster: cluster 1
formado solamente por la Merck & Co., un
cluster 2 formado nicamente por el National
Res. Council of Canada y el cluster 3 que incluye
al resto de las instituciones. Este ltimo grupo
est formado por una gran cantidad de
instituciones que tienen igual estrategia de
citacin, sobre todo las representadas con colores
ms claros y sin lmites de separacin. Se
presupone que estas firmas se basan para su
desarrollo en su propia base tecnolgica, pues
citan poco a otras instituciones. El cluster 2
evidencia un alto nivel de autocitacin, cuando
esto sucede, algunos investigadores [1] en el
tema sealan que probablemente esta institucin
tenga un nicho de proteccin cerrada sobre un
espacio tecnolgico. Puede estar ocurriendo que
exista una patente importante, la cual se ha
rodeado de invenciones mejoradas. El cluster
formado por la Merck & Co. indica un mayor
nivel de citacin, esto presupone una estrategia
balanceada: absorbe tecnologa externa y
produce tecnologa propia. La cercana de los
cluster tambin es una evidencia sobre las

instituciones que tienen estrategias parecidas a la


de otras. La Rockefeller University hace frontera
con el cluster que incluye a North American
Vaccine, y el National Res. Council de Canada;
estas instituciones forman un colegio tecnolgico
invisible que basa sus desarrollos en la misma
innovacin tecnolgica.

pases que presentan mayor nivel regional en el


desarrollo agrcola. [4]

ANLISIS

DE
PACIENTE
DIABTICOS INTERNADOS

Otro ejemplo Otra aplicacin se presenta en un


campo diferente del conocimiento: la agricultura.
En este ejemplo no solo se tom como elemento
de entrada la produccin documental de
determinados pases, tambin se consideraron
otros tipos de variables como "gastos en I+D" en
cada uno de los pases analizados, "personal
dedicado a actividades de I+D", etc.

ANLISIS DE PACIENTE FACTORES


DE RIESGO

Ilustracin 7 Mapa de Amrica Latina y el Caribe


(pases seleccionados) de acuerdo con la

En la figura 6 se presenta un mapa autoorganizado sobre la actividad en ciencia agrcola


en Amrica Latina y el Caribe (se seleccionaron
algunos pases segn los datos disponibles). Con
ello se pretende lograr una representacin de la
regin, teniendo en cuenta los indicadores de
insumo y de resultados ms significativos. En la
figura aparecen, en dos dimensiones, 22 pases.
La semejanza de los pases, considerando de
forma simultnea los 20 indicadores, se expresa
mediante la cercana de estos en el mapa. Los 22
pases se agrupan (autorganizan) en 3 clusters o
grupos: El cluster C1, que aparece en la esquina
inferior izquierda, es seguido por una banda de 4
pases correspondientes al cluster C2 (Cuba,
Colombia, Chile y Venezuela) y otro cluster (C3)
con el resto de los pases.
En el mbito regional e internacional hay un
grupo de pases formado por Brasil, Mxico y
Argentina que tienen una investigacin en la
temtica con mayor solidez y con parecidos
niveles de desarrollo. Esto coincide con los

RIESGOS

BANCARIOS VARIABLES
DE LOS DATOS [5]

INTERFERENCIA
CATRASTOFICA
Sucede cuando cuanod la informacion que fue
recientemente aprendida a menudo elimina la
que fue anteriormente aprendida. El problema
principal consiste en disear un sistema que sea
simultaneament sensible a pero no radicalmente
destructivo, a la nueva entrada.

ROBUSTEZ:
En la data real existen diversos puntos
denominados outliers los cuales difieren del
comun de los datos. Las SOM no son sensibles a
la presencia de este tipo de datos, no logranso
realizar una buena generalizacion del conjunto de
entrada, siendo otro problema importante que se
debe abordar. [6]

CONCLUSIONES:
El uso de las redes neurales incide en las
empresas mejorando el proceso de calificacin
de las finanzas econmicas al margen de error en
el ranking. Todo esto demuestra su utilizacin en
varios campos (capital de trabajo, pagos,
inversiones, etc.), para poder ser aplicado a una
gran variedad de proyectos e investigaciones.
En este trabajo hemos presentado los mapas autoorganizados tal y como fueron introducidas por
Kohonen y particularizando desde el punto de
vista general de redes neuronales artificiales. De
entre las miles de aplicaciones que tienen los
mapas auto-organizados hemos descrito varias
de ellas orientadas a la segmentacin de
imgenes en color. Posteriormente hemos
introducido el concepto de mapa autoorganizado generalizado, cuya principal virtud
sea quizs su simetra respecto a los datos de
entrada y las neuronas. Hemos visto como
algunas de las variantes de mapas autoorganizados explicados anteriormente se
enmarcan dentro de este nuevo concepto
generalizado mientras que no lo hacan en el
concepto clsico de mapa auto-organizado.
Creemos que este concepto podra dar a nuevas
desarrollos o variaciones de mapas autoorganizados. Como aplicacin hemos diseado
un mapa auto-organizado generalizado orientado
a la segmentacin de imgenes en color. La
diferencia con un mapa clsico radica
fundamentalmente en que el movimiento de las
neuronas se realiza a lo largo de las geodsicas
de cierta mtrica. Esta mtrica depende de una
densidad continua calculada a partir de las
muestras. La implementacin se ha llevado a
cabo en MATLAB y C.

Bibliografa
[1] [En lnea]. Available: http://geneura.ugr.es/~jmerelo/tutoriales/bioinfo/Kohonen.html.
[ltimo acceso: 22 mayo 2015].
[2] D. C. d. l. C. e. I. A. U. d. Sevilla, 10 enero 2014. [En lnea]. Available:
http://www.cs.us.es/~fsancho/?e=76. [ltimo acceso: 22 mayo 2015].
[3] [En lnea]. Available:
http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/DM/tema5dm.pdf. [ltimo
acceso: 22 MAYO 2015].
[4] M. V. Guzmn. [En lnea]. Available:
http://www.dynamics.unam.edu/DinamicaNoLineal/Articulos/MineriaDatos/Articulo03.pdf.
[ltimo acceso: 22 mayo 2015].
[5] G. Meschino. [En lnea]. Available:
http://www3.fi.mdp.edu.ar/meschino/Presentaciones/GUSTAVO%2008%20%20KOHONEN.pdf. [ltimo acceso: 22 mayo 2015].
[6] [En lnea]. Available: http://www.doc4net.es/doc/1850344633707/. [ltimo acceso: 22
mayo 2015].

S-ar putea să vă placă și