Documente Academic
Documente Profesional
Documente Cultură
REDES NEURONALES
ndice General
....................................................................
pg 1
2. Generalidades
..............................................................................................
2.1 Qu entendemos por Red Neuronal Artificial ?
..............................
2.1.1 Redes Neuronales de tipo Biolgico
..............................
2.1.2 Neurona Artificial .....................................................................
2.1.3 Conexiones entre Neuronas
...........................................
2.1.4 Regla de Aprendizaje
........................................................
2.1.5 Redes Neuronales para Aplicaciones Concretas ..................
2.2 Fases en la Aplicacin de Redes Neuronales ...........................................
pg
pg
pg
pg
pg
pg
pg
pg
4
4
4
5
6
7
7
7
pg 9
pg 9
pg 9
pg 11
pg 11
pg 11
pg 11
pg 12
pg 20
pg 20
pg 20
pg 20
pg 21
pg 21
pg 22
pg 22
pg 22
pg 23
pg 12
pg 14
pg 16
pg 16
pg 17
pg 17
pg 26
pg 26
pg 26
pg 26
6. Aplicaciones ...........................................................................................................
6.1 Redes vs Mtodos Clsicos ....................................................................
6.2 Campos de Aplicacin
....................................................................
6.3 Aplicaciones
.................................................................................
6.3.1 Ejemplo de Consumo Elctrico ..........................................
6.3.2 Ejemplo de una Targeta de Credito
.............................
6.3.3 Ejemplo de Consumo de Gas
..........................................
6.3.4 Ejemplo Financiero
.......................................................
6.3.5 Ejemplo de Decisiones de Actuacin en el Mercado
...
6.4 Pluviometra
.................................................................................
6.4.1 Introduccin
....................................................................
6.4.2 Gestin del Alcantarillado y Pluviometra ..............................
6.4.3 Objetivos: la Prediccin a Corto Plazo
..............................
6.4.4 Las ANNs: una Herramienta de Prediccin
.................
6.4.5 Preparacin de los Datos de Lluvia
..............................
6.4.6 Construccin de un Modelo de Prediccin ..............................
6.4.7 Resultados
.....................................................................
6.4.8 Nuevos Objetivos .....................................................................
6.4.9 Conclusiones
.....................................................................
pg 28
pg 28
pg 28
pg 30
pg 30
pg 32
pg 34
pg 37
pg 39
pg 41
pg 41
pg 41
pg 42
pg 42
pg 43
pg 43
pg 45
pg 45
pg 46
pg 47
pg 47
pg 48
pg 48
...........................................
pg 49
9. Conclusiones
...............................................................................................
pg 56
10. Bibliografa
...............................................................................................
pg 57
un
fallo de diseo.
2 Generalidades
2.1 Qu entendemos por Red Neuronal Artificial ?
Las Redes Neuronales Artificiales (ANN) son sistemas paralelos para el procesamiento de la
informacin, inspirados en el modo en el que las redes de neuronas biolgicas del cerebro
procesan esta. Es decir que se han intentado plasmar los aspectos esenciales de una neurona real
a la hora de disear una neurona artificial. Estos modelos realizan una simplificacin,
averiguando cuales son los elementos relevantes del sistema, bien porque la cantidad de
informacin de que dispone es excesiva o bien porque es redundante. Una eleccin adecuada de
sus caractersticas, ms una estructura conveniente, es el procedimiento convencional utilizado
para construir redes capaces de realizar una determinada tarea.
Es de prever que dichas ANN tengan caractersticas similares a las del cerebro:
Sean robustas y tolerantes a fallos
Sean flexibles. El cerebro se adapta a nuevas circunstancias mediante el aprendizaje.
Puedan trabajar con informacin borrosa, incompleta, probabilstica, con ruido o
inconsistente.
Sean altamente paralelas. El cerebro est formado por muchas neuronas interconectadas
entre si y es, precisamente el comportamiento colectivo de todas ellas, lo que caracteriza su
forma de procesar la informacin.
El punto clave de las ANNs es la nueva estructuracin de estos sistemas para el procesamiento
de la informacin. A partir de esta informacin como ejemplo, las ANN aprenden. Aprender en
sistemas biolgicos involucra la modificacin de la interconectividad entre las neuronas; este
concepto tambin es cierto para las ANNs.
Los campos de aplicacin de las ANNs crecen por momentos, por ejemplo, reconocimiento de
patrones, clasificacin de datos, predicciones,... Su ventaja ms destacada es la de solucionar
problemas que con las tcnicas convencionales seran demasiado complejos.
Las redes neuronales, en su inicio eran una simulacin de los sistemas nerviosos biolgicos. De
este modo una primera clasificacin de los modelos de ANNs puede ser basndonos en su
similitud con la realidad biolgica: modelos de tipo biolgico y aquellos dirigidos a
aplicaciones.
Las unidades de entrada reciben seales desde el entorno (son seales que
proceden de sensores o de otros sectores del sistema).
Las unidades de salida envan la seal fuera del sistema (son seales que pueden
controlar directamente potencias u otros sistemas). Las neuronas de las capas
ocultas pueden estar interconectadas de distinta manera, lo que denomina, lo que
determina con su nmero, las distintas tipologas de redes neuronales.
Las unidades ocultas son aquellas cuyas entradas y salidas se encuentran dentro
del sistema (son seales que no tienen contacto con el exterior).
net j w ji yi
i
Esta regla muestra el procedimiento a seguir para combinar los valores de entrada a una unidad
con los pesos de las conexiones que llegan a esa unidad y es conocida como regla de
propagacin.
En la fase de entrenamiento se trata de determinar los pesos usando un conjunto de datos para
definir el modelo neuronal. Una vez entrenado este modelo en la fase de prueba, se procesarn
los patrones que constituyen la entrada habitual de la red, analizando as las prestaciones finales
de la red.
Fase de prueba. Los parmetros de diseo de la red neuronal se han obtenido unos patrones
representativos de las entradas, a los que denominamos patrones de entrenamiento.
Segn el tipo de red, y en funcin de las ecuaciones dinmicas de prueba, los resultados pueden
ser calculados de una vez o adaptados iterativamente. Para validar el diseo, una vez calculados
los pesos, se comparan los valores de las neuronas de la ltima capa con la salida deseada.
Fase de aprendizaje. Una caracterstica bsica de las ANNs es su capacidad de aprender.
Aprenden por su actualizacin o cambio de los pesos sinpticos que caracterizan a las
conexiones. Los pesos se adaptan de acuerdo a la informacin extrada de los patrones de
entrenamiento nuevos que se van presentando.
10
Redes Neuronales
FIJO
Red de Hamming
Red de Hopfield
NO SUPERVISADO
Mapa de
Caractersticas
Aprendizaje
Competitivo
SUPERVISADO
Perceptrn
Basadas en Decisin
ADALINE (LMS)
Perceptrn Multicapa
Modelos Temporales
Dinmicos
Modelos Ocultos de
Markov
11
12
13
14
15
,...,
w
w N
w1
16
cada uno corresponde a una de las L clases i , i 1,..., L . Cada clase se modela
por una subred con funcin discriminante, digamos, x, wi i 1,..., L . Supongamos que
el patrn de entrenamiento m-simo x (m ) se sabe que pertenece a la clase i y
x ( m ) , w (jm ) x ( m ) , wl( m ) , l j
Esto es, la clase ganadora para el patrn es la clase (subred) j-sima.
1. Cuando j=1, entonces el patrn x (m ) es clasificado correctamente y no se
necesita
ninguna actualizacin.
j
i
2. Cuando
, esto es, x (m ) es mal clasificado, entonces se realiza lo
siguiente:
( m 1)
wim x, wi
Entrenamiento reforzado: wi
( m 1)
w mj x, w j
Entrenamiento antirreforzado: w j
x, wl z T wl
Entonces el gradiente en la frmula de actualizacin, es simplemente
z
w
Que nos lleva a la regla del perceptrn lineal.
Funcin de base lineal. Una funcin discriminante RBF es una funcin de radio
entre el patrn y el centroide, x wl :
x, wl
x wl
17
( m 1)
wi( m ) x w (jm )
Entrenamiento reforzado: wi
( m 1)
w (jm ) x w (jm )
Entrenamiento antirreforzado: w j
x, wl lk x k wik i
2
k 1
18
-Subcluster DBNNs.
Constituyen una alternativa a usar la suma escalada de los pesos de los nodos
en la estructura de los nodos ocultos. Esta nueva alternativa usa la aproximacin
de el ganador se lleva todo (winner-take-all). Esto es, slo el peso superior ms
representativo tiene un peso de l y todos los dems tienen peso cero.
Para la estructura jerrquica del subcluster, introducimos las nociones del
ganador local y ganador absoluto. El ganador local es el ganador de entre los
subnodos dentro de la misma subred. El ganador local de la subred l est
indexada por s l , esto es
sl arg max l x, wl
Un patrn se clasifica dentro de la clase j-sima si la subred j-sima es la
ganadora absoluta.
-Algoritmo:
Supongamos que varios subclasificadores se usan para representar una clase
con s i , s j , etc, representando los ganadores locales. Supongamos que el patron
x (m ) debe pertenecer a la clase i , pero la subred j-sima se selecciona como
la ganadora absoluta. Cuando i , esto es x (m ) se clasifica mal, entonces se
actualiza lo siguiente:
( m 1)
wsi( m ) x, wsi
Aprendizaje reforzado: wsi
( m 1)
wsj( m ) x, wsj
Aprendizaje no reforzado: wsj
19
E x, w
x, w
t x, w
w
w
20
de
es
las
un
21
1. Producto interno:
xi , x j xiT x j xi x j cos xi , x j
d xi , x j xi k x j k
k
xi k
w
si
y
solo
si
C
ij
ij
wij nk
otros casos
0
22
xi k
w
si
j
gana
sobre
el
estmulo
k
ij
wij nk
23
xi k
gl
wij
24
25
Capacidad representacional
Redes con alimentacin hacia delante (no recurrentes) y sin capas ocultas
(Rosenblatt) Cada unidad de salida es independiente de las otras ya que cada peso
afecta slo a una salida. Se puede construir cualquier multi-perceptron a partir de
perceptrones de una salida Pueden representar funciones booleanas complejas. Ej:
una funcin que detecta si ms de la mitad
de sus n entradas estn a 1, se
representan con un perceptron con todos los pesos a 1 y Slo pueden representar
funciones linealmente separables .
Un ejemplo prctico de un Perceptrn multicapa podra ser su uso en visin artificial.
Dada su capacidad para generalizar, las redes neuronales ya han demostrado su
importncia en este campo. El unico problema s la lentitud que tiene para aprender.
5.1.4 Backpropagation
El aprendizaje con redes de neuronas se realiza actualmente siguiendo el enfoque de
la Retropropagacin de Gradiente Backpropagation y el de los algoritmos
constructivos. El primero necesita introducir a priori el nmero y conexiones de las
unidades ocultas, y determinar los pesos por minimizacin de un costo. La red as
obtenida es eventualmente simplificada eliminando unidades y/o conexiones que
parecen intiles.
26
27
28
En 1982 Kohonen (Kohonen 1982, 1995) propuso el "kohonen's Feature Map", modelo
que pretenda integrar las caractersticas de los modelos biolgicos. Este nuevo
modelo consiste en una Red Neuronal de dos capas, la primera de las cuales es una
capa de entrada y la segunda es una "capa de competicin". Las clulas de ambas
capas estn conectadas entre s, de tal forma que una clula de la capa de entrada
conecta con las de la capa de competicin. Estas conexiones son ponderadas, es
decir, el estmulo excita la capa de entrada, teniendo ambos la misma dimensin.
Representaremos el estmulo mediante el vector {e1, e2,..., en}, siendo {t1, t2,..., tn} el
vector que representa la salida de la capa de competicin, representando igualmente
las conexiones entre la primera capa y la segunda mediante {m 1, m2,..., mn}. De tal
forma podramos definir la salida mediante la siguiente ecuacin:
De tal forma que cada conjunto ordenado {m1, m2,..., mn} sea una imagen que
comparamos con {e1, e2,..., en}. Por tanto, la Red deber adaptar sus parmetros para
que cada unidad est especialmente sensibilizada a un dominio de la seal de entrada
en orden regular.
Para hacer esta comparacin podemos utilizar diversas medidas de distancia, como
por ejemplo la anteriormente utilizada en la que se utiliz el producto escalar de dos
vectores, y tambin podramos utilizar la distancia eucldea entre vectores, de tal forma
si tenemos
entonces calcularemos
siendo la medida de distancia utilizada.
29
donde a(t) es una funcin de "olvido" que decrece con respecto al tiempo, y una
funcin de umbral de salida G(x). Esta funcin es inversamente proporcional a la
respuesta de las clulas, ya que sta ser mxima para clulas con una respuesta
mnima y a la inversa, mnima para clulas con respuesta mxima. Por tanto,
aplicamos la funcin G a la salida de las clulas de la capa de competicin para as
poder obtener una respuesta mayor a estmulos que se aproximen ms a los
almacenados en las conexiones y viceversa.
Podemos discretizar la ecuacin anterior, para ello utilizaremos un "vecindario" Nc(Si)
de la clula c, el cual se define como el conjunto de aquellas clulas que estn a
menos de una distancia Si de c; dicha distancia es discreta, por lo que debemos definir
para cada clula una serie de conjuntos Nc(S1), Nc(S2), Nc(S3) ....
Mediante este vecindario podemos definir la ordenacin topolgica de las clulas del sistema, lo
cual equivaldra a las conexiones laterales del modelo de interaccin lateral. Los vecindarios
nos permiten definir las reglas de modificacin sinptica, lo cual confiere a este modelo cierta
similitud con el crtex cerebral.
Del mismo modo el vecindario nos permitira definir la funcin a de olvido, tanto de
forma continua como discreta, cuyo valor disminuira con la distancia a la clula i, para
la que calcularemos los nuevos pesos.
Adems la funcin G(ti) se puede hacer igual a t i cuando i pertenezca a Nc e igual a
cero en caso contrario, quedando la ecuacin anterior
para i Nc
para i Nc
Podremos, por tanto, definir un espacio alrededor de la clula ganadora, en el cual se
incrementarn las eficacias sinpticas de las clulas. Dicho incremento sera igual
para todas las clulas del vecindario y no existir dicho incremento en las clulas
externas a dicho vecindario.
30
para i Nc
siendo en caso contrario
31
32
6 Aplicaciones
6.1 Redes vs. Metodos clsicos
En muchas areas donde existen problemas de prediccin, clasificacin, etc, existen soluciones
que no estan basadas en redes neuronales pero que dan buenos resultados, o como mnimo
mejores que el no hacer nada.
Frente a este tipo de problemas, donde ya existe dicha solucin clsica, las redes pueden
aportar su alta no linealidad y su gran facilidad en aportar datos adicionales, tanto numricos,
como borrosos y/o subjetivos, que en tcnicas convencionales o medelos clsicos no son
tenidos en consideracin. Por lo tanto, se llega a la conclusin que la utilizacin de redes
neuronales aporta soluciones ms eficientes y seguras que las convencionales. El nico dilema
existente frente a este tipo de problemas con una solucin clsica, es la eleccin entre dos
modos distintos de utilizar las redes, es decir la utilizacin tipo a) o la tipo b).
Tipo a) Se basa en construir un red donde ya este incorporado el modelo clsico,aadir las
nuevas variables que consideremos de inters y efectuar el aprendizaje de la red de tal modo que
esta solo tenga que mejorar el resultado clsico con respecto al resultado deseado. De este modo
nos aseguramos que el resultado de la red siepre sea mejor que el resultado clsico. Solo ser
igual a la resultado clsico, en el caso que las variables adicionales no aporten nada nuevo y no
se necesario no utilizar la no linealidad de la red, dos condiciones que difcilmente se cumplen
simultneamente.
Tipo b) Se basa en construir una red sin incorporar el el modelo clsico pero aadiendo todas
las variables adicionales que sean de inters. Esto no garantiza qu el resultado sea superior al
clsico pero la experiencia acumulada hasta el momento demuestra que siempre es superior
debido a que se utiliza la no linealidad de la red y/o las nuevas variables. Si en algn problema
esto no fuera cierto, siempre podemos recurrir a la incorporacin del modelo clsico en la red
(tipo a).
33
Negocios
Marketing
Venta cruzada
Campanas de venta
Tratamientos de texto y proceso de formas
Reconocimiento de caracteres impresos mecnicamente.
Reconocimiento de grficos
Reconocimiento de caracteres escritos a mano.
Reconocimiento de escritura manual cursiva.
Alimentacin
Anlisis de olor i aroma
Perfilamiento de clientes en funcin de la compra
Desarrollo de productos
Control de calidad
Energa
Prediccin del consumo elctrico
Distribucin recursos hidrulicos para la produccin elctrica
Prediccin consumo de gas ciudad
Industria manufacturera
Control de procesos
Control de calidad
Control de robots
Medicina y salud
Ayuda al diagnstico
Anlisis de imgenes
Desarrollo de medicamentos
Distribucin de recursos
Ciencia e Ingeniera
Anlisis de datos i clasificacin
Ingeniera Qumica
Ingeniera Elctrica
Climatologa
Transportes i comunicaciones
Optimizacin de rutas
Optimizacin en la distribucin de recursos
34
6.3 Aplicaciones
6.3.1 Ejemplo de consumo elctrico
AERN
CONSUMO ELECTRICO
Problema
Determinar la cantidad de electricidad
que se consumir maana durante
cada hora del da en funcin del tipo
de da.
VARIABLES.
Variables elegidas para este estudio:
Parametrizacin en nicamente dos variables
de: 1-24) Perfil normalizado del consumo
horario durante todo el dia.
Esta parametrizacin es hallada
automaticamente por la red.
Variable a PREDECIR:
1) Consumo total.
2-25) Perfil normalizado del consumo horario
durante todo el da.
La red debe buscar la mejor parametrizacin
(ejemplo de clasificacin), para poder utilizarla
posteriormente como prediccin (ejemplo de
prediccin)
35
RESULTADOS.
36
TARJETA DE CREDITO
VARIABLES.
Variables elegidas para este estudio:
Variable a PREDECIR:
Por razones de confidencialidad no se da una descripcin de 1) una variable binaria: 1 si se le
las variables utilizadas.
tiene que dar la tarjeta, 0 en caso
1-15) las 15 que el banco ha considerado relevantes. (Entre contrario.
ellas hay tanto variables numricas como alfanumricas).
RESULTADOS.
Despus de ejecutar la red los resultados se encuentran en el fichero "card.tes". A partir de
este fichero podemos construir la matriz de confusion y valorar los resultados.
Observar que los elementos de la diagonal de dicha matriz son muy superiores a los de fuera de la
diagonal, demostranto la cualidad de la clasificacion.
37
38
GAS
Objetivo
Ayuda al proceso de toma de decisiones
en las previsiones de demanda de
energa.
Problema
Determinar la cantidad de gas que se
consumir maana en una ciudad, en
funcin del histrico de los ltimos das
y de las previsines meteorolgicas.
DATOS.
1.-DATOS ORIGINALES
Se han recopilado datos de consumo y variables climatolgicas de varios aos.
39
VARIABLES.
Variables elegidas para este estudio:
Variable a PREDECIR:
Histrico del Consumo total
Consumo total de maana.
Previsin de consumo industrial para maana y
su histrico
Temperatura y direccin del viento previstas
para maana y su histrico
RESULTADOS.
Despus de ejecutar la red y aplicarla sobre nuevos datos, los resultados se encuentran en el
fichero "gas.tes". La primera columna es la previsin y la segunda la realidad. Como puede
observarse el promedio del valor absoluto del error cometido es solo del 8%, frente al 20% del
modelo lineal.
40
41
BOLSA
Objetivo
Problema
Ayuda al proceso de toma de decisionesDeterminar la rentabilidad de las
en inversin financiera.
acciones de una empresa estudiando
ciertos factores que influyen en el
comportamiento del ndice burstil de
los mercados de capitales.
DATOS.
1.-DATOS ORIGINALES Se han recopilado datos trimestrales de diversas empresas desde enero
de 1988 hasta abril de 1992. Una muestra del fichero original puede verse a continuacin.
VARIABLES.
Variables elegidas para este estudio:
Lingusticas:
Numricas:
1) PG: Poltica general
5) PER: ultima cotizacin dividida
2) PE: Poltica econmica
rentabilidad del capital
3) CBMC: clima burstil en los medios de 6) C/CV: cotizacin sobre valor contable
entre
42
comunicacin
4) IB: ndice burstil
Variable a PREDECIR:
RESULTADOS.
43
FUTUROS FINANCIEROS
Objetivo
Problema
Ayuda al proceso de toma de decisionesDeterminar la evolucin del precio de
de actuacin en el mercado de futuros un contrato de futuro en el da de hoy
sobre el bono nocional espaol.
en funcin de su histrico y su
comportamiento durante el dia de hoy
antes de efectuar la prediccion.
DATOS.
1.-DATOS ORIGINALES
Se han utilizado todas las transacciones de compra/venta de un determinado contrato desde
Enero de 1993 hasta Marzo de 1996. En este cuadro tenemos una muestra.
VARIABLES.
Variables elegidas para este estudio:
Variable a PREDECIR:
Signo de la diferencia entre el precio a la hora
Volumen negociado.
Evolucin del precio durante el da de de la prediccin y el actual.
hoy, antes de efectuar la prediccin.
Volatilidad observada.
Precios promedio, en das anteriores, a
las primeras horas de la maana y a la
hora de la prediccin.
44
RESULTADOS.
45
6.4 Pluviometria
SISTEMA EXPERTO BASADO EN REDES NEURONALES APLICADO A LA
PREDICCIN A CORTO PLAZO DE LA INTENSIDAD DE LLUVIA Y DE LOS
NIVELES EN LA RED DE ALCANTARILLADO
6.4.1 Introduccin
Desde hace unos aos, las nuevas tcnicas de gestin de las redes de servicios estn
siendo adoptadas tambin en la gestin de las redes de alcantarillado. La concepcin
de las redes de alcantarillado como unas redes estticas que evacuan aguas pluviales
y residuales nicamente por gravedad o con algn bombeo de ayuda esta quedando
atrs.
Las nuevas tcnicas permiten ir mucho ms all en la tarea de evacuacin efectiva de
las aguas recogidas en las reas urbanas, permitiendo conseguir ms ambiciosos
objetivos de reduccin de inundaciones, reduccin de impactos al medio ambiente de
las aguas descargadas por el sistema de saneamiento, informacin al ciudadano o
costes de las obras de infraestructura.
Estas tcnicas basadas principalmente en integracin de tecnologas ya existentes
requieren una infraestructura base: los actuadores de la red. Es decir, la colocacin de
compuertas, vlvulas, bombas, depsitos de retencin, etc., en la red de alcantarillado.
Pero para saber como actuar sobre ella, hay que contar con toda una serie de
medidores que permitan establecer las acciones adecuadas. As pues, hay que contar
con pluvimetros, limnmetros, caudalmetros, medidores de la calidad del agua, etc.
Las tecnologas informticas de computacin y comunicaciones permitirn construir
con todo ello un sistema de telecontrol. Con l, y con los criterios de actuacin
respaldados por los modelos hidrolgicos de simulacin del comportamiento de la red
ante cualquier situacin, podremos hacer una nueva y efectiva gestin del
alcantarillado.
La anticipacin a los acontecimientos nos permitir mejores actuaciones. En concreto,
el disponer de predicciones de lluvia o nivel de agua en el colector a corto plazo
permitir decidir cual es la mejor operacin de la red posible.
CLABSA, empresa que gestiona tcnicamente el alcantarillado de la ciudad de
Barcelona, ha adoptado este enfoque de explotacin de la red de alcantarillado.
46
47
48
La salida del proceso de clasificacin nos dar el tipo de red, con el cual cargaremos
un modelo
u otro, el cual habr pasado previamente el proceso de aprendizaje.
En la prediccin de precipitacin 5-minutal, la
seleccin del modelo a implementar fue
siguiendo la manera standard de crear una red
neuronal. Se cre un SLAB de entrada externa
de seis neuronas, en el que se introducen los
datos de la lluvia de la ltima media hora, un
SLAB de entrada interno de seis neuronas (que
mantiene los datos de la ltima media hora
anterior), un SLAB intermedio que sirve para la
propagacin de las entradas, y un SLAB de
salida de seis neuronas que nos dar los datos
en periodos 5-minutales de la prediccin de los
prximos 30 minutos.
Imagen 6.2 SLAB
49
6.4.7 Resultados
Antes de poder dar unos resultados aceptables, se implementaron distintos tipos de
redes con errores que superaban el error estipulado como mximo.
En la ltima implementacin con una estructura ms estable, pudimos ver que las
grficas reales y las estimadas empezaban a parecerse, con un error en las
aproximaciones que no superaba como se ha mencionado anteriormente al 10%.
Esta grfica es un ejemplo de lluvia de Tipo A, con entrada real (trazo fino) y salida
estimada (trazo punteado). Apreciamos como se ajustan las curvas en los picos, ya
que la red ha sido entrenada para detectar puntas, y por contra la lluvia menos intensa
no la reconoce.
En cambio, en la grfica de Tipo C, se observa que la prediccin es mejor donde no
hay picos, ya que los pesos utilizados se han calculado para lluvias suaves.
50
51
52
53
Imagen 9.1.
Imagen 9.1
En dicho men, se puede observar, podemos elegir entre:
-
Metdos de aprendizaje:
Backpropagation
Backpropagation with maps of memory
Hybrid Network
Radial Basis
Kohonen Classifier
Conjugate Gradient
Hopfield Ass Memory
Kohonen Demo
Trav Salesman Demo
54
Imagen 9.2
Una vez dentro, nos pide que introduzcamos los siguientes datos:
1- Data Directory
Aqu introducimos el nombre del directorio donde se encuentran los ficheros de
datos.
2- Data File
Aqu introducimos el nombre del archivo que queremos. Los cuales se pueden
visualizar en la ventana adjunta.
3- Noise
Aqu introducimos el ruido que queremos.
4- Normalize
Aqu podemos escoger entre:
Ninguno
Energy
Stadistical
Una vez introducidos todos estos datos, nos aparece otra ventana en la que
introducimos datos topolgicos de la red (imagen 9.3). Estos son:
55
Imagen 9.3
1- Number of layers: Introducimos nmero de capas
2- Hidden Nodes: Nmero de nodos ocultos.
3- Weight File: Introducimos el archivo donde se encuentran el valor de los pesos.
Tambin tenemos la opcin de ponerlos aleatoriamente random.
Una vez introducidos todos estos datos, comienza la simulacin de la red. La que
podemos visualizar graficamente. Aqu tenemos un ejemplo de perceptron (imagen
9.4) con los siguientes datos:
-
Number of Layers: 2
Hidden Nodes: 5
Weight file: r
Imagen 9.4
Durante la ejecucin de la simulacin podemos acceder unos iconos que estan
situados en la parte superior de la pantalla. Y estos son:
-
56
Learning On/Off: Al que accedemos con la tecla L y con la que seleccionamos que
la red est aprendiendo o no.
Read: Al que accedemos con la tecla R. Sirve para cargar una simulacin.
Kohonen Classifier.
En este ejemplo los pasos a seguir son los mismos que en el ejemplo anterior.
Pero el mtodo es diferente (imagen 9.5).
Imagen 9.5
Hopfield.
57
Imagen 9.6
El programa tambin incluye las siguientes demos:
1- Tray Salesman Demo.
Aqu introducimos los siguientes datos:
Data Directory
Data File
Imagen 9.7
2- Kohonen Demo.
Una vez dentro de la demo, al igual que en los otros simuladores, debemos introducir
los siguientes parmetros:
-
Funcin de densidad:
Elegir entre: cuadrado, triangulo y cruz
Funciones de probabilidad:
Que utiliza el programa en los ejes x e y.
58
Random
Random
Imagen 9.8
2Funcin probabilidad: Gausiana
Gausiana
Imagen 9.9
59
Imagen 9.10
Conclusiones.
Cuando utilizamos una funcin de probabilidad Random podemos observar que es la
que se aproxima ms a la figura real, pero se sale de los lmites. Si utilizamos
Gausiana, no se sale de los lmites, pero no se aproxima tanto como la Random. Y
finalmente, con la Chi Squared observamos que es la peor opcin de todas, ya que es
la que menos se aproxima a la figura real.
60
9. Conclusiones
61
El mundo tiene mucho que ganar con las redes neuronales, ya que las personas que
las utilizan ahora y las utilizarn en el futuro son aquellas que tienen que trabajar o
analizar datos de cualquier tipo. Gente de industria, finanzas, negocios, educacin y
ciencia cuyos problemas son complejos, laboriosos, confusos o simplemente sin
solucin con los mtodos actuales. Gente que quiere mejores soluciones y esperan
ganar un lugar estratgico.
Su habilidad para aprender mediante ejemplos las hace muy flexibles y poderosas. Adems no
es necesario crear un algoritmo para llevar a cabo una tarea especifica, esto es, no hay necesidad
de entender el mecanismo interno de la tarea. Ellas estn bien adaptadas para los sistemas de
tiempo real debido a su capacidad de respuesta rpida, la cual se debe a su arquitectura paralela.
Las Redes neuronales, con su notable habilidad para deducir significados de datos complicados
o imprecisos pueden ser usadas para extraer patrones y detectar tendencias que son demasiado
complejas para ser comprendidas por los humanos u otras tcnicas computacionales. Una red
neuronal capacitada puede ser concebida como algo que algn da le podremos realizar
preguntas como "que pasara si...".
Quizs el aspecto ms excitante de las redes neuronales es la posibilidad de dotar a estas de
conciencia. Existe un nmero de cientficos que argumentan que la concienciacin es una
propiedad mecnica y que la conciencia de las redes neuronales es una posibilidad real.
Finalmente, nos gustara afirmar que incluso las redes neuronales tienen un gran
potencial que slo obtendremos de ellas cuando las integremos al conjunto de la
Inteligencia artificial.
62
10 Bibliografa
Freeman, J.A., Skapura, D.M., "Neural Networks", Ed. Addison Wesley.
Caudill, M., Butler, Ch., "Understanding Neural Networks", MIT Press.
Widrow, J., Rumelhart, D.E., Lehr, M.A., "Neural networks: Applications in industry,
business and science", ACM communications, Vol-37, 1.994.
Hagan, Martin T, Neural Network Design, PWS Publishing Company,1996.
J.R. Hilera Gonzlez y V.J. Martnez Redes Neuronales Artificiales: Fundamentos,
modelos y aplicaciones, RA-MA, 1995.
Varios, Aprendizaje Automtico, Edicions UPC, Barcelona, CAT, 1994.
[HEBB49] D.O Hebb. The organization of Behaviour John Wiley & sons, New York,
1949.
[MINS69] M. Minsky & S. Papert, Perceptrons MIT Press, Cambridge, MA, 1969.
Webs Sites
http://www.geocities.com/SiliconValley/Campus/9756/RNA_index.htm
http://elgva1.usc.es/~antonio/rn/temas-rn.htm
http://www.gc.ssr.upm.es/inves/neural/ann2/anntutorial.html
http://boletin-fh.tid.es/bole19/art002.htm#biologico
http://www.dbai.tuwien.ac.at/marchives/
http://www.eupmt.es/cra/inform/info11.htm
http://mediapolis.es/tethys/num1/Clabsa_CAS.htm
http://www.ecm.ub.es/aern/rn0.htm
http://decsai.ugr.es/~castro/MCII/node20.html
http://www.aircenter.net
http://moon.inf.uji.es/%7Ejavi/historia/eniac.htm
63