Sunteți pe pagina 1din 54

VISIÓN PANORÁMICA DE LAS

REDES NEURONALES ARTIFICIALES


Introducción
 Búsqueda constante de nuevas vías para mejorar
condiciones de vida del hombre.
Máquinas mecánicas (fuerza)
Calculadoras para resolver operaciones básicas
Primera computadora electrónica: ENIAC (1946)

• El computador convencional puede ejecutar


operaciones aritméticas y lógicas mucho más rápido
que el cerebro humano
• PERO .......
Introducción

 El computador convencional puede ejecutar


operaciones aritméticas y lógicas mucho más rápido
que el cerebro humano

PERO .......
¿Pero .....?

 ¿Clasificación de objetos por razgos comunes?


 ¿Contamos con información imprecisa, masiva y
muchas veces distorsionada?
 ¿Si no se puede definir un algoritmo para obtener el

resultado deseado?
Introducción

 Enfoque del problema de una manera distinta


 Característica común de los problemas que no se
resuelven con un algoritmo:

LA EXPERIENCIA
 Estudio del cerebro humano desde el punto de vista

de la computación
Cerebro Computador
Velocidad de = 10-2 seg. (100 Hz) =10-9 seg. (1000
Proceso MHz)
Estilo de Paralelo Secuencial
Procesamiento
# de Procesadores 10 11 - 1014 Pocos
Conexiones 10,000 por Pocas
procesador
Almacenamiento del Distribuido Direcciones fijas
conocimiento
Tolerancia a fallos Amplia Nula
Tipo de control del Auto organizado Centralizado
proceso
Introducción
 La IA busca descubrir y describir aspectos de la inteligencia humana que
pueden ser simulados mediante máquinas.
 Los sistemas neuronales toman las características esenciales de la estructura
neuronal del cerebro para emularlo en parte.

Las RNA no intentan solucionar los


problemas mediante una secuencia
de pasos, sino combinando muchos
elementos simples (neuronas)
interconectados y operando en
paralelo.
Introducción

Operan en base a reconocimiento de


patrones.
Adquieren, almacenan y utilizan
conocimiento experimental obtenido a
partir de ejemplos.
No se programan: “aprenden” mediante
un algoritmo de aprendizaje.
Las redes neuronales son modelos
matemáticos multivariantes que utilizan
procedimientos iterativos, en general para
minimizar funciones de error.
Elementos Básicos

La Neurona biológica
Elementos Básicos

Comunicación entre neuronas: SINAPSIS


Elementos Básicos

 Las sinapsis alteran la efectividad con la que la señal


es transmitida, a través de un parámetro: El peso.
 El aprendizaje resulta de la modificación de estos
pesos, los que unidos al procesamiento de
información de la neurona determinan el mecanismo
básico de la memoria.
Elementos Básicos

 El soma de la neurona recibe todos estos inputs, y


emite una señal de salida (output) si la entrada total
supera el valor del umbral.
 Esta salida se transmite a través del axón, desde
donde se propaga mediante diferencias de potencial
a las dentritas de otras neuronas
Elementos Básicos

 Hay grupos neuronales, compuestos de millones de


neuronas pertenecientes a una determinada región
del cerebro, que constituyen unidades funcionales
especializadas en ciertas tareas (un área visual, un
área auditiva, etc.).
Estructura de un Sistema
Neuronal Artificial

E S
N A
T L
 R I
A D
D A
A S
S Parte
algorítmica

Neurona Capa Red Sistema Neuronal


Características

Aprendizaje adaptativo:
 Capacidad de aprender a realizar tareas basadas en un entrenamiento o
en una experiencia inicial.
 Una red neuronal no necesita un algoritmo para resolver su
problema, ya que puede generar su propia distribución de los
pesos de los enlaces mediante el aprendizaje.
Características

Auto organización:
 Pueden crear su propia organización o representación de la información
que reciben mediante una etapa de aprendizaje.
 Da lugar a la generalización: Para entradas poco claras o incompletas
Características

Tolerancia a fallos:
 Estando la información distribuida por las sinapsis de la red, si una
sinapsis se daña solamente perdemos una pequeña parte de la
información.
Características

Procesamiento Paralelo:
 Los cómputos neuronales pueden ser realizados en paralelo
 Para esto se diseñan y fabrican máquinas con hardware especial para
obtener esta capacidad.
Elementos Básicos

Un sistema neuronal o conexionista tiene:


 Un conjunto de procesadores elementales o neuronas artificiales.
 Un patrón de conectividad o arquitectura.
 Una dinámica de activaciones.
 Una regla o dinámica de aprendizaje.
 El entorno donde opera.
La Neurona Artificial

Es un dispositivo simple de cálculo que, a partir de un vector de


entrada procedente del exterior o de otras neuronas, proporciona
una única respuesta o salida.
La Neurona Artificial

Tipos de Neuronas

E I1 O1 S
N A
T L
R I2 O2 I
A . . . . . . D
D .
. . . . . . A
. . . . .
A S
S Im Om

Nivel de Niveles Nivel de


Entrada Ocultos Salida
La Neurona Artificial

Elementos de la neurona i:

Valor o estado de Activación ai(t): Valor


numérico que caracteriza a la neurona.
Función de transferencia fi que transforma
el estado actual de activación en una
señal de salida yi, la que es enviada a
otras neuronas de la red a través de los
canales de comunicación.
Estas señales se modifican de acuerdo a
los pesos sinápticos wji asociados a cada
canal.
La Neurona Artificial

 Las entradas moduladas que llegan a la


neurona j se combinan entre ellas, generando
la entrada total

Netj   yi wji
i
 Una regla de activación determina el nuevo
estado de activación aj (t+1) de la neurona,
teniendo en cuenta la entrada total
calculada y el anterior estado de activación
aj (t).
La Neurona Artificial

Neurona Uh
yh
Neurona Uj
wjh
Neurona Ui
F(aj(t), Netj) fj(aj(t+1))
yi Netj = = yj
wji
. aj (t+1) yj
.
. wjg
.
Neurona Ug
yg
APRENDIZAJE

 Biológicamente, la información memorizada en el cerebro está


más relacionada con los valores sinápticos de las conexiones entre
las neuronas, que con ellas mismas; es decir, el conocimiento se
encuentra en las sinapsis.
APRENDIZAJE

 Una red neuronal artificial aprende mediante la modificación de


los pesos de las conexiones entre las neuronas.
 Se dice que la red “ha aprendido” cuando los valores de los pesos
permanecen estables:

dwij /dt = 0
APRENDIZAJE

Reglas de Aprendizaje:

Supervisado
No supervisado o autoorganizado
Aprendizaje Supervisado

 Se proporciona a la red parejas de patrones entrada – salida, y


ésta aprende a asociarlos.
Formas:

Aprendizaje por corrección de


error
Aprendizaje por refuerzo
Aprendizaje estocástico
Aprendizaje Supervisado por
Corrección de Error

 Los pesos de las conexiones de la red se ajustan en función de la


diferencia entre los valores deseados y los obtenidos en la salida;
es decir, en función del error cometido.
Aprendizaje Supervisado por
Corrección de Error

y1
1
.
. wj1
.
yi wji
i yj
. wjn
.
. yn
Unidad Uj
n
Aprendizaje Supervisado por
Corrección de Error

Regla de aprendizaje del Perceptrón (Rosenblatt, 1958)


 wji =  yi (dj – yj)
Donde
 wji = variación en el peso de la conexión
yi : Valor de salida de la neurona i.
dj : Valor de salida deseado para la
neurona j.
yj :Valor de salida obtenido de la neurona j.
 : Factor de aprendizaje (0 <  <= 1) que
regula la velocidad del aprendizaje.
Aprendizaje Supervisado por
Corrección de Error
Regla Delta o del error mínimo cuadrado (Widrow y Hoff, 1960).

P N
1
Errorglobal  
2 P k 1 j 1
( yj  dj )
(k ) (k ) 2

N : número de neuronas de salida


P: número de informaciones que debe aprender
1 N

2 j 1
( yj
k
 dj
k 2
) Error cometido en el aprendizaje de la
información k-ésima
Aprendizaje Supervisado por
Corrección de Error
Regla Delta Generalizada, LMS – Least Mean Square Error - Multicapa
ó Backpropagation (1986).
 Se aplica a redes con una o más capas ocultas
 Se emplean en muchas más aplicaciones que las anteriores
 Su aprendizaje en más lento por la mayor cantidad de conexiones que
explorar.
Aprendizaje Supervisado por Refuerzo

 Mas lento que el anterior, basado en no indicar exactamente a la


red la salida deseada ante una determinada entrada.
 Se indica a la red mediante una señal de refuerzo si la salida
obtenida se ajusta a la deseada (éxito = +1 ó fracaso = -1), y en
función de ello se ajustan los pesos.
Aprendizaje Supervisado Estocástico

 Consiste básicamente en realizar cambios aleatorios en los valores


de los pesos de las conexiones de la red, y evaluar su efecto a
partir del objetivo deseado y de distribuciones de probabilidad.
Aprendizaje No Supervisado

 Se proporciona a la red solamente las entradas, para que extraiga


los razgos característicos esenciales.
 La red busca el agrupamiento de los patrones de entrada, análisis
de conglomerados o cluster, escalas multidimensionales, etc.
 La interpretación de las salidas depende de su estructura y del
algoritmo de aprendizaje.
Aprendizaje No Supervisado

 Puede representar el grado de similitud entre la información que se le


está presentando en la entrada y las informaciones que se le han
mostrado en el pasado (Aprendizaje Hebbiano).
 En otro caso, podría realizar un clustering o establecimiento de
categorías (Aprendizaje competitivo y comparativo).
COMPARACIÓN CON OTRAS
TÉCNICAS
Inteligencia Artificial (IA):
 Imitar el razonamiento humano a través de una lógica deductiva o
manipulación de símbolos:
Qué hace el cerebro
Redes Neuronales Artificiales (RNA):
 Inspiración biológica:
Cómo funciona el cerebro
Comparación con otras
técnicas
IA - Sistemas Expertos:
 Motor de Inferencia con la programación de las manipulaciones
genéricas de tipo lógico a aplicar,
 Base de Conocimiento, que almacena la información a emplear en el
problema (reglas y parámetros)
Comparación con otras
técnicas
Redes Neuronales Artificiales:
 El conocimiento emerge de las interconexiones de la estructura de la red
de procesadores elementales (inteligencia computacional)
 La intensidad de las conexiones se obtiene mediante entrenamiento: no
hay que programarla.
Comparación con otras
técnicas
IA - Sistemas Expertos:
 Desarrollos normalmente costosos en tiempo y dinero.
 Tiempo de respuesta usualmente lento, por frondosos árboles de
decisión
Comparación con otras
técnicas
Redes Neuronales Artificiales:
 Tiempos de respuesta muy pequeños (milisegundos), aún en
computadores convencionales.
 Lo costoso es el aprendizaje, pero se suele realizar solamente una vez.
 Pueden resolver problemas complejos para los que no existe un
algoritmo definido.
Comparación con otras
técnicas
 La IA tiene un enfoque descendente (reglas, conceptos y cálculos
secuenciales), como la mitad izquierda del cerebro.
 Las RNA tienen enfoque emergente, interpretando intuitiva y
paralelamente imágenes, sonidos y estímulos, como el lado derecho del
cerebro.
Comparación con otras
técnicas

 La IA y las RNA son tecnologías complementarias, no excluyentes.


 Los mejores resultados se obtienen aplicando cada técnica al aspecto
del problema para el que resulte más apropiada.
APLICACIONES

 RNA lineales
 Clasificación de Patrones
 Predicción y Análisis financiero
 Control y Optimización
 Aplicaciones militares
 Aplicaciones Médicas y Biomédicas
 ..........................
APLICACIONES

Características que debe tener el problema para trabajarlo con RNA:


 No se cuenta con reglas que lo describan completamente.
 Se dispone de muchos ejemplos o datos históricos.
 Datos imprecisos o con “ruido”
 Elevada dimensionalidad
 Condiciones cambiantes
APLICACIONES

Características que hacen desaconsejable el uso de RNA:


 Existe un algoritmo que resuelve con total eficacia el problema.
 No se dispone de un número adecuado de casos ejemplo para entrenar la
red.
 Tareas críticas o potencialmente peligrosas, cuya solución siempre deba ser
perfectamente predecible y explicable.
CASO DE ESTUDIO
Administración de Servicio de
Perinatología

 El cuerpo humano y sus interacciones con su entorno conforman uno de


los sistemas más complejos.
 Muchas variables: Alta dimensionalidad
 Información a menudo incompleta y con errores
 Abundancia de datos clínicos
CASO DE ESTUDIO
Administración de Servicio de
Perinatología

Se dispone de data detallada de


más de 160,000 nacimientos de los
últimos 4 años:
Información de la madre
Información del hijo: Peso al nacer,
edad gestacional, condiciones al
egreso
Si fallecido, edad y causa de muerte
CASO DE ESTUDIO
Administración de Servicio de
Perinatología

Se requiere identificar el perfil de


salud de la madre asociado al
fallecimiento de los bebes según:
Madre: dolencias generales que
cursan con el embarazo, y dolencias
obstétricas
Hijo: peso al nacer y edad al fallecer
CASO DE ESTUDIO
Administración de Servicio de
Perinatología

Peso /
FATP FDTP F<1día F<7 días F<27días
edad

< 1500 gr

< 2500 gr

> 2500 gr
CASO DE ESTUDIO
Administración de Servicio de
Perinatología

Estrategia:
Planteamiento del Problema
Requerimientos del sistema
Revisión bibliográfica
Elección del modelo: MLP con
aprendizaje BP
CASO DE ESTUDIO
Administración de Servicio de
Perinatología

Estrategia:
Datos disponibles y selección de
variables relevantes
Elección del conjunto de
aprendizaje y prueba.
Preprocesamiento: Tratamiento de
los datos para adecuarlos a la red
CASO DE ESTUDIO
Administración de Servicio de
Perinatología

Estrategia:
Entrenamiento: pesos, ritmo de
aprendizaje, cantidad de neuronas
ocultas
Evaluación de resultados