Sunteți pe pagina 1din 123

1 Universidad Autnoma de Quertaro

INTRODUCCIN A LA INTELIGENCIA ARTIFICIAL.


Titular de la Materia.
Efrn Gorrostieta Hurtado.
NDICE DEL CONTENIDO DE LA MATERIA:
CAPITULO I: INTRODUCCIN.
Antecedentes e Historia. [6]
Los principios de la Inteligencia Artificial. [8]
Los antecedentes de las novelas de ciencia ficcin. [11]
Aportes de la ciencia ficcin a la ciencia [14]
Primeros intentos de los algoritmos de inteligencia artificial. [15]
El desarrollo de los algoritmo gentico [16]
Desarrollo de la inteligencia Artificial [17]
Sistema experto [18]
Definiciones Bsicas. [19]
1.2.1 Definicin de inteligencia. [19]
1.2.2 Definicin de razonamiento. [19]
1.2.3 Definicin de inteligencia artificial. [20]
1.2.4 Definicin de sistemas de estado. [20]
Sistemas de estados.
1.3.2 Ejemplo de los sistemas de estado. [22]
1.3.3 Ventajas y desventajas de los sistemas de estado. [23]
Sistemas Expertos.
Definicin de los sistemas expertos. [24]
1.4.2 Caractersticas de los sistemas expertos. [25]
1.4.3 Algoritmos de sistemas expertos. [27]
1.4.4 Ejemplo de sistemas expertos. [28]
1.4.5 Ventajas y desventajas de sistemas expertos. [29]
Paradigmas de la Inteligencia artificial [30]
La inteligencia artificial contra la inteligencia humana. [31]
Sistemas inteligentes como sustitutos humanos.
2
Caractersticas de los sistemas donde se aplica I. A. [33]
Estado actual de la Inteligencia Artificial. [34]
CAPITULO II: LGICA DIFUSA.
Introduccin a la lgica difusa. [35]
Principios biolgicos de la lgica difusa. [36]
Estructura bsica de sistemas difusos. [37]
Proceso de fussificacion. [38]
Operaciones Difusas. [41]
Operaciones lgicas bsicas. [41]
Propiedades de los operadores. [43]
Inferencias Difusas. [44]
Defusificacin. [46]
Proceso de defusificacin. [46]
Aplicaciones. [47]
CAPITULO III: REDES NEURONALES.
Introduccin y origen de las redes neuronales. [52]
Historia. [52]
Definicin red neuronal [56]
La neurona artificial [58]
Estructura bsica de una neurona. [59]
3
La red Neurona. [60]
3.4.2 caracteristicas de una red neuronal [67]
3.6 Estructura bsica de las redes neuronales. [71]
Retropropagacion [79]
Algoritmos de calculo [81]
Proceso de aprendizaje de la red [84]
aplicaciones [92]
CAPITULO IV: ALGORITMOS GENTICOS.
4.1 Introduccin. [95]
Historia. [96]
Fundamento natural. [97]
Esquema general del algoritmo [98]
Evaluacin y seleccin [99]
4.4.1 Introduccin de Algoritmos genticos. [101]
4.4.2 Caractersticas de los cruzamientos. [102]
4.4.3 Tipos de cruzamientos [106]
4.5 MUTACIONES. [108]
4.5.2 Caractersticas de las Mutaciones [109]
4.5.3 Desarrollo y estado actual. [110]
4.6.1 Generadores. [111]
4.6.2 Tipo de generadores bsicos. [112]
4.6.3 Evolucin de Especies. [113]
4.7 APLICACIONES. [115]
4.7.1 Ejemplos de Algoritmo Gentico. [115]
4.7.2 Aplicaciones de los Algoritmos Genticos. [119]
Bibliografa. [122]
4
El hombre se ha denominado a si mismo el nombre
cientfico de homo sapiens (hombre sabio) como una
valoracin de la trascendencia de nuestras habilidades
mentales tanto para nuestra vida cotidiana como en
nuestro propio sentido de identidad. Los esfuerzos del
campo de la inteligencia artificial o IA, se enfocan en
lograr la comprensin de entidades inteligentes. Por ello,
una de las razones de su estudio es el aprender ms
acerca de nosotros mismos.
Otra razn por la cual se estudia la IA es debido a que
las entidades inteligentes as construidas son
interesantes y tiles por derecho propio, debido a esto
tendrn repercusiones muy importantes en nuestra vida
diaria as como en el devenir de la civilizacin.
La IA es una de las disciplinas ms nuevas. Formalmente
se inicia en 1956, cuando se acu el trmino, no
obstante que ya para entonces se haba estado
trabajando en ello durante cinco aos. Junto con la
gentica moderna, es el campo en que a la mayora de
los cientficos de otras disciplinas les gustara trabajar.
Universidad Autnoma de Quertaro 5
CAPITULO I: INTRODUCCIN.
El origen del concepto y de los criterios de desarrollo de la "IA"
se remonta a la intuicin del genio matemtico ingls Alan
Turing y el apelativo "Inteligencia Artificial" se debe a McCarthy,
uno de los integrantes del "Grupo de Darmouth", que en el
verano de 1956, se reuni en el Darmouth College (Estados
Unidos) para discutir la posibilidad de construir mquinas
"inteligentes".
Los principales integrantes del grupo eran:
John McCarthy: quien le dio el nombre a esta nueva rea del
conocimiento y estudiaba sistemas capaces de efectuar
razonamientos de sentido comn.
Marvin Minsky: fundador del laboratorio de IA del MIT.
Trabajaba sobre razonamientos analgicos de geometra
Claude Shannon: de los laboratorios Bell de EEUU.
Nathaniel Rochester: de IBM
Allen Newell: primer presidente de la AAAI (Asociacin
Americana de Inteligencia Artificial)
Herbert Simon
A partir de este grupo inicial, se formaron dos grandes
"escuelas" de I.A.: Newell y Simon lideraron el equipo de la
Universidad de Carnegie-Mellon, proponindose desarrollar
modelos de comportamiento humano con aparatos cuya
estructura se pareciese lo ms posible a la del cerebro (lo que
posteriormente deriv en la llamada postura "conexionista" y en
los trabajos sobre "redes neuronales" artificiales).
6
1.1 ANTECEDENTES E HISTORIA.
McCarthy y Minsky formaron otro equipo en el
Instituto Tecnolgico de Massachusett (MIT),
centrndose ms en que los productos del
procesamiento tengan el carcter de
inteligente, sin preocuparse por que el
funcionamiento o la estructura de los
componentes sean parecidas a los del ser
humano.
Ambos enfoques sin embargo corresponden a
los mismos objetivos prioritarios de la I.A.:
"entender la inteligencia natural humana, y
usar mquinas inteligentes para adquirir
conocimientos y resolver problemas
considerados como intelectualmente difciles".
La historia de la IA ha sido testigo de ciclos de
xito, injustificado optimismo y la consecuente
desaparicin de entusiasmo y apoyos
financieros. Tambin ha habido ciclos
caracterizados por la introduccin de nuevos y
creativos enfoques y de un sistemtico
perfeccionamiento de los mejores.
Universidad Autnoma de Quertaro 7
La inteligencia artificial es un campo joven, se heredera de
diversas ideas, puntos de vista y tcnicas de otras
disciplinas.
Para la evolucin de la Inteligencia Artificial las dos
fuerzas ms importantes fueron la lgica matemtica, la
cual se desarrolla rpidamente a finales del siglo XIX, y
las nuevas ideas acerca de computacin y los avances en
electrnica que permitieron la construccin de los
primeros computadores en 1940. Tambin son fuente de
la inteligencia artificial: la filosofa, la neurociencia y la
lingstica. La lgica matemtica ha continuando siendo
un rea muy activa en la inteligencia artificial. Incluso
antes de la existencia de los ordenadores con los
sistemas lgicos deductivos.
FILOSOFA (DE 428 A.C. AL PRESENTE)
Los filsofos permitieron el poder pensar en la inteligencia
artificial al concebir a la mente con maneras diversas
como una mquina que funciona a partir del conocimiento
codificado en un lenguaje interno y al considerar que el
pensamiento serva para determinar cul era la accin
correcta que haba que emprender.
Cerca de 300 a. C., Aristteles fue el primero en describir
de manera estructurada un conjunto de reglas,
silogismos, que describen una parte del funcionamiento
de la mente humana y que, al seguirlas paso a paso,
producen conclusiones racionales a partir de premisas
dadas.
Universidad Autnoma de Quertaro 8
1.1.1 LOS PRINCIPIOS DE LA INTELIGENCIAARTIFICIAL.
MATEMTICAS (APROXIMADAMENTE DEL AO 800 AL
PRESENTE)
Proveyeron las herramientas para manipular las
aseveraciones de certeza lgica as como las inciertas de
tipo probabilista. As mismo prepararon el terreno para el
manejo del razonamiento con algoritmos.
Era necesario contar con una formalizacin matemtica
en tres reas principales: la computacin, la lgica y la
probabilidad. La idea de expresar un clculo mediante un
algoritmo formal se remonta a la poca de al-Jwarizmi,
matemtico rabe del siglo IX, con cuyas obras se
introdujeron en Europa los nmeros arbigos y el lgebra.
La lgica de George Boole (1815-1864) introdujo su
lenguaje formal para hacer inferencias lgicas en 1847. El
mtodo de Boole no estaba del todo completo, pero era
bastante bueno.
En 1937 Alan Turing public un artculo de bastante
repercusin sobre los "Nmeros Calculables", un artculo
que estableci las bases tericas para todas las ciencias
de computacin.
En este artculo introdujo el concepto de Mquina de
Turing, una entidad matemtica abstracta que formaliz el
concepto de algoritmo y result ser la precursora de las
computadoras digitales. Poda conceptualmente leer
instrucciones de una cinta de papel perforada y ejecutar
todas las operaciones crticas de un computador. El
artculo fij los lmites de las ciencias de la computacin
porque demostr que no es posible resolver problemas
con ningn tipo de computador. Con ayuda de su
mquina, Turing pudo demostrar que existen problemas
irresolubles, de los que ningn ordenador ser capaz de
obtener su solucin, por lo que se le considera el padre
de la teora de la computabilidad.
Universidad Autnoma de Quertaro 9
INGENIERA COMPUTACIONAL (DE
1940 AL PRESENTE)
Ofreci el dispositivo que permite hacer realidad
las aplicaciones de la inteligencia artificial. Los
programas de inteligencia artificial por general son
extensos y no funcionaran sin los grandes
avances de velocidad y memoria apartadas por la
industria de cmputo.
La ingeniera computacional ha experimentado un
notable xito y, por lo general, logra duplicar
eficiencia cada dos aos, sin que se prevea un fin
de esta tendencia a corto plazo.
La IA debe mucho tambin al rea de software de
la informtica, pues la ha dotado de sistemas
operativos, lenguajes de programacin y
herramientas necesarias para escribir programas
modernos (as como disertaciones sobre stos).
LINGSTICA (DE 1957 AL PRESENTE)
La lingstica moderna y la IA nacieron al mismo
tiempo, por lo que la primera no desempeo un papel
determinante en el desarrollo de la IA. Ms bien ambas
crecieron juntas, y se cruzaron en campo hbrido
denominado lingstica computacional o procesamiento
del lenguaje natural, y que se concentra en el problema
del uso del lenguaje demostrando que el uso de un
lenguaje se ajusta dentro de este modelo.
10
1.1.2 ANTECEDENTES DE LAS NOVELAS DE CIENCIA FICCIN.
La ciencia ficcin es un gnero de ficcin especulativo donde
los relatos presentan el impacto de avances cientficos y
tecnolgicos, presentes o futuros, sobre la sociedad o los
individuos. Este gnero ha experimentado durante todo el siglo
XX un gran xito tanto en la literatura como en el cine.
Los cuentos o historias de ciencia ficcin exploran lo
desconocido enmarcndolo en los efectos de la ciencia y la
tecnologa sobre la sociedad. En una visin amplia incluye
obras fantsticas de autores fuera del gnero especfico.
Originalmente un gnero literario que tambin ha alcanzado
gran desarrollo en el cine.
CARACTERSTICAS FRECUENTES
1. Diferenciacin del ser humano a partir de la
comparacin con robots, extraterrestres y otros seres
superinteligentes.
2. Futuros o alternativas temporales (diacronas),
centrndose habitualmente en el desarrollo cientfico o
social.
3. Posibles inventos o descubrimientos cientficos y tcnicos.
4. Contacto con extraterrestres y sus consecuencias.
5. Robots e inteligencias sintticas.
6. Clonacin y manipulacin gentica.
7. Exploracin y colonizacin del espacio.
8. Mundo controlado por ordenadores y tecnologa en
general.
9. Una red que conecta a todo el mundo y personas (como
Internet).
10. Vida extraterrestre.
11. Viajes en el tiempo.
12. Futuro apocalptico
13. Futuro utpico y tambin sinptico.
14. Seres Humanos con anomalas fsicas.
11
La expresin Ciencia ficcin fue acuada en 1926 por Hugo
Gernsback cuando la incorpor a la portada de una de las
revistas de narrativa especulativa ms conocidas de los
aos 1920 en Estados Unidos: Amazing. El uso ms
temprano del trmino parece datar de 1851 y es atribuido a
William Wilson, pero se trata de un uso aislado y el trmino
no se generaliz con su acepcin actual, hasta que
Gernsback lo utiliz de forma consistente.
As pues, hasta el ao 1926 la ciencia ficcin no exista
como tal. Hasta esa fecha las narraciones que hoy da no
dudamos en calificar de ciencia ficcin reciban diversos
nombres: viajes fantsticos, relatos de mundos perdidos,
utopas, novelas cientficas.
Para muchos la primera obra de ciencia ficcin con
contenidos similares a los del gnero, tal y como hoy se
entiende, se remonta a 1818, ao en que es publicado
Frankenstein.
En la mitologa griega, se cuenta que Ddalo, el padre de
caro y constructor del laberinto de Minos, construy
estatuas de madera que eran capaces de moverse solas
(una primitiva referencia a los modernos robots?). Tambin
el viaje a la Luna fue objeto de iniciativas literarias antes de
1818; dos de las ms conocidas son la de Cyrano de
Bergerac, siglo XVII y la del Barn de Mnchausen, siglo
XVIII.
Universidad Autnoma de Quertaro 12
Historia de la ciencia-ficcin
Sin embargo, en la
dcada de 1850
Probablemente
pasa por ser uno de los
autores ms prolficos
del siglo XIX en el
campo de las aventuras
de corte cientfico:
Jules Verne
quien en 1851 publica su
primera obra con contenido de ficcin cientfica:
Cinco semanas en globo a partir de su publicacin
este gnero empieza a transformar sus intenciones, y
la ciencia subyacente pasa de ser un motivo de
inquietud o de preocupacin por lo desconocido a ser
un soporte de historias de aventuras y
descubrimientos.
Los relatos y novelas cortas con temas fantsticos
aparecieron en las publicaciones peridicas en los
ltimos aos del siglo XIX, y muchos de ellos
emplearon ideas cientficas como una excusa para
lanzarse a la imaginacin.
Universidad Autnoma de Quertaro 13
APORTES DE LA CIENCIA FICCIN A LA CIENCIA
De igual manera que la ciencia ficcin ha tomado
muchos de sus argumentos y elementos de
ambientacin de conceptos o creaciones de la Ciencia,
para convertirlos en conceptos reales o hiptesis de
trabajo de cara al futuro cientfico o tecnolgico.
Los casos ms conocidos de esta transferencia son los
del trmino robot empleado por primera vez por el
escritor checo Karel apek en su obra R.U.R. (Robots
Universales de Rossum), el trmino derivado robtica,
creado en las novelas de robots de Isaac Asimov o el
ascensor espacial imaginado independientemente por
Arthur C. Clarke y Charles Sheffield.
Otros conceptos, aunque creados por eminentes
cientficos, han sido profusamente desarrollados por la
ciencia ficcin antes incluso de ser tenidos en cuenta
por la ciencia. Son ejemplos de ello la utilizacin de
antimateria, los agujeros de gusano o la
nanotecnologa.
Finalmente, y de modo sorprendente, algunas
invenciones de la ciencia ficcin han inspirado alguna
de las lneas de investigacin actual, como la
comunicacin instantnea , o, en La vuelta al mundo en
80 das, el autor describi el globo aerosttico y el
telfono, que en ese tiempo an no existan.
Universidad Autnoma de Quertaro 14
Algoritmo Gentico
Un algoritmo gentico (o AG para abreviar) es una tcnica de
programacin que imita a la evolucin biolgica como estrategia para
resolver problemas. Dado un problema especfico a resolver, la
entrada del AG es un conjunto de soluciones potenciales a ese
problema, codificadas de alguna manera, y una mtrica llamada
funcin de aptitud que permite evaluar cuantitativamente a cada
candidata. Estas candidatas pueden ser soluciones que ya se sabe
que funcionan, con el objetivo de que el AG las mejore, pero se suelen
generar aleatoriamente.
Son llamados as porque se inspiran en la evolucin biolgica y su
base gentico-molecular. Los algoritmos genticos forman parte de
una familia denominada algoritmos evolutivos, que incluye las
Estrategias de evolucin, la Programacin evolutiva y la Programacin
gentica.
Un algoritmo gentico es un mtodo de bsqueda dirigida basada en
probabilidad. Bajo una condicin muy dbil (que el algoritmo
mantenga elitismo, es decir, guarde siempre al mejor elemento de la
poblacin sin hacerle ningn cambio) En otras palabras, al aumentar
el nmero de iteraciones, la probabilidad de tener el ptimo en la
poblacin tiende a. 1
La principal diferencia del algoritmo gentico con otras tcnicas, es
que utiliza la cruza como operador principal y a la mutacin como
operador secundario . El algoritmo gentico, al igual que las redes
neuronales, funciona como una caja negra que recibe ciertas entradas
y produce (tras una cantidad de tiempo indeterminada) las salidas
deseadas. Sin embargo, los algoritmos genticos no necesitan
entrenarse con ejemplos de ningn tipo, sino que son capaces de
generar sus propios ejemplos y contraejemplos que guen la evolucin
a partir de poblaciones inciales totalmente aleatorias.
Los mecanismos de seleccin del ms apto y de reproduccin sexual
del algoritmo gentico, son los encargados de preservar las
caractersticas ms adecuadas de cada individuo a fin de hacer
converger a la poblacin en soluciones ptimas.
Universidad Autnoma de Quertaro 15
1.1.3 PRIMEROS INTENTOS DE LOS ALGORITMOS DE INTELIGENCIA
ARTIFICIAL.
Los algoritmos genticos se distinguen tambin por no
quedar atrapados fcilmente en mnimos locales, como la
mayor parte de las tcnicas de bsqueda clsicas, adems
de usar operadores probabilsticos ms robustos que los
operadores determinados, que las otras tcnicas suelen
usar.
No obstante, siendo una heurstica, tampoco pueden
garantizar encontrar siempre la solucin ptima, si bien
la experiencia acumulada hasta la fecha parece demostrar
que, cuando se utilizan apropiadamente, pueden
proporcionar soluciones muy aceptables y, en la mayora
de los casos, superiores a las encontradas con otras
tcnicas de bsqueda y optimizacin.
Aunque an atacados por algunos sectores de la
comunidad de Inteligencia Artificial, los algoritmos
genticos, al igual que las redes neuronales, se han ido
ganando poco a poco el reconocimiento de los
investigadores como una tcnica efectiva en problemas de
gran complejidad.
Universidad Autnoma de Quertaro 16
Algoritmo Gentico
Sistemas Basados en Conocimiento
Los mtodos generales desarrollados para la resolucin de problemas y
tcnicas de bsqueda al inicio de la era de la Inteligencia Artificial
demostraron no ser suficientes para resolver los problemas orientados a
las aplicaciones, ni fueron capaces de satisfacer los difciles
requerimientos de la investigacin.
La definicin de un sistema basado en conocimiento puede ser la
siguiente: software de interfaz, base de datos, programa
computacional.
Los Sistemas Basados en Conocimiento y la Ingeniera Cognoscitiva,
son una rama de la Inteligencia Artificial.
Una relativamente nueva categora de sistemas de informacin orientada
al servicio es el sistema experto, llamado as porque su base de datos
guarda una descripcin de habilidades en la toma de decisiones de
experiencias humanas en un estrecho dominio de procedimientos. Dado
que cada condicin que puede ser encontrada puede ser descrita por
una regla, los sistemas expertos basados en reglas no pueden manejar
eventos no anticipados, pero pueden evolucionar con el uso, y
permanece limitado a un estrecho dominio de problemas.
Otra variante de sistemas expertos, uno que no posee esta limitacin,
emplea una base de conocimiento que consiste de descripciones
estructuradas de situaciones, de problemas del mundo real y de
decisiones actualmente hechas por expertos humanos.
En medicina, por ejemplo, el registro de un paciente contiene
descripciones de datos personales, exmenes fsicos y de laboratorio,
diagnstico clnico, tratamiento propuesto, y los resultados de tales
tratamientos.
Dada una gran base de datos con tales registros en una especialidad
mdica, el mdico puede indagar acerca de eventos anlogos a los
relacionados con el paciente. Esto en contraste con el sistema que
idealmente intenta reemplazar al ser humano, ya que en casos como
estos slo podra usarse este tipo de conocimiento como una
herramienta que ayuda en la toma de decisiones.
Un programa computacional que usa inteligencia artificial resuelve
problemas en un dominio especializado que ordinariamente requiere
experiencia humana. El software requerido para este tipo de sistemas se
ha ido complicando con el tiempo ya que su desarrollo demanda tiempo,
un buen equipo de programadores y un buen producto final.
Universidad Autnoma de Quertaro 17
DESARROLLO DE LOS ALGORITMOS DE
INTELIGENCIA ARTIFICIAL.
Los sistemas expertos se basan en la simulacin del razonamiento
humano. El razonamiento humano tiene para ellos, un doble inters:
por una parte, el del anlisis del razonamiento que seguira un
experto humano en la materia a fin de poder codificarlo mediante el
empleo de un determinado lenguaje informtico; por otra, la sntesis
artificial, de tipo mecnico, de los razonamientos de manera que
stos sean semejantes a los empleados por el experto humano en
la resolucin de la cuestin planteada.
Estos dos campos de inters han conducido a los investigadores
que trabajan en el campo de la inteligencia artificial (de la cual los
sistemas expertos son un campo preferente) a intentar establecer
una metodologa que permita verificar el intercambio con los
expertos humanos y aislar los diversos tipos de razonamiento
existentes. Los sistemas expertos son, por lo tanto, intermediarios
entre el experto humano, que transmite sus conocimientos al
sistema, y el usuario de dicho sistema, que lo emplea para resolver
los problemas que se le plantean con la competencia de un
especialista en la materia y que, adems, puede adquirir una
destreza semejante a la del experto gracias a la observacin del
modo de actuar de la mquina.
Los sistemas expertos son, pues, simultneamente, un sistema de
ejecucin y un sistema de transmisin del conocimiento. Asimismo,
los sistemas expertos se definen mediante su arquitectura;
obtienen, por lo tanto, una realidad palpable, en el caso de los
sistemas expertos se diferencian tres componentes principales. Son
los siguientes:
La base de conocimientos aloja la totalidad de las informaciones
especficas relativas al campo del saber deseado. Junto a cada
regla, se almacena tambin su porcentaje en forma de probabilidad.
La memoria de trabajo memoriza todos los resultados intermedios,
permitiendo conservar el rastro de los razonamientos llevados a
cabo.
Universidad Autnoma de Quertaro 18
Sistemas Expertos
Definicin de Inteligencia:
Inteligencia, capacidad para aprender o comprender. Suele ser sinnimo de
intelecto (entendimiento), pero se diferencia de ste por hacer hincapi en
las habilidades y aptitudes para manejar situaciones concretas y por
beneficiarse de la experiencia sensorial.
SEGN LA REAL ACADEMIA ESPAOLA.
1.- capacidad para aprender o comprender.
2.- Capacidad de resolver problemas
3.- conocimiento, compresin, acto de entender.
En psicologa, la inteligencia se define como la capacidad de adquirir
conocimiento o entendimiento y de utilizarlo en situaciones novedosas. En
condiciones experimentales se puede medir en trminos cuantitativos el
xito de las personas a adecuar su conocimiento a una situacin o al
superar una situacin especfica.
Definicin de Razonamiento:
El trmino razonamiento se define de diferente manera segn el contexto,
normalmente se refiere a un conjunto de actividades mentales consistentes
en conectar unas ideas con otras de acuerdo a ciertas reglas o tambin
puede referirse al estudio de ese proceso. En sentido amplio, se entiende
por razonamiento la facultad humana que permite resolver problemas.
Se llama tambin razonamiento al resultado de la actividad mental de
razonar, es decir, un conjunto de proposiciones enlazadas entre s que dan
apoyo o justifican una idea. El razonamiento se corresponde con la
actividad verbal de argumentar. En otras palabras, un argumento es la
expresin verbal de un razonamiento.
SEGN LA REAL ACADEMIA ESPAOLA.
1.- Accin y efecto de razonar.
2. -Serie de conceptos encaminados a demostrar algo o a persuadir o
mover a oyentes o lectores.
Universidad Autnoma de Quertaro 19
1.2 DEFINICIONES BASICAS.
Definicin de Inteligencia Artificial:
SEGN LA REAL ACADEMIA ESPAOLA
Desarrollo y utilizacin de ordenadores con los que se intenta reproducir los
procesos de la inteligencia humana.
En este sentido, el trmino IA se ha aplicado a sistemas y programas
informticos capaces de realizar tareas complejas, simulando el
funcionamiento del pensamiento humano, aunque todava muy lejos de
ste. En esta esfera los campos de investigacin ms importantes son el
procesamiento de la informacin, el reconocimiento de modelos, los juegos
y las reas aplicadas como el diagnstico mdico.
Definicin de Sistemas de Estado:
Es el conjunto de estados que puede tomar un problema a partir de un
estado inicial siguiendo las reglas de generacin de estados (operadores)
hasta llegar a un resultado final o estado final.

Los estados constituyen los nodos del rbol de bsqueda.


Caractersticas de los Sistemas de Estado.

Este modelo puede tener varias representaciones. La forma ms simple de


representacin consiste en un vector de caractersticas como el que
utilizan los sistemas E-R.

El vector de caractersticas utilizado por un agente E-R se puede considerar


como una representacin del estado del entorno relevante para la tarea que
desarrolla el agente. A partir de este vector de caractersticas, el agente E-R
calcula una accin apropiada para el estado correspondiente.
Universidad Autnoma de Quertaro 20
Debido a que los entornos en los que puede operar un
agente pueden ser arbitrariamente complejos, el vector de
caractersticas del agente slo podr representar el
entorno de manera imperfecta. Sin embargo, incluso en
estos casos, podemos disear agentes capaces de
fusionar la informacin proveniente de varios estados del
entorno.
Para ello, el diseador del agente debe encontrar un
vector de caractersticas que ofrezca una representacin
adecuada del entorno- al menos en lo que concierne a la
tarea que desarrolla.
Adems de las entradas sensoriales inmediatas, este tipo
de sistemas debe tener una memoria en la que poder
almacenar un modelo del entorno.
Universidad Autnoma de Quertaro 21
1.3 SISTEMAS DE ESTADOS.
Como ejemplo de sistema con estados. Tenemos un Robot que modela su
entorno mediante un vector de caractersticas, que obtienen directamente
de ocho entradas sensoriales que informaban al agente si existen casillas
que lo rodean estn ocupadas o no.
Supongamos ahora que nuestro robot tiene limitadas sus capacidades
sensoriales, es decir, ahora slo puede percibir el estado de las casillas
situadas al norte, sur, este y oeste. Como podemos apreciar, impedimos
que pueda percibir el estado de las cuatro casillas situadas en las
diagonales. Por tanto, sus entradas sensoriales sern y y tomarn el valor
1 si las correspondientes celdas estn ocupadas, y 0 si estn libres. Incluso
con esta limitacin, el robot puede desarrollar su tarea (el seguimiento de
los bordes) si el vector de caractersticas necesario para decidir qu accin
tomar se calcula a partir de sus entradas sensoriales, el anterior vector de
caractersticas y la accin que acaba de ser ejecutada (siempre y cuando
asumamos que no existen pasillos estrechos).
Para hacer que el clculo de la accin dependa de esta versin limitada del
vector de caractersticas utilizaremos las caractersticas para . En lugar de
las entradas sensoriales que estn ausentes, sustituiremos dichas
caractersticas, y por los siguientes clculos: tomar el valor 1 si, y slo si,
en el instante anterior tena el valor 1 y el robot se movi al este. De la
misma forma, tomar el valor 1 si, y slo si, en el instante anterior tena el
valor 1 y el robot se movi al sur (en cualquier otro caso, = 0). El resto de
las caractersticas pueden ser evaluadas de la misma forma.
Con estas caractersticas y el siguiente sistema de produccin podemos
implementar la tarea que permite al robot seguir las paredes (en un mundo
sin pasillos estrechos).
Si todos los aspectos del entorno que son relevantes para el agente pueden
ser percibidos en el instante en que son necesarios, no hay motivo alguno
para almacenar un modelo del entorno en la memoria. Sin embargo, las
capacidades sensoriales estn siempre limitadas de alguna forma, y, por
tanto, los agentes que dispongan de modelos del entorno almacenados en
sus memorias pueden desarrollar tareas que los agentes sin memoria no
podran.
Universidad Autnoma de Quertaro 22
1.3.2 Ejemplo de los sistemas de Estado.
Los sistemas de estados son ms comunes que los
agentes E-R y los modelos etolgicos de
comportamiento animal.
Muchos animales mantienen, como mnimo,
informacin parcial sobre las caractersticas de sus
mundos externos e internos que no pueden ser
percibidas inmediatamente. Los sistemas de
produccin que trabajan con la memoria y con la
percepcin tambin han sido utilizados para modelar
determinados fenmenos psicolgicos.
Las redes de Elman son un ejemplo de autmata de
Estados finitos con capacidad de aprendizaje.
Muchos investigadores han analizado el problema
del aprendizaje de mapas espaciales, que son un
ejemplo de representacin icnica. El aprendizaje de
este tipo de representacin se complica cuando
existe incertidumbre sobre el estado actual y sobre
los efectos de las acciones.
Universidad Autnoma de Quertaro 23
1.3.3 Ventajas y Desventajas de los Sistemas de Estado.
En el rea de los (SE). A este tipo de conocimiento se le llama
conocimiento sobre el dominio. La palabra dominio se usa para
enfatizar que el conocimiento pertenece a un problema especfico.
En la actualidad existe un campo dentro de la inteligencia artificial al
que se le atribuye esa facultad: el de los sistemas expertos (SE).
Estos sistemas tambin son conocidos como Sistemas Basados en
Conocimiento, los cuales permiten la creacin de mquinas que
razonan como el hombre, restringindose a un espacio de
conocimientos limitado.
En teora pueden razonar siguiendo los pasos que seguira un experto
humano (mdico, analista, empresario, etc.) para resolver un problema
concreto. Este tipo de modelos de conocimiento por ordenador ofrece
un extenso campo de posibilidades en resolucin de problemas y en
aprendizaje. Su uso se extender ampliamente en el futuro, debido a
su importante impacto sobre los negocios y la industria.
Es un software que imita el comportamiento de un experto humano en
la solucin de un problema. Pueden almacenar conocimientos de
expertos para un campo determinado y solucionar un problema
mediante deduccin lgica de conclusiones.
Los sistemas expertos son llamados as porque emulan el
comportamiento de un experto en un dominio concreto y en ocasiones
son usados por ellos.
Un sistema experto (SE) es una rama de la Inteligencia Artificial y es
aquel que imita las actividades de un humano para resolver problemas
de distinta ndole (no necesariamente tiene que ser de Inteligencia
Artificial). Tambin se dice que un SE se basa en el conocimiento
declarativo (hechos sobre objetos, situaciones) y el conocimiento de
control (informacin sobre el seguimiento de una accin).
Con los sistemas expertos se busca una mejor calidad y rapidez en las
respuestas dando as lugar a una mejora de la productividad del
experto.
Universidad Autnoma de Quertaro 24
1.4 SISTEMAS EXPERTOS.
1.4.1 Definicin de los Sistemas Expertos.
Un Sistema Experto est conformado por:
Base de conocimientos (BC):
Contiene conocimiento modelado extrado del dilogo con el
experto.
Base de hechos (Memoria de trabajo):
Contiene los hechos sobre un problema que se ha descubierto
durante el anlisis.
Motor de inferencia:
Modela el proceso de razonamiento humano.
Mdulos de justificacin:
Explica el razonamiento utilizado por el sistema para llegar a una
determinada conclusin.
Interfaz de usuario:
es la interaccin entre el SE y el usuario, y se realiza mediante el
lenguaje natural.
TIPOS DE SISTEMAS EXPERTOS.
Principalmente existen tres tipos de sistemas expertos:
Basados en reglas.
Basados en casos o CBR (Case Based Reasoning).
Basados en redes bayesianas.
En cada uno de ellos, la solucin a un problema planteado se obtiene:
Aplicando reglas heursticas apoyadas generalmente en lgica difusa para
su evaluacin y aplicacin.
Aplicando el razonamiento basado en casos, donde la solucin a un
problema similar planteado con anterioridad se adapta al nuevo problema.
Aplicando redes bayesianas, basadas en estadstica y el teorema de Bayes.
Universidad Autnoma de Quertaro 25
1.4.2 CARACTERSTICAS DE LOS SISTEMAS
EXPERTOS
Base de conocimientos. Es la parte del sistema experto que contiene el
conocimiento sobre el dominio. Hay que obtener el conocimiento del
experto y codificarlo en la base de conocimientos. Representando el
conocimiento con reglas. Una regla es una estructura condicional que
relaciona lgicamente la informacin contenida en la parte del antecedente
con otra informacin contenida en la parte del consecuente.
Base de hechos (Memoria de trabajo). Contiene los hechos sobre un
problema que se han descubierto durante una consulta, el usuario introduce
la informacin del problema actual en la base de hechos. El sistema
empareja esta informacin con el conocimiento disponible en la base de
conocimientos para deducir nuevos hechos.
Motor de inferencia. El sistema experto modela el proceso de
razonamiento humano con un mdulo conocido como el motor de
inferencia. Dicho motor de inferencia trabaja con la informacin contenida
en la base de conocimientos y la base de hechos para deducir nuevos
hechos. Contrasta los hechos particulares de la base de hechos con el
conocimiento contenido en la base de conocimientos para obtener
conclusiones acerca del problema.
Subsistema de explicacin. Una caracterstica de los sistemas expertos
es su habilidad para explicar su razonamiento. Usando el mdulo del
subsistema de explicacin, un sistema experto puede proporcionar una
explicacin al usuario de por qu est haciendo una pregunta y cmo ha
llegado a una conclusin. Este mdulo proporciona beneficios tanto al
diseador del sistema como al usuario. El diseador puede usarlo para
detectar errores y el usuario se beneficia de la transparencia del sistema.
Interfaz de usuario. La interaccin entre un sistema experto y un usuario
se realiza en lenguaje natural. Tambin es altamente interactiva y sigue el
patrn de la conversacin entre seres humanos. Para conducir este proceso
de manera aceptable para el usuario es especialmente importante el diseo
del interfaz de usuario. Un requerimiento bsico del interfaz es la habilidad
de hacer preguntas. Para obtener informacin fiable del usuario hay que
poner especial cuidado en el diseo de las cuestiones. Esto puede requerir
disear el interfaz usando mens o grficos.
Universidad Autnoma de Quertaro 26
ARQUITECTURA BSICA DE LOS
SISTEMAS EXPERTOS
Son programas que se han diseado principalmente para emular un
comportamiento inteligente. Incluyen algoritmos de juego tales como el
ajedrez, programas de comprensin del lenguaje natural, visin por
computadora, robtica y "sistemas de expertos". Responde a una
interfaz ensamblador, el segundo a interfaz compilador y el ltimo a
interfaz interprete.
Un Lenguaje de Programacin se basa en reglas de accin
(silogismos), y el anlisis de posibilidades dndonos una ayuda muy
til en todas las ramas de la accin humana. Es as como los
Sistemas Expertos desarrollan una Funcin muy
importante "Realizar tareas genricas: es decir para la monitorizacin
y el diagnstico, adems de los trabajos de simulacin de la
realidad (Realidad Virtual en la actualidad)
Algunos lenguajes son lenguajes principalmente interpretados, como
APL, PROLOG y LISP.
La Recursividad representa la estructura ms importante en el
desarrollo de los programas. En la sintaxis del PROLOG no existen los
bucles FOR ni los saltos; los bucles WHILE son de difcil
incorporacin, ya que las variables slo pueden unificarse una sola
vez. La recursin es ms apropiada que otras estructuras de
desarrollo para procesar estructuras de datos recursivas como son las
listas y destacan en estos casos por una representacin ms sencilla y
de mayor claridad.
La Instanciacin es la unin de una variable a una constante o
estructura. La variable ligada se comporta luego como una constante.
La Verificacin es el intento de derivar la estructura a comprobar de
una pregunta desde la base de conocimientos, es decir, desde los
hechos y reglas.
Si es posible, la estructura es verdadera, en caso contrario es falsa.
La Unificacin es el componente principal de la verificacin de
estructuras. Una estructura estar comprobada cuando puede ser
unificada con un hecho, o cuando puede unificarse con la cabecera de
una regla y las estructuras del cuerpo de dicha regla pueden ser
verificadas.
Universidad Autnoma de Quertaro 27
1.4.3 ALGORITMOS DE
SISTEMAS EXPERTOS.
APLICACIONES
Sus principales aplicaciones se dan en las gestiones
empresariales debido a que:
a) Casi todas las empresas disponen de un ordenador que realiza
las funciones bsicas de tratamiento de la informacin:
contabilidad general, decisiones financieras, gestin de la
tesorera, planificacin, etc.
b) Este trabajo implica manejar grandes volmenes de
informacin y realizar operaciones numricas para despus tomar
decisiones. Esto crea un terreno ideal para la implantacin de los
SE.
Adems los SE tambin se aplican en la contabilidad en
apartados como: Auditoria (es el campo en el que ms
aplicaciones de SE se esta realizando) Fiscalidad, planificacin,
anlisis financiero y la contabilidad financiera.
REAS DE APLICACIN
Los SE se aplican a una gran diversidad de campos y/o reas. A
continuacin se listan algunas de las principales:
Universidad Autnoma de Quertaro 28
1.4.4 Ejemplo de Sistemas Expertos.
VENTAJAS
Permanencia: A diferencia de un experto humano un SE (sistema experto)
no envejece, y por tanto no sufre prdida de facultades con el paso del
tiempo.
Duplicacin: Una vez programado un SE lo podemos duplicar infinidad de
veces.
Rapidez: Un SE puede obtener informacin de una base de datos y realizar
clculos numricos mucho ms rpido que cualquier ser humano.
Bajo costo: A pesar de que el costo inicial pueda ser elevado, gracias a la
capacidad de duplicacin el coste finalmente es bajo.
Entornos peligrosos: Un SE puede trabajar en entornos peligrosos o
dainos para el ser humano.
Fiabilidad: Los SE no se ven afectados por condiciones externas, un
humano s (cansancio, presin, etc.).
Consolidar varios conocimientos
Apoyo Acadmico.
DESVENTAJAS
Sentido comn: Para un SE no hay nada obvio. Por ejemplo, un
sistema experto sobre medicina podra admitir que un hombre lleva 40
meses embarazado, a no ser de que se especifique que esto no es
posible.
Lenguaje natural: Con un experto humano podemos mantener una
conversacin informal mientras que con un SE no podemos.
Capacidad de aprendizaje: Cualquier persona aprende con relativa
facilidad de sus errores y de errores ajenos, que un SE haga esto es
muy complicado.
Perspectiva global: Un experto humano es capaz de distinguir cuales
son las cuestiones relevantes de un problema y separarlas de
cuestiones secundarias.
Capacidad sensorial: Un SE carece de sentidos.
Flexibilidad: Un humano es sumamente flexible a la hora de aceptar
datos para la resolucin de un problema.
Conocimiento no estructurado: Un SE no es capaz de manejar
conocimiento poco estructurado.
Universidad Autnoma de Quertaro 29
1.4.5 Ventajas y Desventajas de los Sistemas Expertos.
Universidad Autnoma de Quertaro 30
1.5 PARADIGMAS DE LA INTELIGENCIA ARTIFICIAL.
CONTROVERSIA.
Durante el desarrollo de la Inteligencia Artificial siempre ha
existido una controversia sobre los lmites de esta Ciencia.
Que no pueden hacer las Computadoras?
Pueden pensar las Computadoras?
Realmente pueden ser creativas?
La IA es el estudio de cmo lograr que las computadoras realicen
tareas que, por el momento, los humanos hacen mejor
Turing pens que si una mquina se comporta en todos los
aspectos como inteligente, entonces debe ser inteligente. Por lo
que si un nmero alto de humanos no puede diferenciar a una
mquina de una persona en una conversacin es porque se
comporta de manera inteligente. Esto se llama el Test de Turing y
el primer programa en pasarlo fue Eliza que imitaba el
comportamiento de un psicoanalista en un chat de internet.
Eliza daba respuestas que eran preguntas acerca de lo que
estabas diciendo, con lo cual sin ningn conocimiento real de
psicologa Eliza pasaba el test de Turing. Las soluciones que se
aportan a las tareas que realizan mejor los humanos suponen
muchas veces un compromiso entre parecer que se comporta de
manera inteligente y realizar los procesos mentales que hacemos
los humanos.
Demos ahora un repaso para ver cules pueden ser esas tareas
que, en principio, los humanos realizan mejor que las mquinas:
Universidad Autnoma de Quertaro 31
1.5.2 LA INTELIGENCIAARTIFICIAL CONTRA
LA INTELIGENCIA HUMANA.
Juegos. Durante algunos aos los fabricantes de ordenadores
demostraban la potencia de su tecnologa jugando al ajedrez y a l
las damas contra campeones mundiales.
Consejos. Los humanos solemos pedir consejo a otros humanos
cuando padecemos una enfermedad, se nos estropea el coche,
ante la compra de una casa y para otras decisiones que
necesitamos de un conocimiento que no siempre poseemos.
Desde hace aos los sistemas basados en conocimiento y
sistemas expertos hacen esta tarea con efectividad similar a como
lo hara un experto en la materia.
Lenguaje Natural. Hoy en da las mquinas no hablan nuestro
idioma: lenguajes de programacin, lneas de comando, interfaces
grficas nos sirven para comunicarnos con stos, pero el
comunicarnos con ellos como nos comunicamos con personas
constituye un reto que revolucionara la informtica con
aplicaciones inimaginables.
Aprendizaje. Una de las principales diferencias entre seres vivos
e inertes es la capacidad de adaptarse a los cambios, la
capacidad de aprender. Algoritmos de aprendizaje automtico son
cada da ms utilizados en una cantidad creciente de
aplicaciones.
Empata. Rara vez el ordenador se pone en el lugar del humano
comprendiendo su objetivo abstracto y ayudndole a solucionarlo
pueden las mquinas hacer tal cosa?
Sentido comn. Existe una gran cantidad de conocimiento que
aprendemos en nuestra tierna infancia que las personas
conocemos como lo relativo a consideraciones del tiempo, el
espacio, los materiales, ...y que incluso las aplicaciones que
requieren cierta inteligencia como los sistemas basados en
conocimiento rara vez incluyen.
Pensar con neuronas. Tal vez si conseguimos crear un sistema
artificial que simulara nuestro sistema neurolgico y lo
entrenramos en un entorno adecuado pueda llegar a tener un
nivel de inteligencia similar al nuestro. Lo cierto, es que este tipo
de sistemas estn obteniendo muy buenos resultados en
problemas que haba sido muy difcil abordar por otras vas como
por ejemplo el reconocimiento de formas.
Universidad Autnoma de Quertaro 32
Dentro del enfoque de la ingeniera de la Inteligencia Artificial,
se clasifican las tcnicas que pueden ser usadas como
herramientas para solucionar problemas en las siguientes
categoras:
1. Tcnicas bsicas, as llamadas por encontrarse a la base
de diversas aplicaciones de IA. Entre otras se encuentran
Bsqueda Heurstica de Soluciones, Representacin del
Conocimiento, Deduccin Automtica, Programacin
Simblica (LISP) y Redes Neuronales. Estas tcnicas son las
bases de las aplicaciones. En su mayora, no necesita
conocerla el usuario final, sino los profesionales que se
dedican a su aplicacin y la generacin de aplicaciones
comerciales.
2. Tecnologas, o combinaciones de varias tcnicas bsicas,
orientadas a resolver familias de problemas. Las tecnologas
son ms especializadas que las tcnicas bsicas y estn ms
cerca de las aplicaciones finales. Se pueden mencionar a la
Robtica y Visin, Lenguaje Natural, Sistemas Expertos
3. Clases o tipos de aplicaciones: Diagnstico, Prediccin
(sistemas de autocontrol de reactores atmicos),
Secuenciamiento de operaciones ("Scheduling"), Diseo,
Interpretacin de datos. Todas ellas son familias de problemas
tipo. Por ejemplo, el diagnstico se refiere a encontrar las
causas de fallas, ya sea que se trate de fallas en una lnea de
produccin o de enfermedades en una persona.
4. Campos de aplicacin: Ingeniera, Medicina, Sistemas de
Manufactura, Administracin, Apoyo a la Toma de Decisiones
Gerenciales, etc. Todas caen dentro de las reas de los
sistemas computacionales, pero que se consideran como
clientes de la Inteligencia Artificial.
Universidad Autnoma de Quertaro 33
1.6.2 CARACTERSTICAS DE LOS SISTEMAS
DONDE SE APLICA LA INTELIGENCIA
ARTIFICIAL.
Actualmente segn existen tres paradigmas en cunto al desarrollo de la IA.
1. Sistemas de Lgica difusa.
2. Redes Neuronales.
3. Algoritmos genticos.
Sistemas de lgica difusa
Es la segunda herramienta que permite emular el razonamiento humano.
Los seres humanos pensamos y razonamos por medio de palabras y en
grados entre dos estados por ejemplo blanco y negro fro y caliente, etc.
Estos sistemas de lgica difusa son una mejora a los sistemas experto
tradicionales, en el sentido de que permiten utilizar lenguaje humano como
nosotros razonamos
Redes neuronales
A grandes rasgos, se recordar que el cerebro humano se compone de
decenas de billones de neuronas interconectadas entre s formando
circuitos o redes que desarrollan funciones especficas.
Una neurona tpica recoge seales procedentes de otras neuronas a travs
de una plyada de delicadas estructuras llamadas dendritas. La neurona
emite impulsos de actividad elctrica a lo largo de una fina y delgada capa
denominada axn, que se escinde en millares de ramificaciones.
Algoritmos genticos:
Son una tcnica inspirada en aspectos biolgicos, el proceso de la
evolucin del que Charles Darwin hace referencia se puede aplicar para
optimizar dispositivos de control o robots o cualquier otro tipo de aspectos
que sean susceptibles de ser optimizados como lneas de produccin.
DESARROLLO FUTURO DE LA INTELIGENCIA ARTIFICIAL.
A juicio de algunos autores se determina que todos estos desarrollos
acortan bastante el proceso de decisiones y optimizan las mismas, pero ah
que tener mucho cuidado ya que hay que analizar los diferentes impactos
ya sean ambientales, sociales, polticos y econmicos.
Universidad Autnoma de Quertaro
34
1.6.3 ESTADO ACTUAL DE LA INTELIGENCIAARTIFICIAL.
Universidad Autnoma de Quertaro 35
CAPITULO II: LGICA DIFUSA.
2.1 INTRODUCCIN.
2.1.1 Introduccin a la Lgica Difusa.
La lgica borrosa o difusa se basa en lo relativo de lo observado. Este tipo
de lgica toma dos valores aleatorios, pero contextualizados y referidos
entre s.
La lgica borrosa es una rama de la inteligencia artificial que se funda en el
concepto "Todo es cuestin de grado", lo cual permite manejar informacin
vaga o de difcil especificacin si quisiramos hacer cambiar con esta
informacin el funcionamiento o el estado de un sistema especifico. Es
entonces posible con la lgica borrosa gobernar un sistema por medio de
reglas de 'sentido comn' las cuales se refieren a cantidades indefinidas.
Las reglas involucradas en un sistema borroso pueden ser aprendidas con
sistemas adaptativos que aprenden al ' observar ' como operan las
personas los dispositivos reales, o estas reglas pueden tambin ser
formuladas por un experto humano. En general la lgica borrosa se aplica
tanto a sistemas de control como para modelar cualquier sistema continuo
de ingeniera, fsica, biologa o economa.
La lgica borrosa es entonces definida como un sistema matemtico que
modela funciones no lineales, que convierte unas entradas en salidas
acordes con los planteamientos lgicos que usan el razonamiento
aproximado.
Se fundamenta en los denominados conjuntos borrosos y un sistema de
inferencia borroso basado en reglas de la forma " SI....... ENTONCES...... ",
donde los valores lingsticos de la premisa y el consecuente estn
definidos por conjuntos borrosos, es as como las reglas siempre convierten
un conjunto borroso en otro.
Esta simple idea naci en un artculo de Lofti A. Zadeh publicado en
1965 y titulado "Fuzzy Sets" (Conjuntos Difusos). La lgica difusa
permite representar de forma matemtica conceptos o conjuntos
imprecisos, tales como das fros, meses calurosos, personas altas,
salarios bajos, etc.
Pero hay que tener en cuenta que la idea en s de que las cosas no
son blancas o negras, sino que existen infinitos matices de grises
viene ya desde la poca de los primeros grandes filsofos como
Platn.
Tras la publicacin de Lotfi A. Zadeh, se comenz rpidamente a usar
la lgica difusa en distintas aplicaciones prcticas, llegando a su
mximo auge a principios de los aos 90, y continuando ste hasta la
poca actual.
Como hemos dicho, los conjuntos difusos fueron introducidos por
primera vez en 1965; la creciente disciplina de la lgica difusa provee
por s misma un medio para acoplar estas tareas. En cierto nivel, la
lgica difusa puede ser vista como un lenguaje que permite trasladar
sentencias sofisticadas en lenguaje natural a un lenguaje matemtico
formal. Mientras la motivacin original fue ayudar a manejar aspectos
imprecisos del mundo real, la prctica temprana de la lgica difusa
permiti el desarrollo de aplicaciones prcticas. Aparecieron
numerosas publicaciones que presentaban los fundamentos bsicos
con aplicaciones potenciales. Esta frase marc una fuerte necesidad
de distinguir la lgica difusa de la teora de probabilidad. Tal como la
entendemos ahora, la teora de conjuntos difusos y la teora de
probabilidad tienen diferentes tipos de incertidumbre.
En 1994, la teora de la lgica difusa se encontraba en la cumbre, pero
esta idea no es nueva, para muchos, estuvo bajo el nombre de lgica
difusa durante 25 aos, pero sus orgenes se remontan hasta 2,500
aos. An Aristteles consideraba que existan ciertos grados de
veracidad y falsedad. Platn haba considerado ya grados de
pertenencia.
Universidad Autnoma de Quertaro 36
2 HISTORIA.
2.2.1 Principios biolgicos de la
Lgica Difusa
En la lgica clsica una proposicin slo admite dos valores:
verdadero o falso. Por ello se dice que la lgica usual es bivalente o
binaria. Existen otras lgicas que admiten adems un tercer valor
posible (lgica trivaluada) e incluso mltiple valores de verdad (lgica
multivaluada).
La lgica aristotlica sirve para explicar ciertos fenmenos y
problemas, aunque la gran mayora de ellos enmarcados en el mundo
terico de la matemtica. Por el contrario, la lgica difusa puede
usarse para explicar el mundo en el que vivimos, puesto que sigue el
comportamiento humano de razonar, sacando conclusiones a partir de
hechos observados.
La lgica multivaluada incluye sistemas lgicos que admiten varios
valores de verdad posibles.
La lgica difusa (o borrosa) es una de ellas, que se caracteriza por
querer cuantificar esta incertidumbre: Si P es una proposicin, se le
puede asociar un nmero v(P) en el intervalo [0,1] tal que:
Si v(P) = 0, P es falso.
Si v(P) = 1, P es verdadero.
La veracidad de P aumenta con v(P).
Tomando el ejemplo de la definicin, la persona ms alta ser M=2, y
la ms baja ser M=1. La persona ms alta ser, por lo tanto,
h(2)=Alto, y la ms baja h(1)=Bajo. Es evidente que los valores
manejados, se pueden catalogar segn la lgica clsica a valores de
Verdadero o Falso. Si h(M) = Alto (o Verdadero) entonces se producen
una serie de consecuencias, si h(M) = Bajo (o Falso) entonces se
producen una serie distinta de consecuencias. La dificultad viene
cuando los grados pueden ser intermedios. Por ejemplo, de forma
intermedia podemos decir que una persona que mida 1,82 m es alta
con grado 0,75 indicando que es "bastante alta", teniendo en cuenta
que la persona en cuestin sea masculina.
Salta a la vista la semejanza con la teora de la probabilidad, aunque
la lgica difusa y esta ltima teora persiguen fines distintos.
Universidad Autnoma de Quertaro 37
2.3 ESTRUCTURA BSICA DE SISTEMAS DIFUSOS.
Funcionamiento
La lgica difusa se adapta mejor al mundo real en el que vivimos, e incluso
puede comprender y funcionar con nuestras expresiones, del tipo "hace mucho
calor", "no es muy alto", "el ritmo del corazn est un poco acelerado", etc.
La clave de esta adaptacin al lenguaje, se basa en comprender los
cuantificadores de nuestro lenguaje (en los ejemplos de arriba "mucho", "muy" y
"un poco").
En la teora de conjuntos difusos se definen tambin las operaciones de unin,
interseccin, diferencia, negacin o complemento, y otras operaciones sobre
conjuntos (tambin subconjunto difuso), en los que se basa esta lgica.
Para cada conjunto difuso, existe asociada una funcin de pertenencia para sus
elementos, que indican en qu medida el elemento forma parte de ese conjunto
difuso. Las formas de las funciones de pertenencia ms tpicas son
trapezoidales, lineales y curvas.
Se basa en reglas heursticas de la forma SI (antecedente) ENTONCES
(consecuente), donde el antecedente y el consecuente son tambin conjuntos
difusos, ya sea puros o resultado de operar con ellos. Sirvan como ejemplos de
regla heurstica para esta lgica:
SI hace muchsimo calor ENTONCES disminuyo drsticamente la temperatura.
Los mtodos de inferencia para esta base de reglas deben ser simples, veloces y
eficaces. Los resultados de dichos mtodos son un rea final, fruto de un
conjunto de reas solapadas entre s (cada rea es resultado de una regla de
inferencia). Para escoger una salida concreta a partir de tanta premisa difusa, el
mtodo ms usado es el del centroide, en el que la salida final ser el centro de
gravedad del rea total resultante.
Las reglas de las que dispone el motor de inferencia de un sistema difuso pueden
ser formuladas por expertos, o bien aprendidas por el propio sistema, haciendo
uso en este caso de Redes neuronales para fortalecer las futuras tomas de
decisiones.
Los datos de entrada suelen ser recogidos por sensores, que miden las variables
de entrada de un sistema. El motor de inferencias se basa en chips difusos, que
estn aumentando exponencialmente su capacidad de procesamiento de reglas
ao a ao.
Funcionamiento de un sistema de control difuso
El sistema de control hace los clculos con base en sus reglas heursticas,
comentadas anteriormente. La salida final actuara sobre el entorno fsico, y los
valores de las nuevas entradas sobre el entorno fsico (modificado por la salida
del sistema de control) seran tomados por sensores del sistema.
Por ejemplo, imaginando que nuestro sistema borroso fuese el climatizador de un
coche que se autoregula segn las necesidades: Los chips borrosos del
climatizador recogen los datos de entrada, que en este caso bien podran ser la
temperatura y humedad simplemente. Estos datos se someten a las reglas del
motor de inferencia (como se ha comentado antes, de la forma SI...
ENTONCES...), resultando un rea de resultados. De esa rea se escoger el
centro de gravedad, proporcionndola como salida. Dependiendo del resultado,
el climatizador podra aumentar la temperatura o disminuirla dependiendo del
grado de la salida.
Universidad Autnoma de Quertaro 38
2.3.2 Proceso de fussificacin.
Conjuntos difusos.
La mayora de los fenmenos que encontramos cada da son imprecisos, es
decir, tienen implcito un cierto grado de difusidad en la descripcin de su
naturaleza. Esta imprecisin puede estar asociada con su forma, posicin,
momento, color, textura, o incluso en la semntica que describe lo que son.
En muchos casos el mismo concepto puede tener diferentes grados de
imprecisin en diferentes contextos o tiempo. Un da clido en invierno no
es exactamente lo mismo que un da clido en primavera. La definicin
exacta de cuando la temperatura va de templada a caliente es imprecisa -
no podemos identificar un punto simple de templado, as que emigramos a
un simple grado, la temperatura es ahora considerada caliente. Este tipo de
imprecisin o difusidad asociado continuamente a los fenmenos es comn
en todos los campos de estudio: sociologa, fsica, biologa, finanzas,
ingeniera, oceanografa, psicologa, etc.
Conceptos imprecisos.
Aceptamos la imprecisin como una consecuencia natural de ''la forma de
las cosas en el mundo''. La dicotoma entre el rigor y la precisin del
modelado matemtico en todos los campos y la intrnseca incertidumbre de
''el mundo real'' no es generalmente aceptada por los cientficos, filsofos y
analistas de negocios. Nosotros simplemente aproximamos estos eventos a
funciones numricas y escogemos un resultado en lugar de hacer un
anlisis del conocimiento emprico. Sin embargo procesamos y entendemos
de manera implcita la imprecisin de la informacin fcilmente. Estamos
capacitados para formular planes, tomar decisiones y reconocer conceptos
compatibles con altos niveles de vaguedad y ambigedad, considere las
siguientes sentencias:
. La temperatura est caliente.
. La inflacin actual aumenta rpidamente.
. Los grandes proyectos generalmente tardan mucho.
. Nuestros precios estn por abajo de los precios de la competencia.
. IBM es una compaa grande y agresiva.
. Alejandro es alto pero Ana no es bajita.
Note que el elemento 4 pertenece en grado .4 al conjunto POCOS, en
grado .8 al conjunto VARIOS y en grado .0 a MUCHOS. Zadeh ha hecho
algunas extensiones a los conceptos de conjuntos difusos ordinarios que se
han explicado; por ejemplo los conjuntos difusos de nivel-m y los conjuntos
difusos tipo-n. Para un conjunto difuso de nivel-m se considera como su
universo de discusin al conjunto de conjuntos difusos de nivel-(m-1),
sobreentendiendo que los conjuntos difusos de nivel-1 son conjuntos
difusos ordinarios. Para los conjuntos difusos tipo-n, los valores de las
funciones de pertenencia son conjuntos difusos de tipo-(n-1) del intervalo
[0,1] (en lugar de ser puntos de [0,1]). Tambin los conjuntos difusos tipo-1
son equivalentes a los conjuntos difusos ordinarios.
Universidad Autnoma de Quertaro 39
Estas proposiciones forman el ncleo de nuestras relaciones con ''la forma de
las cosas en el mundo''. Sin embargo, son incompatibles con el modelado
tradicional y el diseo de sistemas de informacin. Si podemos incorporar estos
conceptos logramos que los sistemas sean potentes y se aproximen ms a la
realidad.
Pero, es la imprecisin un concepto artificial utilizado para aumentar o
disminuir en uno o ms las propiedades de los fenmenos? o es una parte
intrnseca del fenmeno en s mismo?.
Esta es una pregunta importante ya que es la parte fundamental de las medidas
de la teora difusa. Como veremos la fusificacin es independiente de cualquier
capacidad para medir, ya que un conjunto difuso es un conjunto que no tiene
lmites bien definidos. Un conjunto difuso tiene muchas propiedades intrnsecas
que afectan la forma del conjunto, su uso y como participa en un modelo. Las
propiedades ms importantes de un conjunto difuso son las concernientes a las
dimensiones verticales del conjunto difuso (altura y normalizacin) y las
dimensiones horizontales (conjunto soporte y cortes "alpha").
La altura de un conjunto difuso es como mximo un grado de pertenencia y es
una cota cercana al concepto de normalizacin. La superficie de la regin de un
conjunto difuso es el universo de valores. Todos estos conceptos se tratarn
ms adelante. Es decir un conjunto difuso A se considera como un conjunto de
pares ordenados, en los que el primer componente es un nmero en el rango
[0,1] que denota el grado de pertenencia de un elemento u de U en A, y el
segundo componente especifica precisamente quin es se elemento de u. En
general los grados de pertenencia son subjetivos en el sentido de que su
especificacin es una cuestin objetiva. Se debe aclarar que aunque puede
interpretarse como el grado de verdad de que la expresin ''u A'' sea cierta, es
ms natural considerarlo simplemente como un grado de pertenencia.
Puede notarse adems que:
a) Mientras ms prximo est (u) a el valor 1, se dice que u pertenece ms a A
(de modo que 0 y 1 denotan la no pertenencia y la pertenencia completa,
respectivamente).
b) Un conjunto en el sentido usual es tambin difuso pues su funcin
caracterstica u es tambin una funcin u [0,1]; o sea que los conjuntos difusos
son una generalizacin de los conjuntos usuales.
Ejemplo: Sea U =11, 2, 3, 4, 5, 6, 7, 8, 9, entonces los conjuntos definidos a
continuacin son difusos:
POCOS = (.4/1, .8/2, 1/3, .4/4)
VARIOS = (.5/3, .8/4, 1/5, 1/6, .8/7, .5,8)
MUCHOS = (.4/6, .6/7, .8/8, .9/9,1/10)
Universidad Autnoma de Quertaro 40
2.4.1 Operaciones Lgicas Bsicas.
En la lgica Booleana tradicional, los conjuntos son considerados
como sistemas bivalentes con sus estados alternando entre inclusin y
exclusin. La caracterstica de la funcin discriminante refleja este
espacio bivaluado.
Esto indica que la funcin de pertenencia para el conjunto A es cero si
x no es un elemento en A y la funcin de pertenencia es si x es un
elemento en A. Dado que existen solamente dos estados, la transicin
entre estos dos estados es siempre inmediata. La pertenencia de
estos conjuntos est siempre totalmente categorizada y no existe
ambigedad o dicotoma acerca de la pertenencia.
Existen 4 operaciones bsicas de conjuntos en esta lgica: unin,
interseccin, complemento y unin exclusiva. Al igual que en los
conjuntos convencionales, existen definiciones especficas para
combinar y especificar nuevos conjuntos difusos. Este conjunto de
funciones tericas provee las herramientas fundamentales de la
lgica. En el caso usual, con las operaciones comunes de
interseccin, unin y complemento, el conjunto de conjuntos de U
forman un lgebra booleana, es decir se cumplen las condiciones de
asociatividad, conmutatividad, elementos neutros, dem potencia,
absorcin, distributividad, complemento y las leyes de Morgan.
Las tres operaciones mencionadas se pueden extender de varias
formas a conjuntos difusos, de modo que al restringirlas a los
conjuntos usuales, coincidan con las comunes. Estas extensiones
resultantes satisfacen en forma general slo a algunas de las
condiciones listadas anteriormente, y para mantener la vigencia de
alguna, ser obligatorio sacrificar a otras. En el sistema se opt por
extender las operaciones en el sentido clsico, es decir, dados dos
conjuntos difusos A y B, se definen las operaciones extendidas de la
siguiente forma
Universidad Autnoma de Quertaro 41
2.4 OPERACIONES DIFUSAS.
Dado que los conjuntos difusos no se particionan en el
mismo sentido que los conjuntos Booleanos, estas
operaciones son aplicadas al nivel de pertenencia,
como una consecuencia de los conjuntos difusos.
Decidir si un valor es o no es miembro de cualquier
conjunto difuso en particular, requiere algunas nociones
de cmo esta construido el conjunto, del universo y de
los lmites de ste.
Los Conjuntos Difusos se pueden operar entre s del
mismo modo que los conjuntos clsicos. Puesto que los
primeros son una generalizacin de los segundos, es
posible definir las operaciones de interseccin, unin y
complemento haciendo uso de las mismas funciones
de pertenencia:
A B (x) = minA(x), B(x))
A B (x) = max (A(x), B(x))
A (x) = 1 - A(x)
En realidad, estas expresiones son bastante arbitrarias
y podran haberse definido de muchas otras maneras.
En la actualidad se considera correcto definir el
operador interseccin mediante cualquier aplicacin t-
norma y el operador unin mediante cualquier
aplicacin s-norma.
Universidad Autnoma de Quertaro 42
2.5.1 Propiedades de los Operadores.
El centro de las tcnicas de modelado difuso es la idea
de variable lingstica. Desde su raz, una variable
lingstica es el nombre de un conjunto difuso. Si
tenemos un conjunto difuso llamado ''largo'' ste es una
simple variable lingstica y puede ser empleada como
una regla-base en un sistema basado en la longitud de
un proyecto en particular Si duracin-proyecto es largo
entonces la-terminacin-de-tareas es DECRECIENTE;
Una variable lingstica encapsula las propiedades de
aproximacin o conceptos de imprecisin en un
sistema y da una forma de computar adecuada.
Esto reduce la aparente complejidad de describir un
sistema que debe concordar con su semntica. Una
variable lingstica siempre representa un espacio
difuso.
Lo importante del concepto de variable lingstica es su
estimacin de variable de alto orden ms que una
variable difusa. En el sentido de que una variable
lingstica toma variables difusas como sus valores. En
el campo de la semntica difusa cuantitativa al
significado de un trmino "x" se le representa como un
conjunto difuso M(x) del universo de discusin. Desde
este punto de vista, uno de los problemas bsicos en
semntica es que se desea calcular el significado de un
trmino compuesto
Universidad Autnoma de Quertaro 43
2.5 FUSSIFICACIN.
La idea bsica sugerida por Zadeh es que una etiqueta lingstica tal como
''muy'', ''ms o menos'', ''ligeramente'', etc... Puede considerarse como un
operador que acta sobre un conjunto difuso asociado al significado de su
operando. Por ejemplo en el caso de un trmino compuesto ''muy alto'', el
operador ''muy'' acta en el conjunto difuso asociado al significado del operando
''alto''. Una representacin aproximada para una etiqueta lingstica se puede
lograr en trminos de combinaciones o composiciones de las operaciones
bsicas explicadas en la seccin anterior. Es importante aclarar que se har
mayor nfasis en que estas representaciones se proponen principalmente para
ilustrar el enfoque, ms que para proporcionar una definicin exacta de las
etiquetas lingsticas. Zadeh tambin considera que las etiquetas lingsticas
pueden clasificarse en dos categoras que informalmente se definen como
sigue:
Tipo I: las que pueden representarse como operadores que actan en un
conjunto difuso: ''muy'', ''ms o menos'', ''mucho'', ''ligeramente'', ''altamente'',
''bastante'', etc. y,
Tipo II: las que requieren una descripcin de cmo actan en los componentes
del conjunto difuso (operando): ''esencialmente'', ''tcnicamente'',
''estrictamente'', ''prcticamente'', ''virtualmente'', etc...
En otras palabras, las etiquetas lingsticas pueden ser caracterizadas cmo
operadores ms que construcciones complicadas sobre las operaciones
primitivas de conjuntos difusos.
Ms y menos
Se pueden definir etiquetas lingsticas artificiales, por ejemplo: ms, menos,
que son instancias de lo que puede llamarse acentuador y desacentuador
respectivamente, cuya funcin es proporcionar ligeras variantes de la
concentracin y la dilatacin.
Los exponentes se eligen de modo que se de la igualdad aproximada: mas mas
x = menos muy x, y que, adems, se pueden utilizar para definir etiquetas
lingsticas cuyo significado difiere ligeramente de otras, ejemplo:
Ms o menos
Otra etiqueta lingstica interesante es ''ms o menos'' que en sus usos ms
comunes como ''ms o menos inteligente'', ''ms o menos rectangular'' etc,
juega el papel de difusificador.
Ligeramente
Su efecto es dependiente de la definicin de proximidad u ordenamientos en el
dominio del operando. Existen casos, sin embargo, en los que su significado
puede definirse en trminos de etiquetas lingsticas tipo I, bajo la suposicin
de que el dominio del operando es un conjunto ordenado linealmente.
Universidad Autnoma de Quertaro 44
2.6 INFERENCIAS DIFUSAS.
Clase de
Es una etiqueta lingstica que tiene el efecto de reducir el
grado de pertenencia de los elementos que estn en el
''centro'' (grados de pertenencia grandes) de una clase x e
incrementa el de aquellos que estn en su periferia
(grados de pertenencia pequeos).
Regular
Es una etiqueta que tiene el efecto de reducir el grado de
pertenencia de aquellos elementos que tienen tanto un alto
grado de pertenencia al conjunto como de aquellos que lo
tienen pequeo, y slo aumenta el grado de pertenencia
de aquellos elementos que tienen un grado de pertenencia
cercano.
Etiquetas tipo II.
Su caracterizacin envuelve una descripcin de forma que
afectan a los componentes del operando, y por lo tanto es
ms compleja que las del tipo I. En general, la definicin
de una etiqueta de este tipo debe formularse como un
algoritmo difuso que envuelve etiquetas tipo I. Su efecto
puede describirse aproximadamente como una
modificacin de los coeficientes de ponderacin de una
combinacin convexa. Como la magnitud de las
ponderaciones es una medida del atributo asociado,
intuitivamente una etiqueta de este tipo tiene el efecto de
aumentar las ponderaciones de los atributos importantes y
disminuir los que relativamente no lo son.
Universidad Autnoma de Quertaro 45
Generalizacin del concepto de conjunto; en particular, un sub-
conjunto F de un conjunto determinado S para el que la funcin
caracterstica: X(f): s -> [0,1] tiene el intervalo de unidad entero
como rango, mas que solo los dos valores [0,1]. Aplicacin del
concepto de conjunto indistinto en sistemas expertos para la
estimacin del grado de incertidumbre de la conclusin.
Apenas pues hay un lazo fuerte entre la lgica booleana y el
concepto de un subconjunto, hay un lazo fuerte similar entre la
lgica confusa y la teora borrosa del subconjunto. En teora
determinada clsica, un subconjunto U de un conjunto S se puede
definir como asociar de los elementos de S a los elementos del
conjunto { 0, 1 }, U: El --> de S { 0, 1 } esto que asocia se puede
representar como conjunto de pares pedidos, con exactamente
uno pidi el par presente para cada elemento del primer elemento
de S. El par pedido es un elemento del conjunto S, y el segundo
elemento es un elemento del conjunto {0,1}. El valor cero se utiliza
para representar no-calidad de miembro, y el valor uno se utiliza
para representar calidad de miembro.
La lgica difusa se utiliza cuando la complejidad del proceso en
cuestin es muy alta y no existen modelos matemticos precisos,
para procesos altamente no lineales y cuando se envuelven
definiciones y conocimiento no estrictamente definido (impreciso o
subjetivo).
En cambio, no es una buena idea usarla cuando algn modelo
matemtico ya soluciona eficientemente el problema, cuando los
problemas son lineales o cuando no tienen solucin.
Universidad Autnoma de Quertaro 46
2.7.1 Proceso de Defusificacin.
A continuacin se citan algunos ejemplos de su aplicacin:
Sistemas de control de acondicionadores de aire.
Sistemas de foco automtico en cmaras fotogrficas.
Electrodomsticos familiares (Frigorficos, lavadoras...)
Optimizacin de sistemas de control industriales.
Sistemas de reconocimiento de escritura.
Mejora en la eficiencia del uso de combustible en motores.
Sistemas expertos del conocimiento (simular el comportamiento de un
experto humano)
Tecnologa informtica.
Bases de datos difusas: Almacenar y consultar informacin imprecisa. Para
este punto, por ejemplo, existe el lenguaje FSQL.
...y, en general, en la gran mayora de los sistemas de control que no
dependen de un S/No.
Tambin se aplica en reas especficas de la computacin como:
Lgica difusa en Inteligencia Artificial:
En Inteligencia artificial, la lgica difusa, o lgica borrosa se utiliza para la
resolucin de una variedad de problemas, principalmente los relacionados
con control de procesos industriales complejos y sistemas de decisin en
general, la resolucin la compresin de datos. Los sistemas de lgica difusa
estn tambin muy extendidos en la tecnologa cotidiana, por ejemplo en
cmaras digitales, sistemas de aire acondicionado, lavarropas, etc. Los
sistemas basados en lgica difusa imitan la forma en que toman decisiones
los humanos, con la ventaja de ser mucho ms rpidos. Estos sistemas son
generalmente robustos y tolerantes a imprecisiones y ruidos en los datos de
entrada.
Consiste en la aplicacin de la lgica difusa con la intencin de imitar el
razonamiento humano en la programacin de computadoras.. En la lgica
difusa, se usan modelos matemticos para representar nociones subjetivas,
como caliente/tibio/fro, para valores concretos que puedan ser manipuladas
por los ordenadores.
Universidad Autnoma de Quertaro 47
2.8 APLICACIONES.
En este paradigma, tambin tiene un especial valor la variable del tiempo, ya
que los sistemas de control pueden necesitar retroalimentarse en un espacio
concreto de tiempo, pueden necesitarse datos anteriores para hacer una
evaluacin media de la situacin en un periodo de tiempo anterior...
Ventajas e Inconvenientes
Como principal ventaja, cabe destacar los excelentes resultados que brinda un
sistema de control basado en lgica difusa: ofrece salidas de una forma veloz y
precisa, disminuyendo as las transiciones de estados fundamentales en el
entorno fsico que controle. Por ejemplo, si el aire acondicionado se encendiese
al llegar a la temperatura de 30, y la temperatura actual oscilase entre los 29-
30, nuestro sistema de aire acondicionado estara encendindose y apagndose
continuamente, con el gasto energtico que ello conllevara. Si estuviese
regulado por lgica difusa, esos 30 no seran ningn umbral, y el sistema de
control aprendera a mantener una temperatura estable sin continuos apagados y
encendidos.
Del mismo ejemplo puede observarse otra de las principales ventajas de estos
sistemas, que es la capacidad de adelantarse en el tiempo a los acontecimientos,
estabilizando siempre el entorno fsico que controla.
Como principal incoveniente cabe destacar la dificultad de elegir una correcta
funcin de pertenencia para los conjuntos difusos, ya que en ocasiones no es
sencillo especificar el efecto de los cuantificadores de nuestro lenguaje en dicha
funcin. El hecho de que cualquier funcin de pertenencia del sistema estuviese
mal especificada, hara fallar, muy probablemente, todo el sistema completo.
Control borroso:
Los reguladores borrosos son las aplicaciones ms importantes de la teora
borrosa. Trabajan algo diferente que reguladores convencionales; el
conocimiento experto se utiliza en vez de ecuaciones diferenciales para describir
un sistema. Este conocimiento se puede expresar en una manera muy natural
usando las variables lingsticas, que son descritas por los conjuntos borrosos.
El propsito del control es influenciar el comportamiento de un sistema
cambiando una entrada de informacin o las entradas de informacin a ese
sistema segn una regla o conjunto de las reglas que modelan cmo el sistema
funciona. El sistema que es controlado puede ser mecnico, elctrico, producto
qumico o cualquier combinacin de stos. La teora de control clsica utiliza un
modelo matemtico para definir en un lazo que transforme el estado deseado
(solicitado) y estado observado (medido) del sistema en una entrada de
informacin o las entradas de informacin que alterarn el estado futuro de ese
sistema.
Universidad Autnoma de Quertaro 48
El ejemplo ms comn de un modelo de control es el regulador de PID
(proporcional-integral-derivado). Esto toma la salida del sistema y la compara con
el estado deseado del sistema.
Los nmeros borrosos son subconjuntos borrosos de la lnea verdadera. Tienen
un pico o una meseta con el grado 1 de la calidad de miembro, concluido el cual
los miembros del universo estn totalmente en el conjunto. La funcin de la
calidad de miembro est aumentando hacia el pico y est disminuyendo lejos de
ella. Los nmeros borrosos se utilizan muy extensamente en aplicaciones
borrosas del control. La cuesta y las funciones trapezoidales tambin se utilizan,
al igual que las curvas exponenciales similares a las densidades gaussianas de
la probabilidad.
Mientras que los conjuntos borrosos y la lgica generalizan conjuntos y lgica
boleanos, tambin generalizan probabilidad. En hecho, de una perspectiva
matemtica, los conjuntos borrosos y la probabilidad existen como partes de una
mayor teora de informacin generalizada que incluyen muchos formalismos para
representar incertidumbre (conjuntos al azar incluyendo, teora de la evidencia de
Demster-Shafer, los intervalos de la probabilidad, teora de la posibilidad, las
medidas borrosas generales, anlisis del intervalo, etc.). Adems, uno puede
tambin hablar de acontecimientos borrosos al azar y de acontecimientos al azar
borrosos.
Estructura de un controlador lgico difuso:
Los sistemas que utilizan la lgica difusa han sido tambin llamados sistemas
basados en conocimientos. Se ha visto que puede llegar a ser ventajosa la
aplicacin del control lgico difuso (CLD) cuando una o mas de las variables
controladas son continuas, o bien, si el modelo de la planta no esta bien definido,
es complejo, o no se conoce.
El CLD funciona bsicamente en la forma en que se explica a continuacin:
1) Cada variable de entrada numrica se interpreta primero en una interfase de
fusificacion en la que se aplican los factores de escalas correspondientes a su
recorrido universal, y se difusionan los datos de entrada a nmeros difusos.
2) Luego, la maquina de inferencia aplica los datos de entrada fusificados al
conjunto de reglas. Los consecuentes de todas las reglas gatilladas contribuyen a
formar la salida de la maquina de inferencia, expresada como un numero difuso.
3) Como la salida del proceso debe ser tambin un nmero, la ltima etapa del
proceso es la interfase de defusificacion, encargada de interpretar la accin de
control lgico difuso inferido y generar una accin de control no difuso. (Figura
1.1)
Universidad Autnoma de Quertaro 49
La maquina de inferencias de un CLD es una especie de procesador paralelo:
todas las reglas que tienen algn grado de verdad en sus premisas son
gatilladas y contribuyen al conjunto difuso de salida, se podra agregar que no
es inusual que mas de una regla sea gatillada para una misma combinacin de
las variables de entrada.
Defusificacion: El proceso de defusificacion se disea para producir una
salida no difusa (o accin de control en CLD) que representa la posible
distribucin de la accin inferida.
Existen varios mtodos para implementar la interface de defusificacion y son:
1) La media de los Mximos (MOM)
2) Mtodo de la Centroide, Centro de rea o de Gravedad (COA)
Al trabajar con Lgica Difusa estamos imitando la vida real.
Con estos pocos ejemplos, se pone de manifiesto que la Lgica Difusa abarca
un conjunto asombroso de aplicaciones. La Lgica Difusa puede aparecer casi
en cualquier lugar donde ordenadores y moderna teora de control sean
necesariamente imprescindibles, as como en trabajos que precisen de la
delicada precisin humana y de su experiencia. La Lgica Difusa es una
herramienta imprescindible para el desarrollo de los "hogares inteligentes" que
veremos dar a luz en los prximos aos.
Universidad Autnoma de Quertaro 50
3.1 INTRODUCCIN.
Las redes neuronales artificiales o simplemente redes neuronales
constituyen una de las reas de la inteligencia artificial que ha
despertado mayor inters en los ltimos aos. La razn de sto es
que las redes neuronales potencialmente son capaces de resolver
problemas cuya solucin por otros mtodos convencionales resulta
extremadamente difcil. La cualidad ms sobresaliente de las redes
neuronales es que ellas son capaces de aprender . En lugar de
programar a una red se le presenta una serie de ejemplos, a partir de
los cuales ella aprende las relaciones principales que estn implcitas
en la base de datos de entrenamiento. Puesto que estas relaciones
pueden ser fuertemente nolineales, las redes pueden constituir
entonces una herramienta muy general y potente para modelar
procesos industriales de cualquier grado de complejidad.
La figura presenta un ejemplo de una red neuronal tpica, conocida
en la literatura como perceptrn multi-capas. . La red consiste de
neuronas de procesamiento (crculos) y canales de flujo de
informacin entre las neuronas llamadas interconexiones . Los
rectngulos son neuronas que simplemente almacenan entradas a la
red. Cada neurona de procesamiento posee una cantidad limitada de
memoria y realiza un clculo local que transforma las entradas en la
salida.
Este clculo se denomina la funcin de activacin o funcin
transferencial de la neurona. Las funciones transferenciales pueden
ser lineales o no y consisten de ecuaciones algebraicas o
diferenciales.
Universidad Autnoma de Quertaro 51
CAPITULO III: REDES NEURONALES.
Historia de las Redes Neuronales
Conseguir disear y construir mquinas capaces de
realizar procesos con cierta inteligencia ha sido uno de los
principales objetivos de los cientficos a lo largo de la
historia. De los intentos realizados en este sentido se han
llegado a definir las lneas fundamentales para la
obtencin de mquinas inteligentes: En un principio los
esfuerzos estuvieron dirigidos a la obtencin de
autmatas, en el sentido de mquinas que realizaran, con
ms o menos xito, alguna funcin tpica de los seres
humanos. Hoy en da se contina estudiando en sta
misma lnea, con resultados sorprendentes, existen
maneras de realizar procesos similares a los inteligentes y
que podemos encuadrar dentro de la llamada Inteligencia
Artificial (IA).
La otra lnea de la investigacin ha tratado de aplicar
principios fsicos que rigen en la naturaleza para obtener
mquinas que realicen trabajos pesados en nuestro lugar.
De igual manera se puede pensar respecto a la forma y
capacidad de razonamiento humano; se puede intentar
obtener mquinas con esta capacidad basadas en el
mismo principio de funcionamiento.
No se trata de construir mquinas que compitan con los
seres humanos, sino que realicen ciertas tareas de rango
intelectual con que ayudarle, principio bsico de la
Inteligencia Artificial.
Universidad Autnoma de Quertaro 52
3.1.1 Introduccin y origen de las Redes Neuronales.
1943 - Teora de las Redes Neuronales Artificiales.
Walter Pitts junto a Bertran Russell y Warren McCulloch intentaron
explicar el funcionamiento del cerebro humano, por medio de una
red de clulas conectadas entre s, para experimentar ejecutando
operaciones lgicas. Partiendo del menor suceso psquico
(estimado por ellos): el impulso todo/nada, generado por una
clula nerviosa.
El bucle "sentidos - cerebro - msculos", mediante la
retroalimentacin produciran una reaccin positiva si los
msculos reducen la diferencia entre una condicin percibida por
los sentidos y un estado fsico impuesto por el cerebro.
1949 - Conductividad de la sinpsis en las Redes Neuronales.
Seis aos despus de que McCulloch y Pitts mostraran sus Redes
Neuronales, el fisilogo Donald O. Hebb (de la McGill University)
expuso que estas (las redes neuronales) podan aprender. Su
propuesta tenia que ver con la conductividad de la sinpsis, es
decir, con las conexiones entre neuronas. Hebb expuso que la
repetida activacin de una neurona por otra a travs de una
sinpsis determinada, aumenta su conductividad, y la hacia ms
propensa a ser activada sucesivamente, induciendo a la
formacin de un circuito de neuronas estrechamente conectadas
entre s.
1949 - Donald Hebb. Escribi un importante libro: La
organizacin del comportamiento, en el que se establece una
conexin entre psicologa y fisiologa. Fue el primero en explicar
los procesos del aprendizaje (que es el elemento bsico de la
inteligencia humana) desde un punto de vista psicolgico,
desarrollando una regla de como el aprendizaje ocurra. Aun hoy,
este es el fundamento de la mayora de las funciones de
aprendizaje que pueden hallarse en una red neuronal. Su idea fue
que el aprendizaje ocurra cuando ciertos cambios en una
neurona eran activados. Tambin intent encontrar semejanzas
entre el aprendizaje y la actividad nerviosa. Los trabajos de Hebb
formaron las bases de la Teora de las Redes Neuronales.
Universidad Autnoma de Quertaro 53
1950 - Karl Lashley. En sus series de ensayos, encontr que la informacin
no era almacenada en forma centralizada en el cerebro sino que era
distribuida encima de l.
1951 - Primera Red Neuronal.
El extraordinario estudiante de Harvard, Marvin Minsky conoci al cientfico
Burrhus Frederic Skinner, con el que trabaj algn tiempo ayudndole en el
diseo y creacin de mquinas para sus experimentos. Minsky se inspir en
Skinner para gestar su primera idea "oficial" sobre inteligencia artificial, su
Red Neuronal. Por aquel entonces entabl amistad con otro brillante
estudiante, Dean Edmonds, el cual estaba interesado en el estudio de una
nueva ciencia llamada Electrnica.
1956 - Congreso de Dartmouth. Este Congreso frecuentemente se
menciona para indicar el nacimiento de la inteligencia artificial.
1957 - Frank Rosenblatt. Comenz el desarrollo del Perceptrn. Esta es la
red neuronal ms antigua; utilizndose hoy en da para aplicacin como
reconocedor de patrones. Este modelo era capaz de generalizar, es decir,
despus de haber aprendido una serie de patrones poda reconocer otros
similares, aunque no se le hubiesen presentado anteriormente. Sin embargo,
tena una serie de limitaciones, por ejemplo, su incapacidad para resolver el
problema de la funcin OR-exclusiva y, en general, era incapaz de clasificar
clases no separables linealmente. En 1959, escribi el libro Principios de
Neurodinmica, en el que confirm que, bajo ciertas condiciones, el
aprendizaje del Perceptrn converga hacia un estado finito (Teorema de
Convergencia del Perceptrn).
1960 - Bernard Widrow/Marcial Hoff. Desarrollaron el modelo Adaline
(ADAptative LINear Elements). Esta fue la primera red neuronal aplicada a un
problema real (filtros adaptativos para eliminar ecos en las lneas telefnicas)
que se ha utilizado comercialmente durante varias dcadas.
1961 - Karl Steinbeck: Die Lernmatrix. Red neuronal para simples
realizaciones tcnicas (memoria asociativa).
1967 - Stephen Grossberg. A partir de sus conocimientos fisiolgicos, ha
escrito numerosos libros y desarrollado modelo de redes neuronales. Realiz
una red: Avalancha, que consista en elementos discretos con actividad que
vara en el tiempo que satisface ecuaciones diferenciales continuas, para
resolver actividades como reconocimiento continuo de habla y aprendizaje de
los brazos de un robot.
Universidad Autnoma de Quertaro 54
1969 - Marvin Minsky/Seymour Papert. En este ao surgieron crticas que
frenaron, hasta 1982, el crecimiento que estaban experimentando las
investigaciones sobre redes neuronales. Minsky y Papera, del Instituto
Tecnolgico de Massachussets (MIT), publicaron un libro Perceptrons.
Probaron (matemticamente) que el Perceptrn no era capaz de resolver
problemas relativamente fciles, tales como el aprendizaje de una funcin
no-lineal. Esto demostr que el Perceptrn era muy dbil, dado que las
funciones no-lineales son extensamente empleadas en computacin y en
los problemas del mundo real. A pesar del libro, algunos investigadores
continuaron su trabajo. Tal fue el caso de James Anderson, que desarroll
un modelo lineal, llamado Asociador Lineal, que consista en unos
elementos integradores lineales (neuronas) que sumaban sus entradas.
Este modelo se basa en el principio de que las conexiones entre neuronas
son reforzadas cada vez que son activadas. Anderson dise una potente
extensin del Asociador Lineal, llamada Brain State in a Box (BSB).
1974 - Paul Werbos. Desarroll la idea bsica del algoritmo de aprendizaje
de propagacin hacia atrs (backpropagation); cuyo significado qued
definitivamente aclarado en 1985.
1977 - Stephen Grossberg. Teora de Resonancia Adaptada (TRA). La
Teora de Resonancia Adaptada es una arquitectura de red que se
diferencia de todas las dems previamente inventadas. La misma simula
otras habilidades del cerebro: memoria a largo y corto plazo.
1977 - Teuvo Kohonen. Ingeniero electrnico de la Universidad de Helsinki,
desarroll un modelo similar al de Anderson, pero independientemente.
1980 - Kunihiko Fukushima. Desarroll un modelo neuronal para el
reconocimiento de patrones visuales.
1985 - John Hopfield. Provoc el renacimiento de las redes neuronales
con su libro: "Computacin neuronal de decisiones en problemas de
optimizacin."
1986 - David Rumelhart/G. Hinton. Redescubrieron el algoritmo de
aprendizaje de propagacin hacia atrs (backpropagation). A partir de 1986,
el panorama fue alentador con respecto a las investigaciones y el desarrollo
de las redes neuronales. En la actualidad, son numerosos los trabajos que
se realizan y publican cada ao, las aplicaciones nuevas que surgen
(sobretodo en el rea de control) y las empresas que lanzan al mercado
productos nuevos, tanto hardware como software (sobre todo para
simulacin).
Universidad Autnoma de Quertaro 55
Existen numerosas formas de definir a las redes neuronales; desde las definiciones
cortas y genricas hasta las que intentan explicar ms detalladamente qu son las
redes neuronales. Por ejemplo:
1) Una nueva forma de computacin, inspirada en modelos biolgicos.
2) Un modelo matemtico compuesto por un gran nmero de elementos procesales
organizados en niveles.
3)...un sistema de computacin compuesto por un gran nmero de elementos
simples, elementos de procesos muy interconectados, los cuales procesan
informacin por medio de su estado dinmico como respuesta a entradas externas.
4) Redes neuronales artificiales son redes interconectadas masivamente en paralelo
de elementos simples (usualmente adaptativos) y con organizacin jerrquica, las
cuales intentan interactuar con los objetos del mundo real del mismo modo que lo
hace el sistema nervioso biolgico.
En el campo de la inteligencia artificial se refiere habitualmente de forma ms
sencilla como redes de neuronas o redes neuronales, las redes de neuronas
artificiales (denominadas habitualmente como RNA o en ingls como: "ANN") son
un paradigma de aprendizaje y procesamiento automtico inspirado en la forma en
que funciona el sistema nervioso de los animales. Se trata de un sistema de
interconexin de neuronas en una red que colabora para producir un estmulo de
salida.
Esta dificultad de los sistemas de computo que trabajan bajo la filosofa de los
sistemas secuenciales, desarrollados por Von Neuman, ha hecho que un gran
nmero de investigadores centre su atencin en el desarrollo de nuevos sistemas de
tratamiento de la informacin, que permitan solucionar problemas cotidianos, tal
como lo hace el cerebro humano; este rgano biolgico cuenta con varias
caractersticas deseables para cualquier sistema de procesamiento digital, tales
como:
Es robusto y tolerante a fallas, diariamente mueren neuronas sin afectar su
desempeo.
Es flexible, se ajusta a nuevos ambientes por aprendizaje, no hay que programarlo.
Puede manejar informacin difusa, con ruido o inconsistente.
Es altamente paralelo
Es pequeo, compacto y consume poca energa.
Universidad Autnoma de Quertaro 56
Definiciones de una red neuronal.
El cerebro humano constituye una computadora muy notable, es capaz de
interpretar informacin imprecisa suministrada por los sentidos a un ritmo
increblemente veloz. Logra discernir un susurro en una sala ruidosa, un rostro en
un callejn mal iluminado y leer entre lneas un discurso; lo ms impresionante
de todo, es que el cerebro aprende sin instrucciones explcitas de ninguna clase,
a crear las representaciones internas que hacen posibles estas habilidades.
Basados en la eficiencia de los procesos llevados a cabo por el cerebro, e
inspirados en su funcionamiento, varios investigadores han desarrollado desde
hace ms de 30 aos la teora de las Redes Neuronales Artificiales (RNA), las
cuales emulan las redes neuronales biolgicas, y que se han utilizado para
aprender estrategias de solucin basadas en ejemplos de comportamiento tpico
de patrones; estos sistemas no requieren que la tarea a ejecutar se programe,
ellos generalizan y aprenden de la experiencia.
La teora de las RNA ha brindado una alternativa a la computacin clsica, para
aquellos problemas, en los cuales los mtodos tradicionales no han entregado
resultados muy convincentes, o poco convenientes. Las aplicaciones ms
exitosas de las RNA son:
Procesamiento de imgenes y de voz.
Reconocimiento de patrones.
Planeamiento.
Interfaces adaptadas para sistemas Hombre/mquina.
Prediccin.
Control y optimizacin.
Filtrado de seales.
Los sistemas de computo tradicional procesan la informacin en forma
secuencial; un computador serial consiste por lo general de un solo procesador
que puede manipular instrucciones y datos que se localizan en la memoria, el
procesador lee, y ejecuta una a una las instrucciones en la memoria; este
sistema serial es secuencial, todo sucede en una sola secuencia determinstica
de operaciones. Las RNA no ejecutan instrucciones, responden en paralelo a las
entradas que se les presenta. El resultado no se almacena en una posicin de
memoria, este es el estado de la red para el cual se logra equilibrio. El
conocimiento de una red neuronal no se almacena en instrucciones, el poder de
la red est en su topologa y en los valores de las conexiones (pesos) entre
neuronas.
Las RNA son una teora que an esta en proceso de desarrollo, su verdadera
potencialidad no se ha alcanzado todava; aunque los investigadores han
desarrollado potentes algoritmos de aprendizaje de gran valor prctico, las
representaciones y procedimientos de que se sirve el cerebro, son an
desconocidas. Tarde o temprano los estudios computacionales del aprendizaje
con RNA acabarn por converger a los mtodos descubiertos por evolucin,
cuando eso suceda, muchos datos empricos concernientes al cerebro
comenzarn sbitamente a adquirir sentido y se tornarn factibles muchas
aplicaciones desconocidas de las redes neuronales.
Universidad Autnoma de Quertaro 57
Un circuito elctrico que realice la suma ponderada de las diferentes seales que
recibe de otras unidades iguales y produzca en la salida un uno o un cero segn
el resultado de la suma con relacin al umbral o nivel de disparo, conforma una
buena representacin de lo que es una neurona artificial.

Interpretacin De La Neurona Por Computadora


Una neurona se puede comparar con una caja negra compuesta por varias
entradas y una salida. La relacin de activacin entre la salida y la entrada, o en
trminos circuitales o de teora de control.
El Futuro.

Hasta ahora el control de un entorno electrnico o incluso uno electromecnico,


(ej. Manejar una silla de ruedas), ha sido utilizando un solo tipo de seal, sea que
provenga de un msculo, del ojo o de ondas cerebrales.

Tambin somos nosotros quienes debemos entrenarnos para controlar nuestros


impulsos y luego poder mover o ejecutar la accin deseada.

Quiz el futuro se encuentre en sistemas que sean capaces de traducir muchos y


diferentes tipos de seales, y as poder "leer" lo que nosotros deseamos hacer,
dejando al sistema y no a nosotros, el trabajo de entrenarse.

En cuanto a las aplicaciones quiz se logren versiones comerciales para manejar


entornos informticos, y as a travs de los ordenadores controlar, medios de
transporte, electrodomsticos, equipos mdicos y militares, el campo de
aplicacin es enorme...
Los implantes que salvan vidas.
Los futurrologos norteamericanos dicen que dentro de un siglo la medicina ser
capaz no slo de reemplazar cualquier parte daada del cuerpo, sino que podr
sustituir, por medio de un chip implantado en el cerebro ciertos dficit de la
inteligencia para que todos los individuos estn a la altura del progreso tcnico y
cientfico del conjunto.

La electrnica ayuda a la medicina, se ha aliado con ella y ha inventado


implantes que podrn parar el mal de Parkinson o la epilepsia, as como rganos
artificiales que mejoran el modo de vida. Tambin permitir una administracin
precisa de los medicamentos, colocando minibombas en alguna parte del cuerpo
que proporcionarn las dosis adecuadas para cada paciente, evitando los efectos
secundarios.

El desarrollo de nuevos materiales permitir la aparicin de nuevos rganos


artificiales, como por ejemplo falsos msculos realizados con materiales
retrctiles u rganos hbridos compuestos, a la vez, por clulas vivas y chips
electrnicos.
Universidad Autnoma de Quertaro 58
La Neurona Artificial
La Neurona
A finales del siglo 19 se logr una mayor claridad sobre el trabajo del
cerebro debido a los trabajos de Ramn y Cajal en Espaa y Sherrington en
Inglaterra. El primero trabaj en la anatoma de las neuronas y el segundo
en los puntos de conexin de las mismas o sinpsis.
El tejido nervioso es el ms diferenciado del organismo y est constituido
por clulas nerviosas, fibras nerviosas y la neuroglia, que est formada por
varias clases de clulas. La clula nerviosa se denomina neurona, que es la
unidad funcional del sistema nervioso. Hay neuronas bipolares, con dos
prolongaciones de fibras y multipolares, con numerosas prolongaciones.
Pueden ser neuronas sensoriales, motoras y de asociacin.
Se estima que en cada milmetro del cerebro hay cerca de 50.000
neuronas.
El tamao y la forma de las neuronas es variable, pero con las mismas
subdivisiones. El cuerpo de la neurona o Soma contiene el ncleo. Se
encarga de todas las actividades metablicas de la neurona y recibe la
informacin de otras neuronas vecinas a travs de las conexiones
sinpticas.
Las dendritas son las conexiones de entrada de la neurona. Por su parte el
axn es la "salida" de la neurona y se utiliza para enviar impulsos o seales
a otras clulas nerviosas. Cuando el axn esta cerca de sus clulas destino
se divide en muchas ramificaciones que forman sinpsis con el soma o
axones de otras clulas. Esta unin puede ser "inhibidora" o "excitadora"
segn el transmisor que las libere. Cada neurona recibe de 10.000 a
100.000 sinpsis y el axn realiza una cantidad de conexiones similar.
La transmisin de una seal de una clula a otra por medio de la sinpsis
es un proceso qumico. En l se liberan substancias transmisoras en el lado
del emisor de la unin. El efecto es elevar o disminuir el potencial elctrico
dentro del cuerpo de la clula receptora. Si su potencial alcanza el umbral
se enva un pulso o potencial de accin por el axn. Se dice, entonces, que
la clula se dispar. Este pulso alcanza otras neuronas a travs de la
distribuciones de los axones.
Universidad Autnoma de Quertaro 59
3.4 ESTRUCTURA BSICA DE UNA NEURONA.
La Red Neuronal
El sistema de neuronas biolgico esta compuesto por
neuronas de entrada (censores) conectados a una
compleja red de neuronas "calculadoras" (neuronas
ocultas), las cuales, a su vez, estn conectadas a las
neuronas de salidas que controlan, por ejemplo, los
msculos.
Los censores pueden ser seales de los odos, ojos,
etc. las respuestas de las neuronas de salida activan
los msculos correspondientes. En el cerebro hay una
gigantesca red de neuronas "calculadoras" u ocultas
que realizan la computacin necesaria. De esta manera
similar, una red neuronal artificial debe ser compuesta
por censores del tipo mecnico o elctrico.
Universidad Autnoma de Quertaro 60
El cerebro consta de un gran nmero (aproximadamente 10
11
) de elementos
altamente interconectados (aproximadamente 10
4
conexiones por elemento),
llamados neuronas. Estas neuronas tienen tres componentes principales, las
dendritas, el cuerpo de la clula o soma, y el axn.
Las dendritas, son el rbol receptor de la red, son como fibras nerviosas que
cargan de seales elctricas el cuerpo de la clula.
El cuerpo de la clula, realiza la suma de esas seales de entrada.
El axn es una fibra larga que lleva la seal desde el cuerpo de la clula hacia
otras neuronas.
El punto de contacto entre un axn de una clula y una dendrita de otra clula es
llamado sinpsis, la longitud de la sinpsis es determinada por la complejidad del
proceso qumico que estabiliza la funcin de la red neuronal.
Un esquema simplificado de la interconexin de dos neuronas biolgicas se
observa en la figura
Algunas de las estructuras neuronales son determinadas en el nacimiento, otra
parte es desarrollada a travs del aprendizaje, proceso en que nuevas
conexiones neuronales son realizadas y otras se pierden por completo. El
desarrollo neurolgico se hace crtico durante los primeros aos de vida, por
ejemplo est demostrado que si a un cachorro de gato, se le impide usar uno de
sus ojos durante un periodo corto de tiempo, el nunca desarrollara una visin
normal en ese ojo.
Universidad Autnoma de Quertaro 61
3.4.2 Estructura bsica de una Neurona.
Las estructuras neuronales continan cambiando durante toda la
vida, estos cambios consisten en el refuerzo o debilitamiento de las
uniones sinpticas; por ejemplo se cree que nuevas memorias son
formadas por la modificacin de esta intensidad entre sinpsis, as el
proceso de recordar el rostro de un nuevo amigo, consiste en alterar
varias sinpsis.
Como consecuencia de los primeros estudios sobre la base neural
de los sistemas mnmicos (relacionados con la memoria), se crea
que el almacenamiento de la memoria asociativa, tanto implcita
como explcita, requeran de un circuito neuronal muy complejo.
Entre quienes comenzaron a oponerse a este enfoque se hallaba
Donald O. Hebb, profesor de la universidad de Milner; Hebb sugiri
que el aprendizaje asociativo podra ser producido por un
mecanismo celular sencillo y propuso que las asociaciones podran
formarse por una actividad neuronal coincidente: "Cuando un axn
de la clula A excita la clula B y participa en su activacin, se
produce algn proceso de desarrollo o cambio metablico en una o
en ambas clulas, de suerte que la eficacia de A, como clula
excitadora de B, se intensifica". Segn la regla Hebbiana de
aprendizaje, el que coincida la actividad de las neuronas
presinpticas (suministran el impulso de entrada) con la de las
postsinpticas (reciben el impulso) es muy importante para que se
refuerce la conexin entre ellas, este mecanismo es llamado pre-
postasociativo, del cual puede observarse un ejemplo en la figura
Universidad Autnoma de Quertaro 62
Todas las neuronas conducen la informacin de forma similar, esta
viaja a lo largo de axones en breves impulsos elctricos, denominados
potenciales de accin; los potenciales de accin que alcanzan una
amplitud mxima de unos 100 mV y duran 1 ms, son resultado del
desplazamiento a travs de la membrana celular de iones de sodio
dotados de carga positiva, que pasan desde el fluido extracelular
hasta el citoplasma intracelular; la concentracin extracelular de sodio
supera enormemente la concentracin intracelular.
La membrana en reposo mantiene un gradiente de potencial elctrico
de -70mv, el signo negativo se debe a que el citoplasma intracelular
est cargado negativamente con respecto al exterior; los iones de
sodio no atraviesan con facilidad la membrana en reposo, los
estmulos fsicos o qumicos que reducen el gradiente de potencial, o
que despolaricen la membrana, aumentan su permeabilidad al sodio y
el flujo de este ion hacia el exterior acenta la despolarizacin de la
membrana, con lo que la permeabilidad al sodio se incrementa ms
an.
Alcanzado un potencial crtico denominado "umbral", la realimentacin
positiva produce un efecto regenerativo que obliga al potencial de
membrana a cambiar de signo. Es decir, el interior de la clula se
torna positivo con respecto al exterior, al cabo de 1 ms, la
permeabilidad del sodio decae y el potencial de membrana retorna a -
70mv, su valor de reposo. Tras cada explosin de actividad inica, el
mecanismo de permeabilidad del sodio se mantiene refractario
durante algunos milisegundos; la tasa de generacin de potenciales
de accin queda as limitada a unos 200 impulsos por segundo, o
menos.
Aunque los axones puedan parecer hilos conductores aislados, no
conducen los impulsos elctricos de igual forma, como hilos elctricos
no seran muy valiosos, pues su resistencia a lo largo del eje es
demasiado grande y a resistencia de la membrana demasiado baja; la
carga positiva inyectada en el axn durante el potencial de accin
queda disipada uno o dos milmetros ms adelante, para que la seal
recorra varios centmetros es preciso regenerar frecuentemente el
potencial de accin a lo largo del camino la necesidad de reforzar
repetidamente esta corriente elctrica limita a unos 100 metros por
segundo la velocidad mxima de viaje de los impulsos, tal velocidad
es inferior a la millonsima de la velocidad de una seal elctrica por
un hilo de cobre.
Universidad Autnoma de Quertaro 63
Los potenciales de accin, son seales de baja frecuencia
conducidas en forma muy lenta, estos no pueden saltar de una
clula a otra, la comunicacin entre neuronas viene siempre
mediada por transmisores qumicos que son liberados en las
sinpsis. Un ejemplo de comunicacin entre neuronas y del
proceso qumico de la liberacin de neurotransmisores se ilustra
en la figura
Comunicacin entre neuronas
Universidad Autnoma de Quertaro 64
Cuando un potencial de accin llega al Terminal de un axn son
liberados transmisores alojados en diminutas vesculas, que
despus son vertidos en una hendidura de unos 20 nanmetros
de anchura que separa la membrana presinptica de la
postsinptica; durante el apogeo del potencial de accin,
penetran iones de calcio en el terminal nervioso, su movimiento
constituye la seal determinante de la exocitosis sincronizada,
esto es la liberacin coordinada de molculas
neurotransmisoras. En cuanto son liberados, los
neurotransmisores se enlazan con receptores postsinpticos,
instando el cambio de la permeabilidad de la membrana.
Cuando el desplazamiento de carga hace que la membrana se
aproxime al umbral de generacin de potenciales de accin, se
produce un efecto excitador y cuando la membrana resulta
estabilizada en la vecindad el valor de reposo se produce un
efecto inhibidor. Cada sinpsis produce slo un pequeo efecto,
para determinar la intensidad (frecuencia de los potenciales de
accin) de la respuesta cada neurona ha de integrar
continuamente hasta unas 1000 seales sinpticas, que se suman
en el soma o cuerpo de la clula.
En algunas neuronas los impulsos se inician en la unin entre el
axn y el soma, y luego se transmiten a lo largo del axn a otras
clulas nerviosas. Cuando el axn est cerca de sus clulas
destino, se divide en muchas ramificaciones que forman sinpsis
con el soma o axones de otras clulas. Las sinpsis pueden ser
excitatorias o inhibitorias segn el neurotransmisor que se
libere, cada neurona recibe de 10.000 a 100.000 sinpsis y su axn
realiza una cantidad similar de sinpsis.
Las sinpsis se clasifican segn su posicin en la superficie de la
neurona receptora en tres tipos: axo-somtica, axo-dendrtica,
axo-axnica. Los fenmenos que ocurren en la sinpsis son de
naturaleza qumica, pero tienen efectos elctricos laterales que
se pueden medir.
Universidad Autnoma de Quertaro 65
En la figura se visualiza el proceso qumico de una sinpsis y los
diferentes elementos que hacen parte del proceso tanto en la
neurona presinptica, como en la postsinptica.
Proceso qumico de una sinapsis
Las RNA no alcanzan la complejidad del cerebro, sin embargo hay
dos aspectos similares entre redes biolgicas y artificiales,
primero los bloques de construccin de ambas redes son sencillos
elementos computacionales (aunque las RNA son mucho ms
simples que las biolgicas) altamente interconectados; segundo,
las conexiones entre neuronas determinan la funcin de la red.
Universidad Autnoma de Quertaro 66
CARACTERISTICAS DE UNA RED NEURONAL ARTIFICIAL
El modelo de una neurona artificial es una imitacin del proceso
de una neurona biolgica, puede tambin asemejarse a un
sumador hecho con un amplificador operacional tal como se ve en
la figura 1.6
Neurona Artificial
Existen varias formas de nombrar una neurona artificial, es
conocida como nodo, neuronodo, celda, unidad o elemento de
procesamiento (PE); En la figura 1.7 se observa un PE en forma
general y su similitud con una neurona biolgica
Universidad Autnoma de Quertaro 67
3.5.1 Comportamiento de la Neurona.
En la figura De la neurona biolgica a la neurona artificial
De la observacin detallada del proceso biolgico se han hallado los
siguientes anlogos con el sistema artificial:
Las entradas X
i
representan las seales que provienen de otras
neuronas y que son capturadas por las dendritas.

Los pesos W
i
son la intensidad de la sinpsis que conecta dos
neuronas; tanto X
i
como W
i
son valores reales.

es la funcin umbral que la neurona debe sobrepasar para activarse;


este proceso ocurre biolgicamente en el cuerpo de la clula.
Las seales de entrada a una neurona artificial X
1
, X
2
,.., X
n
son
variables continuas en lugar de pulsos discretos, como se presentan
en una neurona biolgica. Cada seal de entrada pasa a travs de
una ganancia o peso, llamado peso sinptico o fortaleza de la
conexin cuya funcin es anloga a la de la funcin sinptica de la
neurona biolgica. Los pesos pueden ser positivos (excitatorios), o
negativos (inhibitorios), el nodo sumatorio acumula todas las seales
de entradas multiplicadas por los pesos o ponderadas y las pasa a la
salida a travs de una funcin umbral o funcin de transferencia. La
entrada neta a cada unidad puede escribirse de la siguiente manera
Universidad Autnoma de Quertaro 68
Una idea clara de este proceso se muestra en la figura en donde puede
observarse el recorrido de un conjunto de seales que entran a la red.
Proceso de una red neuronal
Una vez que se ha calculado la activacin del nodo, el valor de salida equivale a
Donde representa la funcin de activacin para esa unidad, que corresponde a la
funcin escogida para transformar la entrada neta
i
en el valor de salida y que
depende de las caractersticas especficas de cada red.

Notacin: Una notacin matemtica estndar no ha sido an establecida para


las redes neuronales, ya que sus aplicaciones son tiles en muchos campos,
Ingeniera, Fsica, Sicologa y Matemticas. En este trabajo se adopt la
siguiente convencin para identificar las variables, de manera que fuera
compatibles con las diferentes reas, siendo lo ms sencilla posible:
Valores escalares: se representarn por medio de letra minscula itlica
Vectores: se representarn con letra itlica minscula en negrilla.
Matrices: se representarn con letra mayscula itlica en negrilla.

Universidad Autnoma de Quertaro 69


Para redes multicapa, los parmetros adoptaran la siguiente
forma:
Donde c, es el nmero de la capa a la que corresponde dicho
peso, y s representa las neuronas que participan en proceso.
As representa el peso de la segunda capa que comunica la
primera neurona de dicha capa con la primera neurona de la
primera capa. De igual manera el peso que representa la
conexin desde la ltima neurona de la capa dos a la ltima
neurona de la capa uno estar representado por:
Esta convencin es adoptada para todos los parmetros de la red.
Universidad Autnoma de Quertaro 70
Funciones de Transferencia: Un modelo ms acadmico que
facilita el estudio de una neurona, puede visualizarse en la figura
Neurona de una sola entrada
Las entradas a la red sern ahora presentadas en el vector p, que
para el caso de una sola neurona contiene solo un elemento, w
sigue representando los pesos y la nueva entrada b es una
ganancia que refuerza la salida del sumador n, la cual es la salida
neta de la red; la salida total est determinada por la funcin de
transferencia , la cual puede ser una funcin lineal o no lineal de
n, y que es escogida dependiendo de las especificaciones del
problema que la neurona tenga que resolver; aunque las RNA se
inspiren en modelos biolgicos no existe ninguna limitacin para
realizar modificaciones en las funciones de salida, as que se
encontrarn modelos artificiales que nada tienen que ver con las
caractersticas del sistema biolgico.
Universidad Autnoma de Quertaro 71
3.6 ESTRUCUTRA BSICA DE
LAS REDES NEURONALES.
Limitador fuerte (Hardlim): La figura 1.11, muestra como esta
funcin de transferencia acerca la salida de la red a cero, si el
argumento de la funcin es menor que cero y la lleva a uno si
este argumento es mayor que uno. Esta funcin crea
neuronas que clasifican las entradas en dos categoras
diferentes, caracterstica que le permite ser empleada en la
red tipo Perceptrn
Funcin de transferencia Hardlim
El icono para la funcin Hardlim reemplazara a la letra f en la
expresin general, cuando se utilice la funcin Hardlim.
Universidad Autnoma de Quertaro 72
Una modificacin de esta funcin puede verse en la figura
1.12, la que representa la funcin de transferencia Hardlims
que restringe el espacio de salida a valores entre 1 y 1.
Funcin de transferencia Hardlims
Funcin de transferencia lineal (purelin): La salida de una
funcin de transferencia lineal es igual a su entrada,
Universidad Autnoma de Quertaro 73
Funcin de transferencia lineal
En la grfica del lado derecho de la figura 1.13, puede
verse la caracterstica de la salida a de la red,
comparada con la entrada p, ms un valor de ganancia
b, neuronas que emplean esta funcin de transferencia
son utilizadas en la red tipo Adaline.
Funcin de transferencia sigmoidal (logsig): Esta
funcin toma los valores de entrada, los cuales pueden
oscilar entre mas y menos infinito, y restringe la salida
a valores entre cero y uno, de acuerdo a la expresin.
Universidad Autnoma de Quertaro 74
La tabla hace una relacin de las principales funciones de
transferencia empleadas en el entrenamiento de redes neuronales
Universidad Autnoma de Quertaro 75
Topologa de una Red: Tpicamente una neurona
tiene ms de una entrada; en la figura 1.15 se observa
una neurona con R entradas; las entradas individuales
p
1
,p
2
,...,p
R
son multiplicadas por los pesos
correspondientes w
1,1
, w
1,2
,...w
1,R
pertenecientes a la
matriz de pesos W.
Neurona con mltiples entradas
La neurona tiene una ganancia b, la cual
llega al mismo sumador al que llegan las
entradas multiplicadas por los pesos, para
formar la salida n,
Esta expresin puede ser escrita en forma
matricial
Universidad Autnoma de Quertaro 76
Los subndices de la matriz de pesos representan los trminos involucrados en
la conexin, el primer subndice representa la neurona destino y el segundo,
representa la fuente de la seal que alimenta a la neurona. Por ejemplo, los
ndices de w
1,2
indican que este peso es la conexin desde la segunda entrada
a la primera neurona. Esta convencin se hace ms til cuando hay ms de
una neurona, o cuando se tiene una neurona con demasiados parmetros; en
este caso la notacin de la figura
Neurona con mltiples entradas, notacin abreviada
El vector de entrada p es representado por la barra slida vertical a la
izquierda. Las dimensiones de p son mostradas en la parte inferior de la
variable como Rx1, indicando que el vector de entrada es un vector fila de
R elementos. Las entradas van a la matriz de pesos W, la cual tiene R
columnas y solo una fila para el caso de una sola neurona. Una constante
1 entra a la neurona multiplicada por la ganancia escalar b. La salida de la
red a, es en este caso un escalar, si la red tuviera ms de una neurona a
sera un vector.
Dentro de una red neuronal, los elementos de procesamiento se encuentran
agrupados por capas, una capa es una coleccin de neuronas; de acuerdo a la
ubicacin de la capa en la RNA, esta recibe diferentes nombres
Universidad Autnoma de Quertaro 77
En la red mostrada en la figura , hay 3 capas de
neuronas: La capa de entrada, la escondida y la capa
de salida. En algunas publicaciones la capa de
entrada no se cuenta y desde este punto de vista la
red de la figura 1 podr considerarse un conjunto de
2 capas. No obstante, nosotros adoptaremos la
convencin de que la capa de entrada se cuente
como una ms. De acuerdo con un estudio reciente,
existen ms de 50 tipos de redes neuronales que han
sido estudiadas y/o usadas en una gran diversidad de
aplicaciones. Sin embargo, quizs la ms extendida
y utilizada para la identificacin de procesos
dinmicos y su control es la llamada red de
retropropagacin , que es la que expondremos a
continuacin.
Universidad Autnoma de Quertaro 78
El concepto de retropropagacin se refiere a un mtodo de entrenamiento de la
red y por extensin se le llama red de retropropagacin a aquella que se entrena
mediante dicho mtodo. Es conveniente aclarar que el mtodo o algoritmo de
retropropagacin no es el nico existente en la actualidad, no obstante, puede
afirmarse que el mtodo bsico y sus modificaciones han sido las ms exitosas
en la solucin de una gran diversidad de problemas prcticos.
Entre las aplicaciones de este tipo de red podemos citar:
- Reconocimiento y sntesis de voz
- Reconocimiento de patrones visuales o imgenes
- Anlisis de seales de sonar
- Aplicaciones en la defensa
- Diagnstico mdico
- Control de columnas de destilacin y otros procesos
La red de retropropagacin es un tipo de red neuronal que es capaz de desarrollar
una aproximacin tan fina como se quiera de cualquier funcin no-lineal y = f(x),
a partir de un conjunto de pares de ejemplo x, y. Este mtodo es una
generalizacin de la ley de aprendizaje por el descenso ms rpido presentada
por Widrow y Hoff (1960) que analizaron una red neuronal de dos capas llamada
ADALINE y desarrollaron un mtodo de descenso local segn la direccin del
gradiente. El mtodo propuesto por Widrow y Hoff fue generalizado al caso de
capas mltiples con el nombre de algoritmo de retropropagacin
La cuestin del nmero de capas en una red es muy importante tal como
demuestran Minsky y Papert (1972) en su texto clsico Perceptrons . Ellos
mostraron que una red de dos capas del tipo estudiado hasta entonces estaba
limitada en cuanto al espectro de problemas que podra resolver y especularon
sobre que el estudio de redes multicapas sera un rea estril. No obstante, la
experiencia ha demostrado que esa especulacin era incorrecta.
En efecto, las redes multicapas pueden dar resultados que son imposibles de alcanzar
con las redes de dos capas, la adicin de capas escondidas permite al algoritmo de
retropropagacin desarrollar una representacin interna del problema que puede ser
vital para su solucin..
Universidad Autnoma de Quertaro 79
Retropropagacin.
Parece ser que la presencia de una o ms capas
escondidas le da a la retropropagacin nuevas
dimensiones en trminos de su habilidad para aprender
la representacin de una funcin arbitraria f(x). Uno de los
aspectos que sern tratados aqu es que los modelos
dinmicos lineales tradicionales, como el ARX, presentado
en el captulo 2, o el de Convolucin, son equivalentes a
un modelo de red neuronal de dos capas con
retropropagacin. Es de esperarse entonces que esos
modelos tradicionales estn ms limitados que un modelo
de tres capas con retropropagacin en trminos de su
habilidad para modelar procesos dinmicos
Es conveniente aclarar en este punto que los datos de
entrada y de salida xi , yi. deben estar normalizados en el
intervalo 0-1. Los coeficientes wij, vjk , se denominan pesos
y a la entrada n+1, cuyo valor es fijado en el valor 1, se le
conoce como bias . Este ltimo elemento permite que la red
pueda modelar sistemas en que las salidas pueden tener
valores distintos de cero cuando todas las entradas son cero.
La salida de la neurona j de la capa escondida se calcula
generalmente como una funcin no-lineal de la excitacin
aunque en algunos casos particulares puede ser tambin una
funcin lineal.
Por el momento vamos a definir a la funcin no lineal de
salida o funcin de activacin como la funcin sigma, tanto
para las neuronas de la capa escondida como para las de la
capa de salida. Esta funcin presenta considerables ventajas
dada su simplicidad aunque es posible utilizar otras funciones
como la tangente hiperblica, la funcin de Gauss, etc. La
forma de la funcin sigma o sigmoide, se representa en la
figura siguiente:
Universidad Autnoma de Quertaro 80
Consideremos la red representada en forma simplificada en la
figura 8.2 y supongamos que se dispone de un conjunto de pares
de datos, Xp, Yp, p=1. 2. . . . . ., N.
Para la neurona j de la capa escondida, definimos la funcin de
excitacin, correspondiente a la muestra p de los datos:
Universidad Autnoma de Quertaro 81
Algoritmos de Clculo.
Entonces la salida de la neurona j de la capa escondida, se
expresa:
La excitacin de la neurona k de la capa de salida, se calcula en
forma anloga, mediante la expresin:
Universidad Autnoma de Quertaro 82
y por ltimo, la salida de la neurona k
de la capa de salida se expresa como:
Definimos ahora al error en la salida k,
para la muestra p como:
y el criterio a minimizar en la muestra p:
o tambin:
Universidad Autnoma de Quertaro 83
consiste entonces en presentar secuencialmente las entradas
xi p (p=1,. . . . . .,M) (i =1,2,. . . . . .,n), calcular las salidas de
la red Ok p (k=1,2,. . . . . ,m) (p=1,2, . . . . . .,M), los errores e
k p y aplicar algn procedimiento de minimizacin de la
funcin Ep y el criterio Ep con respecto a los coeficientes de
peso wij y vjk de manera que estos se vayan aproximando
paulatinamente a los valores que garantizan un error mnimo
entre las salidas de la red Ok y los datos de salida Yk.
Este procedimiento se repite tantas veces como sea
necesario, es decir, los vectores de datos Xp e Yp
se utilizan reiteradamente hasta tanto el error en cada salida
y el criterio Ep , para p = 1,2,. . . .N, se encuentren por debajo
del lmite pre-fijado. Una vez lograda esta condicin, se dice
que la red est entrenada, lo que significa que ella ser capaz
de reproducir la funcin y = f(x) con suficiente exactitud si los
datos de entrenamiento han sido bien seleccionados y
suficientes. A cada ciclo de uso de los datos de entrenamiento
suele denominrsele poca en el argot de las redes
neuronales.
Para minimizar la funcin Ep con respecto a los coeficientes
de peso wij y vjk vamos a utilizar el mtodo del descenso
ms rpido (steepest descent) que consiste en moverse
siempre en la direccin del negativo del gradiente de la
funcin Ep con respecto a los coeficientes wij y vjk
El gradiente de la funcin Ep es un vector multidimensional
cuyas componentes son las derivadas parciales.
Universidad Autnoma de Quertaro 84
El proceso de aprendizaje de la red
Vamos a calcular en primer lugar las
derivadas parciales con respecto a las
neuronas de la capa de salida, lo que
resulta ms simple:
Sustituyendo tenemos que :
Universidad Autnoma de Quertaro 85
Definimos ahora:
Sustituyendo tenemos entonces:
La segunda parte del gradiente de Ep
requiere del clculo de sus derivadas parciales con
respecto a los coeficientes de peso wij que conectan
a la capa de entrada con la capa escondida. A
continuacin procedemos a realizar dicho clculo. En
primer lugar, retomemos la expresin que define al
criterio Ep
y teniendo en cuenta la definicin de
rkp
Universidad Autnoma de Quertaro 86
Sabemos adems, que de acuerdo
Aplicando ahora la regla de la cadena de
la derivacin y teniendo en cuenta las
relaciones
Definimos:
Universidad Autnoma de Quertaro 87
Y sustituyendo tenemos que :
Teniendo en cuanta las expresiones
tenemos que:
El algoritmo de retropropagacin aplicado
al entrenamiento de las neuronas de una
red de 3 capas, consiste en aplicar el mtodo
del descenso ms rpido, o en otras
palabras, moverse en la direccin del
negativo del gradiente, dando un paso de
actualizacin de los valores de los
coeficientes de peso Vjkp
Y Wijp con cada par de vectores de entrada
y salida Xp, Yp, osea
c
Universidad Autnoma de Quertaro 88

De donde son evidentes las relaciones:
Donde es una constante que se denomina
constante de aprendizaje.
Se ha demostrado experimentalmente que
una forma de acelerar la convergencia en el
proceso de aprendizaje es incluir un
trmino proporcional al cambio realizado
en los coeficientes de peso en la muestra
anterior. Entonces definimos:

Universidad Autnoma de Quertaro 89


Y:
donde el coeficiente a se denomina coeficiente de
momentumy sus valores son generalmente menores
que los de .
La utilizacin del coeficiente de momentumen las
ecuaciones de actualizacin de los coeficientes de
peso tiene tambin el efecto benfico de disminuir
considerablemente la probabilidad de que el
algoritmo de minimizacin quede atrapado en un
mnimo local. Los valores especficos de los
coeficientes ay deben escogerse
experimentalmente;
como valores tpicos puede partirse de los valores
= 0.5 y a = 0.1. Hemos comprobado
experimentalmente que valores mayores de
aunque pueden resultar en
una convergencia ms rpida, pueden tambin
conducir a una aproximacin oscilatoria en la
convergencia de los coeficientes vjk y wij y despues
. Se ha intentado tambin con relativo xito, el uso
de coeficientes de aprendizaje y de momentum
variables, partiendo de valores menores hasta lograr
la aproximacin a un entorno de los valores
estacionarios de vjk y wij y despues ir
sucesivamente aumentando a
Universidad Autnoma de Quertaro 90
Es importante destacar que la estrategia de entrenamiento de
una red neuronal mediante el algoritmo de retropropagacin
explicado hasta aqu, tiene algunas particularidades que lo
distinguen de un problema convencional de optimizacin. Si
se dispone de una muestra de M pares de valores xp, yp de
entrada y salida, estos datos sern presentados
secuencialmente a la red, calculndose una actualizacin de
los coeficientes de peso wij, vjk para cada par de datos,
hasta agotarlos todos, es decir, para p = 1, 2, . . . . , M. A este
ciclo de entrenamiento se le llama generalmente una poca .
Es muy frecuente que un solo ciclo o poca no sea suficiente
para lograr un valor aceptablemente pequeo del criterio Ep
para todos los valores de p y entonces es necesario reciclar
los datos, o en otras palabras, comenzar una nueva poca.
Dependiendo del tamao de la muestra de entrenamiento, se
necesitarn ms o menos pocas, pudiendo ser su nmero
desde unas decenas hasta cientos o miles. El mtodo de la
retropropagacin basado en el algoritmo del descenso ms
rpido tiene la virtud de su simplicidad, no obstante, como es
conocido, ese algoritmo puede resultar en algunos casos
demasiado lento y adems, no siempre garantiza la
convergencia a un mnimo absoluto, es decir, puede
empantanarse en un mnimo local. Existen otros mtodos,
como los llamados del tipo Quasi-Newton que garantizan la
convergencia a un mnimo absoluto y adems convergen ms
rpido, siendo caracterstico de ellos que en cada etapa se
calcula un tamao del paso ptimo, que se requiere el clculo
o estimacin de la matriz Hessiana, formada por las segundas
derivadas del criterio Ep con respecto a w y v
No obstante, para redes de dimensiones grandes, el nmero
de coeficientes de peso puede ser hasta de varios cientos o
miles, lo cual hace que la dimensin del problema de
optimizacin crezca intolerablemente. Concluyendo,
podemos decir que el mtodo de retropropagacin
convencional presentado aqu es una alternativa simple y
econmica que debe ser intentada en primer lugar antes de
acudir a otros mtodos ms sofisticados.
Universidad Autnoma de Quertaro 91
OIDO ARTIFICIAL:

Cada sonido es una vibracin mecnica que pasa por el


tmpano, y en el odo interno se convierte en seales
elctricas que son enviadas al nervio auditivo.

Esta transformacin elctrica es crucial, ya que el 93


porciento de las sorderas estn ligadas a la destruccin del
rgano de Corti, que es justamente el transformador de
nuestro odo.

Desde los aos cincuenta se sabe que un electrodo


implantado en el odo permite a la persona entender los
sonidos, pero la gran dificultad estribaba en transcribir con
precisin todos los sonidos del mundo exterior. Segn la zona
estimulada, el nervio auditivo entiende un sonido agudo,
grave o medio. La solucin se dio con un dispositivo
miniaturizado que convierte los sonidos captados por un
micrfono en impulsos elctricos, los cuales son enviados por
cables subcutneos a una antena adosada a la piel, cerca de
la oreja. Otra antena casi microscpica, disimulada en la piel
del paciente, acta como receptor de seales. La ltima fase
del proceso se completa al activarse un manojo de electrodos
(de 4 a 16 ) fijados previamente a la cclea, haciendo una
especie de puente sobre la va sensorial daada.

La tcnica, que es muy segura, tiene sus limitaciones, ya que


los impulsos elctricos slo pueden ser entendidos y
decodificados por una persona que alguna vez haya odo. Un
sordo total de nacimiento sera incapaz de "organizar" y
entender lo que escucha.

Universidad Autnoma de Quertaro 92


3.8 APLICACIONES.
MOTROCIDAD ASISTIDA:

El profesor israel Gideon Inbar, decano de la Facultad de Ingeniera


Elctrica, est investigando con xito la inteligencia artificial de la
locomocin. Consigui, fijando sensores en la pierna de una
voluntaria, fabricar seales nerviosas que pueden ser vueltas a emitir
por una computadora activando los msculos atrofiados.
La "computadora mdica para caminar" de Inbar podra monitorear la
pierna constantemente (Usando una Red Neuronal) y en
consecuencia proporcionar una informacin ininterrumpida al msculo
por medio de miles de seales elctricas estimulantes. De esta
manera, ciertos pacientes inmovilizados podran movilizarse.
Los enfermos parapljicos y tetrapljicos podran beneficiarse con las
investigaciones que se estn realizando para que, ayudados por
bastones, vuelvan a caminar. Los que padecen esta enfermedad estn
afectados por una lesin en la mdula espinal.
Una de las soluciones, la ms prometedora, es reactivar los msculos
situados cerca de la lesin con una corriente elctrica. El problema es
que este mtodo requiere poner los electrodos en cada utilizacin. La
respuesta es implantar, en el interior del cuerpo, una cajita electrnica
capaz de enviar a los msculos la corriente de estimulacin, ya sea
por electrodos situados alrededor de los nervios o de los fascculos
(haz de nervios que tienen el mismo origen y destino) representantes
de una parte del tronco, o mediante electrodos situados en los
msculos. Todava llevaran bastones para mantener el equilibrio,
donde se situaran unos botones que accionaran el dispositivo.
Los brazos binicos ya son una realidad, as tambin como lo son los
huesos y las articulaciones artificiales. En los Estados Unidos ya hay
65.000 rodillas mecnicas, 110.000 caderas y 50.000 hombros. Una
cadera artificial dura diez aos y una rodilla algo menos por su gran
desgaste, pero estas prtesis ya cuentan con sistemas robticos para
su implantacin. En Israel estn perfeccionando un sistema de
retroalimentacin continuo, proveniente de los sensores implantados
en los nervios del hombro del miembro amputado, que produce una
respuesta inmediata a la comunicacin elctrica de un nervio, en la
misma forma en que se comporta el sistema nervioso. Eso permite
que el brazo binico (que encierra una minicomputadora) funcione
suavemente, casi como uno normal.
Universidad Autnoma de Quertaro 93
CORAZON ARTIFICIAL:
Las virtudes del corazn artificial son
conocidas por casi todo el mundo, ya se ha
odo hablar de la bomba de resina implantada
y porttil, capaz de ayudar a un rgano
deficiente. Varias personas se han
beneficiado con este sistema, el Novacor, que
por el momento es la solucin para los
pacientes que esperan un transplante.
Hasta ahora quienes llevaban un corazn
artificial tenan enganchado a la cintura un
aparato que pesaba cinco kilos. El Novacor,
en cambio, es un diminuto controlador que se
sita en el abdomen, cerca de la bomba, y la
energa es dispensada, no por un cable, sino
directamente a travs de la piel. Se basa en
dos cinturones, uno exterior, dotado de
batera, y otro interior, cargado por el primero.
Este corazn ofrece la ventaja de que no es
rechazado y de que se puede implantar a
cualquier edad.
Universidad Autnoma de Quertaro 94
4.1 INTRODUCCIN.

4.1.1 Mximo descenso.

Segn [John Holland] los Algoritmos Genticos son algoritmos matemticos de optimizacin de
propsito general basados en mecanismos naturales de seleccin y gentica, proporcionando
excelentes soluciones en problemas complejos con gran nmero de parmetros.
Segn [ACM] los AG son una herramienta muy poderosa de optimizacin que puede ser usada
para resolver una gran nmero de problemas difciles con gran eficiencia y exactitud, bsandose
en la gentica natural y la teora de la evolucin de Darwin.
John Holland desde pequeo, se preguntaba cmo logra la naturaleza, crear seres cada vez
ms perfectos (aunque, como se ha visto, esto no es totalmente cierto, o en todo caso depende
de qu entienda uno por perfecto). Lo curioso era que todo se lleva a cabo a base de
interacciones locales entre individuos, y entre estos y lo que les rodea. No saba la respuesta,
pero tena una cierta idea de como hallarla: tratando de hacer pequeos modelos de la
naturaleza, que tuvieran alguna de sus caractersticas, y ver cmo funcionaban, para luego
extrapolar sus conclusiones a la totalidad. De hecho, ya de pequeo haca simulaciones de
batallas clebres con todos sus elementos: copiaba mapas y los cubra luego de pequeos
ejrcitos que se enfrentaban entre s.
En esa universidad, Holland imparta un curso titulado Teora de sistemas adaptativos. Dentro
de este curso, y con una participacin activa por parte de sus estudiantes, fue donde se crearon
las ideas que ms tarde se convertiran en los algoritmos genticos.
Por tanto, cuando Holland se enfrent a los algoritmos genticos, los objetivos de su
investigacin fueron dos:
imitar los procesos adaptativos de los sistemas naturales, y
disear sistemas artificiales (normalmente programas) que retengan los mecanismos
importantes de los sistemas naturales.
Unos 15 aos ms adelante, David Goldberg, actual experto de los algoritmos genticos,
conoci a Holland, y se convirti en su estudiante. Golberg era un ingeniero industrial trabajando
en diseo de pipelines, y fue uno de los primeros que trat de aplicar los algoritmos genticos a
problemas industriales. Aunque Holland trat de disuadirle, porque pensaba que el problema era
excesivamente complicado como para aplicarle algoritmos genticos, Goldberg consigui lo que
quera, escribiendo un algoritmo gentico en un ordenador personal Apple II. Estas y otras
aplicaciones creadas por estudiantes de Holland convirtieron a los algoritmos genticos en un
campo con base suficiente aceptado para celebrar la primera conferencia en 1985, ICGA 85. Tal
conferencia se sigue celebrando bianualmente.

Universidad Autnoma de Quertaro 95


CAPITULO IV: ALGORITMOS GENTICOS.
4.2.1 Formalizacin.

Un algoritmo es una serie de pasos organizados que describe el


proceso que se debe seguir, para dar solucin a un problema
especfico.

En los aos 1970, de la mano de John Holland, surgi una de las


lneas ms prometedoras de la inteligencia artificial, la de los
algoritmos genticos. Son llamados as porque se inspiran en la
evolucin biolgica y su base gentico-molecular. Estos algoritmos
hacen evolucionar una poblacin de individuos sometindola a
acciones aleatorias semejantes a las que actan en la evolucin
biolgica (mutaciones y recombinaciones genticas), as como
tambin a una seleccin de acuerdo con algn criterio, en funcin del
cual se decide cules son los individuos ms adaptados, que
sobreviven, y cules los menos aptos, que son descartados.
Los algoritmos genticos forman parte de una familia denominada
algoritmos evolutivos, que incluye las estrategias de evolucin, la
programacin evolutiva y la programacin gentica. Dentro de esta
ltima se han logrado avances curiosos:
En 1999, por primera vez en la historia, se concedi una patente a un
invento no realizado directamente por un ser humano: se trata de una
antena de forma extraa, pero que funciona perfectamente en las
condiciones a las que estaba destinada. No hay, sin embargo, nada
injusto en el hecho de que el autor del algoritmo gentico del que sali
la forma de la antena se haya atribuido la autora de la patente, pues
l escribi el programa e ide el criterio de seleccin que condujo al
diseo patentado.
Un algoritmo gentico es un mtodo de bsqueda dirigida basada en
probabilidad. Bajo una condicin muy dbil (que el algoritmo
mantenga elitismo, es decir, guarde siempre al mejor elemento de la
poblacin sin hacerle ningn cambio) se puede demostrar que el
algoritmo converge en probabilidad al ptimo. En otras palabras, al
aumentar el nmero de iteraciones, la probabilidad de tener el ptimo
en la poblacin tiende a 1 (uno).
Universidad Autnoma de Quertaro 96
4.2 HISTORIA.
4.3.1 Fundamentos.
Los algoritmos genticos establecen una analoga entre el conjunto de soluciones de un problema,
llamado fenotipo, y el conjunto de individuos de una poblacin natural, codificando la informacin de
cada solucin en una cadena, generalmente binaria, llamada cromosoma. Los smbolos que forman
la cadena son llamados los genes. Cuando la representacin de los cromosomas se hace con
cadenas de dgitos binarios se le conoce como genotipo. Los cromosomas evolucionan a travs de
iteraciones, llamadas generaciones. En cada generacin, los cromosomas son evaluados usando
alguna medida de aptitud. Las siguientes generaciones (nuevos cromosomas), llamada
descendencia, se forman utilizando dos operadores, de cruzamiento y de mutacin.
Cundo usar estos algoritmos
Los algoritmos genticos son de probada eficacia en caso de querer calcular funciones no derivables
(o de derivacin muy compleja) aunque su uso es posible con cualquier funcin.
Deben tenerse en cuenta tambin las siguientes consideraciones:
Si la funcin a optimizar tiene muchos mximos/mnimos locales se requerirn ms iteraciones del
algoritmo para "asegurar" el mximo/mnimo global. Si la funcin a optimizar contiene varios puntos
muy cercanos en valor al ptimo, solamente podemos "asegurar" que encontraremos uno de ellos (no
necesariamente el ptimo).
Funcionamiento de un algoritmo gentico bsico.
Se genera aleatoriamente la poblacin inicial, que est constituida por un conjunto de cromosomas,
que representan las posibles soluciones del problema. En caso de no hacerlo aleatoriamente, es
importante garantizar que dentro de la poblacin inicial, se tenga la diversidad estructural de estas
soluciones para tener una representacin de la mayor parte de la poblacin posible o al menos evitar
la convergencia prematura.
A cada uno de los cromosomas de esta poblacin se aplicar la funcin de aptitud para saber qu tan
"buena" es la solucin que se est codificando.
Despus de saber la aptitud de cada cromosoma se procede a elegir los cromosomas que sern
cruzados en la siguiente generacin.
Los cromosomas con mejor aptitud tienen mayor probabilidad de ser seleccionados.
El cruzamiento es el principal operador gentico, representa la reproduccin sexual, opera sobre dos
cromosomas a la vez para generar dos descendientes donde se combinan las caractersticas de
ambos cromosomas padres.
El AG se deber detener cuando se alcance la solucin ptima, pero sta generalmente se
desconoce, por lo que se deben utilizar otros criterios de detencin. Normalmente se usan dos
criterios: correr el AG un nmero mximo de iteraciones (generaciones) o detenerlo cuando no haya
cambios en la poblacin.
El problema de seleccin de variables se puede ver como un problema de optimizacin, ya que si se
quiere encontrar, bajo alguna heurstica, el subconjunto de variables que potencialicen la
diferenciacin y las semejanzas de objetos de clases diferentes y de la misma clase respectivamente.
Universidad Autnoma de Quertaro 97
4.3 FUNDAMENTO NATURAL.
Inicializar aleatoriamente una poblacin de soluciones a un problema, representadas por una
estructura de datos adecuada.

Evaluar cada una de las soluciones, y asignarle una puntuacin o fitness segn lo bien que lo
hayan hecho.

Escoger de la poblacin la parte que tenga una puntuacin mayor.

Mutar (cambiar) y entrecruzar (combinar) las diferentes soluciones de esa parte escogida, para
reconstruir la poblacin.

Repetir un nmero determinado de veces, o hasta que se haya encontrado la solucin deseada.

Algoritmo gentico propiamente dicho


Para comenzar la competicin, se generan aleatoriamente una serie de cromosomas. El
algoritmo gentico procede de la forma siguiente:

Algoritmo gentico
Evaluar la puntuacin (fitness) de cada uno de los genes.

Permitir a cada uno de los individuos reproducirse, de acuerdo con su puntuacin.

Emparejar los individuos de la nueva poblacin, haciendo que intercambien material gentico, y
que alguno de los bits de un gen se vea alterado debido a una mutacin espontnea.

Cada uno de los pasos consiste en una actuacin sobre las cadenas de bits, es decir, la
aplicacin de un operador a una cadena binaria. Se les denominan, por razones obvias,
operadores genticos, y hay tres principales: seleccin, crossover o recombinacin y mutacin;
aparte de otros operadores genticos no tan comunes, todos ellos se vern a continuacin.

Un algoritmo gentico tiene tambin una serie de parmetros que se tienen que fijar para cada
ejecucin, como los siguientes:

Tamao de la poblacin: debe de ser suficiente para garantizar la diversidad de las soluciones,
y, adems, tiene que crecer ms o menos con el nmero de bits del cromosoma, aunque nadie
ha aclarado cmo tiene que hacerlo. Por supuesto, depende tambin del ordenador en el que se
est ejecutando.

Condicin de terminacin: lo ms habitual es que la condicin de terminacin sea la


convergencia del algoritmo gentico o un nmero prefijado de generaciones.
Universidad Autnoma de Quertaro 98
Esquema general del algoritmo.
Durante la evaluacin, se decodifica el gen, convirtindose
en una serie de parmetros de un problema, se halla la
solucin del problema a partir de esos parmetros, y se le
da una puntuacin a esa solucin en funcin de lo cerca
que est de la mejor solucin. A esta puntuacin se le
llama fitness.
Por ejemplo, supongamos que queremos hallar el mximo
de la funcin, una parbola invertida con el mximo en
x=1. En este caso, el nico parmetro del problema es la
variable x. La optimizacin consiste en hallar un x tal que
F(x) sea mximo. Crearemos, pues, una poblacin de
cromosomas, cada uno de los cuales contiene una
codificacin binaria del parmetro x. Lo haremos de la
forma siguiente: cada byte, cuyo valor est comprendido
entre 0 y 255, se transformar para ajustarse al intervalo [-
1,1], donde queremos hallar el mximo de la funcin.
Universidad Autnoma de Quertaro 99
Evaluacin y seleccin
El fitness determina siempre los cromosomas que se van a reproducir, y aquellos
que se van a eliminar, pero hay varias formas de considerarlo para seleccionar la
poblacin de la siguiente generacin:
Usar el orden, o rango, y hacer depender la probabilidad de permanencia o
evaluacin de la posicin en el orden.
Aplicar una operacin al fitness para escalarlo; como por ejemplo el escalado
sigma. En este esquema el fitness se escala?
En algunos casos, el fitness no es una sola cantidad, sino diversos nmeros, que
tienen diferente consideracin. Basta con que tal fitness forme un orden parcial,
es decir, que se puedan comparar dos individuos y decir cul de ellos es mejor.
Esto suele suceder cuando se necesitan optimizar varios objetivos.
Una vez evaluado el fitness, se tiene que crear la nueva poblacin teniendo en
cuenta que los buenos rasgos de los mejores se transmitan a esta. Para ello, hay
que seleccionar a una serie de individuos encargados de tan ardua tarea. Y esta
seleccin, y la consiguiente reproduccin, se puede hacer de dos formas
principales:
Basado en el rango: en este esquema se mantiene un porcentaje de la poblacin,
generalmente la mayora, para la siguiente generacin. Se coloca toda la
poblacin por orden de fitness, y los M menos dignos son eliminados y
sustituidos por la descendencia de alguno de los M mejores con algn otro
individuo de la poblacin. A este esquema se le pueden aplicar otros criterios; por
ejemplo, se crea la descendencia de uno de los paladines/amazonas, y esta
sustituye al ms parecido entre los perdedores. Esto se denomina crowding, y
fue introducido por DeJong. En nuestro caso, se eliminara el cromosoma
nmero 3, y se sustituira por un descendiente del cromosoma nmero 2 y otro
aleatorio, escogido entre el 1 y el 4. En realidad, para este esquema se escoge
un crowding factor, CF. Cuando nace una nueva criatura, se seleccionan CF
individuos de la poblacin, y se elimina al ms parecido a la nueva criatura. Una
variante de este es el muestreado estocstico universal, que trata de evitar que
los individuos con ms fitness copen la poblacin; en vez de dar la vuelta a una
ruleta con una ranura, da la vuelta a la ruleta con N ranuras, tantas como la
poblacin; de esta forma, la distribucin estadstica de descendientes en la nueva
poblacin es ms parecida a la real.
Rueda de ruleta: se crea un pool gentico formado por cromosomas de la
generacin actual, en una cantidad proporcional a su fitness. Si la proporcin
hace que un individuo domine la poblacin, se le aplica alguna operacin de
escalado. Dentro de este pool, se cogen parejas aleatorias de cromosomas y se
emparejan, sin importar incluso que sean del mismo progenitor (para eso estn
otros operadores, como la mutacin). Hay otras variantes: por ejemplo, en la
nueva generacin se puede incluir el mejor representante de la generacin
actual. En este caso, se denomina mtodo elitista.
Seleccin de torneo: se escogen aleatoriamente un nmero T de individuos de la
poblacin, y el que tiene puntuacin mayor se reproduce, sustituyendo su
descendencia al que tiene menor puntuacin.
Universidad Autnoma de Quertaro 100
4.4.1 Introduccin de Algoritmos Genticos.
Anatoma de un algoritmo gentico simple.
Los algoritmos genticos son mtodos sistemticos para la resolucin de
problemas de bsqueda y optimizacin que aplican a estos los mismos
mtodos de la evolucin biolgica: seleccin basada en la poblacin,
reproduccin sexual y mutacin.
Los algoritmos genticos son mtodos de optimizacin, que tratan de
resolver el mismo conjunto de problemas que se ha contemplado
anteriormente, es decir, hallar (x
i
,...,x
n
) tales que F(x
i
,...,x
n
) sea mximo. En
un algoritmo gentico, tras parametrizar el problema en una serie de
variables, (x
i
,...,x
n
) se codifican en un cromosoma. Todas los operadores
utilizados por un algoritmo gentico se aplicarn sobre estos cromosomas,
o sobre poblaciones de ellos. En el algoritmo gentico va implcito el
mtodo para resolver el problema; son solo parmetros de tal mtodo los
que estn codificados, a diferencia de otros algoritmos evolutivos como la
programacin gentica. Hay que tener en cuenta que un algoritmo gentico
es independiente del problema, lo cual lo hace un algoritmo robusto, por ser
til para cualquier problema, pero a la vez dbil, pues no est especializado
en ninguno.
Las soluciones codificadas en un cromosoma compiten para ver cul
constituye la mejor solucin (aunque no necesariamente la mejor de todas
las soluciones posibles). El ambiente, constituido por las otras camaradas
soluciones, ejercer una presin selectiva sobre la poblacin, de forma que
slo los mejor adaptados (aquellos que resuelvan mejor el problema)
sobrevivan o leguen su material gentico a las siguientes generaciones,
igual que en la evolucin de las especies. La diversidad gentica se
introduce mediante mutaciones y reproduccin sexual.
En la Naturaleza lo nico que hay que optimizar es la supervivencia, y eso
significa a su vez maximizar diversos factores y minimizar otros. Un
algoritmo gentico, sin embargo, se usar habitualmente para optimizar
slo una funcin, no diversas funciones relacionadas entre s
simultneamente. La optimizacin que busca diferentes objetivos
simultneamente, denominada multimodal o multiobjetivo, tambin se suele
abordar con un algoritmo gentico especializado.
Por lo tanto, un algoritmo gentico consiste en lo siguiente: hallar de qu
parmetros depende el problema, codificarlos en un cromosoma, y se
aplican los mtodos de la evolucin: seleccin y reproduccin sexual con
intercambio de informacin y alteraciones que generan diversidad. En las
siguientes secciones se vern cada uno de los aspectos de un algoritmo
gentico.
Universidad Autnoma de Quertaro 101
4.4.1 Introduccin de Algoritmos Genticos.
4.4.2 Caractersticas de los cruzamientos.
Cruce
El Algoritmo Gentico Cannico descrito anteriormente
utiliza el cruce basado en un punto, en el cual los dos
individuos seleccionados para jugar el papel de padres, son
recombinados por medio de la seleccin de un punto de
corte, para posteriormente intercambiar las secciones que se
encuentran a la derecha de dicho punto.
Se han investigado otros operadores de cruce, habitualmente
teniendo en cuenta ms de un punto de cruce. De Jong
investig el comportamiento del operador de cruce basado en
mltiples puntos, concluyendo que el cruce basado en dos
puntos, representaba una mejora mientras que aadir ms
puntos de cruce no beneficiaba el comportamiento del
algoritmo. La ventaja de tener ms de un punto de cruce
radica en que el espacio de bsqueda puede ser explorado
ms fcilmente, siendo la principal desventaja el hecho de
aumentar la probabilidad de ruptura de buenos esquemas.
En el operador de cruce basado en dos puntos, los
cromosomas (individuos) pueden contemplarse como un
circuito en el cual se efecta la seleccin aleatoria de dos
puntos, tal y como se indica en la Figura 1.40.
Universidad Autnoma de Quertaro 102
Desde este punto de vista, el cruce
basado en un punto, puede verse como
un caso particular del cruce basado en
dos puntos, en el cual uno de los puntos
de corte se encuentra fijo al comienzo de
la ristra que representa al individuo.
Figura 1.41.
En el denominado operador de cruce
uniforme (Syswerda) cada gen, en la
descendencia se crea copiando el
correspondiente gen de uno de los dos
padres, escogido de acuerdo ' a una
"mscara de cruce" generada
aleatoriamente. Cuando existe un l en la
"mscara de cruce", el gen es copiado del
primer padre, mientras que cuando
exista un 0 en la.
Universidad Autnoma de Quertaro 103
"mscara de cruce", el gen se copia del segundo padre,
tal y como se muestra en la Figura 1.42. En la literatura,
el trmino operador de cruce uniforme se relaciona con
la obtencin
de la "mscara de cruce" uniforme, en el sentido de que
cualquiera de los elementos del alfabeto tenga asociada la
misma probabilidad. Hablando en trminos de la teora de la
probabilidad la mscara de cruce est compuesta por una
muestra aleatoria de tamao A extrada de una distribucin
de probabilidad de Bernouilli de parmetro l/2.
Si tuvisemos en cuenta el valor de la funcin de adaptacin
de cada padre en el momento de generar la "mscara de
cruce", de tal manera que cuanto mayor sea la funcin de
adaptacin de un individuo, ms probable sea heredar sus
caractersticas, podramos definir, un operador de cruce
basado en la funcin objetivo, en el cual la "mscara de
cruce" se interpreta como una muestra aleatoria de tamao l
proveniente de una distribucin de Bernouilli de parmetro
Universidad Autnoma de Quertaro 104
Donde (I super j sub t) y I(super i sub t) denotan los padres seleccionados
para ser cruzados.
El concepto de "mscara de cruce" puede tambin servir para representar
los cruces basados en un punto y basados en mltiples puntos, tal y como
se muestra en Figura 1.43.
Sirag y Weiser, modifican el operador de cruce en el sentido del
Simulated Annealing. De esta manera el operador de cruce se
modifica definiendo un umbral de energa H. y una temperatura T,
las cuales influencian la manera en la que se escogen los bits
individuales. Segn el operador propuesto el bit (i + 1)-simo se
tomar del padre opuesto al que se ha tomado el bit i-simo, con
probabilidad exp( . (tetha sub c)/T), donde T es el parmetro
"temperatura" el cual, al igual que en Simulated Annealing,
decrecer lentamente por medio de un programa de enfriamiento.
Con altas temperaturas el comportamiento se asemeja al del
operador de cruce uniforme, es decir con probabilidad cercana a la
unidad los bits se van escogiendo alternativamente de cada padre.
Por otra parte cuando el valor
Del parmetro temperatura se acerca a cero el hijo "resultante
coincide prcticamente con uno de los padres.
Existen otros operadores de cruce especficos para un
determinado problema como son, por ejemplo, los definidos
para el problema del agente de comercio.
Por otra parte, la idea de que el cruce debera de ser ms
probable en algunas posiciones ha sido descrita por varios
autores (Schaffer y Morishima, Holland, Davis, Levenick).
Universidad Autnoma de Quertaro 105
4.4.3 Tipos de cruzamientos.
Crossover
Consiste en el intercambio de material gentico entre dos
cromosomas (a veces ms, como el operador orga propuesto por
Eiben et al.). El crossover es el principal operador gentico, hasta el
punto que se puede decir que no es un algoritmo gentico si no tiene
crossover, y, sin embargo, puede serlo perfectamente sin mutacin,
segn descubri Holland. El teorema de los esquemas confa en l
para hallar la mejor solucin a un problema, combinando soluciones
parciales.
Para aplicar el crossover, entrecruzamiento o recombinacin, se
escogen aleatoriamente dos miembros de la poblacin. No pasa nada
si se emparejan dos descendientes de los mismos padres; ello
garantiza la perpetuacin de un individuo con buena puntuacin (y,
adems, algo parecido ocurre en la realidad; es una prctica utilizada,
por ejemplo, en la cra de ganado, llamada inbreeding, y destinada a
potenciar ciertas caractersticas frente a otras). Sin embargo, si esto
sucede demasiado a menudo, puede crear problemas: toda la
poblacin puede aparecer dominada por los descendientes de algn
gen, que, adems, puede tener caracteres no deseados. Esto se suele
denominar en otros mtodos de optimizacin atranque en un
mnimo local, y es uno de los principales problemas con los que se
enfrentan los que aplican algoritmos genticos.
En cuanto al teorema de los esquemas, se basa en la nocin de
bloques de construccin. Una buena solucin a un problema est
constituida por unos buenos bloques, igual que una buena mquina
est hecha por buenas piezas.
El crossover es el encargado de mezclar bloques buenos que se
encuentren en los diversos progenitores, y que sern los que den a los
mismos una buena puntuacin. La presin selectiva se encarga de
que slo los buenos bloques se perpeten, y poco a poco vayan
formando una buena solucin. El teorema de los esquemas viene a
decir que la cantidad de buenos bloques se va incrementando con el
tiempo de ejecucin de un algoritmo gentico, y es el resultado
terico ms importante en algoritmos genticos.
Universidad Autnoma de Quertaro 106
El intercambio gentico se puede llevar a cabo de
muchas formas, pero hay dos grupos principales
Crossover n-puntos: los dos cromosomas se cortan
por n puntos, y el material gentico situado entre
ellos se intercambia. Lo ms habitual es un
crossover de un punto o de dos puntos.
Crossover uniforme: se genera un patrn aleatorio de
1s y 0s, y se intercambian los bits de los dos
cromosomas que coincidan donde hay un 1 en el
patrn. O bien se genera un nmero aleatorio para
cada bit, y si supera una determinada probabilidad
se intercambia ese bit entre los dos cromosomas.
Crossover especializados: en algunos problemas,
aplicar aleatoriamente el crossover da lugar a
cromosomas que codifican soluciones invlidas; en
este caso hay que aplicar el crossover de forma que
genere siempre soluciones vlidas. Un ejemplo de
estos son los operadores de crossover usados en el
problema del viajante.
Universidad Autnoma de Quertaro 107
4.5 MUTACIONES.
4.5.1 Tipo de Mutaciones.
Mutacin
En la Evolucin, una mutacin es un suceso bastante poco comn
(sucede aproximadamente una de cada mil replicaciones), como ya
se ha visto anteriormente. En la mayora de los casos las mutaciones
son letales, pero en promedio, contribuyen a la diversidad gentica
de la especie. En un algoritmo gentico tendrn el mismo papel, y la
misma frecuencia (es decir, muy baja).
Una vez establecida la frecuencia de mutacin, por ejemplo, uno por
mil, se examina cada bit de cada cadena cuando se vaya a crear la
nueva criatura a partir de sus padres (normalmente se hace de forma
simultnea al crossover). Si un nmero generado aleatoriamente est
por debajo de esa probabilidad, se cambiar el bit (es decir, de 0 a 1 o
de 1 a 0). Si no, se dejar como est. Dependiendo del nmero de
individuos que haya y del nmero de bits por individuo, puede
resultar que las mutaciones sean extremadamente raras en una sola
generacin.
No hace falta decir que no conviene abusar de la mutacin. Es cierto
que es un mecanismo generador de diversidad, y, por tanto, la
solucin cuando un algoritmo gentico est estancado, pero tambin
es cierto que reduce el algoritmo gentico a una bsqueda aleatoria.
Siempre es ms conveniente usar otros mecanismos de generacin de
diversidad, como aumentar el tamao de la poblacin, o garantizar la
aleatoriedad de la poblacin inicial.
Este operador, junto con la anterior y el mtodo de seleccin de ruleta,
constituyen un algoritmo gentico simple, sga, introducido por
Goldberg en su libro.
Universidad Autnoma de Quertaro 108
4.5.2 Caractersticas de las Mutaciones.
La mutacin se considera un operador bsico, que proporciona un
pequeo elemento de aleatoriedad en la vecindad (entorno) de los
individuos de la poblacin. Si bien se admite que el operador de
cruce es el responsable de efectuar la bsqueda a lo largo del espacio
de posibles soluciones, tambin parece desprenderse de los
experimentos efectuados por varios investigadores que el operador
de mutacin va ganando en importancia a medida que la poblacin
de individuos va convergiendo (Davis).
Schaffer y col. encuentran que el efecto del cruce en la bsqueda es
inferior al que previamente se esperaba. Utilizan la denominada
evolucin primitiva, en la cual, el proceso evolutivo consta tan slo
de seleccin y mutacin. Encuentran que dicha evolucin primitiva
supera con creces a una evolucin basada exclusivamente en la
seleccin y el cruce. Otra conclusin de su trabajo es que la
determinacin del valor ptimo de la probabilidad de mutacin es
mucho ms crucial que el relativo a la probabilidad de cruce.
La bsqueda del valor ptimo para la probabilidad de mutacin, es
una cuestin que ha sido motivo de varios trabajos. As, De Jong
recomienda la utilizacin de una probabilidad de mutacin del bit de
(l super -1), siendo l la longitud del string. Schaffer y col. utilizan
resultados experimentales para estimar la tasa ptima proporcional a
l /(lambda super 0.9318),(l super 0.4535), donde lambda denota el
nmero de individuos en la poblacin.
Si bien en la mayora de las implementaciones de Algoritmos
Genticos se asume que tanto la probabilidad de cruce como la de
mutacin permanecen constantes, algunos autores han obtenido
mejores resultados experimentales modificando la probabilidad de
mutacin a medida que aumenta el nmero de iteraciones. Pueden
consultarse los trabajos de Ackley, Bramlette, Fogarty y Michalewicz
y Janikow.
Universidad Autnoma de Quertaro 109
4.5.3 Desarrollo y estado actual.
En toda ejecucin de un algoritmo gentico hay que
decidir con qu frecuencia se va a aplicar cada uno
de los algoritmos genticos; en algunos casos, como
en la mutacin o el crossover uniforme, se debe de
aadir algn parmetro adicional, que indique con
qu frecuencia se va a aplicar dentro de cada gen del
cromosoma. La frecuencia de aplicacin de cada
operador estar en funcin del problema; teniendo
en cuenta los efectos de cada operador, tendr que
aplicarse con cierta frecuencia o no. Generalmente,
la mutacin y otros operadores que generen
diversidad se suele aplicar con poca frecuencia; la
recombinacin se suele aplicar con frecuencia alta.
En general, la frecuencia de los operadores no vara
durante la ejecucin del algoritmo, pero hay que
tener en cuenta que cada operador es ms efectivo
en un momento de la ejecucin. Por ejemplo, al
principio, en la fase denominada de exploracin, los
ms eficaces son la mutacin y la recombinacin;
posteriormente, cuando la poblacin ha convergido
en parte, la recombinacin no es til, pues se est
trabajando con individuos bastante similares, y es
poca la informacin que se intercambia. Sin
embargo, si se produce un estancamiento, la
mutacin tampoco es til, pues est reduciendo el
algoritmo gentico a una bsqueda aleatoria; y hay
que aplicar otros operadores. En todo caso, se
pueden usar operadores especializados.
Universidad Autnoma de Quertaro 110
4.6 GENERACIONES.
4.6.1 Generadores.
En una serie de problemas hay que restringir las
nuevas soluciones generadas por los operadores
genticos, pues no todas las soluciones generadas
van a ser vlidas, sobre todo en los problemas con
restricciones. Por ello, se aplican operadores que
mantengan la estructura del problema. Otros
operadores son simplemente generadores de
diversidad, pero la generan de una forma
determinada:
Zap: en vez de cambiar un solo bit de un
cromosoma, cambia un gen completo de un
cromosoma.
Creep: este operador aumenta o disminuye en 1 el
valor de un gen; sirve para cambiar suavemente y de
forma controlada los valores de los genes.
Transposicin: similar al crossover y a la
recombinacin gentica, pero dentro de un solo
cromosoma; dos genes intercambian sus valores, sin
afectar al resto del cromosoma. Similar a este es el
operador de eliminacin-reinsercin, en el que un
gen cambia de posicin con respecto a los dems.
Universidad Autnoma de Quertaro 111
4.6.2 Tipo de generadores bsicos.
Existen varios paquetes y bibliotecas de algoritmos genticos en el mercado, algunos
de ellos son:
GALOPPS: Bastante bueno, es muy flexible y adems nos permite con facilidad
puede ser encontrado en GARAGe. Su direccin primaria en Internet es
GARAGe.cps.msu.edu/software/software-index.html, y su direccin para descargarlo
va FTP es garage.cps.msu.edu/pub/GA/galopps/
GAGS: Generador de aplicaciones basadas en algoritmos genticos, escrito en C++.
Desarrollado por el grupo de J.J. Melero. Excelente. Su direccin Web es kal-
el.ugr.es/gags.html, y su direccin para descargarlo va FTP es kal-el.ugr.es/GAGS/.
FORTRAN GA: Desarrollo de algoritmos genticos para Fortran. Su direccin Web es
www.staff.uiuc.edu/~ carroll/ga.html.
Galib: Biblioteca de algoritmos genticos de Matthew. Conjunto de clases en C++ de
algoritmos genticos. Su direccin Web es lancet.mit.edu/ga/, y su direccin para
descargarlo va FTP es lancet.mit.edu/pub/ga/. Podemos registrarlo en
http://lancet.mit.edu/ga/Register.html.
GAS: Paquete para desarrollar aplicaciones de algoritmos genticos en Python. Su
direccin Web es starship.skyport.net/crew/gandalf, y su direccin para descargarlo
va FTP es ftp.coe.uga.edu/users/jae/ai.
GECO: Conjunto de herramientas para Lisp. Su direccin para descargarlo va FTP es
ftp://ftp.aic.nrl.navy.mil/pub/galist/src/.
GPdata: Para desarrollar algoritmos genticos en C++. Su direccin para descargarlo va
FTP es ftp.cs.bham.ac.uk/pub/authors/W.B.Langdon/gp-code/, y su documentacin
-GPdata-icga-95.ps- la podemos encontrar en el site de Internet
cs.ucl.ac.uk/genetic/papers/.
gpjpp: Bibliotecas de clases para desarrollar algoritmos genticos en Java Su direccin
Web es www.turbopower.com/~ kimk/gpjpp.asp.
GP Kernel: Biblioteca de clases para programacin gentica en C++. Su direccin Web es
www.emk.e-technik.th-darmstadt.de/~ thomasw/gp.html.
lil-gp: Herramientas para programacin gentica en C. Su direccin Web es
isl.msu.edu/GA/software/lil-gp/index.html, y su direccin para descargarlo va FTP
es isl.cps.msu.edu/pub/GA/lilgp/. Podemos encontrar los parches para Linux en
www.cs.umd.edu/users/seanl/patched-gp.
PGAPack: Parallel Genetic Algorithm Library. Biblioteca de algoritmos genticos
paralelos. Podemos encontrarlo en la direccin de Internet con un navegador en
www.mcs.anl.gov/home/levine/PGAPACK/index.html, y su direccin para
descargarlo va FTP es ftp.mcs.anl.gov/pub/pgapack/.
Sugal: SUnderland Genetic ALgorithm system. Para hacer experimentos con algoritmos
genticos. Podemos encontrarlo en la direccin de Internet con el navegador en
www.trajan-software.demon.co.uk/sugal.htm.
ADATE: Automatic Design of Algorithms Through Evolution. Programacin evolutiva. Su
direccin Web es www-ia.hiof.no/~ rolando/adate_intro.html.
GPsys: Sistema de programacin gentica en Java. Podemos encontrarlo en la direccin
de Internet www.cs.ucl.ac.uk/staff/A.Qureshi/gpsys.html.
Universidad Autnoma de Quertaro 112
4.6.3 Evolucin de Especies.
La evolucin natural es un proceso incesante en el que las especies
biolgicas desarrollan mejores y ms eficaces armas para enfrentarse
a un entorno continuamente cambiante como nica posibilidad de
supervivencia. Muchas son las especies que fueron moldeadas por la
prodigiosa mano de la evolucin: varias conservan gran parte de su
arquitectura anatmica, pero otras son irreconocibles si se la
compara con sus ancestros prehistricos.
Como la evolucin natural ha encontrado soluciones originales a
problemas extremadamente difciles del mundo natural, los
ingenieros la ven como un proceso de optimizacin que puede ser
simulado usando computadoras u otros dispositivos. La Evolucin
Artificial es el proceso de aplicar la evolucin a los sistemas
artificiales. En general, todo lo que se necesita es algn equivalente
artificial de los genes y un mtodo para combinar los cdigos
genticos. El nico otro trabajo adicional que debe hacerse es la
traduccin de este cdigo en entidades y medir la aptitud de estas
dentro del ambiente. Y un mtodo para hacer esto son los Algoritmos
Genticos, dice Gordon Hollingworth, investigador de esta nueva
tcnica.
Desde el punto de vista de la ingeniera, la utilidad de los algoritmos
genticos est en su habilidad de adquirir comportamientos no
previstos para hacer frente a entornos dinmicos complejos, que no
pueden especificarse completamente con anterioridad y que,
adems, pueden cambiar con el transcurso del tiempo.
Lo importante es que las soluciones a los problemas no se programan
sino que se cultivan. Circuitos que evolucionan?
Universidad Autnoma de Quertaro 113
A travs de la aplicacin de un proceso adaptable (como los algoritmos
genticos) sobre una clase especial de circuitos lgicos electrnicos
(como los dispositivos reconfigurables), se logra una nueva tecnologa
denominada hardware evolutivo, capaz de modificar su propia
configuracin interna para adaptarse mejor al entorno en donde debe
trabajar o a los errores en el hardware.
Los circuitos evolucionados pueden ser extremadamente complejos en
su estructura y dinmica, pudiendo alcanzar mayores niveles de
desempeo que las que son posibles con las tcnicas tradicionales de
diseo humanas, afirma el Dr. Hugo de Garis, del Instituto de
Investigaciones Avanzadas de Telecomunicaciones de Kyoto, Japn. El
hardware evolutivo puede tambin tener considerables consecuencias
prcticas en el futuro: siempre se so con un sistema electrnico que
trabaje con independencia del entorno, de sus defectos de fabricacin o
de los daos sufridos en el transporte. Alcanzar este objetivo clave es algo
extremadamente difcil para un diseador humano. Sin embargo, es
probable que la evolucin produzca (o sera mejor decir engendre?)
chips extraordinariamente eficientes, flexibles y tolerantes a las fallas.
Adems de ser capaces de operar en cualquier parte, estos chips tambin
se deberan adaptar inmediatamente si la aplicacin a la cual estn
asignados llegase a cambiar a lo largo del tiempo. Las conexiones internas
entre los elementos del chip tendran que evolucionar a fin de resolver
una nueva versin del mismo problema, ofreciendo la posibilidad de
realizar hardware evolutivo directamente sobre el chip, a mximas
velocidades. Si tal cosa es posible, se revolucionara la industria de
microelectrnica actual, comenta el especialista.
Muy bien, pero qu es un circuito reconfigurable? Son chips capaces de
modificar dinmicamente sus propios circuitos internos, enviando
seales al chip desde el exterior por el usuario. Aunque se disean para
hacer sumamente bien una reducida cantidad de tareas especficas,
pueden tambin ser reconfigurados para ejecutar otras tareas igualmente
especficas, mucho despus de que ste ha dejado la fbrica. Su
repertorio, por lo tanto, es variable. Para el inicio del prximo siglo se
espera que alcancen el milln de compuertas y una velocidad de
configuracin de menos de una dcima de milisegundo. Qu se puede
hacer con ellos? Se los puede utilizar, por ejemplo, para construir
electrodomsticos reconfigurables a fin de poder aprovechar los avances
tecnolgicos o las preferencias del consumidor. Si uno compra un
telfono celular, por ejemplo, y a los tres meses sale un nuevo chip mucho
ms rpido, podra reconfigurarlo y tener una vez ms la tecnologa ms
avanzada.
Universidad Autnoma de Quertaro 114
4.7 APLICACIONES.
4.7.1 Ejemplos de Algoritmo Gentico.
Ejemplo 1
Veamos cmo funciona un algoritmo gentico:
Vamos a partir de una funcin f(x) muy sencilla:
f(x)=x
2
Imagina que deseas encontrar el valor de x que hace que la funcin f(x)
alcance su valor mximo, pero restringiendo a la variable x a tomar
valores comprendidos entre 0 y 31. An ms, a x slo le vamos a permitir
tomar valores enteros, es decir: 0,1,2,3,...,30, 31. Obviamente el mximo se
tiene para x = 31, donde f vale 961. No necesitamos saber algoritmos
genticos para resolver este problema, pero su sencillez hace que el
algoritmo sea ms fcil de comprender.
Lo primero que debemos hacer es encontrar una manera de codificar las
posibles soluciones (posibles valores de x). Una manera de hacerlo es con
la codificacin binaria. Con esta codificacin un posible valor de x es
(0,1,0,1,1). Cmo se interpreta esto? Muy sencillo: multiplica la ltima
componente (un 1) por 1, la penltima (un 1) por 2, la anterior (un 0) por
4, la segunda (un 1) por 8 y la primera (un 0) por 16 y a continuacin haz
la suma: 11. Observa que (0,0,0,0,0) equivale a x = 0 y que (1,1,1,1,1)
equivale a x = 31.
A cada posible valor de la variable x en representacin binaria le vamos a
llamar individuo. Una coleccin de individuos constituye lo que se
denomina poblacin y el nmero de individuos que la componen es el
tamao de la poblacin. Una vez que tenemos codificada la solucin,
debemos escoger un tamao de poblacin. Para este ejemplo ilustrativo
vamos a escoger 6 individuos.
Debemos partir de una poblacin inicial. Una manera de generarla es
aleatoriamente: coge una moneda y lnzala al aire; si sale cara, la primera
componente del primer individuo es un 0 y en caso contrario un 1. Repite
el lanzamiento de la moneda y tendremos la segunda componente del
primer individuo (un 0 s sale cara y un 1 s sale cruz). As hasta 5 veces y
obtendrs el primer individuo. Repite ahora la secuencia anterior para
generar los individuos de la poblacin restantes. En total tienes que
lanzar 5 * 6 = 30 veces la moneda.
Universidad Autnoma de Quertaro 115
Nuestro siguiente paso es hacer competir a los individuos
entre s. Este proceso se conoce como seleccin. La tabla
3.2 resume el proceso.
Tabla 3.2.- SELECCIN
Cada fila en la tabla 1 est asociada a un individuo de la poblacin inicial. El
significado de cada columna de la tabla es el siguiente:
(1) = Nmero que le asignamos al individuo.
(2)= Individuo en codificacin binaria.
(3) = Valor de x.
(4) = Valor de f(x).
Observa que el mejor individuo es el 5 con f = 676. Calcula la media de f y
obtendrs fmed=324.3. En cuanto a la columna (5) ahora te lo explico. Una
manera de realizar el proceso de seleccin es mediante un torneo entre dos. A
cada individuo de la poblacin se le asigna una pareja y entre ellos se establece
un torneo: el mejor genera dos copias y el peor se desecha. La columna (5)
indica la pareja asignada a cada individuo, lo cual se ha realizado
aleatoriamente. Existen muchas variantes de este proceso de seleccin, aunque
este mtodo nos vale para ilustrar el ejemplo.
Despus de realizar el proceso de seleccin, la poblacin que tenemos es la
mostrada en la columna (2) de la tabla 3.3. Observa, por ejemplo, que en el
torneo entre el individuo 1 y el 6 de la poblacin inicial, el primero de ellos ha
recibido dos copias, mientras que el segundo cae en el olvido.
Universidad Autnoma de Quertaro 116
(1) (2) (3) (4) (5)
1
(0,1,1,0,0) 12 144 6
2
(1,0,0,1,0) 18 324 3
3
(0,1,1,1,1) 15 225 2
4
(1,1,0,0,0) 24 576 5
5
(1,1,0,1,0) 26 676 4
6
(0,0,0,0,1) 1 1 1
Tabla 3.3.- CRUCE
Tras realizar la seleccin, se realiza el cruce. Una
manera de hacerlo es mediante el cruce 1X: se
forman parejas entre los individuos aleatoriamente
de forma similar a la seleccin. Dados dos
individuos pareja se establece un punto de cruce
aleatorio, que no es ms que un nmero aleatorio
entre 1 y 4 (la longitud del individuo menos 1). Por
ejemplo, en la pareja 2-3 el punto de cruce es 3, lo
que significa que un hijo de la pareja conserva los
tres primeros bits del padre y hereda los dos ltimos
de la madre, mientras que el otro hijo de la pareja
conserva los tres primeros bits de la madre y hereda
los dos ltimos del padre. La poblacin resultante se
muestra en la columna (2) de la tabla 3.4.
Universidad Autnoma de Quertaro 117
(1) (2) (3) (4)
1 (0,1,1,0,0) 5 1
2 (0,1,1,0,0) 3 3
3 (1,0,0,1,0) 2 3
4 (1,0,0,1,0) 6 1
5 (1,1,0,1,0) 1 1
6 (1,1,0,1,0) 4 1
Tabla 3.4.- POBLACION TRAS EL CRUCE
En la columna (3) tienes el valor de x; en la siguiente tienes el
valor de f correspondiente. Fjate en que ahora el valor
mximo de f es 784 (para el individuo 2), mientras que antes
de la seleccin y el cruce era de 676. Adems fmed ha subido
de 324.3 a 389.3. Qu quiere decir esto? Simplemente que
los individuos despus de la seleccin y el cruce son mejores
que antes de estas transformaciones.
El siguiente paso es volver a realizar la seleccin y el cruce
tomando como poblacin inicial la de la tabla 3.4. Esta
manera de proceder se repite tantas veces como nmero de
iteraciones t fijes. Y cul es el ptimo?. En realidad un
algoritmo gentico no te garantiza la obtencin del ptimo
pero, si est bien construido, te proporcionar una solucin
razonablemente buena. Puede que obtengas el ptimo, pero
el algoritmo no te confirma que lo sea. As que qudate con la
mejor solucin de la ltima iteracin. Tambin es buena idea
ir guardando la mejor solucin de todas las iteraciones
anteriores y al final quedarte con la mejor solucin de las
exploradas.
Universidad Autnoma de Quertaro 118
(1) (2) (3) (4)
1 (0,1,0,1,0) 10 100
2 (1,1,1,0,0) 28 784
3 (0,1,1,1,0) 14 196
4 (1,0,0,0,0) 16 256
5 (1,1,0,1,0) 26 676
6 (1,0,0,1,0) 18 324
4.7.2 Aplicaciones de los Algoritmos Genticos.
Con la finalidad de aclarar mejor los conceptos
cubiertos previamente, presentaremos ahora
una sencilla aplicacin del algoritmo gentico a
un problema de optimizacin:
Un grupo de financieros mexicanos ha resuelto
invertir 10 millones de pesos en la nueva marca
de vino "Carta Nueva". As pues, en 4 ciudades
de las principales de Mxico se decide iniciar
una vigorosa campaa comercial: Mxico en el
centro, Monterrey en el noroeste, Guadalajara
en el occidente y Veracruz en el oriente. A esas
4 ciudades van a corresponder las zonas
comerciales I, II, III y IV. Un estudio de
mercado ha sido realizado en cada una de las
zonas citadas y han sido establecidas curvas de
ganancias medias, en millones de pesos, en
funcin de las inversiones totales (almacenes,
tiendas de venta, representantes, publicidad,
etc.) Estos datos se ilustran en la tabla 3.5 y en
la figura 1.44. Para simplificar los clculos,
supondremos que las asignaciones de crditos o
de inversiones deben hacerse por unidades de 1
milln de pesos. La pregunta es: en dnde se
deben de asignar los 10 millones de pesos de los
que se dispone para que la ganancia total sea
mxima?
Universidad Autnoma de Quertaro 119
Tabla 3.5. Datos obtenidos con la investigacin de mercado en
cada una de las regiones en estudio.
1) Representacin: Para poder aplicar el algoritmo gentico,
lo primero que necesitamos determinar es cul ser el
esquema a utilizarse para representar las posibles soluciones
del problema. En este caso necesitamos 4 bits (2^4 = 16) para
representar cada solucin, porque cada una admite 11 valores
posibles (de 0 a 10). Como existen 4 valores independientes
(uno por cada zona de estudio), se requieren entonces 16 bits
(4 x 4) por cada cromosoma. Es importante hacer notar que
se requiere una funcin de codificacin (i.e., que transforme
el valor de la inversin a binario) y una de decodificacin
(i.e., que realice el proceso inverso). Debido a que en este
caso los 4 bits utilizados para representar una solucin
pueden producir ms valores de los que se necesitan, se usar
una funcin de ajuste que haga que los resultados producidos
siempre se encuentren en el rango vlido.
Universidad Autnoma de Quertaro 120
Inversin
(en
millones)
Beneficio I
Beneficio
II
Beneficio
III
Beneficio
IV
0 0 0 0 0
1 0.28 0.25 0.15 0.20
2 0.45 0.41 0.25 0.33
3 0.65 0.55 0.40 0.42
4 0.78 0.65 0.50 0.48
5 0.90 0.75 0.62 0.53
6 1.02 0.80 0.73 0.56
7 1.13 0.85 0.82 0.58
8 1.23 0.88 0.90 0.60
9 1.32 0.90 0.96 0.60
10 1.38 0.90 1.00 0.60
2) Funcin de Aptitud: Dado que el objetivo es obtener
las inversiones que sumen 10, y que tengan un beneficio
mximo, podemos usar la siguiente funcin de aptitud
penalizada:
c1+c2+c3+c4
F(x)=-------------
500*V+1
Donde c1, c2, c3 y c4 son las ganancias por zona, que se
calculan de acuerdo a los valores de la tabla 3.5, y v es el
valor absoluto de la diferencia entre la suma obtenida de
las inversiones y 10. Ntese que cuando no se viole
ninguna restriccin (i.e., cuando la suma de inversiones
sea exactamente 10) la funcin de aptitud no ser
"castigada".
3) Operadores: Se usar una cruza de 2 puntos. La
probabilidad que se dar a la misma ser del 80%. En
cuanto a la mutacin, se le asignar una probabilidad
baja, que ser del 1%. El tamao de poblacin manejado
para este ejemplo ser de 50 cromosomas, y se correr el
algoritmo gentico durante 20 generaciones.
4) Resultados: El resultado obtenido en una corrida
tpica es un beneficio de 1.81 millones de pesos,
correspondiente a invertir 4 millones en la zona comercial
I, 3 millones en la zona II, 1 milln en la zona III y 2
millones en la zona IV. Esta es la solucin ptima, la cual
se obtuvo originalmente mediante programacin
dinmica. El tiempo que le tom al algoritmo gentico
encontrar este valor fue de slo 13 segundos. Debe hacerse
notar que, en este caso, si deseramos analizar inversiones
que sumen otra cantidad, y en unidades menores al
milln, el algoritmo gentico tendra que modificarse de
manera mnima, mientras que la programacin dinmica
requerira una cantidad tal de trabajo que prcticamente
se volvera inoperante.
Universidad Autnoma de Quertaro 121
BIBLIOGRAFIA:
(Inteligencia Artificial)
INTELIGENCIA ARTIFICIAL E INGENIERA DEL
CONOCIMIENTO.
PAJARES, G. y SANTOS, M. (Editorial Ra-ma) 384 pginas.
ISBN: 8478976760. ISBN-13: 9788478976768
http://es.wikipedia.org/wiki/Inteligencia_artificial
http://www.monografias.com/trabajos16/la-inteligencia-
artificial/la-inteligencia-artificial.shtml
http://www.fortunecity.com/skyscraper/chaos/279/index.htm
http://www.redcientifica.com/doc/doc200206190001.html
http://www.aepia.org/revista/
(Logica Difusa)
REDES NEURONALES Y SISTEMAS BORROSOS. 3
EDICIN MARTIN DEL BRIO, B y SANZ, A. (Editorial Ra-
ma) 442 pginas.
ISBN: 8478977430. ISBN-13: 9788478977437
http://es.wikipedia.org/wiki/L%C3%B3gica_difusa
http://www.answermath.com/Spanish/esp-fuz.htm
http://personales.ya.com/casanchi/mat/difusa01.htm
http://www.itq.edu.mx/vidatec/espacio/aiee/fuzzy.ppt#257,2,L
OGICA DIFUSA
http://delta.cs.cinvestav.mx/~gmorales/ldifll/ldifll.html
http://www.abcdatos.com/tutoriales/tutorial/l8765.html
Universidad Autnoma de Quertaro 122
(Redes Neuronales)
LAS REDES NEURONALES ARTIFICIALES Y SUS
APLICACIONES PRCTICAS Ins Galvn Len; Pedro Isasi
Viuela (Pearson Educacin)
ISBN: 8420540250. ISBN-13: 9788420540252
http://es.wikipedia.org/wiki/Red_neuronal_artificial
http://www.monografias.com/trabajos/redesneuro/redesneuro.
shtml
http://www.monografias.com/trabajos12/redneuro/redneuro.sh
tml
http://www.electronica.com.mx/neural/
http://www.gc.ssr.upm.es/inves/neural/ann2/anntutorial.html
http://ohm.utp.edu.co/neuronales/main.htm
http://ingenieria.udea.edu.co/investigacion/mecatronica/mectr
onics/redes.htm
(Algoritmos Genticos)
GENETIC ALGORITHMS IN SEARCH, OPTIMIZATION
AND MACHINE LEARNING. Goldberg, David E. (Addison
Wesley) 412 pginas. Idioma: Ingls
ISBN: 0201157675. ISBN-13: 9780201157673
http://www.wikilearning.com/evolucion_artificial_y_algoritmo
s_geneticos-wkccp-8590-2.htm
http://es.wikipedia.org/wiki/Algoritmo_gen%C3%A9tico
http://www.geocities.com/krousky/Espanol/Random.htm
Universidad Autnoma de Quertaro 123

S-ar putea să vă placă și