Sunteți pe pagina 1din 176

Modelos econ omicos de m ultiples agentes

Una aproximaci on de la economa desde los sistemas complejos


D. Heymann
1
, R. Perazzo
2
y M.G. Zimmermann
3
WORK IN PROGRESS
Mayo 2010
1
Universidad de Buenos Aires
2
Instituto Tecnologico Buenos Aires
3
Universidad de San Andres
2
Modelos economicos de m ultiples agentes 10/6/2010
i
Prefacio
Este texto es una sntesis de algunos importantes temas que
los sistemas complejos hacen a la economa.
Partiendo de modelos esquematicos donde prima la interaccion
por sobre el comportamiento racional, se muestra mediante
algoritmos y simulaciones, la emergencia de patrones de escala
macroscopica y la aparicion de fenomenos crticos.
Este texto esta en estado de work in progress. Nacio como
serie de apuntes, que paulatinamente se han ido depurando a
medida que dictabamos el curso de Topicos de Racionalidad
Acotada para la maestra en Economa de la Universidad de
San Andres. Es por ellos que debemos agradecer a todos los
alumnos que nos permitieron mostrar mediante la discusion, el
modelado y hasta experimentacion que la economa es un muy
interesante sistema complejo.
D. H., R. P., M. G. Z.
Modelos economicos de m ultiples agentes 10/6/2010
ii
Modelos economicos de m ultiples agentes 10/6/2010
Contenido
1 Sistemas complejos 1
1.1 Introduccion 1
1.2 Propiedades de los sistemas complejos 3
1.3 La modelizacion de los sistemas complejos 5
1.4 Acerca de la modelizacion tradicional en economa 6
2 Modelos computacionales 9
2.1 Automatas celulares 9
2.2 Evolucion y complejidad 11
2.3 Computabilidad 13
2.4 Automatas celulares bidimensionales 15
2.4.1 Modelo de condensacion 16
2.4.2 El juego de la vida de Conway 17
2.4.3 El modelo de segregacion de Schelling 19
2.4.4 Un mercado inmobiliario 25
2.4.5 Dilema del Prisionero Espacial 25
3 Modelos estadsticos 29
3.1 Introduccion 29
3.2 Entropa, desorden e informacion 31
3.3 Principio de maxima entropa 34
3.3.1 Distribuciones debidas a un vnculo 35
3.3.2 Loteras bilaterales y la distribucion de Gibbs 38
3.3.3 Intercambios bilaterales entre muchos jugadores 41
3.4 La hipotesis ergodica 44
3.5 Metodos de Monte Carlo 46
iii
iv CONTENIDO
3.5.1 Algoritmo de Metropolis 47
3.5.2 Dinamica de Glauber o muestreo de Gibbs 47
3.5.3 Modelo de Ising 47
3.6 Recocido simulado 52
4 Leyes de potencias 55
4.1 Distribuciones que siguen leyes de potencias 55
4.1.1 Algunas propiedades 56
4.2 Ocurrencia de leyes de potencias 57
4.2.1 Mercados nancieros y paseos al azar. 58
4.2.2 Fenomenos crticos 65
4.2.3 Criticalidad Autoorganizada 71
5 Redes complejas, modas y cacerolazos 75
5.1 Introduccion 75
5.2 Que es una red y algunas deniciones generales 76
5.3 Redes aleatorias, mundos peque nos y redes libres de escala 79
5.3.1 Redes aleatorias 80
5.3.2 Mundos peque nos 81
5.3.3 Redes libres de escala: Preferential attachment 83
5.3.4 Robustez y vulnerabilidad 83
5.4 Modelos de contagio en ciencias sociales 84
5.4.1 Que es un contagio epidemiologico 85
5.4.2 SIS y el umbral crtico de infeccion 85
5.4.3 Ejemplo numerico 86
5.4.4 SIS con rewiring: redes adaptativas 89
5.4.5 SIS en redes libres de escala: Viruses informaticos 90
5.4.6 Modelos de umbrales locales: modas y revoluciones 92
6 Aprendizaje y adaptacion 97
6.1 Redes neuronales (I): Modelo de Hopeld 97
6.1.1 Ejemplo: Recuperacion de una imagen 101
6.2 Redes neuronales (II): Redes en capas 102
6.2.1 Ejemplo: La telara na (I): una red neuronal para estimacion de precios
futuros. (Ejemplo elaborado por C. Parpaglione) 106
Modelos economicos de m ultiples agentes 10/6/2010
CONTENIDO v
6.3 Modelos evolutivos 109
6.3.1 Motivacion biologica 110
6.3.2 Agentes complejos adaptivos 112
6.3.3 Algoritmos Geneticos 112
6.3.4 Ejemplo: Optimizacion de un portafolio de inversiones (I) 114
6.3.5 Implementacion computacional del GA 114
6.4 Modelos evolutivos del aprendizaje 119
6.4.1 Los individuos y el medio 120
6.4.2 El juego de la minora 120
6.4.3 Ejemplo (II): El modelo del Bar de Brian Arthur 123
6.4.4 Ejemplo (III): Un modelo de panico 127
6.4.5 Ejemplo (IV): La telara na con m ultiples agentes 129
6.4.6 Ejemplo (V): Coadaptacion de oferta y demanda 130
6.5 El dise no de agentes complejos adaptivos 139
6.5.1 El aumento de la complejidad 139
6.5.2 Los desafos de la supervivencia 141
7 Mercados y Experimentos 143
7.1 Introduccion 143
7.2 Juego de mercado minimal: construccion bottom-up 144
7.2.1 Precio de mercado competitivo 145
7.3 Formacion de precios: modelo Brutus 146
7.3.1 La cuenta 147
7.3.2 Aproximacion 147
7.3.3 Precios Bertrand, inexistencia de Nash en estrategias puras 148
7.3.4 Umbral de competencia 149
7.3.5 Experimentos numericos 150
7.4 Formacion de precios: modelo Maximizador de Benecios 150
7.4.1 Experimentos numericos 151
7.4.2 Evolucion temporal de precios depende de N 151
7.5 Competencia entre modelos de formacion de precio 154
7.6 Experimentos 157
7.6.1 Partiendo del equilibrio competitivo 158
7.6.2 Partiendo desde el precio = costo y con el ranking prendido 162
Modelos economicos de m ultiples agentes 10/6/2010
vi CONTENIDO
7.6.3 Resultados estadsticos 164
7.7 Conclusiones 165
Modelos economicos de m ultiples agentes 10/6/2010
Captulo 1
Sistemas complejos
Un sistema complejo, estimulado controladamente
y observado bajo condiciones de laboratorio se
comporta como se le da la gana.
(autor anonimo)
1.1 Introducci on
Durante los pasados siglos, las ciencias de la naturaleza han avanzado continuamente en una descripci on cada
vez m as detallada de la realidad que nos circunda. Una de las claves de este fen omeno fue la tendencia de
buscar ladrillos elementales con los cuales construir la realidad observable e interpretar su comportamiento.
La qumica dio un paso adelante de proporciones cuando se individualizaron los elementos qumicos, la biologa
experiment o el mismo desarrollo cuando se reconoci o que las celulas eran las unidades m as elementales que
mostraban el comportamiento de los seres vivos. La fsica lo di o cuando reconoci o la existencia de los atomos y
pudo describir su estructura en terminos de unas pocas partculas elementales.
Esta actitud reduccionista pretende buscar tanto en la estructura como en las propiedades y las mutuas
relaciones de esos ladrillos las explicaciones para el comportamiento del conjunto. Se ha dicho
1
que si tan s olo
una frase debiera subsistir para que futuras generaciones puedan reconstruir lo que hoy se sabe de las ciencias
de la naturaleza, esta debera poner enfasis en que todo sistema fsico observable puede describirse por medio de
atomos y sus interacciones.
Existen, sin embargo, en la naturaleza muchos sistemas que desafan este abordaje. La din amica de los
uidos, las conductas y capacidad de procesamiento del sistema nervioso central de organismos superiores, los
ecosistema o la evolucion biol ogica y los sistemas sociales y econ omicos son buenos ejemplos. Todos ellos presen-
tan una gran diversidad de regmenes: hay tanto din amicas conservativas como disipativas, presentan en distintas
escalas comportamientos organizados y otros que no son, tienen cambios en el tiempo y en el espacio que pueden
tanto poseer regularidades estadsticas como irregularidades impredecibles.
Esta problem atica ha sido agrupada bajo el r otulo de sistemas complejos y su caracterstica m as saliente
es que el todo es m as que la suma de sus partes. Con esto se quiere decir que lo que resulta dominante en estos
sistemas es su organizaci on, raz on por la cual leyes muy sencillas que pueden aplicarse a las partes que forman
un todo pueden dar lugar a comportamientos del conjunto que son muy complejos y variados. El agregado de un
gran n umero de partes que interact uan con reglas sencillas puede originar algo que posee identidad propia ya que
su comportamiento no es la superposici on ingenua de sus componentes (Anderson 1972).
La comprensi on del funcionamiento de los sistemas econ omicos puede ser encuadrada de esta manera. Los
agentes act uan de modo asincronico y descentralizado tomando decisiones sobre la base de informaci on incompleta
1
Richard. P. Feynmann.
1
2 CAP

ITULO 1. SISTEMAS COMPLEJOS


y en respuesta a incentivos que muchas veces son contrapuestos entre si. Surgen muchas veces espont aneamente
instituciones que dictan reglas para el comportamiento econ omico que son semejantes aun en conextos muy
diversos. Las economas parecen poseer un alto grado de homeostasis: son capaces de absorber perturbaciones
externas importantes pero tambien muestran serias fallas de funcionamiento.
Esta ruptura entre lo singular y lo plural puede verse en los siguientes
Ejemplos:
Las ecuaciones de la din amica que expresan el movimiento de los cuerpos en funci on de las fuerzas que
se ejercen sobre ellos son de segundo orden y, por consiguiente son invariantes frente a reversi on temporal
(consistente en el cambio de t por t). Esto signica que si se lmara, por ejemplo, la colisi on de dos
cuerpos perfectamente elasticos - como pueden serlo dos moleculas de un gas - que esta muy bien descripta
por estas leyes no habra manera de reconocer si la pelcula se proyecta tal como ha sido lmada o al reves,
cambiando el curso del tiempo. A pesar de este hecho, muchas moleculas que chocan entre si obedeciendo
a las leyes de Newton poseen una evoluci on que es termodin amicamente irreversible en la que la direcci on
del tiempo queda perfectamente determinada como surgira por ejemplo si se lma y proyecta la colisi on
de un autom ovil con una vidriera.
Las interacciones electromagneticas poseen simetra esferica, o sea, no reconocen direcciones privilegiadas
en el espacio. Sin embargo, los atomos y moleculas complejas que s olo se mantienen unidas por fuerzas
electromagneticas, no poseen esa simetra.
Una neurona aislada puede considerarse como un procesador de umbral, ya que tienen s olo dos estados y
se comportan como un interruptor pasando de uno a otro estado cuando un estmulo del medio, supera
un cierto valor. Sin embargo, un conjunto grande de neuronas pueden efectuar un procesamiento de la
informaci on sumamente complejo, tales como reconocer un rostro, o construir un mensaje o efectuar su
an alisis sem antico. Chomsky ha armado que Quiz a exista una ley fsica desconocida que dice que si se
ponen 10
10
neuronas en un recipiente del tama no de una pelota de b asquetbol, se obtiene la gram atica
transformacional (Chomsky 1990)
El conjunto de abejas de un panal o de hormigas de un hormiguero despliegan conductas con un alto nivel
de organizacion y realizan trabajos cooperativos altamente ecaces al punto de dar lugar a estudios de una
llamada inteligencia de enjambres (?).
Las dicultades para poder efectuar predicciones sobre el comportamiento de estos sistemas reside en una
cabal comprensi on de la transici on que media entre lo singular, individual o aislado y lo plural, organizado y
compuesto. Esta verdadera catastrofe de las multitudes est a compartida por disciplinas muy diversas y muchas
de las herramientas que se utilizan para estudiarlos son comunes a todas ellas.
Ejemplos:
En la fsica y en la qumica este problema se presenta cuando se desea comprender, por ejemplo,
muchas propiedades de los polmeros en general y las protenas en particular. Los polmeros son moleculas
conformados por una cadena muy extensa cuyos eslabones son la repetici on de muy pocos compuestos
simples. Las protenas son polmeros formados por no m as de 20 compuestos b asicos llamados amino acidos.
Estas moleculas gigantes se pliegan sobre s mismas adoptando formas que determinan sus propiedades
qumicas y, por consiguiente, su relevancia en funciones biologicas. Hasta donde se sabe, este proceso de
plegamiento no puede comprenderse en terminos de relaciones aisladas entre las partes de la protena sino
que involucra efectos cooperativos del conjunto de amino acidos que la componen.
En la biologa la transici on entre lo singular y lo plural se presenta, por ejemplo, en el estudio de sistemas
ecol ogicos. Predecir los mecanismos por los que se forma un sistema de esta naturaleza, su robustez
o resiliencia involucra comprender el detalle de los procesos de agregaci on y de los diversos niveles de
organziaci on de los individuos que componen el sistema. La composici on de organismos simples para dar
lugar a otros m as complejos es un tema central de los modernos enfoques de la teora de la evoluci on que
apuntan a comprender y cuanticar la emergencia de complejidad en organismos vivos. Algunos estudios
Modelos economicos de m ultiples agentes 10/6/2010
1.2. PROPIEDADES DE LOS SISTEMAS COMPLEJOS 3
postulan la ocurrencia de transiciones evolutivas principales (ver Captulos 5 y 6) que est an relacionadas
con, por ejemplo, el surgimiento de organismos pluricelulares en un mundo s olo poblado por organismos
unicelulares.
En la antropologa y las ciencias sociales el problema de comprender los procesos de agregaci on y
organizaci on se presenta cuando se desea predecir el comportamiento de una conjunto de individuos a partir
de la conducta separada de cada uno de ellos. Este es el proceso por el que un grupo de personas conforman
una partida de caza, se organiza una tribu o se constituyen sociedades con mecanismos de gobierno m as
complejos. Este es quiz a el campo en que el problema resulta m as claro de plantear pero en el que, al
mismo tiempo, es m as difcil de estudiar ya que los individuos que componen el conjunto poseen una amplia
gama de comportamientos posibles y un alto grado de capacidad de procesamiento de la informaci on.
En economa la problem atica de los sistemas complejos aparece en los aspectos m as basicos y elementales
de la constituci on de un sistema econ omico, tal es la consolidaci on de una trama eciente de productores
y consumidores, la organizacion de un mercado o la denci on de funciones de utilidad colectivas a partir
de la composici on de funciones de utilidad individuales. Un problema en este campo es comprender
los mecanismos por los cuales pueden emerger reglas de comportamiento colectivas a partir de actitudes
individuales que, en muchos casos, responden a intereses contrapuestos y operan en base a informaci on
fragemntaria e inconsistente.
1.2 Propiedades de los sistemas complejos
Las razones por las cuales los aspectos organizativos adquieren relevancia se centran en el hecho que buena
parte del enfoque en las ciencias de la naturaleza, y en desarrollos formales en otras ciencias, se han limitado
a presuponer que vale un principio de superposicion, que, dicho en terminos matem aticos, presupone que las
ecuaciones fundamentales son lineales. En tanto valga esto, la suma de soluciones es tambien una soluci on y
queda implcito que causas y efectos son proporcionales o que efectos de causas independientes se superponen de
la misma manera que sus causas.
Se pueden reconocer violaciones al principio de superposicion en la misma base de la economa ya que la
actividad econ omica de un conjunto de agentes depende fuertemente de su nivel de organizacion. Los ejemplos
m as triviales provienen de la aproximaci on al equilibrio por compensaci on de excesos de demanda o el principio
de rendimientos marginales decreciente o de la variaci on de rendimientos con la escala de producci on.
Pueden se nalarse otros ejemplos. As por ejemplo, las consecuencias de eventos singulares o accidentes
en los sistemas nancieros est an fuertemente gobernados por la presencia de umbrales y cuando determinados
indicadores los cruzan surgen cambios cualitativos de comportamiento de los agentes econ omicos. Existen nu-
merosos perturbaciones de sistemas econ omicos que dan lugar a cascadas o avalanchas que pueden magnicarse
por procesos de realimentaci on positiva. Finalmente otro elemento altamente no lineal propio de la economa es
el de la genesis de expectativas y de los cambios de actitud o comportamiento que surgen a partir de las mismas.
Un ejemplo de los efectos profundos que poseen terminos no lineales en la din amica de un sistema pueden
apreciarse en el sencillo problema del crecimiento de una poblaci on. Sea P(t) la poblaci on de alguna especie
en el momento t. Una hip otesis de crecimiento lineal presupone que la poblacion en un momento posterior es
proporcional a la poblaci on en el momento anterior: P(t +1) = P(t). Una ley de este tipo da por resultado una
misma familia de leyes exponenciales de aumento ( > 1) o disminucion ( < 1) a partir de una poblaci on inicial
P
o
; o sea P(t) = ()
t
P
o
.
Efectos no lineales pueden surgir si, por ejemplo, existe una limitacion en el acceso a recursos alimenticios.
Si se supone que el ambiente s olo sustentan una poblaci on m axima (que se puede normalizar a 1), una ley de
crecmiento no lineal que contemple este hecho puede escribirse como P(t+1) = P(t)(1P(t)). En ella se corrige
la ley lineal prediciendo que si P(t) > 0.5 se puede dar una caida en la poblaci on. De hecho, esta caida puede ser
tal que la poblaci on en el instante posterior sea nula cuando ella alcanza su m aximo valor en el momento anterior.
Para esta ley demogr aca, distintos valores de no quedan ya mas asociados a un mismo tipo de crecimiento o
decrecimiento poblacional sino que presentan una diversidad grande de posibles comportamientos que abarcan la
desaparici on de la poblaci on, su estabilizaci on en valores m aximos, su oscilaci on o la generaci on de una secuencia
ca otica.
Modelos economicos de m ultiples agentes 10/6/2010
4 CAP

ITULO 1. SISTEMAS COMPLEJOS


Ejercicio Obtener la poblaci on P(t) como funci on del tiempo con una ley logstica P(t + 1) = P(t)(1 P(t))
de crecimiento, con = 0.5, 1.5, 3.8. Explorar diversos valores de y comprobar que para ciertos valores, la serie
temporal P(t) es inestable frente a cambios en las condiciones iniciales. Por razones de normalizaci on conviene
utilizar < 4. Ver Figura 1.1
Figura 1.1: Evolucion lineal y no lineal de una poblacion. El crecimiento
o disminucion de la poblacion segun una ley lineal es siempre exponencial.
El agregado de terminos no lineales puede dar lugar a leyes de crecimiento
o decrecimiento de naturaleza muy diversa.
Si bien en general los sistemas complejos est an compuestos de numerosas partes o individuos que inter-
act uan entre si, pueden poseer tantos atributos que escapan a una denici on simple y escueta. Corresponde dar
a continuaci on una lista de sus propiedades m as evidentes que, adem as, consideraremos que los denen.
1. El todo es mas que las partes: Cuando el agregado es cualitativamente diferente de lo que son sus partes
constitutivas se suele decir que el sistema posee propiedades emergentes que son atribuibles a su nivel de
organizaci on interna. Estas porpiedades emergentes est an asociadas al hecho que reglas de interacci on
simples pueden dar lugar a comportamientos complejos del conjunto (ver Captulo 2).
2. Poseen m ultiples escalas de espacio y de tiempo. El comportamiento del agregado puede presentar
rasgos de organizaci on en una o varias escalas tanto espaciales como temporales que, en principio, tiene
poco que ver con los tiempos o dominios espaciales propios de las partes que componen el sistema. Consid-
erado el cerebro globalmente, este es capaz de implementar procesos cognitivos superiores (por ejemplo el
reconocimiento de un rostro) en lapsos que son propios de la organzici on de la corteza cerebral y que poco
tienen que ver con la duraci on tpica de los procesos sicoqumicos que tienen lugar en un nivel celular. La
actividad econ omica puede presentar perodos de expansi on o de retracci on tanto estacionales atribuibles a
ciclos de producci on (e.g. agraria), como epis odicos (burbujas) cuya duraci on y alcance no son previsibles
Modelos economicos de m ultiples agentes 10/6/2010
1.3. LA MODELIZACI

ON DE LOS SISTEMAS COMPLEJOS 5


y que responde a procesos propios del conjunto y tiene poca relaci on con los tiempos caractersticos de las
actividades productivas asociadas (ver captulo 5.4.4).
3. Presentan una organizacion jerarquica Los individuos o sectores que componen un sistema complejo
suelen presentar capas sucesivas de organizaci on, a veces, de creciente complejidad. Por lo general, los
individuos de un dado nivel se asocian dando as lugar a individuos de un nivel inmediato superior. Por
ejemplo la organizacion de una sociedad puede pensarse basada en individuos, familias, sectores, etc.
Las actividades econ omicas pueden pensarse organizadas en trabajadores, estos en empresas, estas en
corporaciones, agrupadas en sectores, etc., Estos niveles de organizaci on pueden tambien poseer dimensiones
espaciales (casas, municipios, provincias, naciones, regiones, etc.)(Ver captulo 6)
4. Contienen informacion.

Esta es la necesaria para establecer de que manera esta relacionadas las partes
que lo constituyen, c omo interact uan entre si y cu al es su ley de evoluci on temporal (ver captulo 3.2).
Por lo general, cada una de las partes de un sistema es capaz de recibir o intercambiar informaci on con su
entorno y cambiar por esas razones su estado o su conducta. Como la organizaci on de un sistema complejo
puede cambiar con el tiempo a medida que el sistema evoluciona, se suele decir que poseen una capacidad
de procesamiento y, que dicha capacidad es una propiedad emergente como las mencionadas en el primer
punto (ver captulo 5.1).
5. Simplicacion de las componentes y de sus interacciones En un sistema complejo, no todas las
propiedades de sus componentes o de sus interacciones se reejan en el comportamiento del conjunto.
Ciertas propiedades emergentes responden s olo a ciertos caracteres estilizados de las partes que forman el
sistema complejo (ver captulo 4).
6. Son capaces de adaptacion La organizaci on interna de los sistemas complejos puede cambiar, re-
deniendose con el transcurso del tiempo. Se da as lugar a un proceso de adaptaci on o de aprendizaje
(ver captulo 5).
7. Poseen mecanismos de regulacion que son antagonicos. En un sistema complejo por lo general est an
presentes mecanismos antag onicos cuya acci on conjunta o lo mantienen en equilibrio, o lo llevan a el. La
analoga es mantener constante la temperatura de una habitaci on operando al mismo tiempo un equipo de
refrigeraci on y otro de calefacci on. En transacciones economicas el equilibrio se puede lograr mediante la
variaci on tanto de precios como de cantidades. En el sistema nervioso central existen neurotransmisores que
son tanto excitatorios (que provocan la polarizaci on de la membrana de las neuronas) como inhibitorios (que
provocan lo opuesto), en la evoluci on biol ogica existen verdaderas competencias entre pares de especies
que logran coexistir como mutuas presa y predador, en la que se desarrollan, por ejemplo, capacidades
crecientemente renadas de mimetismo y de detecci on.
1.3 La modelizacion de los sistemas complejos
Corresponde en este punto preguntarse que signica comprender un sistema complejo. Se puede decir que avan-
zamos en la comprensi on de su comportamiento si se lo puede inferir a partir de hechos, partes e interacciones
que sean signicativamente mas simples que las que surgen de una observaci on directa del sistema real. En otras
palabras, si es posible despreciar elementos que se pueden considerar como meramente circunstanciales y trazar
una vinculaci on causal entre aspectos que se consideran esenciales. Se trata pues de una estrategia constructiva
por la que se procura armar o hacer crecer el sistema a partir de partes o subsistemas signicativamente m as
simples que el conjunto.
Observese que este planteo no comporta un reduccionismo ciego. Se acepta desde el vamos que las leyes
que gobiernan cada escala jer arquica son diferentes a las de la siguiente o que hay rupturas tan profundas como
la reversi on temporal o el aumento de entropa. Se acepta adem as que es posible entender caractersticas del
todo como composici on de las de las partes aun cuando de estas s olo se retengan muy pocos de los elementos
que las describen. Esto hace que las estrategias de modelizacion deban hacer uso reiterado de la navaja de
Occam construyendo modelos minimales en las que se desechan hip otesis superuas y se renuncia a dar cuenta
de detalles. La descripci on que se construya debe con todo ser robusta frente a cambios o perturbaciones en el
valor de par ametros de control del modelo o en sus hip otesis constitutivas. Este camino podra bien sintetizarse
en: dada una propiedad emergente (un hecho estilizado y sucientemente universal y robusto) determinar cu al es
la base microsc opica (minimal) que basta para dar cuenta del mismo.
Modelos economicos de m ultiples agentes 10/6/2010
6 CAP

ITULO 1. SISTEMAS COMPLEJOS


As como es difcil dar una denci on explcita de los que se entiende por un sistema complejo tampoco
existe una teora unica para estudiarlos y analizarlos. Solamente existe un conjunto de herramientas, modelos y
met aforas que ayudan a desarrollar modelos matem aticos que sirven, seg un sola decir Galileo, para acomodar
las evidencias del movimiento de los astros. Con esto el quera decir que no importaba si realmente las cosas
sucedan exactamente como estaba implcito en sus ecuaciones sino que su descripci on estaba m as orientada a
para dar cuenta de los hechos observados, hacer predicciones y, eventualmente proveer un sustento cuantitativo o
relaciones causales que permitan anticipar el funcionamiento del sistema.
As como tambien Galileo sola decir que el libro de la naturaleza est a escrito en el lenguaje de la
matem atica, el libro de los sistemas complejos, si es que puede escribirse, debera ser hecho en el lenguaje de
la computaci on. Esto es debido al papel preponderante que posee la informaci on tanto en la denici on como
en la evoluci on de un sistema complejo. Un instrumento general para el estudio desde esta perspectiva lo con-
stituyen los modelos computacionales de m ultiples agentes. Este abordaje ha sido bautizado como bottom-up
esto es, modelos constructivos capaces de generar sociedades articiales a partir de agentes descriptos con un
alto nivel de abstracci on y simplicidad. Desde las ciencias computacionales, caen bajo el area de Inteligencia
Articial Distribuida (Weiss 1999). Estos desarrollos han recibido en tiempos recientes un impulso excepcional
por la disponibilidad de medios de c alculo con una potencia que muy poco tiempo atr as eran impensables.
El uso de estas tecnicas requiere atribuir a los agentes conductas y capacidades de procesamiento que se
formalizan como un programa de instrucciones. Esto puede bien reejar el hecho que en la vida real cada agente,
por lo general, tiene a su disposici on un elenco relativamente limitado de conductas y acciones posibles y adem as,
cada una de ellas es seleccionada procesando la informaci on que recoge de su entorno. Este procesamiento y la
denci on de la acci on resultante se supone, por consiguiente, que puede ser concretada mediante un algoritmo. Una
objeci on posible es la excesiva limitaci on que signica imponer conductas algortmicas a los agentes. Sin embargo
esta restriccion no impide que la complejidad de cada agente pueda variar entre m argenes extremadamente amplios.
Por otra parte plantea el dilema de si efectivamente un agente racional puede o no ser representado elmente por
una computadora.
Las razones para suponer conductas individuales extremadamente simples son dobles. Por una parte, la
real comprensi on de un fen omeno colectivo atribuible a un sistema s olo puede basarse en su estilizaci on con la
consiguiente individualizaci on de las interacciones relevantes entre sus componentes. Si as no fuera su estudio
debera limitarse a una descripci on de lo directamente observado y sera imposible extraer conclusiones de alcance
m as general. Si se abunda en la cantidad de atributos a los agentes y sus interacciones puede resultar imposible
establecer relaciones causales entre los mismos y el comportamiento del sistema. La otra raz on no es metodol ogica
sino puramente pr actica: conductas individuales m as elaboradas o interacciones m as compleja amplan el espacio
de par ametros desmesuradamente y tanto su exploraci on como la extracci on de conclusiones se torna impracticable.
1.4 Acerca de la modelizacion tradicional en economa
Sin duda las ciencias econ omicas han tenido en los ultimos tiempos un desarrollo muy importante. A partir de
la decada del 50, con los modelos de equilibrio general introducidos por Arrow y Debreu (?) y la posibilidad de
resolverlos analticamente en forma muy elegante, han dotado en principio a los economistas de una modelizaci on
con una exactitud sobre sus asersiones nunca vista hasta el momento. Los agentes econ omicos de dichos modelos
son agentes representativos, y suponen que son capaces de efectuar optimizaciones de alto grado de complejidad.
En otras palabras, suponen que los problemas de agregaci on est an resueltos de alguna manera, debido a que los
agentes buscan maximizar su benecio. El entusiasmo generado por dicha corriente fue tal que dichos supuestos
fueron replicados sin una clara contrastaci on experimental en las distintas aplicaciones.
Sin embargo, las crisis sufridas por los paises m as desarrollados en las ultimas decadas y la sistematizaci on
de registros de datos econ omicos en los ultimos a nos, ayudaron a ver que la realidad econ omica era mucho
m as rica fenomenologicamente que la mostrada por los modelos. M as recientemente, se ha intentado achicar
esta brecha realizando experimentos econ omicos en situaciones controladas, con relativamente pocos individuos,
que permiten aislar y simplicar el entorno, y por ende concentrarse en las conductas de los individuos. La
economa experimental, dio cuenta r apidamente que muchos de los supuestos en los que se basan los modelos m as
tradicionales, son al menos cuestionables. En rigor de verdad, aun queda mucho trabajo por hacer, dado que no
Modelos economicos de m ultiples agentes 10/6/2010
1.4. ACERCA DE LA MODELIZACI

ON TRADICIONAL EN ECONOM

IA 7
est a claro como se extienden dichos resultados a entornos con muchos individuos, como los que ocurren en nuestra
realidad cotidiana.
Desde este punto de vista, uno de los objetivos centrales de este trabajo es mostrar como el enfasis
propuesto por los sistemas complejos sobre las conductas individuales de una mnima complejidad para focalizarse
en el problema que surgen de la agregaci on de conductas debido a las m ultiples interacciones, pueden aportar una
visi on refrescante a los modelos econ omicos, y preparar el campo para una nueva oleada de modelos focalizados en
hechos estilizados observados en la realidad. Este es el desao que queda por delante para las futuras generaciones
de cientcos.
Modelos economicos de m ultiples agentes 10/6/2010
8 CAP

ITULO 1. SISTEMAS COMPLEJOS


Modelos economicos de m ultiples agentes 10/6/2010
Captulo 2
Modelos computacionales
2.1 Automatas celulares
Los modelos computacionales de m ultiples agente comienzan por suponer que cada agente del agregado se puede
representar como una maquina capaz de procesar informaci on. En las teoras de la computaci on se las suelen
idealizar mediante el concepto de aut omata. Un aut omata esta denido al menos por dos elementos: un conjunto
de estados internos y un conjunto de reglas que les permite pasar de uno a otro de estos estados. La capacidad
de procesamiento de un aut omata queda denido por la riqueza de los dos conjuntos quie lo denen.
Los denominados aut omatas celulares son un paradigma computacional que da las bases conceptuales para
considerar un agregado de agentes en el que cada uno posee una limitada capacidad de procesamiento. Este
concepto fue desarrollado por Theodor von Neumann en la decada del 40. Se trata de una aproximaci on a la
computaci on diferente de la desarrollada por Alan Turing en Inglaterra algunos a nos antes y que sent o las bases
de la teora de la computabilidad.

Esta ser a considerada en la secci on 2.3. La idea original de von Neumann
era tratar de emular a los tejidos biol ogicos o, eventualmente, organismos vivos, raz on por la cual se incluy o la
palabra celular en el nombre de estos automatas. Este concepto posee los elementos esenciales de los modelos
de m ultiples agentes que se ir an viendo a lo largo de los captulos siguientes.
Denici on 1 (Aut omata Celular) Un aut omata celular (AC) consiste en un
Un conjunto N de celulas (agentes) o aut omatas, cada uno de los cuales puede estar en un n umero nito
de estados internos (son aut omatas nitos). Se suele identicar a los estados internos de cada celula con
las letras S
i
de un alfabeto /; (S
i
/)
Cada celula posee una matriz de transici on entre sus estados internos que es ja. La misma puede ser
determinista (AC determinsta) o probabilstica (AC probabilstico o estoc astico)
En cada instante de tiempo, cada celula cambia su estado interno dependiendo del estado en que se encuen-
tran un n umero n ; (n < N) de vecinos. Para ello el arreglo de N celulas debe tener denida un sistema
de vecindades. La actualizacion de los estados de las N celulas puede ser sincr onica (todas cambian de
estado en un mismo instante de tiempo) o asincr onica (los N aut omatas cambian de estado en momentos
diferentes).
A los efectos de una modelizacion, la vecindad entre agentes puede ser una vecindad fsica y estar asociada
con la efectiva proximidad espacial entre agentes. En un contexto econ omico se asociara con la aglomeraci on de
empresas en una dada localizaci on geogr aca. Tambien puede asociarse con una vecindad funcional tal como la
que queda establecida por una relaci on comercial o contractual entre dos agentes econ omicos (p. ej. : proveedor
y consumidor, vendedor y comprador, asalariado y empleador), etc.
9
10 CAP

ITULO 2. MODELOS COMPUTACIONALES


Denici on 2 (Estados) Los estados E del AC estan denidos por el estado de todas sus celulas.
E
k
|S
1
, S
2
, . . . , S
N
(2.1)
Denici on 3 (Evolucion) La evolucion de un AC est a determinada por la sucesi on de estados del AC a lo largo
del tiempo:
E
1
E
1
E
t
E
t+1
. . . (2.2)
Se suele representar un AC disponiendo sus celulas en una grilla de una, dos o m as dimensiones. Cuando
las vecindades de cada celula tiene la topologa de los n umeros naturales se los suele llamar un aut omata ordenado
(ver g. 2.1). Puede denirse un automata con vencindades aleatorias en cuyo caso se suele decir que se trata
de un aut omata desordenado. Es usual que el alfabeto de los estados internos de cada celula sea simplemente
/ |0, 1. Cuando el nuevo estado de cada celula queda determinado por una distribuci on de probabilidad
se habla de un aut omata probabilstico La evoluci on de los aut omatas unidimensionales se representa f acilmente
poniendo sucesivos instantes de tiempo en renglones consecutivos, de modo que el eje de tiempo sea creciente
o decreciente verticalmente. En la g. 2.2 se muestran algunos ejemplos de AC deterministas y aleatorios con
vencidades reducidas.
Figura 2.1: Automata unidimensional. Se indican las vencindades que
corresponden a un automata ordeando y a uno desordenado.
Un estudio general de AC realizado por S. Wolfram (Wolfram 1984) motiv o una clasi- caci on de los
aut omatas deterministas unidimensionales en cuatro grandes grupos seg un el estado asint otico al cual llegan.
Se muestran ejemplos en la g. 2.2. Los ejemplos que se muestran en esta gura son aut omatas con reglas de
actualizaci on llamadas totalsticas en que el caracter de cada sitio depende de la suma de los caracteres de su
vecindad:
S
i
(t + 1) = f(T) ; T =
j=+2
X
j=2
S
i+j
(t) (2.3)
Clase 1: Evolucionan hacia un estado jo y homogeneo (ejemplo en g. 2.3, corresponde a la regla
S
i
(t + 1) = 1 solamente si T = 2).
Clase 2 : evolucionan hacia un estado jo inhomogeneo o a un ciclo lmite (ejemplo en g. 2.3, corresponde
a la regla S
i
(t + 1) = 1 solamente si T = 3).
Clase 3 : evolucionan hacia un estado ca otico o aperi odico (ejemplo g. 2.3, corresponde a la regla
S
i
(t + 1) = 1 solamente si T = 1 o 3).
Clase 4 : evolucionan hacia un estado que involucra una estructura compleja y localizada (ejemplo en
g. 2.3, corresponde a la regla S
i
(t + 1) = 1 solamente si T = 2 o 4).
Modelos economicos de m ultiples agentes 10/6/2010
2.2. EVOLUCI

ON Y COMPLEJIDAD 11
2.2 Evoluci on y complejidad
Los ejemplos anteriores indican que la evoluci on de los AC pueden poseer diverso grado de complejidad. Esta
idea est a en todos los casos ligada a la informaci on contenida en el sistema y en su evoluci on. Hay dos posibles
enfoques para acercarnos a una denici on cuantitativa. Uno es est atico y liga la complejidad a la multitud de
elementos que forman el sistema y su mutua dependencia. Por lo general se la suele medir por la cantidad de
Figura 2.2: Ejemplo de evolucion de automatas unidimensionales or-
denados. Uno es determinista y el otro es estocastico o aleatorio. La
actualizacion de cada sitio se efect ua con la funcion booleana que se
indica al costado del dibujo. Las dos entradas son el estado de los dos
sitios vecinos a la derecha y a la izquierda. Los sitios en 1 tiene color ob-
scuro e instantes sucesivos estan gracados en renglones contiguos hacia
arriba. La condicion inicial es la misma para ambas evoluciones y es que
el casillero central esta en 1 y los restantes en 0.
informaci on que es necesario dar para especicar el sistema integramente y, si se la mide en bits, se la dene como
S = log
2
() (2.4)
En esta ecuaci on es la cantidad de estados del sistema y S es la entropa del sistema. Para ligar la dencion
2.4 con la termodin amica se la debe multiplicar por la constante de Boltzmann k 1.38 Joule/
o
Kelvin.
El otro abordaje para denir cuantitativamente complejidad es din amico. Es el que se ha siguido en la
clasicaci on de los AC hecha por Wolfram y es la que seguiremos nosotros ahora. En este segundo enfoque (que
no es independiente del anterior), un comportamiento complejo est a asociado a lo intrincada que es la evolucion
Modelos economicos de m ultiples agentes 10/6/2010
12 CAP

ITULO 2. MODELOS COMPUTACIONALES


de un sistema, referida nuevamente a la secuencia de estados que recorre el sistema a medida que transcurre el
tiempo. Esta denci on (Kolmogorov - Chaitin) establece que la complejidad de una secuencia es la longitud del
mnimo conjunto de instrucciones que se deben seguir (la longitud del programa m as corto) para reproducir dicha
secuencia. Esto es equivalente a determinar el programa m as corto capaz de predecir la evolucion del sistema.
Por extensi on, esta dencion puede usarse en el enfoque est atico mencionado arriba, deniendo la complejidad
por la longitud del programa m as corto necesario para construir el sistema.
La clasicaci on de Wolfram que dimos en la secci on anterior no es cuantitativa y pretende clasicar la
evoluci on de los AC en grandes grupos. El principal objetivo de Wolfram con dicha clasicacion fue mostra que
aun sistemas muy simples pueden presentar evoluciones de un alto grado de complejidad.
Figura 2.3: Se muestran sendos ejemplos de la evolucion de AC de las
cuatro clases indicadas en el texto.
La evoluci on de los AC de las distintas clases de Wolfram puede anticiparse con distinto grado de certidum-
bre (Wolfram 1984), esto es haciendo uso de distinta cantidad de informaci on. Los AC de la 1ra. clase evolucionan
siempre con certidumbre a un punto jo independientemente de las condiciones de las que se parta. En los AC
de la clase 2 el valor de un sitio particular (despues que ha transcurrido suciente tiempo), est a determinado por
los valores iniciales de sitios de una regi on limitada del espacio en el que esta denido el AC.
Los AC de clase 3 son m as complejos. Para predecir el estado de una celula del AC de esta clase se
requiere informaci on de los valores iniciales de sitios que pertenecen a regiones cada vez m as extensas a medida
que transcurre el tiempo. Se ha conjeturado que, con todo, el valor que adoptara un determinado sitio del AC
en un momento futuro puede determinarse mediante un algoritmo simple (esto es, mediante un programa breve).
En este contexto un programa o un algoritmo (que son sin onimos) para que sea breve debe involucrar menos
informaci on que la contenida en todas las celulas del AC, en todo tiempo previo. Los AC de clase 4 son los de
m axima complejidad ya que presentan una evoluci on que escapa a esta posibilidad y por consiguiente la unica
manera de establecer el valor de un determinado sitio del AC es siguiendo efectivamente toda la evoluci on del
mismo.
Modelos economicos de m ultiples agentes 10/6/2010
2.3. COMPUTABILIDAD 13
2.3 Computabilidad
El agrupamiento de los AC en cuatro categoras ha motivado una clasicaci on de la complejidad de un sistema
(o de su evoluci on) en dos grandes clases: reducible e irreducible. La primera clase agrupa todos los sistemas
en los que la evoluci on puede ser descripta mediante un algoritmo simple. En este grupo se inscriben muchos
sistemas fsicos tales como el sistema planetario o una antena de radio. Estos sistemas poseen ecuaciones de
movimiento que son - o pueden considerarse - estables frente a perturbaciones en las condiciones inciales. Los dos
ejemplos corresponden a sistemas descriptos respectivamente por las ecuaciones de la mec anica de Newton y las
del ectromagnetismo de Maxwell.
La evolucion de sistemas que presentan una complejidad irreducible s olo se puede establecer mediante
su observaci on y no es susceptible de ser anticipada de manera sencilla. En esta clase se inscriben una enorme
variedad de sistemas pero, quiz a los ejemplos m as claros provienen de la biologa o la sociologa. En esta clase
se inscriben tambien sistemas fsicos o qumicos como una computadora o el medio bioqumico de una celula, as
como otros cuyas ecuaciones de movimiento son no lineales y presentan diverso grado de inestabilidades frente a
perturbaciones en las condiciones inciales. En este grupo est an los sistemas que presentan caos determinstico.
Es interesante hacer notar que la complejidad irreducible no est a ligada necesariamente a un n umero elevado de
grados de libertad internos del sistema. Los AC de clase 4 son sistemas de complejidad irreducible con muchos
grados de libertad internos, pero el ejemplo visto en el captulo 1 de evoluci on logstica es tambin irreducible e
involucra tan s olo un grado de libertad.
No debe producir confusi on la complejidad irreducible de una AC con el hecho que cada una de sus celulas
sea representada mediante un algoritmo simple. En un caso se trata del comportamiento de cada individuo
por separado mientras que la complejidad a la que hacemos referencia es irreducible porque necesita de tanta
informaci on como la contenida en toda la historia previa de la totalidad de las celulas del sistema. Este es, de
paso, un ejemplo de propiedad emergente a la que se hizo refrencia en el Captulo 1 en el que la totalidad puede
ser muchoi m as que la suma de sus partes: la composici on de agentes simples puede dar lugar a un sistema de
complejidad irreducible.
Podemos decir que, generalmente un sistema capaz de procesar informaci on que se le suministre y computar
con ella resultados es un ejemplo de sistema cuya evoluci on es de una complejidad irreducible ya que la unica
manera de predecir el resultado del procesamiento es llevando a cabo el procesamiento mismo. El interes te orico
por este tipo de sistema surgi o en respuesta al 10mo. de los problemas que present o Hilbert en el Congreso
Internacional de Paris de 1900 y en el de Bologna de 1928. Planteando este problema Hilbert pretenda que se
respondiera a una conjetura acerca de la eventual naturaleza mec anica de la matem atica. Si esta fuera as toda
ella podra ser reducida a un procedimento deductivo autom atico que se ajustara a las reglas de la l ogica. El
denominado Entscheidungsproblem fue formulado como
Denici on 4 (El decimo problema de Hilbert) Encontrar la manera de tratar cualquier problema matem atico
como un procedimiento mec anico, o, en su defecto, responder a la pregunta de si puede existir o no un proced-
imiento de esa naturaleza.
En respuesta a este problema Turing se propuso formalizar lo que es un procedimiento mec anico (o au-
tom atico) y deni o una m aquina capaz de efectuar operaciones (en lo sucesivo M aquina de Turing o MT) con los
siguientes elementos:
Una m aquina debe poseer un n umero nito (probablemente muy grande) de estados internos (es un
aut omata nito)
Debe disponer de memoria. Turing supuso que esta no posea restricci on alguna en su volumen y la
represent o por una cinta (innita) dividida en celdas en cada una de las cuales es posible escribir un
smbolo de un alfabeto nito (supondremos que este alfabeto consta de los smbolos 0, 1).
Debe disponer de una cabeza lectora y escritora que sea capaz de desplazarse hacia la derecha o izquierda
y examinar y/o cambiar el dato que se encuentra en el sitio de la cinta con el que est a en contacto.
Cuando el c alculo naliza la cabeza lectora se detiene
Modelos economicos de m ultiples agentes 10/6/2010
14 CAP

ITULO 2. MODELOS COMPUTACIONALES


Una m aquina con estos elementos puede efectuar un c alculo que se le programe mediante un conjunto de instruc-
ciones. Las mismas tiene el formato |, S

, a

, S, a donde
1. indica el movimiento de la cabeza lectora y |I, D, H donde I (D) indica desplazamiento de un sitio
hacia la izquiera (derecha) y H indica que la cabeza se detiene.
2. S

, S indican estados internos de la MT


3. a

, a indican smbolo del alfabeto


Se supone que la cabeza lectora de la MT est a ubicada en alguna posici on determinada de la cinta y se
encuentra en un estado interno S. A partir de esa situaci on ejecuta secuencialmente las instrucciones almacenadas
con el formato anterior realizando las siguientes acciones
1. Lee el caracter a de la cinta en el que est a posicionada la cabeza
2. Encuentra la instrucci on |, S

, a

, S, a cuyos dos ultimos elementos son (S, a)


3. Cambia su estado interno S por S

4. Escribe el caracter a

en el sitio donde est a posicionada la cabeza.


5. Efect ua el movimiento indicado por
Una MT puede ser considerada un sistema din amico en el que los estados internos S(t), S

(t), los caracteres


a(t), a

(t) y la posicion en la cinta son funciones del tiempo y las instrucciones cumplen el papel de una matriz
de transici on determinista cuyos elementos vinculan el estado, el caracter y la ubicaci on en el instante t y los
correspondientes en el instante t + 1.
EJEMPLO S

S a COMENTARIO
Ejemplo 1(*) H S
1
0 S
1
1 Parte de (S
1
,1); cambia por
(S
1
,0); se detiene
Ejemplo 2(**) D S
2
1 S
1
1 Parte de (S
1
,1); cambia por
(S
2
,1); va a la derecha
I S
1
1 S
2
1 Estaba en S
2
,lee 1; cambia por
(S
1
,1); va a la izquierda
(*) Se supone que la cabeza lectora enfrenta incialmente un 1. La instrucci on s olo cambia el contenido de la cinta
por un 0 y se detiene. (**)Se supone que la cabeza lectora enfrenta inicialmente un 1 que tiene a su derecha otro
1. Con estas instrucciones y esos datos en la cinta, el programa no se detiene nunca.
Ejercicio 1 Suponga que en la cinta hay un n umero de casilleros ocupados por 1s y la cabeza lectora est a lejos, a
la izquierda del primer 1 y en un estado S
0
Escriba una secuencia de instrucciones que agregue un 1 a la derecha
del ultimo 1.
Respuesta
1. D; S0, 0; S0, 1
2. D; S1, 1; S0, 0
3. H; S0, 1; S1, 0
4. D; S1, 1; S1, 1
Si se representa un n umero natural por igual n umero de 1s (representaci on unaria), el programa anterior
es equivalente a la instrucci on de sumar 1 al n umero inicial. De este modo se puede programar tambien operaciones
m as complejas como la substracci on, la multiplicaci on y la divisi on entera. Resulta obvio que con una MT es
Modelos economicos de m ultiples agentes 10/6/2010
2.4. AUT

OMATAS CELULARES BIDIMENSIONALES 15


posible efectuar cualquier operaci on aritmetica entre enteros o entre n umeros reales con precisi on nita. Es claro
que la programaci on de una MT es en extremo inc omoda pero de ninguna manera hace imposible representar
todas las funciones l ogicas y aritmeticas imaginables. En realidad se puede denir una operaci on mec anica (o un
algoritmo efectivo) como una que se puede efectuar con una MT.
Si bien una MT s olo puede efectuar las operaciones que le indica su programa de instrucciones esta
potencialidad permite construir una MT que puede realizar las computaciones de la que es capaz cualquier
otra MT. Esa MT se denomina Universal (MTU) y a los sistemas din amicos que son capaces de este tipo de
procesamiento se los puede considerar equivalentes a una MTU. Se conjetura que los AC clase 4 son sistemas
din amicos que caen en esta categora. Las computadoras de uso corriente son MTU y es por ello que es posible
hacer que cualquier maquina se comporte como cualquier otra. El recurso que se utiliza para esta imitaci on es
incorporar en la m aquina un software adecuado, o sea, un lote de instrucciones para producir una tal imitaci on.
La idea general que se sigue para mostrar esta universalidad consiste en codicar la lista de instrucciones
de una MT arbitraria que se desea replicar en la cinta de datos de la MTU y reservando un espacio para trabajo
en la cinta. Adem as a la MTU se le deben suministrar los datos con que opera la MT que se desea copiar. En
esas condiciones la MTU operar a de la misma manera que esta.
En el lenguaje de las MT el 10mo. problema de Hilbert se formula como el Problema de la Detenci on de
una MT (en ingles es el halting problem):
Denici on 5 (Halting problem) Es posible elaborar una teora sistem atica que determine si una MT cualquiera
llega a detenerse?
Es ciertamente posible, mediante alg un analisis particular, decidir que algunas m aquinas son capaces de
terminar su c alculo y dar una respuesta mientras que otras no. La pregunta se reere en cambio a las condiciones
generales que se deben satisfacer para establecer de manera sistem atica y universal cu ando una m aquina puede
llegar a detenerse y dar un resultado. La respuesta a la pregunta - y por consiguiente al 10mo. problema de
Hilbert es que una tal teora no es posible. Si dice que la pregunta formulada arriba es indecidible y es equivalente
a la proposici on de G odel que dice que en todo sistema l ogico existen proposiciones que no se pueden demostrar
en un n umero nito de pasos.
El problema de si el cerebro es una MT o tiene en realidad otras posibilidades computacionales es una
polemica m as los oca que pr actica ya que no puede demostrarse por la armativa o la negativa. Descartes
consider o que el cerebro y la capacidad de razonamiento humanos no son una m aquina porque el ser humano
posee el libre albedro. Mientras que una m aquina debe obedecer ciegamente una secuencia ja de acciones
preestablecidas, el ser humano puede decidir en todo momento cambiar el rumbo de sus acciones libr andolas al
azar. En terminos matem aticos esta proposici on es equivalente a imaginar una MT gobernada por una secuencia
de instrucciones sujetas al azar. Desde este punto de vista una MT podra ejercer el libre albedro con el solo
tr amite de agregarle una cinta aleatoria. Sin embargo, una cinta de este tipo no puede en principio fabricarse
mediante un algoritmo nito con lo que quedara al menos formalmente salvada la diferencia entre una MT y el
cerebro. Sin embargo esa diferencia pueda hacerse tan imperceptible como se desee con lo que, para todos los nes
pr acticos sera imposible diferenciar una m aquina de un comportamiento inteligente en un tiempo compatible con
la duracion de la vida de un ser humano.
Las consideraciones que anteceden son tambien aplicables al comportamiento de un agregado de agentes
inteligentes o sea, a un sistema social o econ omico. Cabe con todo preguntarse la capacidad computacional efectiva
que posee un conjunto de agentes. Sin pretender dar una respuesta a esta preguntano parece haber limitaciones
formales que invaliden representar un sistema social o economico con herramientas computacionales. Sin embargo
posee una limitaci on que es mucho m as pr actica que formal: una modelizaci on no ser a de utilidad si se la construye
con elementos de la misma complejidad que la realidad misma: Si as fuera no habra diferencia entre el modelo y
la situacion que se estudia y ser imposible abstraer caractersticas generales aplicables a situaciones semejantes.
2.4 Automatas celulares bidimensionales
Una generalizaci on muy frecuente de los AC presentados hasta el momento, es cuando las celulas se disponen en
un plano (ver g. 2.4). Pasar de una a dos dimensiones requiere un cambio en la denici on del entorno de cada
Modelos economicos de m ultiples agentes 10/6/2010
16 CAP

ITULO 2. MODELOS COMPUTACIONALES


celula. Existe en la literatura una diversidad de vecindades de uso corriente. Adem as de la que se muestra en la
gura se suele utilizar otra que s olo involucra los casilleros ubicados en los cuatro puntos cardinales (N, S, E y O).
En este ejemplo la vecindad est a asociada al rango de la interaccion de la fuerza con que interact uan los dipolos
ubicados en cada lugar. Tambien se suelen considerar vecindades m as extensas que involucran mas hileras. Es
asimismo com un com un evitar efectos indeseados en los bordes imponiendo condiciones de contorno peri odicas.
para ello se identican los bordes superior con el inferior y los de ambos costados entre si. Con estas suposiciones
el AC posee la topologa de un toro.
Figura 2.4: Automata bidimensional. Se indica una vencindad que corre-
sponden a un automata ordeando. Se indican las condiciones de contorno
periodicas.
En lo que sigue daremos algunos ejemplos de modelos realizados mediante el uso de aut omatas bidimen-
sionales.
2.4.1 Modelo de condensacion
El AC bidimensional de este ejemplo representa el espacio ocupado por una substancia que puede estar en una
de dos fases posible: vapor o lquido. Cada celula representa un elemento de volumen que puede pertenecer a la
fase condensada (amarillo) o no condensada (gris). El aut omata evoluciona prque se supone que cada celda puede
cambiar su estado pasando de la fase condensada a a de vapor o recprocamente. Las reglas de evoluci on del AC
son las siguientes:
1. Una celula se condensa (0 1) si en su vecindad hay 4 o mas celulas condensadas
2. Una celula pasa a un estado gaseoso (1 0) si en su vencidad hay menos de 4 celulas condensadas
3. Todas las celulas cambian de estado de manera sincr onica
Las condiciones iniciales se eligen determinando al azar con probabilidad p
c
si cada celula pertenece o no
a la fase condensada. La dinamica de este AC est a dominada por puntos jos, esto signica que cualquiera sea
la condici on inicial el AC converge a una conguraci on estable que no cambia en el tiempo. En la g. 2.5 se
muestran varios momentos del proceso evolutivo para condiciones iniciales en las que hay un 25% de celulas que
pertencen a la fase condensada (p
c
= 0.25).
En los momentos inciales las celulas condensadas que est an aisladas pasan a la fase de vapor mientras que
las celulas condensadas pr oximas entre si tienden a formar gotas m as grandes (primer panel en g. 2.5). Esta
din amica puede entenderse analizando lo que sucede en las fronteras entre ambas fases. Es f acil comprobar que
separaciones verticales, horizontales o a 45
o
son estables y no cambian en el tiempo, mientras que las concavidades
tienden a desaparecer provocando el crecimiento de las gotas al tiempo que las fuerza a que sean convexas. Estos
efectos se pueden ver comparando los paneles que corresponden a 10 y a 12 iteraciones que se muestran en la
g. 2.5.
Modelos economicos de m ultiples agentes 10/6/2010
2.4. AUT

OMATAS CELULARES BIDIMENSIONALES 17


Figura 2.5: Diferentes momentos en la iteracion del Automata de con-
densacion. La fase condensada esta represetada en amarillo. En 50
iteraciones el AC ha alcanzado un punto jo.
Se puede mostrar que este modelo presenta un comportamiento lmite cuando la probabilidad inicial de
celulas condensadas p
c
es pr oxima al 25 %. Cuando p
c
< 0.25, el estado asint otico contiene gotas condensadas
cuyo tama no se distribuye alrededor de un valor medio que es tanto m as peque no cuanto menor es p
c
(ver panel
superior en la g. 2.6).
Para el valor lmite de p
c
0.25 el estado asint otico posee gotas cuya distribuci on se aproxima una ley
de potencias (P(S) S

) con P(S) = probabilidad de ocurrencia de una gota de tama no S). Cuando una
distribuci on posee este compatimiento es facil ver que no existe un valor medio nito. En este caso se suele decir
que esta distribuci on no posee un tama no caracterstico (ver panel central de la g. 2.6 o bien la conguraci on
limite alcanzada al cabo de 50 iteraciones en g. 2.5). Si p
c
> 0.25 el punto jo es uno en que todo el espacio
pertenece a la fase condensada. En el tercer panel del la g. 2.6 se muestra el estado del AC al cabo de 50
iteraciones, justamente antes que el espacio sea integramente ocupado por la fase condensada. Observese que en
este panel abundan las concavidades que deben ser r apidamente llenadas en sucesivas iteraciones.
2.4.2 El juego de la vida de Conway
Un at omata bidimensional extremadamente popular es el llamado juego de la vida de Conway. Este aut omata
demuestra de manera terminante c omo reglas extremadamente sencillas pueden dar lugar a comportamientos
colectivos de una enorme complejidad. Las reglas del juego condensan criterios elementales de supervivencia y
reproduccion y parte de condiciones iniciales en las que alg un n umero de sitios estan ocupados por celulas vivas
y otros sitios por celulas muertas. La din amica surge del hecho que celulas pueden nacer a la vida o morir.
Aun cuando las reglas son en extremo simples y absolutamente deterministas el AC tiene una evoluci on
que muestra un tipo particular de inestabilidad: aun partiendo de condiciones iniciales muy parecidas entre si,
la evoluci on temporal puede conducir al AC a conguraciones que se alejan arbitrariamente unas de otras. Una
manera de medir la distancia entre conguraciones es mediante la distancia de Hamming, o sea por el n umero de
celulas que est an en estados diferentes.
En alguna oportunidad este AC fue utilizado para argumentar sobre lo impredecible que puede llegar a ser
la conducta de una sociedad. En realidad, este es un excelente ejemplo para demostrar la falacidad de presuponer
Modelos economicos de m ultiples agentes 10/6/2010
18 CAP

ITULO 2. MODELOS COMPUTACIONALES


Figura 2.6: Diferentes estados asintoticos para diferentes p
c
iniciales.
Panel (A) p
c
= 0.20, panel (B) p
c
= 0.25 y panel(C) p
c
= 0.27 con la
simulacion detenida a las 50 iteraciones.
que existe una correspondencia directa entre la complejidad de conductas individuales y colectivas, esto es, que
reglas individuales simples deben conducir necesariamente a conductas colectivas simples y reglas individuales
complejas deben conducir a conductas colectivas complejas.
Las reglas de evoluci on del aut omata de Conway son las siguientes:
1. Una celula permanece viva si tiene 2 o 3 celulas vivas en su vecindad. De lo contrario muere.
2. Una celula muerta permanece como tal a menos que tenga exactamente 2 ( o 3) celulas vivas en su vecindad.
Si sucede esto, renace.
3. Todas las celulas evolucionan de manera sincr onica
Este AC admite puntos jos y ciclos lmites de diversa longitud. En la g. 2.7 se muestran algunos ejemplos.
En el panel (A) se muestran sucesivos estados en un ciclo lmite de orden 2 que se lo suele denominar Sem aforo.
En el panel (B) se muestra una secuencia de conguraciones que conducen a un punto jo denominado el Panal.
Finalmente en el panel (C) se muestra una sucesi on de conguraciones denominadas Trineo. El primer estado
se vuelve a encontrar despues de algunos pasos pero desplazado a lo largo de una diagonal a 45
o
.
Con estas caractersticas es dable presumir que un AC de Conway posea una complejidad tal que sea
posible ubicarlo en la misma clase que los AC unidimensionales de clase 4 en la clasicaci on de Wolfram. De
hecho es posible vericar que una AC de Conway es formalmente equivalente a una computadora universal de
Turing.
A pesar de lo sencilla que son las reglas de evoluci on la riqueza din amica del AC de Conway es la m axima
imaginable y tan rica como la din amica de un conglomerado social real (aceptando la hip otesis denominada de
inteligencia articial fuerte).
Para mostra que es posible construir una computadora celular basada en el AC de Conway basta con indicar
c omo se construyen las funciones l ogicas includa la negaci on. En la g. 2.8 se muestra c omo se representaran
las funciones l ogicas de la negaci on y la conjunci on mediante el AC de Conway. Para ello se usan Trineos y
Ca nones. Los Ca nones son conguraciones emiten Trineos cada 30 iteraciones. Una vez emitidos, los trineos
comienzan a desplazarse a lo largo de la diagonal en la que est an ubicados. Los trineos son conguraciones que
no solamente se desplazan sin cambio de forma sino que, adem as, cuando dos de ellos colisionan, ambos se
aniquilan dando por resultado la ausencia de toda celula viva.
Con estas propiedades se puede representar a una variable l ogica (binaria) cuyos valores posibles son 1
(verdad) o 0 (falsedad) como, respectivamente, la presencia o ausencia de un Trineo en una dada diagonal. Con
esta convenci on un ca n on genera una se nal 1 en la diagonal en que est a posicionado. Con un Ca n on que emitan
un Trineo es posible a su vez negar una se nal X tal como se muestra en la g. 2.8. Efectivamente si la se nal X es
verdad (X=1) signica que en esa diagonal viaja un trineo y si es falsa (X=0) nada viaja en ella. El resultado
de colisionar con el 1 emitido por el ca n on es un 0 si X=1 y un 1 si X=0. Esta es precisamente la negaci on de
Modelos economicos de m ultiples agentes 10/6/2010
2.4. AUT

OMATAS CELULARES BIDIMENSIONALES 19


Figura 2.7: Ejemplo de evoluciones del AC de Conway: (A): Semaforo:
ciclo l`imite de orden 2, (B) Panal punto jo, (C) Trineo: esquema
que se auto replica desplazandose seg un una diagonal.
X. Si adem as se agrega una se nal Y es posible vericar que se representa tanto la funci on l ogica correspondiente
a la conjunci on de X e Y como la conjunci on de la negaci on de ambas (echas coloreadas en la g. 2.8). La
composicion de funciones l ogicas implementadas de esta manera permite, en principio, construir una computadora
universal.
A este punto conviene recalcar algunos puntos importantes:
1. Reglas simples a nivel de comportamientos individuales pueden dar lugar a comportamientos colectivos
enormemente complejos.
2. Hay propiedades del conglomerado de agentes que son propias del conjunto y que no pueden ser reducidas
a las propiedades de una parte o a las de cada uno de los integrantes del sistema.
3. Si se admite que el comportamiento de una sociedad real no puede exceder en complejidad a una computa-
dora universal (hip otesis de i nteligencia articial fuerte), se puede concluir que la riqueza de din amicas
del AC de Conway es en principio equivalente a la de una sociedad integrada por seres vivos (aun cuando
replicarla utilizando un AC Conway sea extraordinariamente difcil).
2.4.3 El modelo de segregacion de Schelling
Este ejemplo est a orientado a mostrar que s olo algunos elementos propios de un nivel propio de los individuos de un
sistema (nivel micro) pueden trasladarse a un nivel agregado propio del conjunto de individuos (nivel macro).
Es ademas instructivo pues pone por otra parte enfasis en indicar cu al es la estrategia para la modelizaci on de
sistemas sociales o econ omicos basada en las herramientas propias de los sistemas de m ultiples agentes.
Modelos economicos de m ultiples agentes 10/6/2010
20 CAP

ITULO 2. MODELOS COMPUTACIONALES


Figura 2.8: Ejemplo de representacion de las funciones logicas de ne-
gacion y de conjuncion mediante un AC de Conway. En el costado dere-
cho se muestra la tabla de verdad de la conjuncion X.and.Y de las dos
proposiciones X e Y.
Schelling se propuso dilucidar el vnculo causal que podra existir entre la ocurrencia de ghettos en las
grandes ciudades y las conductas individuales de intolerancia. La pregunta que procur o responder es Cuanto
nivel de intolerancia individual es necesaria para que se observe, una segregacion racial colectiva que conne a
blancos y a negros en barrios separados?. El hecho estilizado al que se hizo referencia en el Captulo I es, en este
ejemplo, la ocurrencia de barrios segregados. El modelo (minimal) que se procura construir es uno en el que s olo
se tengan en cuenta pautas para la conducta individual que sean sucientes para dar cuenta de tal segregaci on.
El modelo que elabor o Scelling se basa en un AC bidimensional y con el correr del tiempo se le han
introducido diversas variantes. La que se presenta aqu no es la presentada originalmente por Schelling aun
cuando retenga la mayora de sus caractersticas.
Se supone que los agentes est an ubicados en una grilla bidimensional con los bordes ideticados de modo
de reproducir la topologa del toro. Se supone que toda la cuadrcula de sitios est a ocupada por un agente de uno
de dos colores, verde y anaranjado. Analizaremos dos posibles alterantivas, a saber:
1. Alternativa 1:La situaci on favorable para un agente es participar de la mayora de su vecindad, o sea, un
agente est a descontento si su color es igual al de la minora de agentes de su entorno inmediato.
2. Alternativa 2 La situaci on favorable para un agente es participar de la minora de su vecindad, o sea,
que un agente est a descontento si su color es igual al de la mayora de agentes de su entorno inmediato.
En ambas alterantivas se supone que existe una din amica que deriva de la mudanza de agentes. Cada
agente debe hacer un recuento de la composic on de su vecindad y decidir si pertence a la mayora o a la minora.
La convenci on que se utiliza es que en dicho recuento se incluye el propio agente. Es adem as menester jar de
antemano cu al es la vecindad sobre la que se hace ese censo. En los ejemplos que se muestran m as adelante se ha
utilizado como vecidad la de las 8 celdas con las que cada agente est a en contacto. La din amica comprende los
siguientes pasos:
1. Se seleccionan al azar un par de agentes de distinto color
2. Ambos agentes deciden si est an contentos o descontentos efectuando un recuento en sus respectivas
vecindades
3. Si ambos agentes est an descontentos intercambian sitios, de lo contrario ambos permanecen en sus respec-
tivos lugares. (Observese que esta actualizaci on del AC no es sincr onica.)
Modelos economicos de m ultiples agentes 10/6/2010
2.4. AUT

OMATAS CELULARES BIDIMENSIONALES 21


4. Se recomienza desde el paso 1 y se contin ua hasta que no se encuentra m as pares de agentes de distinto
color descontentos. En la pr actica la b usqueda se suele implementar seleccionando pares al azar, en este
caso se puede establecer que la b usqueda se detiene si no se los encuentra en un n umero preestablecido
(elevado) de intentos.
En las g. 2.9 y g. 2.10 se muestran ejemplos de la evoluci on del AC utilizando respectivamente la
alternativa 1 y la alternativa 2 para determinar el nivel de satisfacci on de los agentes.
En la g. 2.9 se muestra la evoluci on del AC cuando la situaci on favorable es pertenecer a la minora de la
propia vecindad. La conguraci on inicial es una en que cada celda del AC est a ocupada por un agente de cada
color con probabilidad 1/2. Como esta conguraci on se determina al azar es dable que no haya exactamente el
mismo n umero de agentes de cada color. La regla local de preferencias induce mudanzas que progresivalemente
van disminuyendo el n umero de agentes descontentos (comparar paneles D y E de la g. 2.9). Tal dismunici on
es abrupta al comienzo pero luego se torna muy lenta aproxim andose asint oticamente a una situaci on de mnimo
descontento.
Figura 2.9: Evolucion del AC de Schelling en el caso en que la situacion
favorable es pertenecer a la minora. En el panel A se muestra la cong-
uracion inicial en el panel B luego de 500 mudanzas y en el C luego de
1500 mudanzas. En los paneles D y E se muestran en verde y anaranjado
a los agentes de ese color que estan descontentos al cabo de las 500 y
1500 mudanzas respectivamente.
La disminuci on del n umero de agentes descontentos se produce a expensas de producir un orden en gran
escala en que los agentes de distinto color se agrupan en calles. Decimos que el orden es de gran escala puesto
que posee un alcance que es mucho mayor que el jado para determinar el grado de satisfacci on de los agentes y
Modelos economicos de m ultiples agentes 10/6/2010
22 CAP

ITULO 2. MODELOS COMPUTACIONALES


termina por abarcar a la gran mayora de agentes del sistema. Este ordenamiento, sin embargo, no es perfecto.
Observese que los agentes descontentos (paneles D y E) se agrupan en zonas muy denidas que se corresponden con
la frontera entre dominios en los que las calles corren en direcciones perpendiculares. Estos dominios se producen
porque a lo largo del proceso evolutivo la generacion de calles tiene lugar de manera independiente en distintos
puntos del AC. Este proceso genera islas de orden que crecen hasta colisionar con otras cuyo ordenamiento
es incompatible con el propio. Cuando el sistema est a integramente parcelado en dominios si bien el n umro de
descontentos ha disminuido, no se los ha eliminado por completo. En ese punto el proceso de disminuci on de
descontentos se torna muy lento porque cada disminuci on adicional requiere la relocalizaci on de una gran cantidad
de agentes que son los que forman parte de alg un dominio.
Es interesante obsevar que aun cuando se permita que el AC evolucione durante una cantidad arbitraria-
mente grande de pasos existen situaciones en los que un unico ordenamiento global perfecto es imposible. Tal es
el caso cuando el n umero de celdas en cada direcci on no es congruente con las dimensiones de la vecindad. Para
el caso en que el AC tiene la topologa del toro y una vecindad de 8 celdas, si se pretende que el ordenamiento sea
perfecto se deben alternar agentes de distintos colores y, al llegar al borde opuesto, se debe encontrar el mismo
color con el que se parti o. Cuando se dan este tipo de situaciones se est a en la misma situaci on de un modelo de
Ising en el que las interacciones entre dipolos vecinos no son todas positivas (ver gura 3.3 del captulo anterior).
Es otro caso de f rustraci on.
Denici on 6 (Frustracion) Se dice que un sistema es frustrado cuando todos su agentes no se pueden acomodar
de modo de satisfacer todas las condiciones impuestas por las interacciones entre los mismos.
En la g. 2.10 se muestra un ejemplo de evoluci on para la otra alternativa, esto es cuando la situaci on
favorable es pertencer a la mayora. Este es el caso originalmente estudiado por Schelling y utilizado como modelo
de segregaci on. Tambien en este caso la evoluci on del AC produce una disminuci on mon otona del descontento a
expensas de dar lugar a un orden de gran alcance que es la conformacio on de ghettos.
En este caso el sistema no es frustrado con lo que la convergencia no s olo es m as r apida sino que adem as se
puede alcanzar un orden global perfecto que se corresponde con un estado estacionario. Se lo muestra en el panel
D. En este panel subsisten dos descontentos (en el borde superior de la grlla) debido a que en el sorteo inicial el
n umero de agentes verdes no result o igual al de agentes anaranjados. En las etapas intermedias se puede observar
c omo los agentes descontentos se ubican en las fronteras de los barrios segregados.
El ejemplo de la g. 2.10 corresponde a una intolerancia moderada. Un nivel de mayor intransigencia
correspondera, por ejemplo, a denir como favorable una vecindad en la que un color debe exceder al otro en
dos o m as unidades. Si se impone esta pauta individual el AC tarda m as en converger a un ordenamiento y las
fronteras de los ghettos resultan ser rectas y carecen de concavidades como las que se muestran en la g. 2.10.
Si se aumenta aun m as el nivel de intolerancia (la situaci on extrema es exigir que la unica situaci on favorable
es que toda la vecindad sea del mismo color), hace que el sistema no converja a ning un equilibrio. Estos detalles
pueden comprenderse si se observa que la dinamica de adaptaci on del AC se da en las fronteras: es alli donde se
producen las mudanzas y es facil ver que convexidades o concavidades dan lugar a vecindades mas equilibradas
(y por consiguiente m as activas en mudanzas) cuando se imponen pautas individuales de mayor intolerancia.
Entre otras conclusiones interesantes, es en primer lugar destacable que no sea necesario un nivel de intolerancia
individual elevado para dar lugar a barrios segregados y en segundo lugar que las zonas de potencial conicto
est an ubicadas en las fronteras. Estos hechos replican, por otra parte, situaciones empricamente observadas.
Ejemplo computacional
Ac a se presenta una implementaci on en Matlab del modelo de Schelling. La red se dene en la variable U, donde se
distribuyen unos y ceros en igual proporci on. Hay una funci on measures satisfaction(one, x, y) que cuenta
la cantidad de vecinos del mismo color de un agente. La mudanza ocurre cuando ambos agentes, seleccionados al
azar, tienen la cantidad de vecinos por debajo de su umbral crtico.
function nn = schelling(N0, thresh)
Modelos economicos de m ultiples agentes 10/6/2010
2.4. AUT

OMATAS CELULARES BIDIMENSIONALES 23


Figura 2.10: Evoluci on del AC de Schelling en el caso en que la situacion
favorable es pertenecer a la mayora. En el panel A se muestra la con-
guracion inicial aleatoria, en el panel B luego de 50 mudanzas, en el
C luego de 150 mudanzas y en el D la situacion asintotica estable en la
que no pueden producirse mas mudanzas. En las etapas intermedias, los
agentes anaranjados descontentos se lo muestra con color amarillo y los
agentes verdes descontentos se los muestra color verde claro.
global U N;
step = 150;
rand(state,0);
N = N0;
titulo = [Schelling Game: N=, num2str(N*N)]; % title of main window
U = round(rand(N,N)); % sets random field
film = imagesc(U,[0 1]); % sets main figure
axis off; axis square; axis on;
title(titulo);
xlabel(x,fontsize,16);
Modelos economicos de m ultiples agentes 10/6/2010
24 CAP

ITULO 2. MODELOS COMPUTACIONALES


ylabel(y,fontsize,16);
axis([0 N+1 0 N+1]);
i=1;
while i<=90000,
i
% Selects one agent
one = round(rand(1,2)*(N-1))+1;
x1 = one(1); y1 = one(2);
% selects second agent and measures satisfaction
two = round(rand(1,2)*(N-1))+1;
x2 = two(1); y2 = two(2);
% computes satisfaction
if U(x1,y1) ~= U(x2,y2)
sat1 = measures_satisfaction(one,x1,y1);
sat2 = measures_satisfaction(two,x2,y2);
if sat1 < thresh & sat2 < thresh
temp = U(x1,y1);
U(x1,y1)=U(x2,y2);
U(x2,y2)=temp;
end;
end;
if (mod(i,step)==0)
set(film,cdata,U);
drawnow
end
i=i+1;
end
function sat = measures_satisfaction(one,x1,y1)
global U N;
xl = mod(x1-2,N)+1; % index left
xr = mod(x1,N)+1; % index right
yb = mod(y1-2,N)+1; % index bottom
yt = mod(y1,N)+1; % index top
% measures the number of 1s in neighborhood
neig = U(xl,y1) + U(xr,y1) + U(x1,yb) + U(x1,yt);
neig = neig + U(xl,yb) + U(xl,yt) + U(xr, yb) + U(xl, yt);
% defines satisfaction
if U(x1,y1) == 0
sat = 8-neig;
else
sat = neig;
end;
Ejercicio 2 i) En el modelo original, los agentes tenian una cota inferior a la tolerancia antes de la mudanza.
Modelos economicos de m ultiples agentes 10/6/2010
2.4. AUT

OMATAS CELULARES BIDIMENSIONALES 25


Modicar el programa para incluir este efecto.
2.4.4 Un mercado inmobiliario
Sobre la base del modelos de Schelling, es posible construir un modelo elemental de un mercado inmobiliario.
Para ello se supone que los agentes pueden poseer una cantidad de dinero K y una propiedad cuyo precio es P y
las mudanzas se producen intercambiando sus propiedades. Se supone ademas que este hecho s olo se produce si
ambos agentes mejoran su utilidad con la transacci on.
Para ello se dene la utilidad de un agente i con un capital K
i
y una propiedad de precio P
i
como
U
i
K

i
P
(1)
i
. Se establece adem as que el valor imputado a una propiedad ocupada por un agente del color X,
es
P(X) = A[((X) ((X)] +B (para la alternativa 1) (2.5)
P(X) = A[((X) ((X)] +B (para la alternativa 2) (2.6)
donde ((X) indica la cantidad de agentes del color X en su vecindad inmediata (incluyendolo a el mismo). Las
constantes A y B (A y B) aseguran que P sea no negativo.
La din amica para las transacciones tiene en cuenta el hecho que las mismas deben redundar en benecio
de ambos agentes, para ello se procede la manera siguiente:
1. Dos agentes son elegidos al azar. Cada uno ja el precio que pagaran por la propiedad del otro
2. Se ja un precio de transacci on que es el promedio de ambos valores
3. Ambos agentes se intercambian sus propiedades s olo si se dan las dos siguientes condiciones: a) El agente
due no de la propiedad m as barata puede pagar la diferencia de precio, y b) Ambos agentes mejoran su
utilidad.
4. La dinamica se detiene cuando no se pueden concertar transacciones durante un n umero preestablecido de
sorteos de pares de agentes
En estas condiciones son varias las preguntas que uno se puede formular, por ejemplo: Subsiste la seg-
regaci on detectada en el modelo de Schelling?; d onde se concentran los agentes descontentos? c omo es la
convergencia?,Se alcanza un orden perfecto?, etc.
En la g. 2.11 se muestran algunos resultados en las que se analiz o la alternativa en que es favorable
pertenecer a la mayora (se utiliza la regla (2.6)). En estos experuimentos se puede observar el efecto de un
cambio en las preferencias de los agentes: en el panel (A) los agentes obtiene una mayor utilidad de una mejor
propiedad mientras que en el panel (B) y (C) preeren crecientemente disponer de un mayor capital. Para obtener
estos resultados se estableci o que todos los agentes inicialmente poseen el mismo capital (K = 1) y solamente
dieren por su color. Las curvas son de igual utilidad y la convenci on de colores es la misma que la geogr aca
(azulk, celeste, verde, marr on y rojo): los azules corresponden a valores bajos, y los rojos corresponden a valores
elevados. En todos estos casos se convirgi o a un estado estacionario. El nivel de segregaci on que se alcanza es
menor que en el modelo original de Schelling. En realidad, esta es tanto menor cuanto m as relevancia tiene el
capital en la utilidad de los agentes. La imposici on de restricciones economicas para la reubicaci on de los agentes
diculta alcanzar segregaciones mayores y la convergencia es menos ecaz ya que no siempre se pueden reubicar
agentes. Las mayores utilidades se obtienen en el medio de los ghettos y las menores utilidades se producen en
las fronteras, independientemente del valor de . Para = 0.5 (Panel B) las curvas de nivel de K y U resultan
ser muy semejantes. Los menores capitales y utilidades se concentran en las fronteras. Se trata de agentes que
no poseen recursos para buscar mejores ubicaciones aun cuando su utilidad es baja. Los m aximos de capital son
aislados y no se producen necesariamente en el medio de las zonas segregadas.
2.4.5 Dilema del Prisionero Espacial
Otro ejemplo de aut omata celular es el Dilema del Prisionero Espacial. Este juego fue propuesto en (Axelrod
1984), (Nowak and May 1992) y (Nowak, Bonhoeer, and May 1994), como un simple mecanismo por el cual la
cooperaci on tiene una posibilidad de sobrevivir frente a los free-riders.
Modelos economicos de m ultiples agentes 10/6/2010
26 CAP

ITULO 2. MODELOS COMPUTACIONALES


Figura 2.11: Evolucion del AC de Schelling con la dinamica del mercado
inmobiliario. Curvas de nivel de igual utilidad. El AC evoluciono hasta
alcanzar un estado asintotico. Los tres expermientos partieron de las
mismas condiciones inciales: K = 1 y iguales para todos los agentes,
ademas = 0.1 para el panel A = 0.5 para el panel B y = 0.9 en el
Panel C.
El juego tiene dos estrategias C (cooperaci on) y D (defecci on) y la matriz de premios especica el resul-
tado de cada interacci on. En este caso consideramos que cada agente est a ubicado en los nodos de una grilla
unidimensional y juega con un n umero deterinado de sus vecinos a la derecha y a la izquierda, acumulando los
premios obtenidos en cada interacci on. Una vez que todos los jugadores han jugado con sus vecinos todos deciden,
simult aneamente, cu al de las dos estrategias jugar an en la pr oxima iteraci on, para ello cada jugador selecciona
como su pr oxima movida, la estrategia de su vecino que haya obtenido m aximo premio. Esta regla hace cambiar
las estrategias en la red y la idea es estudiar que proporci on de agentes cooperadores hay en la red, como funci on
de la matriz de premios.
C D
C 1 0
D b 0.1
(2.7)
b corresponde al incentivo por no cooperar y debe ser mayor que 1. En el caso de una unica jugada, la opci on
racional es, precisamente, elegir D. Sin embargo cuando se pone en practica la regla explicada arriba, existe
la chance que cooperantes puedan sobrevivir para un b > 1 sufcientemente peque no y un n umero de vecinos
sucientemente grande. La idea es que los cooperantes puedenm sobrevivir si es que forman un grupo, de tal
modo que cualquier explotaci on realizada por los no-cooperantes en la frontera del grupo, siempre tenga un premio
menor que el obtenido por cooperar en el interior del grupo. Con estas condiciones los grupos sobreviven.
La red unidimensional tiene condiciones de contorno peri odicas. El modelo de arriba ha sido implementado
por el siguiente programa. Se preparan algunos vectores utiles que se nalan a los primeros y segundos vecinos a la
derecha y a la izquierda de modo de calcular muy r apidamente la estrategia de los vecinos.
function uout = pd(U0, b0)
close all;
global bpar;
step = 1;
rand(state,0);
N = length(U0);
bpar = b0; % payoff of D-C interaction
Modelos economicos de m ultiples agentes 10/6/2010
2.4. AUT

OMATAS CELULARES BIDIMENSIONALES 27


M = 50; % length of time axis
if N>M M=N; end;
% setup of initial condition
U = U0;
% setup of useful index arrays
il = mod((1:N)-2,N) + 1; % left neigh
il1 = mod((1:N)-3,N) + 1; % 2-left neigh
i0 = 1:N;
ir = mod((1:N),N) + 1; % right neigh
ir1 = mod((1:N)+1,N) + 1; % 2-right neigh
i3 = [2:M M]; % use to shift picture in time
titulo = [PD Game: N=, num2str(N)]; % title of main window
% setup of output image
out = zeros(M,N)-1;
out(1,:) = U;
film = imagesc(out,[-1 1]);
axis off; axis square; axis on;
title(titulo);
xlabel(x,fontsize,16);
ylabel(time,fontsize,16);
axis([0 N 0 N]);
epoch=2;
while epoch <= M,
epoch
for i=1:N
pay(i) = play_game(U(i),U(il(i))) + play_game(U(i),U(ir(i)));
pay(i) = pay(i) + play_game(U(i),U(il1(i))) + play_game(U(i),U(ir1(i)));
end
for i=1:N
ind = [il1(i),il(i),i,ir(i),ir1(i)];
[mm, look(i)] = max(pay([ind]));
end
look2 = mod(look-3-1+i0,N)+1;
U = U([look2]);
% plots output
if epoch<=M
out(epoch,:) = U;
else
out=out(i3,:);
out(M,:) = U;
end
if (mod(epoch,step)==0)
set(film,cdata,out);
drawnow
Modelos economicos de m ultiples agentes 10/6/2010
28 CAP

ITULO 2. MODELOS COMPUTACIONALES


end
epoch = epoch + 1;
end
uout = U;
function payoff = play_game(s1, s2)
global bpar
if s1 == 1
if s2 == 1
payoff=1.0;
else
payoff=0.0;
end
else
if s2 == 1
payoff=bpar;
else
payoff=0.1;
end
end
Este programa graca un arreglo bidimensional donde sucesivos renglones corresponden a pasos de
tiempo mientras que las posiciones a lo largo del eje horizontal se representa el estado de cada agente. La
simulaci on comienza en el primer rengl on y muestra debajo de el los pasos sucesivos. Despues de un n umero M de
pasos el gr aco se desplaza una la y acomoda en el ultimo rengl on la ultima iteraci on calculada. Para procesar
el modelo, s debe denir una condici on inicial en el vector U0. Una condici on inicial aleatoria podra ser:
u1 = round(rand(1,50));
mientras que una manera m as controlada podra consistir en probar
U0 = zeros(1,N); U0([1 2 3]) = 1;
Entonces se puede ejecutar el algoritmo por medio de uu = pd(U0,b) donde b=1.1 es el par ametro de pago.
Cunado el algoritmo naliza devuelve un vector con el estado del sistema ewn la ultima iteraci on, que puede ser
utilizado para procesar el modelo de nuevo.
Ejercicio 3 Estudie el dilema del prisionero espacial con b = 1.1.
i)?Que sucede con una condici on inicial con todos D excepto por tres agentes C contiguos?
ii) Estudie que sucede comenzando con 4 agentes C contiguos.
iii) Estudie que sucede comenzando con 3 C contiguos, luego un D y luego un C.
iv) Estudie que sucede comenzando con 5 agentes C contiguos.
Se podra concluir que para este par ametro b la cooperaci on domina los estados estacionarios para casi
todas las condiciones iniciales.
Ejercicio 4
i) Cambie a b = 1.5 y estudie lo que sucede con 4 y 5 agentes C contigos.
ii) Encuentre b < 1.5 tal que comenzando con 5 C contiguos, comienzan a expandirse a todo el sistema.
iii) Cual es la conclusi on para bs cercanos a 2?
Modelos economicos de m ultiples agentes 10/6/2010
Captulo 3
Modelos estadsticos
La lnea de pensamiento seguida en el desarrollo del captulo anterior fue establecer un nexo entre la capacidad
computacional de un agente (o celula) y las propiedades emergentes del conjunto. El presente captulo com-
plementa esa visi on explorando como el desorden de un sistema, est a vinculado en realidad con la informaci on
del mismo, y c omo a partir del conocimiento de las restricciones del sistema, se pueden conocer las propiedades
colectivas sintetizadas en distribuciones de probabilidad. Este enfoque, propio de la mec anica estadstica, per-
mite abordar el tratamiento de c omo las propiedades emergentes del conjunto pueden cambiar a medida que los
par ametros internos del sistema cambian. Aquellos sistemas sociales donde las interacciones sean preponderantes,
pueden evocar transiciones de fase como lo hacen los sistemas fsicos.
3.1 Introducci on
Una de las grandes sntesis de la fsica que se produjeron hacia el nal del siglo XIX y comienzos del XX fue
la conciliaci on de la termodin amica (desarrollanda desde comienzos del siglo XIX) y la mec anica de Newton
(proveniente del siglo XVII). Mientras la mec anica de Newton haba tenido un enorme exito en la comprensi on
del movimiento de los astros, la termodin amica lo haba tenido obteniendo relaciones (leyes) entre variables
macrosc opicas como temperatura, presi on, entropa o volumen
1
. Pero preguntas como que es la temperatura o
la presi on en terminos m as fundamentales, llev o a Bernoulli (fundador de la teora cinetica de gases), Maxwell,
Boltzmann, Gibbs y hasta el propio Einstein a formular una nueva teora conocida como mec anica estadstica,
donde se explicaba el comportamiento colectivo de una enorme cantidad de partculas individuales (del orden del
n umero de Avogrado N
A
= 6x10
23
) en condiciones de temperatura ambiente y presi on atmosferica
2
.
Dentro de los logros m as destacados de dicha sntesis, fue la interpretaci on microsc opica de
la temperatura en un gas corresponde a la energa cinetica promedio de las partculas:
3
2
kT =

E
c
, donde
k es la constante de Boltzmann,

E
c
es la energa cinetica promedio del sistema y la energa cinetica, por
ejemplo, de un gas monoat omico igual a E
c
=
mv
2
2
(con m igual a la masa del atomo y v su velocidad).
Para calcular el promedio es necesario conocer las velocidades individuales, y se vio experimentalmente
1
Notablemente la ley de los gases ideales es PV = N
A
kT, donde P es la presi on, V el volumen, T la temperatura
en grados Kelvin, k = 1.4x10
23
Joules/Kelvin y N
A
6x10
23
el n umero de Avogrado.
2
El exito del abordaje se debio en gran parte al hecho que se trataba de una enorme cantidad de partculas. Si
bien las colisiones entre ellas se supusieron enteramente prescriptas por las leyes de Newton, dentro de un globo
lleno de helio a temperatura ambiente, cada partcula individual viaja a 500 metros por segundo, y colisiona 1 vez
cada 600 picosegundos, o 1666 millones de veces por segundo! A nivel colectivo, esto hace irrelevante la direcci on a
la cual ambas partculas se despiden, dejando como variable relevante el m odulo de las velocidades. Esta es una de
las aproximaciones que emple o Maxwell en postular una distribuci on de velocidades de las partculas dependiente
del m odulo al cuadrado.
29
30 CAP

ITULO 3. MODELOS ESTAD

ISTICOS
que las mismas siguen una distribuci on de Maxwell-Boltzmann (es una distribuci on Normal en v). A una
misma temperatura, los atomos de hidr ogeno viajan 10 veces m as rapido que las de ne on, debido a su
diferencia de masas
3
.
la presi on se debe a las colisiones entre partculas de distinta velocidad, y no como crea Newton, que se
deba a la repulsi on est atica entre ellas.
el magnetismo: se pudo entender las propiedades b asicas de materiales magneticos como un fen omeno
colectivo, debido a la interacci on local (entre los vecinos) de los campos magneticos de los atomo indi-
viduales. En particular, se pudo explicar porque haba una fuerte dependencia de los materiales con la
temperatura. En este caso, a mayor temperatura se introduca mayor desorden en la orientaci on de los
campos magneticos individuales, modulando el fen omeno colectivo. Veremos en este captulo el modelo de
Ising, como modelo arquetipo de este fen omeno.
la entropa como una medida del desorden interno de un sistema. La entropa naci o en la termodinamica,
como una variable de estado que relaciona el transporte de calor a una determinada temperatura. Asi
mismo, la segunda ley de la termodin amica postula que la entropa de un sistema cerrado o se mantiene
constante o siempre aumenta, llevando a los sistemas a un estado de m aximo desorden. Uno de los logros
m as destacados de la mec anica estadstica es darle un signicado preciso a la entropa, como el grado de
desorden interno del sistema representado por la distribuci on de probabilidad sobre los estados posibles del
sistema.
En este captulo nos proponemos explorar un camino semejante en sistemas sociales o econ omicos. Es
una propuesta altamente riesgosa, aunque creemos que los vnculos y lecciones que podemos obtener lo justican.
Ya han habido acercamientos semejantes, por ejemplo en la teora de juegos (Blume 1993) y en los mercados
nancieros (Smith, Farmer, Gillemot, and Krishnamurthy 2002, Daniels, Farmer, Iori, and Smith 2003).
Por un lado, en el estudio de sistema sociales tambien surgen par ametros de naturaleza colectiva, como
por ejemplo, los que representan valores agregados de actividades econ omicas (producto bruto interno, ahorro,
inversi on), y otros que miden el desempe no del sistema econ omico en su conjunto (tasa de interes, los ndices
de precios o la productividad). Sabemos que dichos par ametros de alg un modo est an ligados al comportamiento
individual de los agentes (personas o rmas). Justamente, como carecemos de una teora an aloga a la mec anica
de Newton que nos indique como se mueven detalladamente los elementos individuales, es que proponemos en este
captulo formalizar modelos de m ultiples agentes a partir de comportamientos y conductas individuales plausibles,
y permitan caracterizar las variables colectivas.
Antes de comenzar, es importante resaltar las siguientes cuestiones para este captulo:
Uno de los elementos centrales de la mec anica estadstica fue el uso de las distribuciones de probabilidades
como vehculo que permite retener las caractersticas colectivas del observable, abstrayendose del detalle
de cada elemento individual. Dichas distribuciones contienen esencialmente informacion sobre frecuencia
de ocurrencia del observable en cuesti on y f acilmente permite obtener el valor medio y el tama no tpico
de las uctuaciones.
La noci on de equilibrio conocida y aplicada en los sistemas sociales puede tener un signicado diferente
de la utilizada en los modelos estadsticos, y conviene en este punto detenerse por un instante. Por un
lado la teora de juegos provee una noci on de equilibrio de Nash, an aloga a la de punto jo en sistemas
din amicos. La misma descansa en resolver una ecuaci on algebr aica, obteniendo un valor jo y constante.
En los modelos estadsticos, dicho equilibrio no es alcanzable frente al componente estoc astico que tiene
dichos sistemas. La noci on de equilibrio suele por lo general estar asociada al equilibrio termodin amico
donde las distribuciones de probabilidad de las cantidades relevantes son estacionarias (no cambian en el
tiempo) y por lo tanto hay un valor medio bien denido y constante. En muchos casos, llevando el sistema
a un n umero cada vez mayor de elementos (el limite termodin amico), suele acelerar su convergencia al
equilibrio termodin amico, haciendo que las distribuciones tengan una varianza cada vez menor.
El abordaje estadstico posee adem as el atractivo de estar en buenas condiciones para salvar, o al menos
anticipar o calicar, la cat astrofe de las multitudes a las que se hizo menci on en el Captulo 1. All se
3
Para una interesante simulaci on numerica de dos gases en un contenedor, y como es su distribuci on de
velocidades, visitar http://intro.chem.okstate.edu/1314F00/Laboratory/GLP.htm
Modelos economicos de m ultiples agentes 10/6/2010
3.2. ENTROP

IA, DESORDEN E INFORMACI

ON 31
enfatiz o que el mero agregado de elementos de la misma naturaleza puede dar lugar a sistemas que poseen
una nueva identidad. El grado de orden o de desorden interno que pueda alcanzar el sistema debe traslucirse
en densidades de probabilidad y los cambios abruptos en su estructura o naturaleza deben manifestarse
en comportamientos singulares de esas mismas distribuciones. Anticiparemos un ejemplo de estos cambios
abruptos en una transicion de fase.
Los punto jos en la evoluci on de un sistema as como los estados estacionarias suelen por su parte asimilarse
a situaciones de equilibrio. Existen diferencias importantes en el concepto de equilibrio propio de las ciencias de
la naturaleza y el que provienen de la economa. Mientras que el equilibrio econ omico tiende a ser concebido
como una situaci on est atica en que los agentes producen o consumen cantidades jas a precios constantes, el
equilibrio mec anico o termodin amico es compatible con uctuaciones o aun variaciones temporales que, de todos
modos, preservan constants los valores medios que denen el estado del sistema. El calculo de promedios est a por
consiguiente estrechamente ligado con el concepto y la denic on de equilibrio.
Las principales dicultades conceptuales para salvar la brecha que media entre los comportamientos in-
dividuales y los colectivos, o, lo que es equivalente, calcular valores medios en sistemas sociales son al menos
dos. Una es inherente a la complejidad de los actores elementales: mientras que en el estudio de la naturaleza
los atomos o moleculas obedecen leyes precisas y conocidas, en el caso de sistemas sociales, se trata de agentes
capaces de comportamientos elaborados y que raramente son repetitivos.
La segunda gran dicultad reside en el hecho que esos actores elementales son numerossimos en el caso
de la naturaleza donde la cantidad relevante es el n umero de Avogadro N
A
10
23
mientras que son muy pocos
en el caso de las ciencias sociales o la economa. Tengase presente que aun considerando la poblaci on mundial de
10
9
individuos se est a abrumadoramente lejos de la cantidad de partculas que hay en pocos gramos de gas.
Que las partculas sean muy numerosas hace que el calculo de promedios sea signicativo y que las uctuaciones
puedan en general ser despreciadas. Lo reducido del n umero de agentes en sistemas econ omicos puede bien hacer
que los promedios dejen de ser signicativos y las uctuaciones pasen a ser tan importantes que sean las que
efectivamente dominen.
En las secciones que siguen vamos a introducir la entropa como una medida del desorden. Luego se
introducir a el Principio de M axima Entropa que ofrece una receta sobre el tipo de distribuciones posibles seg un
las restricciones del problema. Discutimos a continuaci on dos problemas con motivaci on econ omica y un fuerte
sesgo estadstico: el primero corresponde a loteras bilaterales y se estudia una ecuaci on de evoluci on para la
distribuci on de probabilidades. El segundo es una extension de los intercambios de Edgeworth, pero repetitivos y
en una poblaci on de N jugadores. Finalmente, discutimos un modelo de los medios magneticos, que tiene posibles
aplicaciones en sistemas sociales donde se involucra una decisi on binaria, muchos jugadores e interacciones locales.
El mismo tiene como principal caracterstica una transicion de fase. Finalmente, se discute mas en general un
metodo de optimizaci on global conocido como recocido simulado.
3.2 Entropa, desorden e informacion
El concepto de entropa surgi o orginalmente en la termodin amica. Si bien era un concepto central, su inter-
pretaci on microsc opica se pudo dar gracias al surgimiento de la mec anica estadstica. La misma consista en
asociar la entropa de un sistema como una medida de desorden del sistema. Esta idea trascendi o la frontera de la
fsica y fue adoptado por Shannon para dar origen a la teora de la informaci on, interpretando la entropa como
una medida de informacion.
Comenzamos discutiendo como medir desorden en un sistema. Tomemos un automata celular (AC) con que
evoluciona de acuerdo con su regla de actualizaci on visitando en cada momento alguno de las 2
N
conguraciones
posibles. Podemos interpretar este sistema como un emisor de caracteres X
i
(las conguraciones de las N celdas)
de un alfabeto / de [/[ = 2
N
smbolos. Comparemos la situaci on (A) donde el AC alcanza un punto jo y la
secuencia de caracteres que se emiten contiene siempre un mismo smbolo, y (B) para un AC de Tipo III hemos
discutido que la secuencia de caracteres emitidos contendr a siempre smbolos diferentes y terminar a por agotar
toda la lista de los 2
N
smbolos del alfabeto.
Est a claro que la situaci on (B) es m as desordenada que la (A). Una primera medida de desorden, podra
ser por ejemplo hacerla proporcional a la cantidad de smbolos accesibles por la din amica. Para el caso (A) est a
Modelos economicos de m ultiples agentes 10/6/2010
32 CAP

ITULO 3. MODELOS ESTAD

ISTICOS
claro que la cantidad de smbolos es menor que el tama no del alfabeto, mientras que para el caso (B) si se itera
suciente tiempo, la cantidad de smbolos es igual al tama no del alfabeto. El desorden medido de esta forma fue
la base de la primera interpretaci on microsc opica de entropa dada por Boltzman, quien la deni o como
S(X) = log
X
(3.1)
donde
X
= [/[ es la cantidad de estados accesibles del sistema
4
. La entropa se mide en bits si el logaritmo es
base 2 y en nats en base 10. Si los mensajes transmitidos tienen = 2
N
posibles conguraciones, la entropa
m axima de Boltzman (es decir cantidad de estados accesibles) sera de N bits.
Porque la entropa es logartmica?
Las variables de estado en la termodin amica se clasican seg un sean intesivas
o extensivas. Se dice que la temperatura o presion son intensivas ya que son
independiente del tama no del sistema; mientras que las variables como volumen,
o entropa son extensivas porque son proporcionales al tama no del sistema.
Desde la termodin amica hay argumentos como para justicar que en general la
entropa debe ser extensible. En un marco general, a priori uno esperara que el
desorden sea una variable extensiva. Veremos m as adelante que hay sistemas con
fuertes correlaciones internas que al aumentar su su tama no, la entropa no se
comporta como extensiva.
Por lo tanto veamos que sucede si ponemos en contacto dos sistemas indepen-
dientes, o con correlaci on tan debil que rapidamente se anula en el tiempo. Si
uno de los sistemas emite smbolos X
i
, y el otro que emite smbolos Y
i
, el desor-
den conjunto o la entropa conjunta podra visitar
X

Y
estados, con lo que la
entropa conjunta queda
S(X, Y ) = log(
X

Y
) = log(
X
) + log(
Y
) = S(X) +S(Y ) (3.2)
Esta primera aproximaci on de medida del desorden o entropa como proporcional al n umero de estados
accesibles es, sin embargo, insuciente para distinguir el desorden entre dos sistemas que poseen la misma cantidad
de estados accesibles . Imaginemos, por caso, uno de los sistemas visita todos los estados accesibles con la
misma frecuencia, mientras que el otro sistema visita 100 veces m as frecuente una mitad de los smbolos que
la otra. Es evidente que el primer caso es m as desordenado que el segundo, y la manera de distinguirlos es
utilizando las probabilidades de ocurrencias de los smbolos: podes decir que un smbolo muy probable produce
poca sorpresa, mientras que lo contrario ocurre con aquellos smbolos poco probables. Por lo tanto si suponemos
que la sorpresa del smbolo X
i
es proporcional a log(1/P(X
i
)), Gibbs propuso como medida de entropa del
sistema al promedio de la sorpresa que aporta cada smbolo:
Denici on 7 (Entropa de Gibbs) Sea X una variable aleatoria discreta cuyas realizaciones X
i
pertenecen a
un alfabeto nito / y sea P(X
i
) la distribuci on de probabilidad de las mismas, P(X = X
i
) con X
i
/. La
entropa de la variable aleatoria X se dene como
S(X) =
X
i
P(X
i
) log(1/P(X
i
)) =
X
i
P(X
i
) log(P(X
i
)) (3.3)
Esta denicion se extiende al caso de variables continuas X con una medida (X) reemplazando la suma por una
integral
S(X) =
Z
A
P(X) log(P(X))d(X) (3.4)
4
La expresion (3.1) est a grabada en su l apida por considerarla su m aximo descubrimiento.
Modelos economicos de m ultiples agentes 10/6/2010
3.2. ENTROP

IA, DESORDEN E INFORMACI

ON 33
Esta nueva denici on tiene en cuenta la frecuencia de ocurrencia, por lo que medir a el desorden contemp-
lando n umero de estados accesibles, pero tambien su importancia relativa en el curso del tiempo. Se ve que puede
haber smbolos del alfabeto de muy baja probabilidad, pero con un gran n umero, con lo que puede dominar la
entropa del sistema.
Veamos los siguientes ejemplos:
Se un sistema donde la frecuencias de ocurrencia de cada smbolo X
i
es equiprobable, P(X
i
) = 1/
X
, la
entropa de Gibbs (3.3) coincide con la denici on de Boltzman (3.1).
el valor de la entropa es m axima, cuando la distribuci on P es equiprobable o uniforme (ver ejemplo 3.3).
Si uno de los smbolos tiene probabilidad cero, este no contribuye a la entropa de Gibbs (aqu nuevamente
se ve la diferencia entre la entropa de Gibbs y de Boltzman).
Una memoria de 4 bits, tiene = 2
4
conguraciones, y si cada sbolo es equiprobable, la entropa de
Gibbs es S = log
2
2
4
= 4 bits. Supongamos que agregamos una nueva memoria de 3 bits. Si asumimos
independencia de las conguraciones de este subsistema con el original, la nueva entropa ser a de 7 bits,
ya que

= 2
4
2
3
= 2
7
.
el ADN de nuestras celulas se puede ver como una cadena de 10
10
pares de bases. Los pares de bases puede
ser: C-G,T-A,G-C,A-T, es decir 4 smbolos. La molecula puede estar por lo tanto en uno de los = 4
10
10
conguraciones, con lo que el contenido de informaci on (suponiendo independencia de la ocurrencia de
pares de bases) es S = 2
10
10
bits.
Porque la sorpresa es logaritmica?
Nuevamente veamos como la propiedad de los logaritmos y el concepto de inde-
pendencia de probabilidad motivan su uso en la denici on de sorpresa. Sabemos
que la probabilidad conjunta de dos variables aleatorias independientes x X e
y Y es factorizable (separable) en el producto de cada una,
P(x, y) = P(x)P(y) (3.5)
Nos gustara por otra parte que la medida del contenido de informaci on sea adi-
tiva, es decir que si tengo la medida de informaci on de x, y quiero agregarle
los eventos y, la medida de informaci on de x e y sea la suma. Vemos que si
calculamos la entropa de x e y:
S(x, y) = log
1
P(x, y)
= log
1
P(x)P(y)
= log
1
P(x)
+ log
1
P(y)
= S(x) +S(y) (3.6)
para variables aleatorias x e y independientes.
Verique que el mismo resultado aplica para S(X, Y ) =
P
P(X, Y ) log
1
P(X,Y )
.
Ejercicio 5 Programar un AC de cada una de las clases introducidas en el captulo 2. Permitir que evolucionen
hasta obtener una muestra representativa de los estados a los que convergen y poder asignarles una probabilidad.
Calcular numericamente la entropa asociado a cada uno.
La denci on dada arriba posee un ambito de validez mucho mayor que el originalmente pensado por
Gibbs. De hecho Shannon (1948) y Khinchin (1949) buscaron expresiones de la entropa con el requisito de
cumplir exigencias de naturaleza muy general, tales como que sea m axima cuando todas las realizaciones poseen
Modelos economicos de m ultiples agentes 10/6/2010
34 CAP

ITULO 3. MODELOS ESTAD

ISTICOS
la misma probabilidad, o que la inclusi on de una realizaci on de probabilidad nula no cambie su valor. En esas
condiciones demostraron que la expresi on de Gibbs es la unica que las satisface.
Distribuci on de ingreso y entropa en economa
La denic on dada arriba se utiliza en el campo economico, para caracterizar
distribuciones de ingreso o de alguna otra caracterstica. Si Y
i
es un segmento en la
distribuci on del ingreso, es posible denir la probabilidad P(Y
i
) que un habitante
seleccionado al azar de una dada poblaci on tenga un ingreso comprendido en ese
intervalo. En ese caso, la entropa S(Y ) da una idea sobre la distribuci on del
ingreso en esa poblaci on.
Ver Silva and Yakovenko (2004) para un estudio sobre la distribuci on del ingreso
en USA.
Ejercicio 6 (Entropa y distribuci on de ingreso) Discuta los siguientes
ejemplos:
El 5% de la poblaci on es analfabeta, el 70% tiene educaci on primaria, el
15% secundaria el 8% terciaria y el 2% cuaternaria. Cu al es la entropa
de la educaci on de esta sociedad?
Cual es la entropa de una distribucion del ingreso muy pareja?
Si la probabilidad de tener un ingreso y es P(y) = e
y
/A Cu al es la
entropa de la distribuci on de ingreso?
Cual es la entropa asociada a una distribuci on del ingreso que sea log-
normal?
3.3 Principio de maxima entropa
De acuerdo con la denici on de entropa de Gibbs si se pueden enumerar los estados X
i
de un sistema y se conoce
su probabilidad, o es posible hacer alguna hipotesis plausible acerca de la misma, se puede calcular la entropa
del mismo. Aqui nos vamos a ocupar de la pregunta inversa, esto es, dada alguna suposici on general sobre la
entropa, se puede obtener cu al es la distribuci on de probabilidad de una variable aleatoria X cuyas realizaciones
pueden observarse? Observese que en una multitud de casos pr acticos simplemente se supone que la variable
aleatoria cuyas realizaciones se observan obedece a una distribuci on normal y se estiman medias y varianzas como
si ese fuera efectivamente el caso. Sin embargo esta hip otesis puede ser falsa como efectivamente veremos en varios
ejemplos mas adelante.
Conocer la distribuci on de probabilidad de una variable aleatoria X permite calcular lo que se ha propuesto
desde el comienzo de este captulo, esto es, valores medios de cualquier magnitud H que sea funci on de X:
H) =
X
i
P(X
i
)H(X
i
) (3.7)
(NOTA: Observese que en la denici on de entropa se recalc o que se trata de la informaci on aportada por un
mensaje con un gran n umero de realizaciones X
i
de la variable aleatoria X. Esto indica que lo que se busca es el
valor medio de la sorpresa al observar una realizacion, o sea S(X) = log(P(X))).)
Una manera m as correcta de formular la pregunta anterior es Cu al es la distribucion de probabilidad que
s olo contiene la informaci on que se posee y que no tiene ning un otro sesgo? En respuesta a esta pregunta Jaynes
(1957) formul o el principio de m axima entropa
5
:
5
Notar Jaynes logro reescribir la mec anica estadstica a partir de este principio.
Modelos economicos de m ultiples agentes 10/6/2010
3.3. PRINCIPIO DE M

AXIMA ENTROP

IA 35
Denici on 8 (Principio de Jaynes o de maxima entropa) De todas las distribuciones de probabilidad que
son compatibles con los vnculos que operan en un sistema, la densidad de probabilidad que no contiene ning un
otro sesgo es la que maximiza la entropa.
Es util comprobar las consecuencias de este principio cuando se lo aplica a un caso en que s olo se sabe que
el sistema posee N estados y no existe vnculo adicional alguno.
Ejemplo (Maximizaci on de la entropa sin vnculos). Se trata pues que determinar P(X
i
) para i = 1, . . . N
maximizando
S(X) =
X
i=1...N
P(X
i
) log(P(X
i
)) sujeto a
X
i=1...N
P(X
i
) = 1 (3.8)
Para ello se introduce un multiplicador de Lagrange y se calcula el extremo de S +(
P
i
P(X
i
) 1). Se
obtiene:
[S +(
X
i=1...N
P(X
i
) 1)] =
X
i=1...N
P(X
i
)[log(P(X
i
) 1 +] = 0 (3.9)
con lo que log(P(X
i
)) es una constante. Una vez normalizada resulta que
P(X
i
) =
1
N
(3.10)
resultando la distribuci on uniforme.
En otras palabras, si no se imponen vnculos de ninguna naturaleza sobre el sistema, la distribuci on
resultante es la uniforme, que claramente no tiene ning un sesgo.
3.3.1 Distribuciones debidas a un vnculo
Consideremos ahora un caso en que existen vnculos impuestos al sistema debido a los cuales algunos de los
estados son inaccesibles. Dicha inaccesibilidad se puede deber a que sobre el sistema operan restricciones sobre
alguna de sus variables. Veremos a continuaci on dos ejemplos junto a sus respectivas distribuciones: cuando una
variable de interes es constante, y otra cuando el promedio de dicha variable es constante.
Para esto es util considerar las siguientes deniciones.
Denici on 9 (Microestado. Espacio de fases) Un microestado de un sistema es una conguraci on posible
del mismo y queda especicado por el estado de cada una de sus componentes. El conjunto de todos los microestados
de un sistema conguran su espacio de fases
Ejemplos:
gas de moleculas: el microestado estara especicado por las posiciones y velocidades de todas las
moleculas que lo componen.
comunidad de N individuos que interact uan econ omicamente: un microestado podra quedar
denido por una lista con los bienes de todos ellos.
Automata Celular: un microestado es una palabra de N bits y el espacio e fases del mismo son todas
las 2
N
conguraciones posibles de las N celdas.
Por lo general, la virtual imposibilidad de conocer todos los microestados de un sistema induce a consider-
arlos descriptos por una variable aleatoria X. En los ejemplos anteriores, X es necesariamente un vector de una
cantidad muy elevada de dimensiones.
Es importante tener en cuenta que el espacio de las fases abarca la totalidad de los microestados posibles.
Importa s olo que sean posibles y por el momento, no se tiene en cuenta cu ales de ellos son probables. En su
evoluci on, un sistema puede pasar de un microestado a otro. La existencia de vnculos puede bien imponer
Modelos economicos de m ultiples agentes 10/6/2010
36 CAP

ITULO 3. MODELOS ESTAD

ISTICOS
restricciones en este proceso evolutivo haciendo que algunas regiones del espacio de las fases sean accesibles y
otras inaccesibles y ocurran con una probabilidad nula.
El vnculo m as sencillo que se puede imponer a los microestados es que alguna magnitud tenga el mismo
valor para todos. En el ejemplo de una comunidad en el que los microestados se describen por las tenencias de
dinero de cada agente, puede imponerse que todos los microestados tengan la misma suma M de dichas tenencias.
En un sistema mec anico esa magnitud constante para todos los microestados puede ser la energa E que, al igual
que M es expresable como alguna funci on de las coordenadas y velocidades de las partculas del sistema.
La pregunta que ahora nos formulamos es cu al es la probabilidad con que ocurren todos los microestados
con la misma cantidad de dinero M o la misma energa E. La respuesta es en realidad un caso particular de
la situaci on que ya hemos analizado. Si se llama E(X) a la magnitud que se debe ser igual para todos los
microestados este problema consiste en determinar P(X
i
) para i = 1, 2 . . . N maximizando
S(X) =
X
i=1...N
P(X
i
) log(P(X
i
)) (3.11)
sujeta a dos condiciones:
X
i=1...N
P(X
i
) = 1
E(X
i
) = E = constante
Si N(E) es el n umero de estados internos que satisfacen la segunda condici on, resulta que
P(X
i
) = 1/N(E) si E(X
i
) = E (3.12)
= 0 en cualquier otro caso (3.13)
O sea que resultan equiprobables todos los microestados del sistema que satisfacen la condici on E(X
i
) = E
jada de antemano mientras que todos los dem as tienen probabilidad nula de ocurrir. Si se substituye estas
probabilidades en la denicion (3.3), la entropa de Gibbs resulta:
S = log[N(E)] (3.14)
que es la misma (3.1) y corresponde a la cantidad de estados accesibles y se la suele mencionar como el volumen
accesible del espacio de las fases.
En general, el sistema evoluciona en el tiempo visitando distintos microestados. En el caso de una comu-
nidad de agentes, que pueden hacer transacciones transriendo dinero entre ellos, lo que cede uno lo recibe el
otro, con lo que la masa total M de dinero se mantiene constante. Algo an alogo sucede en un sistema fsico como
un gas en que las moleculas colisionan entre si cambiando sus energas individuales pero manteniendo constante
la suma de ambas. Otro ejemplo que vale la pena considerar es un AC. Puede suponerse que la magnitud E
que debe ser constante es funci on de los n umeros N
1
y N
0
que indican respectivamente cu antas celdas est an en
los estados 1 y 0. Si el AC bajo consideraci on es estoc astico como se muestra en uno de los paneles de la gura
2.2, puede bien suceder que E s olo se mantenga constante en valores medios ya que ambas cantidades N
1
y N
0
cambian con cierta probabilidad.
La porcion del espacio de las fases que corresponde, por ejemplo, a mantener M constante alberga con todo
una gran diversidad de estados. Piensese que esa condici on es compatible con que los agentes puedan distribuirse
esa cantidad de muchas maneras posibles. Lo mismo sucede con las moleculas de un gas: jar la energa es
compatible con que unas pocas moleculas se desplacen a gran velocidad y las restantes esten en reposo o que
todas se muevan a una misma velocidad intermedia. Visto desde el punto de vista de una de las partculas del gas
o desde uno de los miembros de la comunidad economica cada transacci on o cada colisi on altera el valor individual
de E. El total no cambia pero los valores para cada una de las partes que interact uan uct ua. Como tanto las
colisiones como las transacciones tienen lugar al azar estamos inducidos a analzar el problema de determinar las
probabilidades con que ocurren microestados con todos los distintos valores posibles de la variable que suponemos
constante.
Modelos economicos de m ultiples agentes 10/6/2010
3.3. PRINCIPIO DE M

AXIMA ENTROP

IA 37
En el caso de un sistema mec anico se trata de la probabilidad de ocurrencia de microestados con distinta
energa. Las energas individuales uct uan porque por lo general se supone que el sistema est a en contacto con una
fuente externa que le puede aportar o quitar energa manteniedo constante el valor medio de la misma. Enseguida
veremos que la causa de dichas uctuaciones es el aporte termico de un ba no (fuente externa) en el que se supone
inmerso el sistema.
El caso de agente econ omicos es diferente ya que la probabilidad de ocurrencia de un microestado que
corresponde a la suma M de tenencias de dinero |m
i
puede expresarse como el producto de las probabilidades
de las tenencias aisladas, o sea P(M) = P(
P
m
i
) =
Q
P(m
i
) con lo que el problema se reduce a obtener las
probabilidades P(m) de ocurrencia de agentes con una dada cantidad de dinero m.
A pesar de estas diferencias, tanto la energa E
i
de los microestados de un sistema fsico como la tenencia
m de dinero de agentes individuales son soluciones del problema de maximizar la entropa de Gibbs
S(X) =
X
i=1...N
P(X
i
) log(P(X
i
)) (3.15)
sujeta a dos condiciones. Una es la normalizaci on de las probabilidades pero la otra corresponde a la conservaci on
del valor medio de una cantidad E
i
o m
i
:
X
i=1...N
P(X
i
) = 1 (3.16)
X
i
P(X
i
)E(X
i
) E) = E (3.17)
En este caso es necesario introducir dos multiplicadores de Lagrange, uno por cada uno de los dos vnculos con lo
que queda:
P(X
i
) =
e
E(X
i
)
Z

(3.18)
Z

=
X
i
e
E(X
i
)
(3.19)
Estas ecuaciones sugieren que es poco probable que cualquier medici on que se efect ue sobre el sistema permita
observarlo en un estado con una E
i
(m
i
) elevada, mientras que es en cambio exponencialmente m as probable que
se lo detecte en un estado baja E
i
(m
i
).
La ecuaci on (3.18) recibe el nombre de distribuci on de Gibbs mientras que la funci on (3.19) que asegura que
la distribuci on de probabilidad P(X
i
) est a correctamente normalizada, recibe el nombre de funci on de partici on.
Al igual que con la entropa, estas distribuciones han probado tener vastsimas aplicaciones y muchas veces, aun
cuando no existan demostraciones rigurosas, se las supone v alidas en contextos muy diversos.
En termodin amica, el multiplicador de Lagrange que se introduce en relaci on con el segundo de los
vnculos mencionados arriba, es la inversa de la temperatura y determina una escala para las energas (o de
cualquier otra variable que se supone que est a conservada en valor medio) en esa distribuci on de probabilidad.
Para convertir las escalas de grados (para T) a dimensiones propias de una energa se suele introducir la
constante de Boltzmann k y escribir:
=
1
kT
(3.20)
La constante k no es de importancia en el presente contexto y en general ser a ignorada. Es en cambio importante
la interpretaci on estadstica de T sobre lo que volveremos en una secci on posterior. Por lo general este par ametro
se asocia con el nivel de quietud o agitaci on interna de un sistema: para muy baja temperatura, s olo son
signicativamente probables unos pocos estados de mnima energa. Para temperatura elevada sucede en cambio
que todos los estados internos del sistema tiene una probabilidad signicativa de ser observados. Se puede
suponer que cuando T es elevada, el sistema visita (puede ser observado) con probabilidad comparable tanto
en microestados de baja como de alta energa mientras que si T 0 el sistema s olo se lo observar a en su estado
de mnima energa.
Si bien es cotidiano escuchar hablar sobre una economa recalentada o sobre enfriar la economa no
es sencillo hacer una correspondencia rigurosa del concepto de temperatura a sistemas sociales. Algo se insin ua
Modelos economicos de m ultiples agentes 10/6/2010
38 CAP

ITULO 3. MODELOS ESTAD

ISTICOS
en el ejemplo que se trata en la pr oxima secci on. De la explicacion dada arriba surje que debera existir una
temperatura asociada a cada variable conservada en un sistema econ omico. Si se restringe este concepto a la
masa de dinero, un sistema caliente sera uno en el que el dinero est a distribudo de manera uniforme entre
todos los agentes. Una economa fra es en cambio una en la que el dinero s olo est a concentrado en una fracci on
reducidad de los agentes.
3.3.2 Loteras bilaterales y la distribuci on de Gibbs
Como primer ejemplo de economa estadstica y que es lo que pueden hacer muchos jugadores en interacci on,
seguimos lo propuesto por (Dragalescu 2003) y ya discutido en los ejemplos arriba. Consideremos un sistema
compuesto por N jugadores comprometidos en una lotera donde iterativamente se sortea un par de agentes y se
decide, al azar, quien de ellos gana una cantidad m, y quien pierde una cantidad igual.
[m
i
, m
j
] [m

i
, m

j
] [m
i
m, m
j
+m] (3.21)
donde m
j
corresponde a la cantidad de dinero que tiene el jugador j, y m

j
es el dinero de j luego de la apuesta.
En caso que el agente que pierde no pueda afrontar el pago de m, la jugada queda cancelada.
Siguiendo con la analogua de mec anica newtoniana, cada sorteo es equivalente a la colisi on de dos moleculas
en un gas: la cantidad de dinero de ambos jugadores antes y despues del sorteo es la misma (m
1
+m
2
= m

1
+m

2
),
asi como lo es la energa total antes y despues de la colision (principio de la conservaci on de la energa). Se desea
averiguar cu al es la probabilidad de ocurrencia de agentes con una tenencia de dinero m que resulte estacionaria
frente ese tipo de transacciones. Claramente, este problema se encuadra en la aplicaci on del principio de Jaynes
que acabamos de enunciar y resolver en la secci on anterior, o sea
max
{m
i
}
|
X
[P(m
i
) log(P(m
i
))] sujeto a
X
P(m
i
) = 1 y
X
m
i
P(m
i
) = M
En realidad, la propiedad ya se nalada de la factorizaci on de la probabilidad permite adelantar que la unica
forma funcional que la satisface es P(m) = Ae
m
que corresponde a la distribuci on de Gibbs. Es interesante
observar que el papel de la temperatura est a desempe nado por la cantidad promedio de dinero por agente
= 1/T = N/M = 1/m
ini
, donde m
ini
es la dotaci on inicial por jugador.
Ecuaci on maestra. En esta secci on examinaremos en mayor detalle c omo es el proceso por el que se llega
a una distribuci on de probabilidades estacionaria en este problema y el correspondiente valor de la entropa.
Para ello supondemos que en el estado inicial todos los agentes comienzan con una cantidad de dinero
m
i
= m

, i y que los intercambios son m = 1 constante. Denamos la distribuci on de m en el instante t


como P(m, t); en realidad, dependiendo de m

se tendr a un conjunto nito de valores de tenencias m para todos


los jugadores. Al iterar la lotera muchas veces, se espera que la distribuci on asint otica llegue a una situaci on
estacionaria.
Si en cada paso de tiempo se eligen dos jugadores al azar y juegan esta lotera, la ecuaci on de evoluci on
para P(m, t) queda:
P(m, t)
t
= P(m1, t)
X
j=1
P(j, t) +P(m+ 1, t)
X
j=0
P(j, t)
P(m, t)
X
j=1
P(j, t) P(m, t)
X
j=0
P(j, t) (3.22)
para m > 0, y otra similar para el caso especial m = 0. Los primeros dos terminos corresponden al cambio de
P(m, t) debido a que los agentes de m1 ganan m = 1 (jugando contra jugadores de m = 1..N que pierden
m = 1), y aquellos que tienen m+1 pierden m = 1 (jugando contra jugadores que tienen m = 0..N y ganan
Modelos economicos de m ultiples agentes 10/6/2010
3.3. PRINCIPIO DE M

AXIMA ENTROP

IA 39
m = 1), respectivamente. Los ultimos dos terminos corresponden a los agentes que tenan m y pierden o ganan
m respectivamente. Con la condicion de normalizaci on
P

j=0
P(m) = 1, podemos reescribir:
P(m, t)
t
= P(m1, t)(1 P(0, t)) +P(m+ 1, t) P(m, t)(1 P(0, t)) P(m, t)
= [P(m1, t) +P(m+ 1, t) 2P(m, t)]
+P(0, t)[P(m, t) P(m1, t)] (3.23)
para m > 0
6
. Esta ecuaci on se denomina ecuaci on maestra de la evolucion de la distribuci on de probabilidad.
Los primeros 3 terminos de (3.23) corresponden a un proceso de difusi on de P(m, t). La difusi on es un
proceso fsico cotidiano, y describe muchas veces el esparcimiento en forma homogenea de materia o energa. Un
ejemplo es el calor, representada por la ecuacion del calor
t
u(x, t) =
xx
u(x, t). Si se discretiza el espacio, el
calor en u(x, t) pasa a estar posiciones discretas . . . , x 1, x, x + 1 . . . y la ecuaci on se puede reescribir como la
evoluci on de diferencias nitas
u
t
= u
x+1
+ u
x1
2u
x
, por lo que corresponde en (3.23) a una difusi on por el
espacio de las tenencias monetarias m.
Inicialmente todo el m est a por partes iguales en todos los agentes, por lo que P
0
(t = 0) = P
1
(t = 0) = 0.
Mientras esto se mantenga, P
0
se mantiene constante, y la evoluci on de P(m, t) corresponde a un proceso difusivo:
aleatoriamente algunos jugadores pasan a ganar en promedio m as sorteos, con lo que van a formar parte de la
cola ganadora de P(m, t), mientras que otros jugadores, en promedio, pierden y contribuyen a la agrandar la
cola perdedora de la distribuci on. Si se graca P(m, t) en este punto, se observara una campana alrededor de
m

=
P
mP(m, t) que se ensancha a medida que pasa el tiempo, es decir difunde.
En alg un momento, comienzan haber jugadores que quedan en banca rota, por lo que P(0, t) > 0, con lo
que el segundo termino de (3.23) comienza a tener un efecto m as visible. Continuando la analoga con la ecuaci on
del calor, la discretizaci on espacial de un termino de gradiente
x
u (normalmente asociado a efectos de transporte
seg un x) corresponde a u
x
u
x1
, mientras que la importancia relativa de este termino con respecto a la difusi on
estara gobernado por un parametro de velocidad, en este caso asociado a P(0, t). Es decir, si se visualiza a P(m, t)
como funci on de m como una campana con P(0, t) > 0, la cantidad de jugadores con m correspondiente a la cola
de los perdedores en P(m, t) tiende a aumentar (P(m, t) P(m 1, t) > 0), mientras que aquellos que tengan
m del lado ganador tienden a disminuir (porque P(m, t) P(m 1, t) < 0). Como la difusi on sigue operando,
la campana se deforma con m

disminuyendo, aumentando P(0, t) y la consiguiente velocidad de transporte. La


deformaci on asint otica es tal que la campana inicial tiende a una funcion exponencial!
Modelo computacional. Podemos simular numericamente el proceso de loteras mediante el siguiente
c odigo:
function [m g hx s] = gibbs(m_ini, N, tim_total)
m_step = 1; % dinero inercambiado en cada interaccion
m = m_ini*ones(1,N); % dinero inicial para todos los agentes
out_steps = N;
num_bins = 50;
6
Para m = 0 suponemos una condici on de contorno
m
P(m, t)[
m=0
= 0, o equivalentemente para m discretos,
P(1, t) = P(1, t). Para m = 0 tenemos,
P(0, t)
t
= 2[P(1, t) P(0, t)] +P(0, t)[P(0, t) P(1, t)]
= [2 P(0, t)][P(1, t) P(0, t)]
Como al inicio P(0, t) = P(1, t) = 0, se espera que cuando P(1, t) aumente, P(0, t) tambien lo haga hasta tanto
P(0, t) P(1, t), equilibr] andose ambos puntos. Est a claro que una vez que sucede esto, la unica manera que
P(0, t) puede decrecer es si P(0, t) crece m as rapido que P(1, t). Con esto concluimos que P(0, t) crece solo cuando
P(1, t) lo hace.
Modelos economicos de m ultiples agentes 10/6/2010
40 CAP

ITULO 3. MODELOS ESTAD

ISTICOS
s = [];
tim = 0;
while tim < N*tim_total,
coin = randint(1,2,[1 N]);
up = coin(1);
down = coin(2);
dm = m_step*rand(1,1);
% encuentra los intercambios prohibidos
if m(down) < dm,
continue
end
up = randperm(N);
down = randperm(N);
dm = m_step*rand(1,N);
m(up) = m(up) + dm;
m(down) = m(down) - dm;
if mod(tim, out_steps) == 0,
[tim, sum(m)]
% calcula la entropia en esta etapa
[h, hx] = hist(m, num_bins);
p = h/sum(h);
xx = find(p > 0);
s = [s; tim, -sum(p(xx).*log(p(xx)))];
end
tim = tim + 1;
end
% distribucion de probabilidades normalizada
[h, hx] = hist(m, num_bins);
p = h/sum(h);
% Distribucion de Gibbs con exponente 1/m_ini
g = exp(-hx/m_ini)/sum(exp(-hx/m_ini));
figure(1)
title(Comparacion entre el proceso aleatorio de la loter\{\i}a y
la distribucion de Gibbs);
subplot(2, 1, 1)
plot(hx, p,r+, hx, g,b)
xlabel(m); ylabel(p(m));
legend(p(x), gibbs);
subplot(2,1,2)
plot(s(:,1), s(:,2), b)
xlabel(t); ylabel(s);
end
Modelos economicos de m ultiples agentes 10/6/2010
3.3. PRINCIPIO DE M

AXIMA ENTROP

IA 41
Figura 3.1: (arriba) Distribucion de m para una lotera de intercambios.
Se superpone la funcion e
m/m

e
m/m

. (Abajo) Serie temporal de la


entropa s(t) = p
m
log p
m
. Parametros N = 500, m

= 10.
Inicialmente todos los jugadores comienzan con m
ini
. En cada paso del tiempo se eligen un par de agentes,
donde el up va a ganar y el down va a perder. Luego denimos la cantidad intercambiada como una variable
aleatoria entre 0 y m
step
. Realizamos los intercambios, para aquellos pares de jugadores donde el perdedor
pueda afrontar su perdida. Al cabo de out steps realizamos un histograma y calculamos la entropa en ese
momento. Al nalizar la simulaci on, se muestra la distribuci on P(m) realizada comparada con la distribuci on
esperada exponencial con exponente 1/m
ini
. En la g. 3.1 se muestran los resultados para N = 500 jugadores. Se
ve que la distribuci on asint otica de m converge a la distribuci on de Gibbs, mientras que la entropa, que comienza
en un valor cercano a cero, aumenta y se mantiene relativamente estable alrededor de 3.
Ejercicio 7 Que sucede si elimina la restricci on de no aceptar loteras que resultaran en la bancarota de un
jugador? A que distribucion se llega?
Ejercicio 8 Que espera que suceda si comienza con una distribuci on donde no todos los jugadores tienen la
misma dotacion inicial?
3.3.3 Intercambios bilaterales entre muchos jugadores
Un ejemplo similar, aunque mucho mas interesante desde el punto de vista de la economa, es el analisis de los
intercambios bilaterales de Edgeworth entre dos bienes |x, y en una poblaci on de N jugadores. Supongamos
que cada agente tiene un vector de existencias X
i
= (x
i
, y
i
), una funci on de preferencia sobre cada bien Cobb-
Douglas tipo u(X) = u(x, y) = log(x) + log(y) donde + = 1, y en cada iteraci on se eligen un par de
jugadores al azar que tienen la posibilidad de realizar un intercambio siempre y cuando mejoren o igualen las
utilidades de ambos jugadores. Nuevamente tenemos un problema donde existe una restricci on operativa, y los
interacambios realizados aseguran que se conserva la cantidad total de cada uno de los bienes, por lo que se espera
una distribucion de Gibbs para la distribuci on de cada uno de los bienes.
Modelos economicos de m ultiples agentes 10/6/2010
42 CAP

ITULO 3. MODELOS ESTAD

ISTICOS
Veamos con m as detalle el juego propuesto. El cambio de utilidad sufrido por un jugador que le ofrecen
intercambiar cantidades x y y de cada producto afectan su utilidad en
u =

x
x +

y
y (3.24)
Como el jugador acepta intercambios solo si u 0, para intercambiar una unidad del bien x tiene dos posibilidades
seg un las cantidades ofrecidas o demandas del bien y:
[Compra y, vende x]: acepta intercambios solo si recibe y
/x
/y
p
y
a cambio de vender una unidad
de x (x = 1)
[Vende y, compra x]: acepta intercambios donde paga y
/x
/y
p
y
a cambio de comprar una unidad
de x (x = +1)
En otras palabras, p
y
corresponde al precio (medido en unidades del bien y) de intercambiar cada unidad de x.
Figura 3.2: Distribucion de m para intercambios bilaterales tipo Edge-
worth para cada uno de los bienes luego de 1500 pasos de tiempo.
Se superpone la funcion f(x) = e
2x/x
ini
/

e
2x/x
ini
. Parametros
N = 5000, x
ini
= 5, = 0.4, = 0.6.
Supongamos que todos los agentes tienen el mismo y . En cada paso del tiempo se generan dos vectores
|
1,2
con permutaciones al azar del vector (1, 2, .., N). Esto dene los pares de intercambio que se van a intentar
en dicho paso del tiempo. Como cada jugador aparece una vez en cada vector
1,2
, efectivamente los jugadores
pueden realizar 2 transacciones por paso de tiempo. Sean los jugadores (A, B) = (
1i
,
2i
) que computan sus
respectivos precios p
y
(A), p
y
(B). Por lo visto anteriormente, si p
y
(A) > p
y
(B) para que ambos mejoren su
utilidad (u
A
> 0 y u
B
> 0), implica que B compra de A bien y por una unidad de bien x. La cantidad del
bien y intercambiada ser a y (p
y
(A), p
y
(B)). Para simplicar, tomemos el precio realizado p como el promedio
p = (p
y
(A) +p
y
(B))/2 y si las existencias lo permiten, se intercambian una unidad del bien x por p del bien y:
X
A
(t + 1) = (x
A
+ 1, x
B
p)
X
B
(t + 1) = (x
B
1, x
B
+p)
Modelos economicos de m ultiples agentes 10/6/2010
3.3. PRINCIPIO DE M

AXIMA ENTROP

IA 43
Figura 3.3: (arriba) Serie temporal de la entropa s(t) = P
x
log P
x
del bien x. (abajo) Precio promedio de intercambios para cada paso de
tiempo. Parametros N = 5000, x
ini
= 5, = 0.4, = 0.6.
Modelos economicos de m ultiples agentes 10/6/2010
44 CAP

ITULO 3. MODELOS ESTAD

ISTICOS
Realizamos experimentos numericos para vericar que tipo de distribucion se llega asint oticamente sigu-
iendo el proceso descripto arriba. La g. 3.2 muestra la distribuci on de unidades del bien x, e y en toda la
poblacion de jugadores luego de 1500 pasos de tiempo (y 3000 intentos de intercambio), habiendo partido de una
condici on inicial de existencias donde cada jugador tiene un n umero aleatorio entre [0, x
ini
] para cada bien. Clara-
mente el proceso va convergiendo a una distribuci on de Gibbs, con par ametro de escala x
ini
/2 que es justamente
el promedio de existencias para cada bien de la poblaci on.
En la g. 3.3 se muestra como vara la entropa del sistema a lo largo del tiempo, junto con el precio
promedio de intercambio realizado en cada iteracion. Se observa que la entropa crece y llega a un maximo,
mientras que el precio promedio del sistema uct ua fuertemente. Los precios se disparan cuando alguno de los p
y
del intercambio diverge, y esto ocurre cuando la existencia del bien x es mnima.
3.4 La hipotesis ergodica
La idea que un sistema puede visitar una cantidad de sus microestados preservando el valor medio de alguna
cantidad como lo suponemos en la (3.17), est a directamente ligada al concepto de equilibrio tal como se anticip o
en las introducci on de este captulo.
En los sistemas fsicos que mencionamos en la secci on anterior, para asegurar que la energa promedio sea
constante, se supone que el gas est a en contacto con una fuente externa (un ba no termico) que al ser tanto m as
grande que el sistema en cuesti on, el contacto con el mismo lo afecta de modo despreciable, y asegura mantener
al sistema a temperatura constante. Por lo visto con la ecuaci on (3.18), esto garantiza mantener inalterada la
distribuci on de probabilidades de los microestados del sistema pero en ning un momento esa situaci on de equilibrio
implica que el sistema permanece en un unico microestado sin apartarse de el. De hecho el ba no termico indica
que el sistema intercambia energa con su entorno, respetando que el valor medio de la energa sea constante.
En el ejemplo de la comunidad de jugadores, la distribuci on de probabilidad llega a una situaci on esta-
cionaria que no impide que los jugadores contin uen efectuando transacciones, respetando las restricciones impues-
tas: M es constante. Esa distribuci on exponencial indica que es exponencialmente m as probable encontrar un
jugador en la ruina que muy adinerado. Dicha distribuci on permanece inalterada en tanto no se aporte dinero
(aumente M) en el sistema, ya que esta juega el papel de la temperatura de un sistema fsico.
Preservar los valores medios es pues equivalente - en cuanto a la presente discusi on - a mantenerse en
equilibrio. Podramos decir que las condiciones del sistema no cambian durante lapsos compatibles con el tiempo
que media entre mediciones sucesivas. Los promedios de los que hemos estado hablando hasta ahora, seran,
de este modo promedios temporales lo que agrega una complicaci on ya que s olo podramos calcularlos luego de
observar el sistema a traves de repetidas mediciones extendidas a lo largo de largos lapsos.
Ahora si un sistema sabemos que visita todos los microestados luego de alguna escala de tiempo su-
cientemente larga, podremos estimar la frecuencia de ocurrencia de dichos microestados. A la larga, con buena
estadstica, es factible pensar que realizar un promedio temporal (con la complicaci on que esto conlleva) es
an alogo a medir el promedio en el espacio de fases, tomando todos los microestados, y sumarlos con su respectiva
probabilidad de ocurrencia. Esto es lo que implica la siguiente
Denici on 10 (Hip otesis erg odica) Los valores medios a lo largo del tiempo (valores medios temporales) son
equivalentes a valores medios sobre densidades de probabilidad independientes del tiempo que s olo dependen de los
estados internos del sistema.
O sea por un lado podemos calcular promedios temporales observando la evoluci on del sistema y registrando
los microestados que va ocupando y por el otro, en un dado instante, podemos efectuar el promedio pesando cada
uno de los microestados de todo el volumen accesible del espacio de las fases por su probabilidad de ocurrencia.
La hip otesis erg odica dice que ambos promedios son enteramente equivalentes y dan el mismo resultado.
Esta hipotesis fue duramente cuestionada para los sistemas fsicos, pues se sabe que algunos sistemas,
dependiendo de la condici on que se parte, la din amica puede terminar atrapada en una regi on del espacio de fase
Modelos economicos de m ultiples agentes 10/6/2010
3.4. LA HIP

OTESIS ERG

ODICA 45
acotado, y nunca escaparse de ella
7
. Sin embargo, a la luz de los resultados obtenidos hasta ahora, en condiciones
reales, dichas situaciones, si ocurren, ocupan un volumen en el espacio de fases tan peque no, que a todas luces
son despreciables. Sin embargo es bueno tener en mente que para que la distribuci on de probabilidades sea la de
Gibbs, adem as de cumplir con que se mantenga constante un vnculo, se debe cumplir la hip otesis erg odica para
que dichos promedios puedan ser calculados correctamente.
Figura 3.4: Representacion esquematica de lo que implica la hipotesis
ergodica.
En la gura g. 3.4 est an representados esquem aticamente los elementos que intervienen en la hip otesis
erg odica. En la izquierda se representa la evoluci on temporal del sistema que en instantes sucesivos ocupa
microestados diferentes.

Estos est an resaltados con un crculo de mayor tama no. En la derecha se representa una
densidad de probabilidad independiente del tiempo, mostrado los estados inaccesible con probabilidad nula. Se
supone que si se observara una evoluci on sucientemente prolongada, se podra detectar al sistema visitando todas
las regiones del espacio de las fases pasando en cada una de ellas un tiempo proporcional al n umero microestados
accesibles de esa regi on. La probabilidad que se le asigna a cada porcion se toma proporcional al tiempo que el
sistema permanece en ella en el decurso de su evoluci on temporal.
En una situacion de equilibrio el sistema s olo visita una fracci on de los microestados posibles. La evoluci on
por la que el sistema relaja a esa situaci on queda afuera del concepto de ergodicidad porque el sistema no vuelve a
visitar nunca los estados de los que parti o o, si se quiere los visita con una probabilidad abritrariamente peque na.
En el modelo de intercambios bilaterales en una comunidad de jugadores de la secci on 3.3.3, el proceso de relajaci on
hasta alcanzar la distribuci on exponencial de tenencias de dinero cumple con esto: se inicializa el sistema en una
situaci on que luego no vuelve a visitar nunca m as. La hip otesis erg odica es m as plenamente aplicable a la evoluci on
posterior del sistema en la que visita distintos microestados debido a las continuas transacciones de la lotera, una
vez que la distribuci on exponencial ha sido alcanzada y esta es estacionaria.
El concepto de equilibrio que es com un en la fsica o la qumica contiene estas uctuaciones. Puede pensarse
que se trata de un equilibrio din amico ya que los elementos del sistema no cesan de evolucionar preservando de
cualquier manera una distribuci on de probabilidad. Esta idea, que en la fsica posee otros alcances, es aplicable al
7
Por ejemplo los sistemas hamiltonianos, como el que rige la din amica planetaria del sistema solar
Modelos economicos de m ultiples agentes 10/6/2010
46 CAP

ITULO 3. MODELOS ESTAD

ISTICOS
presente contexto. Se suele hablar de este tipo de equilibrio cuando un sistema posee una din amica que preserva
inalteradas distribuciones o valores medios de algunos parametros que lo describen.
Es en general sumamente difcil demostrar que un sistema fsico se ajusta a la hip otesis erg odica y, de hecho,
existen circunstancias en las que se ha comprobado con experimentos numericos que la misma no es aplicable.
Sin embargo la mec anica estadstica ha sido utilizada con gran exito en una variedad enorme de situaciones. Por
otro lado pareciera que esta hip otesis es particularmente util y apliable describiendo sistemas no lineales con un
n umero creciente de elementos. Esta es una situaci on relevante al tipo de interacciones que pueden tener lugar
en un sistema social.
3.5 Metodos de Monte Carlo
Por lo hasta aqu visto, la distribuci on de probabilidades P(X
i
) encierra toda la informaci on relevante para un
sistema de la mec anica estadstica. Sin embargo, en aplicaciones pr acticas la utilizaci on de dicha distribuci on
de probabilidad puede dicultarse. Por ejemplo para utilizar la distribuci on P(X
i
) para obtener los promedios
de una variable Y (X
i
),

Y =
P
i
Y (X
i
)P(X
i
), es necesario sumar sobre todos los estados del espacio de fases.
La cantidad de estados, diverge exponencialmente con el n umero de dimensiones que tiene el problema, y en la
mayora de los casos pr acticos se vuelve imposible enumerar todos los estados para calcular correctamente un
promedio.
Metodo directo para muestrear una distribuci on P(x)
En muchas aplicaciones es necesario obtener muestras x
i
de la distribuci on P(x)
donde x [a, b]. El metodo directo consiste en primero obtener una muestra
de una distribuci on uniforme en el rango [0, 1], para obtener la variable aleatoria
x
i
= a+(b a) [a, b]. Luego una segunda muestra de la distribuci on uniforme
, asegura que x
i
es una muestra si < P(x
i
); caso contrario descarto la muestra.
Est a claro que este metodo va probando uniformemente el espacio de fases, y se
torna impracticable cuando las dimensiones del espacio de fases aumentan.
Ejemplo distribuci on uniforme: Si P(x) es uniforme, como la funci on es
independiente de x, solo es necesario comparar muestras uniformes con P(x).
El siguiente ejemplo obtiene n muestras de la distribuci on uniforme en el rango
x [0, 10] y graca la distribuci on de probabilidad obtenida.
n=10000; res = [];
for i = 1:n,
rr = rand();
if rr < 1/10,
res = [res; rr];
end
end
hist(res)
[mean(res), sqrt(var(res))/sqrt(n)]
La funci on hist() genera un histograma de las muestras, y la ultima sentencia
calcula el promedio de la muestra y el error estandard de la media calculadas.
Como se puede observar, al aumentar n el error estandard decrece y la distribuci on
se aproxima a la uniforme en el rango [0, 10].
Ante este escenario, se volvi o imprescindible contar con metodos que sean capaces de aproximar promedios.
Modelos economicos de m ultiples agentes 10/6/2010
3.5. M

ETODOS DE MONTE CARLO 47


La idea de estos metodos es obtener muestras de la distribuci on que sean representativas (en cuanto a su frecuencia
de ocurrencia), y basar los promedios en sumas sobre dichas muestras. Vamos a ver que algunos metodos utilizan
la idea de la hip otesis erg odica, donde en vez de sumar sobre todos los estados, se podra sumar a lo largo de
una trajectoria X
i
(t) por un tiempo sucientemente largo. Esto se conoce en estadstica como el problema del
muestreo.
En los a nos 40, aprovechando el desarrollo de las primeras computadoras, Metropolis y colaboradores,
retomaron el estudio del problema de muestreo aplicado a colisiones con neutrones, dando origen a la fsica com-
putacional. John von Neumann fue uno de los que impulso dichos estudios, d andole el nombre de Monte Carlo,
en referencia a los casinos de la ciudad francesa. Asi con el tiempo estos metodos de muestreo de distribuciones
de probabilidad se conocieron como metodos de Monte Carlo. Se han implementado varias variantes de este
metodo y dentro de las que estudiaremos con mas cuidado est a el algoritmo de Metr opolis, la din amica de Glauber
o muestreo de Gibbs y el metodo de recocido simulado.
Antes de comenzar, es importante destacar que estos metodos a priori parten de una distribuci on de
probabilides conocida, y no es necesario conocer cu al es la din amica propia que dio lugar a dicha distribucion.
Por lo tanto, la trayectoria a la cual se hizo referencia, debe entenderse como una secuencia de muestras |X
i

t
obtenidas por una din amica propia del metodo
8
y no necesariamente del sistema estudiado. En caso de no
conocer la distribuci on, evoluciones temporales de la din amica pueden servir para construir tanto la distribuci on
de probabilidades como las muestras.
3.5.1 Algoritmo de Metropolis
Partiendo de una condici on inicial elegida al azar X
0
, este algoritmo genera una sucesi on de muestras. Si en la
iteraci on t de evaluaci on tenemos la muestra X
t
, la nueva muestra X
t+1
se calcula siguiendo los siguientes pasos:
(a) Se calcula la probabilidad P(X
t
).
(b) Se elige una nueva muestra X

y se evalua P(X

).
(c) Si P(X

) > P(X
t
) se acepta como nueva muestra X

y se dene X
t+1
X

.
(c) Si P(X

) < P(X
t
) con probabilidad P(X

)/P(X
0
) se acepta como nueva muestra X

y se dene X
t+1
X

.
(c) En caso contrario, se toma como nueva muestra la anterior X
t+1
X
t
.
Este algoritmo require que se corra una serie de pasos t
min
que ser an descartados, y solo a partir de t > t
min
se considerar an muestras de la distribuci on P(X). Como se ve, este metodo puede expresarse como una cadena
de Markov, y el descarte inicial sirve para asegurarse que la distribuci on de la cadena haya convergido a P(X).
3.5.2 Dinamica de Glauber o muestreo de Gibbs
En este caso nuevamente se parte de una condici on inicial elegida al azar, y el algoritmo genera una sucesi on
de muestras |X
t
a cada paso t. A diferencia con el metodo de Metropolis, una nueva muestra no depende
de la muestra anterior. Este metodo se aplica cuando el espacio de fases tiene m as de 1 dimension; digamos
X
t
= (x
1
, x
2
, ..., x
N
), y en vez de calcular la probabilidad conjunta P(x
1
, x
2
..., x
N
), para cada nueva muestra
se elige una coordenada al azar j y se toma una muestra de esa coordenada de la probabilidad condicional
P(x
j
[|x
i

i=j
). De esta manera las muestras se van aproximando por cada coordenada elegida al azar.
3.5.3 Modelo de Ising
Consideremos por ejemplo un AC de N celdas, donde el estado de cada una de ellas est a denido por una variable
binaria s
i
con i = 1, 2 . . . N. Esta situacion, originalmente motivada para explicar el origen del magnetismo, ha sido
muy prolca en diversos campos tanto econ omicos, sociales y biol ogicos. Es usual referirse a cada variable binaria
8
Esta din amica corresponde a una cadena de Markov, con algunas propiedades que aseguren que la evoluci on
de la distribuci on de la cadena, converja a la distribuci on deseada P(X
i
).
Modelos economicos de m ultiples agentes 10/6/2010
48 CAP

ITULO 3. MODELOS ESTAD

ISTICOS
s
i
como espin arriba o abajo, siguiendo la analoga de los dipolos magneticos que originan el magnetismo. En un
contexto de sistemas sociales o econ omicos las variables binarias s
i
se las ha hecho representar por ejemplo, dos
opiniones opuestas sobre un tema o dos decisiones opuestas de comprar o vender. En lo subsiguiente pensaremos
que s
i
|+1, 1.
Para poder comparar distintas conguraciones posibles, introducimos un funcional energa que mide la
situaci on de cada celda con su vecindad. La idea de energa est a as asociada con la de interacci on entre celdas o
entre agentes vecinos. La energa total del sistema es una variable extensiva del sistema, o sea, que es proporcional
al tama no del mismo (medido por la masa, volumen, n umero de celdas o partculas, etc) y est a dada por
E
tot
=
1
2
X
in(j)
Js
i
s
j
h
X
i
s
i
(3.25)
donde J es una constante que mide la interacci on entre espines vecinos, h es un par ametro que mide la inuencia
de la media con respecto a la interaccion entre vecinos. En fsica es usual pensar que conguraciones de menor
energa son m as favorables. Si J > 0, dos vecinos con la misma orientaci on de espines es m as favorable que si
tienen orientaci on opuesta (caso ferromagnetico); en cambio si J < 0 es m as favorable conguraciones con espines
en direcciones opuestas (caso antiferromagnetico).
Ahora bien, supongamos que este sistema lo ponemos en contacto con una fuente termica externa a una
temperatura constante T con la que intercambia energa
9
y origina cambios espont aneos en los espines, pero
siempre manteniendo constante la energa promedio E
tot
/N. Siguiendo el principio de m axima entropa se espera
que, luego de alg un transitorio, los espines se acomoden su orientaci on al azar con una distribuci on compatible
a la de Gibbs: P(s
i
) = e
E
tot
(s
i
)
/Z

. Si la temperatura es sucientemente grande kT E


tot
, la distribuci on
de probabilidad es practicamente uniforme y debera aproximar a 1/(N), donde (N) = 2
N
es la cantidad
de conguraciones posibles con N espines binarios. Si la temperatura es muy baja, los cambios ocacionales son
improbables y las conguraciones m as probables son aquellas de mnima energa. Si J > 0, las interacciones entre
vecinos con misma orientaci on logran energas mas bajas, por lo que la conguraci on de mnima energa sera la
de todos los espines alineados en una misma direcci on.
Este an alisis sugiere la posibilidad de que exista una transici on a medida que se cambia la temperatura T
del sistema. Para poder capturar esta transici on, denimos un par ametro de orden
M =
X
i
s
i
/N (3.26)
que mide la polaridad promedio del sistema: tendremos M = 1 cuando la energa sea mnima, y M = 0 en el
caso de espines distribuidos uniformemente al azar.
En lo que sigue denimos una funci on que estudia el modelo de Ising en una grilla cuadrada de lado n,
N = n
2
y h = 0, utilizando el metodo de Metropolis para obtener las muestras de la distribuci on de Gibbs para
este problema. Para esto, se parte de una dada muestra X = (s
1
, ..., s
N
) y se propone una nueva muestra X

donde se elige un espin al azar j y se lo invierte s

j
= 1 s
j
. La nueva muestra X

se acepta si (a) P(X

) > P(X)
o (b) si P(X

) < P(X) se acepta con probabilidad P(X

)/P(X). Si denimos E E(X

) E(X), la condici on
(a) es equivalente a E < 0,
E = 2Js
j
X
in(j)
s
i
(3.27)
Y para el caso (b) tenemos que E > 0 y la probabilidad del evento es:
P(X

)
P(X)
=
e
E(X

)
e
E(X)
= e
(E(X

)E(X))
= e
E
(3.28)
Es decir que el metodo de Metropolis toma muestras donde la energa total del sistema disminuye, o acepta
aumentar la energa, solo con una probabilidad evanescente, controlada por la temperatura externa T: a menor
temperatura son altamente improbables que se acepten muestras que aumenten energa, en cambio con altas
9
M as precisamente, se supone que la fuente es tanto mas grande que el sistema para que los intercambios
necesarios para mantener el valor medio de energa constante, no alteran la temperatura T de la fuente y ni
del sistema.
Modelos economicos de m ultiples agentes 10/6/2010
3.5. M

ETODOS DE MONTE CARLO 49


temperaturas el muestreo explora mas el espacio de fases. Este permite que el muestreo de la distribuci on de
probabilidad no se estanque en mnimos locales y se barra todo el soporte de la distribucion m as probable.
La siguiente funcion dene el proceso b asico del metodo de Metropolis:
function [U, menergy, res, step] = ising(n, J, beta, opts)
max_steps = 100000;
out_steps = 500;
seed = round(rand()*10000);
rand(state,seed);
U = round(rand(n,n)); % define campo al azar
U = (U-0.5)*2; % rescalea a valores entre (-1,1)
film = imagesc(U,[-1 1]); % define la figura
axis off;
res = [];
step = 1;
while (step <= max_steps)
one = round(rand(1,2)*(n-1))+1; % Elige un jugador al azar
ec = compute_local_energy_change(U, n, J, one);
% paso de Metropolis
if (ec < 0) || (ec > 0 && rand() < exp(-beta*ec) ),
U(one(1),one(2)) = -1 * U(one(1),one(2)); % cambia la orientacion de este espin
end
if (mod(step,out_steps)==0)
mag = sum(sum(U)) / n / n;
res = [res; step mag];
[count_mag, mag]
end
set(film,cdata,U);
drawnow
step=step+1;
end
menergy = 0;
for ii = 1:n,
for jj = 1:n,
menergy = menergy - compute_local_energy_change(U, n, J, [ii,jj]) / 2.0 / 2.0;
end
end
menergy = menergy / n / n;
end
Modelos economicos de m ultiples agentes 10/6/2010
50 CAP

ITULO 3. MODELOS ESTAD

ISTICOS
donde la funci on compute local energy change() calcula el cambio de energa de todo el sistema debido a cambiar
un espin elegido al azar E
j
= 2Js
j
P
in(j)
s
i
, y suponemos que la vecindad de cada espin son los primeros 4
vecinos y los bordes de la grilla rectangular se conectan entre si (condiciones peri odicas de contorno) :
function e = compute_local_energy_change(U, n, J, one)
xx = one(1); yy = one(2);
xl = mod(xx-2,n)+1; % index left
xr = mod(xx,n)+1; % index right
yb = mod(yy-2,n)+1; % index bottom
yt = mod(yy,n)+1; % index top
m = U(xl,yy) + U(xr,yy) + U(xx,yb) + U(xx,yt);
e = 2 * J * U(xx,yy) * m;
end
Los cambios de energa posibles son E (8J, 4J, 0, 4J, 8J).
La evolucion temporal de la magnetizaci on M(t) es muy uctuante, y solo cuando se usa temperaturas
bajas T 1 se observa que el sistema se queda en uno de los mnimos de energa M = 1 y el promedio de
energa por espin e = E
tot
/N = 2. Para obtener con m as precisi on como inuencia la temperatura el sistema,
realizamos un experimento numerico simulamos un sistema de N = 100 espines por 10
6
iteraciones y barremos
el parametro T, promediando los ultimos valores de M(t) y e(t) = E
tot
/N de cada simulaci on. En el gr aco de
la g. 3.5 observamos que para temperaturas bajas, la magnetizaci on [M[ est a cercano a los estados de mnima
energa, mientras que al aumentar T, la magnetizaci on disminuye abruptamente hasta caer alrededor de cero.
Esta caida abrupta marca una transicion de fase en el par ametro T. Simulaciones con N creciente apuntan
a que la transici on ocurre alrededor de T
c
= 2.27. Otra caracterstica es que si medimos las uctuaciones lejos
de la transicion, disminuyen con N creciente como 1/

N (respetan el teorema de limite central). Ahora cerca de


la transici on, las uctuaciones se vuelven muy importantes y se dice que el sistema tiene correlaciones de largo
alcance.
Ejercicio 9 (Fluctuaciones en funci on de T) Investigue que sucede si graca la desviaci on estandard de la
energa a lo largo de la transici on. Vea que pasa si aumenta N.
Ejercicio 10 (Transici on en 1-D?) Investigue que sucede si en vez de simular el modelo de Ising en 2-D, lo
hace en 1-D. Existe la transicion?
Ejercicio 11 (Caso Antiferromagnetico J = 1) Haga un experimento numerico con J = 1. Investigue
como se alinean los espines, dependiendo si N es par o impar. Vea que pasa con la magnetizaci on cuando cambia
la temperatura.
Dinamica de Glauber Para analizar el modelo de Ising siguiendo la din amica de Glauber, es necesario
calcular la probabilidad que un espin s
j
sea +1 o 1, dado que los dem as no cambian. Denominamos a cada uno
de esos estados X
+1=(...,s
j
=1,...)
y X
1
= (..., s
j
= 1, ...) a los que se les asocia, respectivamente, las energas
E
+1
y E
1
. De acuerdo con lo dicho en la secci on anterior (y omitiendo la constante de Boltzmann), se puede
decir que para una dada temperaura T, vale que
P(X
+1
) =
e
E
+1
/T
Z
s
(3.29)
P(X
1
) =
e
E
1
/T
Z
s
(3.30)
Modelos economicos de m ultiples agentes 10/6/2010
3.5. M

ETODOS DE MONTE CARLO 51


Figura 3.5: Magnetizacion |M| y energa por espin e = E
tot
/N en
funcion de la temperatura T en el modelo de Ising. Notar que cerca de la
transicion las uctuaciones son maximas. Parametros N = 100, J = 1,
10
6
iteraciones, promediados sobre 50 realizaciones.
con
Z
s
= e
E
+1
/T
+e
E
1
/T
(3.31)
porque P(X
+1
) +P(X
1
) = 1. Resulta entonces que
P(X
+1
) =
1
1 +e
E/T
; E = E
+1
E
1
(3.32)
y (P(X
1
) = 1 P(X
+1
)) que son s olo funci on de la diferencia de las dos energas involucradas.
Si se mantiene constante T, en sucesivas observaciones del sistema, este debe ser encontrado en los estados
X
+1
o X
1
con las correspondientes probabilidades dadas arriba. Hemos obtenido de esta manera el costo
energetico de cambiar la orientaci on de una celda y la probabilidad que dicho cambio tenga lugar a una dada
temperatura T. De acuerdo con estas ecuaciones se debe pensar que el aporte de una mayor temperatura hace que
el sistema pueda sufrir, con una creciente probabilidad, la reorientaci on de celdas que comporten un gran cambio
en energa y recprocamente una menor temperatura permite con apreciable probabilidad solo reorientaciones que
impliquen un reducido costo energetico.
La probabilidad de la actualizaci on queda dada por la ecuaci on (3.32) que involucra el costo energetico de
un cambio de orientaci on dado por (E). La probabilidad de observar un cambio de orientaci on se muestra en la
g. 3.6. Si el sistema tiene inicialmente sus celdas s
i
en alguna conguraci on (cuya energa es E
1
), es necesario
aportar E > 0 para cambiar el valor de una unica celda. Si E T la exponencial en el denominador de (3.32)
se aproxima a 1 y P(+1) 1/2 que signica que el salto de energa necesario para redenir el valor de una celda
es despreciable frente a T con lo que el sistema puede ser observado en el estado X
1
donde se encontraba o en
el X
+1
con esencialmente la misma probabilidad. Cuando T es menor, el estado X
+1
s olo tiene una probabilidad
ser observado si se aporta una energa que supera el valor E. Cuando T 0 esto en cambio sucede con P = 1
si E tiene el valor apropiado.
Ejercicio 12 Modique la funcion ising() para encontrar muestras de la distribuci on de equilibrio usando la
din amica de Glauber.
Modelos economicos de m ultiples agentes 10/6/2010
52 CAP

ITULO 3. MODELOS ESTAD

ISTICOS
Figura 3.6: Comparacion entre la probabilidad de transicion de Glauber
P(X
+1
) = 1/(1 + exp(E/T)) y la de Metropolis P(X
+1
) =
min(1, exp(E/T)) como funcion de la diferencia de energa E =
E
+1
E
1
. La escala de la energa es arbitraria y se comparan a 2
temperaturas diferentes.
3.6 Recocido simulado
Una de las principales caractersticas del metodo de Metropolis, es que intenta buscar muestras de la regi on
de mayor probabilidad en la funci on de distribuci on P(X) compatible con una energa promedio governada por
el par ametro T. Para el caso de una distribuci on de Gibbs, las regiones de mayor probabilidad corresponden
a las de mnima energa E(x), con lo que este metodo de muestreo estadstico estara buscando minimizar la
energa a una temperatura T dada. Kirkpatrick y colaboradores (Kirkpatrick, Gelatt, Jr., and Vecchi 1983)
observaron que si hacen tender la temperatura T a cero, el metodo podra buscar mnimos absolutos de la funci on
E(x). Familiarizados con los procesos de recocido, mediante un enfriamiento gradual ayuda a eliminar tensiones
residuales en grandes piezas met alicas, propusieron el metodo de recocido simulado para resolver problemas de
optimizaci on combinatoria. Esta clase de problemas ocurren cuando (a) se desea minimizar (maximizar) una
funci on costo que depende de la conguraci on de las partes en interacci on, y (b) la funci on costo depende de
muchas variables, por lo que el problema posee complejidad combinatoria, o sea que se necesita explorar una
cantidad exponencialmente grande de alternativas para hallar la optima.
La familia de problemas de complejidad combinatoria es muy vasto y es un campo activo de investigaci on.
Habitualmente se los denomina como problemas NP porque el tiempo para ejecutar los algoritmos para resolverlos
llevan un tiempo que crece mas r apidamente que cualquier potencia o polinomio en los datos de entrada. Problemas
con dicha naturaleza son por ejemplo, encontrar el recorrido que pasa por N ciudades que hace que la distancia
total recorrida sea mnima (problema del viajante de comercio), problemas para satisfacer restricciones temporales
como los que ocurren en la asignaci on de horarios en los turnos de un hospital, y, en general todos los problemas
de coordinaci on entre agentes economicos.
El metodo de recocido simulado permite obtener conguraciones que minimizen una funci on costo, uti-
lizando el algoritmo de Metropolis, junto a un protocolo de enfriamiento y una funci on de distribuci on de Gibbs.
Por lo visto anteriormente, una situaci on de equilibrio a una dada temperatura se debe visualizar como una
situaci on din amica en la que el sistema visita distintos microestados, manteniendo inalterado el valor medio de
la energa. Si la temperatura disminuye y se permite que el sistema relaje a un nuevo equilibrio, los microesta-
dos que se visitan son un subconjunto de los anteriores en los que las distintas partes del sistema se acomodan
respetando los mnimos de las energas de interacci on. Ahora si el proceso de enfriamiento es muy r apido, puede
Modelos economicos de m ultiples agentes 10/6/2010
3.6. RECOCIDO SIMULADO 53
ocurrir que el sistema no llegue a visitar la regi on los mnimos y quede atrapado en un mnimo local que ser a
dicil de salir si la temperatura bajo demasiado.
Por lo tanto este algoritmo deber a visitar una buena porci on del espacio de fases antes de enfriarlo,
haciendo que el metodo deba realizar muchsimas evaluaciones de la funci on de costo. Se ha visto que en los
problemas donde la funci on de costo es aditiva con las partes del sistema, este metodo puede brindar soluciones
muy buenas en tiempos de computo razonables, debido a que el c alculo de E pueda expresarse como debida al
cambio de estado de una parte limitada de todo el sistema. As por ejemplo en el caso del viajante de comercio el
costo es la suma de las distancias entre las ciudades en un dado orden. Una alteraci on consiste en una permutaci on
de dos ciudades que s olo implica corregir una parte muy limitada del recorrido dejando inalterado todo el resto.
El protocolo de enfriamiento debe en general ser ajustado para cada caso particular y pueden a veces
presentar problemas de convergencia. Por lo general se utilizan variantes en el que sucesivas temperaturas siguen
una ley del tipo T
k
= ()
k
= T
k1
con < 1.
El algoritmo comienza de una conguraci on cualquiera y a una temperatura T muy alta. Utilizando el
metodo de Metropolis se evaluan nuevas muestras de la distribucion de Gibbs, hasta que se alcance una situaci on
de equilibrio donde E) no cambie. Aqui se aplica el enfriamiento T

< T y se vuelve a muestrear el espacio de fases


para buscar un nuevo equilibrio. El hecho que no se rechazan algunas reconguraciones que implican un aumento
de costo, hace que en la poblaci on de microestados en cada equilibrio intermedio se encuentren representadas
situaciones a las que no se habra podido llegar si s olo se aceptan cambios que conducen a la disminuci on del
costo. Es util visualizar el proceso de optimizacion como el descenso por las laderas de un paisaje accidentado
cuyas alturas est an dadas por la funci on que se desea minimizar. Hallar el optimo consiste en encontrar el valle
m as profundo de ese paisaje. Con esta imagen in mente, las uctuaciones termicas act uan permitiendo saltar
por encima de barreras formadas por m aximos locales del costo, impiden que la b usqueda del mnimo quede
estancada en mnimos secundarios y ayudan a acceder a los microestados de los valles m as profundos. Este proceso
est a ejemplicado en la g. 3.7. El proceso de optimizaci on se detiene cuando E), cuyo extremo se busca no
tiene mas cambios.
En el algoritmo de Metropolis es posible demostrar que
dE(T))
dT
=
E(T)
2
) E(T))
2
T
2
(3.33)
con lo que se dispone de una estimacion de las uctuaciones de la funci on costo a lo largo del proceso de opti-
mizaci on.
Modelos economicos de m ultiples agentes 10/6/2010
54 CAP

ITULO 3. MODELOS ESTAD

ISTICOS
Figura 3.7: Se ejemplica el proceso de optimizacion como la b usqueda
de un mnimo en un paisaje accidentado. Temperaturas mas elevadas
permiten explorar regiones mas amplias del espacio de las fases y suce-
sivos enfriamientos reducen esa b usqueda a microestados mas proximos
al optimo evitando quedar estancados en mnimos locales.
Modelos economicos de m ultiples agentes 10/6/2010
Captulo 4
Leyes de potencias
4.1 Distribuciones que siguen leyes de potencias
Una lista de registros o mediciones pueden ser caracterizada por alg un valor medio que es representativo de
todo el conjunto. La lista contiene tanto valores mayores como menores a esa media pero aquellas mediciones
que dan resultados proximos a ese valor son por lo general mucho m as frecuentes. Este hecho est a formalmente
representado por densidades de probabilidad Gaussianas o de Poisson que poseen un m aximo en alg un valor
intermedio de la variable aleatoria. Existen sin embargo una gran variedad de magnitudes cuyas distribuciones
no siguen este patr on.

Estas est an asociadas tanto a fen omenos naturales como a hechos sociales o econ omicos.
Tal por ejemplo es la distribuci on de tama nos de ciudades, de intensidades de terremotos, de los di ametro de los
cr ateres de la Luna, la distribuci on de frecuencias de uso de palabras en un dado idioma (ley de Zipf), n umero
de muertes en conictos belicos, n umero de citas en publicaciones cientcas, n umero de especies en taxones
biol ogicos, distribuci on de ingresos, uctuaciones de luminosidad en fuentes estelares de ondas de radio, ujo de
autom oviles en una carretera, y una enorme variedad de otros.
Muchas de estas magnitudes tienen una distribuci on de probabilidad que sigue una ley de potencias que,
tecnicamente, se puede escribir como P(x) = Ax

, donde A es una constante de normalizaci on. En el contexto


del principio de m axima entropa visto en el Captulo 4, una distribuci on de esta naturaleza surge cuando se la
trata de maximizar sujeta a la condici on de vculo que el valor medio del logaritmo de la variable aleatoria sea
una constante C > 0 arbitraria, o sea:
max|
Z
p(x)log(p(x))dx sujeto a
Z
p(x)dx = 1 y
Z
log(x)p(x)dx = C (4.1)
Si se introducen los multiplicadores de Lagrange y asociados respectivamente a la media del logaritmo
de x y a la normalizaci on de las probabilidades resulta
p(x) = Ax

(4.2)
A = ( 1)a
(1)
(4.3)
= 1 +
1
C log a
(4.4)
En estas ecuaciones se ha supuesto que la ley de potencia es v alidad en el rango x [x
min
, ] ya que de otro
modo la normalizacion de la probabilidad divergera en el origen. Mandelbrot utiliz o estos argumentos para
justicar la ley de Zipf que establece que la distribici on de probabilidad de uso de las palabras en un dado
idioma es aproxiamdamente una ley de potencias en su longitud. La idea de Mandelbrot fue que maximizar la
distribici on de probabilidad deba corresponderse con optimizar la informaci on transmitida que est a relacionada
con el logaritmo de la longitud de las palabra.
55
56 CAP

ITULO 4. LEYES DE POTENCIAS


Las leyes de potencias tambien ocurren en diversas funciones termodin amicas en las proximidades de
transiciones que corresponden, por ejemplo al cambio de lquido a vapor o de lquido a s olido. Estos fen omenos
crticos fueron ya mencionados en captulos anteriores en el contexto del Modelo de Ising y en la difusi on de
rumores o la instalaci on de una moda. En presencia de una situaci on crtica las densidades de probabilidad que
obedecen a leyes de potencias han sido vinculadas al hecho que zonas muy distantes del sistema se encuentran de
todos modos fuertemente correlacionadas entre si. Esta correlaci on se traduce a su vez en la ausencia de escalas
caractersticas. En el modelo de condensaci on que presentamos en el Captulo 3, cuando el par ametro de control
posee alg un valor particular, no es posible encontrar que gotas de alg un tama no particular sean particularmente
frecuentes. En el modelo de Ising, los imanes elementales ubicados en cada nodo de la grilla tienden a agruparse
en islas en las que todos tienen la misma orientaci on. En las vecindades del punto crtico en la que el sistema
adquiere una magnetizaci on permanente, la distribuici on de las extensiones de dichas islas no indica que abunden
las islas de alg un tama no particular. Por estas razones se dice que las distribuciones que obedecen a leyes de
potencias corresponden a sistemas libres de escala. M as abajo damos una denici on precisa de este hecho.
4.1.1 Algunas propiedades
Normalizaci on
Z

x
m
in
P(x)dx =
Z

x
m
in
Ax

dx =
A
1
h
x
+1
i

x
min
= 1 (4.5)
que dene la constante A y restringe el valor del exponente a > 1 con lo que la densidad de probabilidad
se puede escribir como
P(x) =
1
x
min

x
x
min

(4.6)
Momentos. De la misma manera se puede determinar que las distribuciones con 2 no tienen media
nita:
x) =
Z

x
m
in
xP(x)dx =
A
2
h
x
+2
i

x
min
(4.7)
De la misma manera se puede establecer que si 3 la varianza resulta innita. En general, el momento
de orden m se expresa como:
x
m
) =
1
( m1)
x
m
min
(4.8)
Hay que tener en cuenta que si se calculan los momentos sobre muestras recogidas de la realidad, tanto la
media como la varianza de distribuciones que siguen leyes de potencias pueden arrojar resultados nitos
pero eso es debido a que el c alculo se efect ua siempre sobre una muestra nita de realizaciones de la variable
aleatoria.
Las distribuciones que obedecen a leyes de potencia son libres de escala. Se suele decir que una distribuci on
p(x) es libre de escalas cuando se verica que p(bx) = g(b)p(x) o sea que la distribuci on de la variable
aleatoria afectada por un factor de dilatacion o de contracci on b es proporcional a la distribuci on original.
Observese que ese factor es irrelevante porque puede absorberse en la normalizaci on de la distribuci on. Para
demostrar la propiedad se nalada al comienzo basta poner x = 1 en la condici on de libertad de escalas, con
lo que queda p(b) = g(b)p(1). Es posible entonces escribir p(bx) = p(b)p(x)/p(1). Como esta propiedad
vale para cualquier valor arbitrario de b, puede deducirse que xp

(x) =
p

(b)p(x)
p(1)
ponendo p

por la derivada
respecto de b. Si en esta ecuacion se pone ahora b = 1 se obtiene una ecuaci on diferencial que dene la
distribuci on p(x). Epeccamente:
x
dp
dx
=
p

(1)
p(1)
p(x) (4.9)
cuya soluci on es
log p(x) =
p(1)
p

(1)
log(x) + constante (4.10)
que corresponde a una ley de potencia p(x) = p(1)x

con = p(1)/p

(1)
Observabilidad de las leyes de potencias. Los valores de las distribuciones que siguen leyes de potencias por
lo general se extienden por algunas decadas y son los valores mayores los m as importantes para determinar
tanto la dependencia funcional de la distribuci on como el exponente de la misma en el caso que ella
Modelos economicos de m ultiples agentes 10/6/2010
4.2. OCURRENCIA DE LEYES DE POTENCIAS 57
obedezcan una ley de potencias. Este hecho entra na una dicultad ya que esos valores son por lo general
los menos frecuentes y est an afectados de importantes errores de observaci on. Otro aspecto a tener en
cuenta es que distribuciones observadas varan su aspecto de manera signicativa dependiendo del ancho
de la ventana en que se agrupan las realizaciones de la variable aleatoria que se utilice para gracarlas.
Estos elementos hacen que es menester ser muy cauteloso cuando se llega al punto de aseverar que una
distribuci on sigue una ley de potencias. Este punto est a cuidadosamente discutido en la (Newman 2005).
4.2 Ocurrencia de leyes de potencias
En esta secci on presentamos diversas situaciones en las que ocurren distribuciones de probabilidad que siguen
leyes de potencias. Nos concentraremos en los siguientes casos:
1. Grafos libres de escala. En el an alisis de grafos reales de gran porte, particularmente la red de servidores
de Internet, se encontr o que la distribuci on de probabilidad del grado de los nodos de la red no decaa
exponencialmente sino que lo haca como una ley de potencias, P(k) Ak

con 2 < < 3. Por esta


raz on se consider o que estos grafos son libres de escala. Este punto se vio en detalle en el capitulo anterior.
2. Fenomenos crticos. Muchas substancias pueden congelarse, evaporarse o fundirse si se cambian par ametros
ambientales como la presion o la temperatura. Si la substancia est a en estado gaseoso, sus estados de
equilibrio poseen densidades de probabilidad de las velocidades de sus moleculas que s olo dependen de
la temperatura del gas. En una transcion de fase que lleve el gas a condensarse como un lquido esa
distribuci on cambia profundamente. Estos mismos sistemas naturales est an adem as caracterizados por
alguna dimensi on particular, como puede ser el camino libre medio entre colisiones de las moleculas del
gas o el tama no de los dominios magneticos si se trata de una substancias magnetizable. En presencia
de una transici on de fase estas longitudes de correlacion pueden llegar a diverger dejando al sistema sin
ninguna escala de longitud que le sea caracterstica. Existen muchos fen omenos de este tipo en los que los
cambios son abruptos, profundos y globales y tiene lugar para un valor muy preciso de alg un parametro
de control externo. Se los suele englobar bajo la denominaci on generica de fen omenos crticos. En estas
situaciones las distribuciones de probabilidad relevantes siguen leyes de potencias y las interacciones entre
las componentes del sistema carecen de escalas caractersticas.
3. Fenomenos crticos. Muchos sistemas naturales proseen alguna escala de longitud que les es propia y
que representa la distancia a la que quedan correlacionadas sus partes por efecto de las interacciones que
operan en su seno. Esta distancia se denomina (distancia de correlaci on). Esta escala cambia con las
condiciones del medio en que se encuentra el sistema. En ciertas oportunidades dicha distancia diverge
indicando que todas las partes del mismo est an correlacionadas entre si. Cuando este proceso tiene lugar
se dice que el sistema se encuentra en un punto crtico. Por lo general estos coinciden con los cambios
de fase, esto es cuando un gas se condensa o cuando un lquido se congela. En las inmediaciones de un
punto crtico las distribuciones de probabilidad asociadas a funciones termodin amicas siguen una ley de
potencias.
4. Paseos al azar en mercados nancieros. El analisis de series de tiempo de mercados nancieros permite
generar distribuciones que dan la probabilidad de obtener un dado rendimiento al cabo de distintos plazos.
En algunas series estas densidades de probabilidad siguen leyes de potencia con lo que resultan invariantes
frente a dilataciones o contracciones de la escala temporal prmitiendo de esa manera relacionar entre si
rendimientos obtenidos al cabo de plazos muy diferentes. Esto adem as permite, dentro de ciertos lmites,
relacionar las uctuaciones de las cotizciones que tiene lugar en pocos das con las que ocurren en lapsos
m as prolongados.
5. Criticalidad autoorganizada. En el caso de sistemas termodin amicos siempe existe un par ametro
de control externo (generalmente es la temperatura) que permite colocarlos en un punto crtico. Si los
mercados desarrollan su din amica cerca de un estado crtico tal como parece surgir del la ocurrencia de
leyes de potencias, para la distribuci on de probabilidad de sus rendimientos, cabe preguntarse cu al debera
ser el par ametro de control que los lleva a una situaci on de esa naturaleza. Respecto a este punto se
ha popularizado el concepto que muchos sistema naturales se auto-organizan cerca de una tal situaci on
crtica sin que para ello medie ning un control externo que los conduzca a ese estado. En esta propiedad
Modelos economicos de m ultiples agentes 10/6/2010
58 CAP

ITULO 4. LEYES DE POTENCIAS


din amica se denomina criticalidad autoorganizada y se la repasa en una pr oxima seccion (ver (Bak, Tang,
and Wiesenfeld 1999)). De acuerdo con este concepto la ocurrencia de eventos catastr ocos no se debera
a ninguna ingerencia externa sino que sera el resultado de una combinaci on muy poco probable de eventos
que son propios del funcionamiento regular y normal del sistema.
4.2.1 Mercados nancieros y paseos al azar.
Una de las conjeturas b asicas de la literatura acerca de mercados nancieros es que los precios responden procesos
estocasticos caracterizados por un paseo al azar. Este principio fundamental es en el que se apoya Bachelier
(1900). Toda la formulaci on de su teora se sostiene sobre la idea de que los rendimientos est an normalmente
distribuidos.
Para que el movimiento de los precios de un activo nanciero siga un paseo al azar, las transacciones
realizadas deberan ser consistentes con lo que se denomina un fair game, en el cual la ganancia esperada de
un especulador debera ser identicamente nula. La mejor predicci on del precio de ma nana, es simplemente el
precio de hoy, donde el terminomejor se reere a aquella predicci on que minimiza el error cuadr atico medio
de la predicci on. Una importante consecuencia de esta hip otesis, es que los cambios en precios de los activos no
est an correlacionados, lo cual implica que no es posible realizar predicciones sobre la base de alg un predictor de
los precios futuros basado en la secuencia de los pasados.
Si el rendimiento, denido como r
t+1
= p
t+1
p
t
= p
t+1
E(p
t+1
/I
t
) es un fair game, debe cumplirse
que E(r
t+1
/I
t
) donde I
t
es la informaci on disponible en el momento t. En general se trabaja con el logaritmo
del precio para que el c alculo de los rendimientos se haga en terminos relativos. La expectativa del precio de
ma nana dado el de hoy es el precio de hoy. En este mundo, el unico cambio posible de precio es resultado del
arribo de nueva informaci on, como no hay razones para esperar que la informaci on llegue de manera no aleatoria,
el cambio de precios perodo a perodo ser a aleatorio y estadsticamente independiente, de manera consistente
con la llegada de informaci on. En estas circunstancias es dable suponer que los rendimientos de un perodo son
variables aleatorias independientes.
Si se considera que no han tenido lugar, durante el perodo de an alisis, cambios de regimen que modiquen
sustancialmente la estructura del mercado, se puede considerar, adicionalmente, que estas variables aleatorias
est an identicamente distribuidas. Se tiene entonces que E(r
t+1
/I
t
) = E(r
t+1
).
Los modelos basados en la hip otesis de paseo al azar suponen adicionalmente, por razones operativas, que
toda la distribuci on es independiente de la informaci on disponible I
t
y que esta es ademas estacionaria. Entonces
que la funci on de distribuci on de los rendimiento satisface que f(r
t+1
/I
t
) = f(r
t
+ 1) con la misma funci on de
distribuci on para todo t. Esto no nos indica que la informaci on pasada carece de valor. Como la distribuci on
de los rendimientos se presupone estacionaria, los rendimientos pasados son la mejor fuente de informaci on para
conocerla, sin embargo, estos no producen ninguna consecuencia sobre la futura evoluci on de los mismos.
Se puede armar que la combinaci on de las propiedades que se originan a partir de la suposici on de que la
evoluci on de los mercados nancieros es consistente con los paseos al azar y, por otro lado, el tratamiento de los
ajustes basados en el an alisis de riesgo, ha dado importantes resultados, especialmente en el estudio de la jaci on
de los precios de opciones nancieras. Esto pone de maniesto la importancia de estudiar las propiedades de las
funciones de distribuci on de los rendimientos en estos mercados.
Muchos modelos de formaci on de precios de activos de capital dependen del conocimiento estas distribu-
ciones, como por ejemplo, los modelos de Lintner, 1965, Mossin, 1966, y Sharpe, 1964, y el famoso modelo de Black
y Scholes, de 1973 respecto de los precios de las opciones burs atiles. En general, se suele suponer que el proceso
estocastico es un movimiento Browniano, por lo que, est a guiado por una distribuci on normal. En su forma m as
estricta, la hip otesis de paseo al azar supone que los rendimientos se distribuyen de manera independiente y est an
identicamente distribuidos. Una versi on no tan restrictiva permite que la historia del proceso pueda inuir sobre
las estrategias de inversi on, pero descarta que sea posible utilizar ecientemente tecnicas o reglas de predicci on
determinsticas (lineales o no lineales). Finalmente, versiones menos restritivas suponen que no es posible utilizar
tecnicas de predicci on lineales, como el an alisis de regresiones.
En lo que sigue veremos ejemplos de distribuciones de mercados que no se ajustan a estas hip otesis de
paseos al azar y se ajustn en cambio a leyes de potencias. Algunas distribuciones que guan al proceso generador
Modelos economicos de m ultiples agentes 10/6/2010
4.2. OCURRENCIA DE LEYES DE POTENCIAS 59
de rendimientos son distribuciones denominadas estables que dan lugares a colas gordas y distribuciones que
siguen leyes de potencias. Excluimos del presente an alisis las descripciones multifractales de series nancieras (?).
Distribuciones estables y vuelos de Levy
Supongamos un proceso estoc astico caracterizado por un paseo al azar, unidimensional, cuyo saltos son indepen-
dientes e identicamente distribuidos con una probabilidad p(x). Cabe preguntarse si las uctuaciones que tuvieron
lugar durante un da, son las mismas, a menos de un factor de escala, que las que tienen lugar durante una semana
o un mes. Responder a esta pregunta es equivalente a responder a ?cu ando la probabilidad P
n
(x) de que el paseo
al azar haya arribado a la posici on x luego de n pasos (x = x
1
+x
2
+ +x
n
) es la misma que la p(x) a menos
de un factor de escala? Si esto sucede, la p(x) correspondiente da lugar a un paseo al azar con una trayectoria
autosimilar. Se suele tambien decir que la distribuci on de probabilidad es invariante frente a cambios en la escala
temporal. Estas invariancias sugieren que la distribuci on carece de una escala de tiempos caracteristica y est an
siempre realcionadas con el surgimiento de leyes de potencias.
Si p(x) es una distribuci on normal con media y varianza , esas condiciones se ven satisfechas pues P
n
(x)
tambien es normal con media
n
= n y varianza
n
= n. Sin embargo, a principio de siglo, Levy, 1937 demostr o
que este es tan s olo un caso particular y que existen otras soluciones que admiten trayectorias auto-similares. La
condici on de autosemejanza se verica cuando las distribuciones asociadas a la suma de n y m pasos se relacionan
con la de n + m. La distribuci on de una suma de variables aleatorias independientes es la convoluci on de sus
distribuciones. o sa que :
P
n
(x) =
Z
+

P
nm
(x x

)P
m
(x

)dx

0 m n (4.11)
Como la transformada de Fourier del producto de convoluci on de dos funciones es el producto de las trans-
formadas, es mas c omodo trabajar con las funciones caractersticas de las distribuciones, que son, precisamente
las transformadas de Fourier de la funciones de distribuci on. Resulta entonces:
P
n
(k) = P
nm
P
m
(k) con P(k) =
Z
+

e
ikx
P(x)dx (4.12)
La variable k es la conjugada de x. Una funci on caracterstica que satisface esta condici on tiene la forma
P
n
(k) = e
(n|k|

)
(4.13)
Denici on 11 (Distribucion estable) . Las distribuciones con funciones caractersticas (4.13) se denominan
distribuciones estables y corresponde a un proceso estocastico llamado como vuelo de Levy y verican que sumas
parciales de n variables aleatorias tienen la misma funci on de distribucion. El exponente se denomina exponente
caracterstico.
Propiedades de los Vuelos de Levy.
1. Por denici on, la funci on de distribucion es:
P
n
(x) =
1
2
Z
+

e
n|k|

e
ikx
dx (4.14)
2. Para cualquier funci on caracterstica, desarrollando la exponencial compleja en series de potencias, se
demuestra que el momento de orden q de la distribuci on vale:
x
q
) = (1)
q

q
p(k)
k
q
q = 0, 1, 2 . . . (4.15)
Entonces, como P
n
(k) = p
n
(k) y p(k = 0) = 1 implica x
q
(n) = nx
q
) Con esto es posible calcular todos
los momentos de la distribucion conociendo la funci on caracterstica de la misma.
Modelos economicos de m ultiples agentes 10/6/2010
60 CAP

ITULO 4. LEYES DE POTENCIAS


3. Resulta que: [p(k)[ = p(k = 0) = 1. Efectivamente:
[p(k)[ =

Z
+

e
ikx
p(x)dx

=
Z
+

e
ikx

p(x)dx =
Z
+

p(x)dx = 1 p(k = 0) (4.16)


4. La varianza que puede calcularse a partir de derivada segunda de p(x) en el origen. Existe s olo si = 2,
que corresponde a la distribuci on normal. De 2) resulta evidente que cuando < 2 , el momento de
segundo orden es innito. Como la varianza es innita no hay un tama no caracterstico para la magnitud
de los saltos del proceso estoc astico. Desde el punto de vista muestral resulta difcil de comprobar que
la varianza de una distribuci on sea innita ya que, como el tama no de todamuestra es nita, siempre se
puede denir un estimador de la varianza de la distribuci on. Usando series temporales de tama no nito
los momentos asociados a la distribuci on se ven afectados por los valores que uct uan alrededor del centro
de las distribuciones y no por sus colas.
5. Ejemplo: La distribuci on de Cauchy corresponde al caso = 1. Poniendo P
n
(k) = e
n|k|
y p(k) = e
|k|
se
obtiene
P
n
(x) =
1
n
1
1 + (x/n)
2
=
1
n
p(
x
n
) (4.17)
6. El exponente caracterstico

beta describe el grado de rugosidad de la serie temporal. El espectro de
potencia (cuadrado de la transformada de Fourier) de estas series sigue una ley de potencias S(f) 1/f

con = 1 + 2/ y la dimensi on fractal (de Hausdor) de una serie temporal con estas caractersticas es
D
f
= 2 1/. Cuando = 2 la correlaci on entre incrementos es nula y corresponde al caso Gaussiano.
Ejemplo:Vuelos de Levy en mercados cambiarios
A continuaci on analizaremos las series temporales de mercdos de divisas con la optica de las distribuciones estables.
Para ello denimos el rendimiento al cabo e t perodos de tiempo como
r(t) =
p(t) p(t t)
p(t t)
(4.18)
donde p(t) es el valor del tipo de cambio al cierre en t. La variable r(t) es una variable aleatoria. Veremos que
su distribuci on de probabilidad P(r, t) que ocurra un valor r para un dado t resulta ser estable. El exponente
caracterstico de la distribuci on se puede estimar de la probabilidad de retorno al origen P(r = 0) ((Mantegna
and Stanley 1995)) pero expresada como funci on de t, o sea, la probabilidad de alcanzar un rendimiento neto
nulo al cabo de t pasos del paseo al azar.
Para ello es conveniente encontrar primero una expresi on de la distribuci on de probabilidad en la que la
invariancia frente a cambios en la escala temporal sea maniesta.
El valor de n usado en la secci on anterior que indica el n umero de variables aleatorias que se suman,
en este contexto se relaciona con el intervalo de tiempo t de cada paso del paseo al azar. Podemos escribir
P
n
(r) = P(r, nt) con lo que la funci on caracterstica de una distribuci on estable se puede expresar:
P(r, nt) =
1
2
Z

+
e
nt|k|

e
ikr
dk =
1

Z
0
+
e
(nt)k

cos(kr)dk (4.19)
Se puede denir un rendimiento est andar o rendimiento normalizado r
s
mediante:
r
s
=
r
(t)
1/
(4.20)
Queda as vinculado un rendimiento r para cualqueir intervalo de tiempo t con un rendimiento est andar.
Utilizando esta nueva variable, la invariancia de escala temporal de la distribuci on (4.19) queda maniesta:
P
s
(r
s
, nt) =
P(r, nt)
(t)
1/
(4.21)
Esta ecuaci on indica que una distribuci on de probabilidad de rendimientos para cualquier intervalo nt est a
relacionada con la distribuci on de rendimientos est andar: se pueden superponer las distribuciones para diferentes
t corrigiendolas s olo por un factor relacionado con su escala temporal
Modelos economicos de m ultiples agentes 10/6/2010
4.2. OCURRENCIA DE LEYES DE POTENCIAS 61
Con la expresi on (4.19) es posible adem as calcula la probabilidad de retorno al origen. Para ello ponemos
P(0, nt) =
1

Z

0
e
(nt)k

=
(1/)
(nt)
1/
(4.22)
donde hemos utilizado
(z) =
Z

0
u
z1
e
u
du conz > 0 (4.23)
La distribuci on (4.22) sigue una ley de potencias en t con el exponente caracterstico de la distribuci on estable.
Con estas reglas se estudi o la evoluci on del tipo de cambio de la Libra Esterlina contra el D olar Americano.
La serie de datos esta formada por el tipo de cambio diario al cierre y corresponde al perodo comprendido entre
el 1ro. de junio de 1973 y el 21 de mayo de 1987, conformando una total de 3511 datos.
En la g. 4.1 mostramos P(r = 0, t) como funci on de t, en una escala log-log. Estos datos pueden
ajustarse con una recta cuya pendiente es - 0,604. Hasta los primeros 50 valores de t el ajuste da un coe-
ciente de correlaci on de 0.988. La pendiente permite determinar el exponente carcaterstico que corresponde
con un comportamiento no gaussiano - ya que = 0.60 - y por lo tanto la varianza de la distribuci on debera
ser te oricamente innita. Como hemos comentado anteriormente no es posible comprobar si la varianza de la
distribuci on es efectivamente innita ya que el tama no de la muestra es nita (3511 datos).
Figura 4.1: Probabilidad de retorno al origen P(r = 0) como funcion
de t.
De la lista de rendimientos se pueden obtener la P(r, t) para diferentes intervalos de tiempo Se tomaron
nt = 1, 2, 8 y 32 das). Un estudio estadstico m as minucioso debera usar datos en intervalos no superpuestos,
pero debido a la escasez de datos numericos esto no resulta posible. No obstante, los exponentes crticos obtenidos
con intervalos superpuestos o no son similares.
En la g. 4.2 se muestra el gr aco de P(r, t) utilizando los 4 valores distintos de t . Se ha pretendido
que estos intervalos esten aproximadamente equi-espaciados en terminos logartmicos. Como se puede observar
estas distribuciones son visiblemente simetricas y sus colas obviamente se despliegan al crecer el intervalo t,
ya que al elegir un mayor intervalo sobre el cual se calculan los rendimientos relativos, crece la probabilidad de
obtener grandes rendimientos (positivos o negativos).
Modelos economicos de m ultiples agentes 10/6/2010
62 CAP

ITULO 4. LEYES DE POTENCIAS


Figura 4.2: Histograma de la distribucion de rendimientos para difer-
entes valores de t.
Con el exponente caracterstico obtenido de la distribuci on P(r = 0, t) se puede corroborar que las
distintas distribuciones son similares salvo un factor de escala. Para vericar esta propiedad, se debe re - escalar
todas las distribuciones para diferentes t, utilizando la variable r
s
En la g. 4.3 se comprueba que, salvo eventos de gran amplitud, las distribuciones escaladas se superponen
en una unica distribucion. En estos mercados no se pueden pues denir escalas de tiempo privilegiadas. En la
Tabla se muestran otros exponentes crticos obtenidos de esta misma manera:
EJEMPLOS DE EXPONENTES CRITICOS
Mercado Perodo No. Datos Exponente Coef. Correl.
L.E. - D.A. 6/73-5/87 3,511 0.60 0.02 0.988
Y.J. - D.A. 6/73-5/87 3,511 0.59 0.02 0.981
D.C. - D.A. 6/73-5/87 3,511 0.59 0.02 0.983
M.A. - D.A. 6/73-5/87 3,511 0.651 0.03 0.997
F.S - D.A. 6/73-5/87 3,511 0.60 0.02 0.989
L.E. - D.A. (1) 6/73 - 6/87 1,174,941 0.581 0.004 -
Y.J. - D.A. (1) 6/73 - 6/87 1,477,992 0.591 0.003 -
F.S. - D.A. (1) 6/73 - 6/87 1,214,901 0.594 0.004 -
M.A. - D.A. (1) 6/73 - 6/87 2,409,086 0.591 0.004 -
ORO - D.A. (1) 6/73 - 6/87 652,194 0.580 0.004 -
Dow Jones 1/00-6/93 25,770 0.583 0.007 0.976
S & P 500 (2) 7/62-12/95 8,431 0.588 ? -
IBM (2) 7/62-12/95 8,431 0.561 ? -
AMPCO (2) 7/62-12/95 8,431 0.621 ? -
DAX (3) 11/86-9/92 1,452 0.54 0.08 -
Modelos economicos de m ultiples agentes 10/6/2010
4.2. OCURRENCIA DE LEYES DE POTENCIAS 63
Figura 4.3: Distribuciones re-escaladas de los rendimientos Libra vs
Dolar.
L.E.: Libra Esterlina, D.A.: D olar Americano, Y.J.: Yen japones, D.C.: D olar canadiense, M.A.: Marco Alem an,
F.S.: Franco suizo. DAX: ndice de 30 acciones del Mercado Bursatil de Frankfurt. (1) Tomado de M uller et al,
1990, datos intradiarios (tick by tick), se utiliza otra metodologa para realizar el c alculo.
Las invariancias de escala y las leyes de potencias en sistemas naturales ocurren en las vecindades de sus
puntos crticos y transiciones de fase (cambio de s olido a lquido o de lquido a vapor). Las mismas est an ligadas
por lo general a propiedades muy fundamentales de las interacciones entre las partculas que los componen,
tales como la dimensionalidad de su ordenamiento espacial y sus simetras (ver (Kadano 1993)) y resultan
por otra parte independientes de una gran n umero de otras propiedades que no hacen a la esencia del sistema.
por estas razones ha sido posible agrupar estas leyes de potencias y transiciones en clases de univerdalidad.
Una clasicacion de mercados por sus exponentes crticos podra quiz a conducir al an alisis de la naturaleza del
mercado en la que intervienen, por ejemplo el tipo, monto o frecuencia de transacciones que tiene lugar en el
mismo. Podra bien suceder, por ejemplo, que un mecado cambiario se comporte diferente de uno burs atil o de
otro tipo de activos nancieros. Responder a estas conjeturas requiere construir modelos de funcionamiento de
estos mercados y vericar la emergencia de estas leyes de potencias vinculando sus expoenentes crticos con su
estructura o funcionamiento. Un modesto avance en este sentido consiste en analizar los lmites de validez de
estas reglas de invariancia, tema que tratamos en la pr oxima secci on.
Un quiebre de la invariancia de escala temporal
En esta secci on aplicamos la metodologa explicada arriba a un mercado de divisas con las patologas propias de
una inaci on persistente a lo largo de perodos muy prolongados. Para ello Se trabaj o con la serie temporal de las
cotizaciones del dolar en la Argentina a lo largo diez a nos en el perodo 1871-1991 con datos diarios, recopilado
seg un la siguiente tabla.
MERCADO CAMBIARIO ARGENTINO
Modelos economicos de m ultiples agentes 10/6/2010
64 CAP

ITULO 4. LEYES DE POTENCIAS


Mercado Perodo
Paralelo 2/8/71 hasta 30/12/75; 4/1/82 hasta 9/10/87; 19/5/89 hasta 14/12/89
Libre 7/1/76 hasta 17/6/81; 15/10/87 hasta 18/5/89; 15/12/89 hasta 30/3/91
nanciero 18/6/81-23/12/81
La probabilidad de retorno al origen se muestra en la g. 4.4. Ya no queda representada por una unica ley
de potencias sino que se requieren dos rectas de distintas pendientes para ajustar la distribucion de probabilidad.
Una de ellas es v alida para perodos breves, de t < 8 das y la otra abarca todos los intervalos de tiempo m as
prolongados.
Figura 4.4: Probabilidad de retorno al origen para el mercado peso-dolar
como funcion de t.
Las correspondientes distribuciones de rendimientos se muestran en la g. 4.5. Las mismas no son m as
simetricas como las que se mostraron para el mercado dolar-libra esterlina sino que se extienden mucho m as
hacia la derecha, como corresponde a una situaci on inacionaria. En una situaci on de ese tipo la probabilidad
de rendimientos positivos debe ser claramente mayor que la de obtener rendimientos negativos para un mismo
perodo t. El regimen inacionario se traduce en una probabiliad de retorno al origen que decae m as r apidamente
para perodos m as prolongados. Comp arese por ejemplo el exponente crtico para el mercado dolar-libra que es
.6 con el del mercado peso-d olar que es .8
Como es previsible, cuando se trata de re-escalar estas distribuciones para comprobar su invariancia resulta
imposible. Sin embargo es posible con todo encontrar un alto grado de invariancia de escala si se utilizan las dos
pendientes diferentes extradas del gr aco g. 4.4 para perodos prolongados y breves. Si se trata ambas series de
rendimientos por separado se obtienen los correspondientes gr acos que se muestran en la g. 4.6 utilizando para
ello los respectivos rendimientos estandar r
s
.
Surge de estos resultados que el mercado cambiario en presencia de inacion presenta un quiebre de la
invariancia de escala temporal. No es m as posible arg uir que este mercado carece de una escala de tiempo que
le es tpica. Podra bien suponerse, en cambio, que t 8das representa un intervalo de tiempo signicativo
ya que los exponentes crticos cambian cuando se pasa de intervalos menores a otros m as prolongados. Es sin
embargo difcil extraer una interpretaci on pr actica y transparente de esta escala de tiempo.
Modelos economicos de m ultiples agentes 10/6/2010
4.2. OCURRENCIA DE LEYES DE POTENCIAS 65
Figura 4.5: Probabilidad de retorno al origen para el mercado peso-dolar
como funcion de t.
Debe con todo observarse que la invariancia de escala temporal parece ser una propiedad muy fundamental
de las series temporales asociadas a mercados de divisas. Pareciera que la misma es capaz de sobrevivir en alguna
medida. La serie analizada presenta dos regmenes, ambos con un alto grado de invariancia para lapsos t < 8
y t > 8das. Lo llamativo es que esto sucede aun en situaciones tan extremas como un regimen inacionario y
con reglas de mercado extremadamente distorsionadas.
4.2.2 Fenomenos crticos
Cuando se calienta o enfra una sustancia o se la somete a presiones diferentes puede cambiar su naturaleza y
pasar de ser s olida a lquida o de ser lquida a gaseosa. En esas circunstancias se dice que la misma se ha fundido,
evaporado o sublimado que es cuando pasa de la fase s olida a la gaseosa sin fundirse previamente. Cada uno de
esas transiciones de fase se corresponden con cambios profundos en la organizaci on de los atomos y moleculas
que componen la sustancia y se traducen en alteraciones en la distribuci on de probabilidad de sus magnitudes
fsicas. Por lo general dichas distribuciones adoptan la forma de leyes de potencias. Es por esta raz on que la
ocurrencia de distribuciones que siguen leyes de potencias sugieren la vencindad de cambios estructurales. estas
transiciones de fase, se agrupan bajo la denominacion generica de fen omenos crticos y han dado lugar a extensas
investigaciones.
Las distintas fases de los sistemas naturales poseen escalas de longitud, volumen o energa que le son
caractersticas y que, adem as son muy distintas entre si. As por ejemplo las moleculas de un gas recorren
distancias grandes entre colisiones (lo que se denomina camino libre medio) mientras que en el seno de un lquido
o de un s olido no se desplazan con igual libertad y se encuentran siempre ubicadas a distancias mucho menores
que en un gas. Las distintas partes del material quedan entonces correlacionadas por causa de las interacciones
entre las moleculas que la componen y esas distancias de correlaci on se ven alteradas en presencia de un fenomeno
crtico del mismo modo que las densidades de probabilidad.
Sistemas sociales pueden tambien presentar cambios abruptos en su estructura u organizacion interna.
Alg un ejemplo ya se vio en el captulo anterior cuando se analizaron contagios, la instalaci on de una moda o
Modelos economicos de m ultiples agentes 10/6/2010
66 CAP

ITULO 4. LEYES DE POTENCIAS


Figura 4.6: Probabilidad de retorno al origen para el mercado peso-dolar
como funcion de t.
la difusi on de un rumor. En todos estos casos, un fen omeno que puede ser localizado, puede, por efecto de las
interacciones entre los agentes del sistema, extenderse y abarcarlo por completo. El prop osito de esta secci on es
presentar elementos que permitan ubicar dentro de un mismo marco conceptual fen omenos sociales aparentemente
desconectados entre si y, de esta manera ofrecer un modo diferente de contemplarlos.
Muchos fen omenos crticos se pueden simular mediante experimentos numericos realizados en sistemas
altamente estilizados pero que retienen, de todos modos, esas discontinuidades que tienen lugar para valores
singulares de sus par ametros de control. Un modelo de estas caractersticas es el aut omata celular que se utiliza
para representar el fen omeno de la condensaci on que fue presentado en la secci on (2.4.1) y tambien los que se
han discutido en el captulo anterior. Veremos a continuaci on que la ocurrencia de leyes de potencias es una
caracterstica compartida que permiten ubicarlos en el contexto de los fen omenos crticos
El aut omata celular de la secci on 2.4.1 representa de manera estilizada la formaci on de gotas de lquido
en un ambiente de gas sobresaturado de vapor. Por esta raz on cada celula puede cambiar de la fase vapor a la
lquida si en su vecindad hay 4 o m as celulas condensadas y pasa al estado de vapor si en su vecindad hay menos
de 4 celulas condensadas. El parametro de control de ese modelo es la densidad con que se siembran inicialmente
celdas en la fase condensada. Una vez que se le permite evolucinar el aut omata celular lleva el conjunto de celdas a
Modelos economicos de m ultiples agentes 10/6/2010
4.2. OCURRENCIA DE LEYES DE POTENCIAS 67
un punto jo. Si dicha probabilidad es menor que 0.25 el punto jo al que converge consiste en gotas representadas
por porciones de la grilla que son convexas y de distinto tama no. Si dicha densidad es levemente superior a ese
valor, el punto jo corresponde a que la totalidad de las celulas se encuentren en la fase condensada. Por debajo
de 0.25 el sistema posee una escala de longitud caracterstica, nita que est a dada por el tama no medio de las
gotas. Para p = p
c
esa longitud de correlaci on diverge porque se hace igual al tama no e la grilla.
Este modelo de condensaci on guarda muchas semejanzas con otro en que la din amica de condensaci on no
se tiene en cuenta y s olo se presta atenci on al tama no de racimos de celdas pertencientes a la fase condensada.
Si la probabilidad es peque na los racimos tienen un tama no medio bien denido que es independiente del tama no
de la grilla, pero cuando esa probabilidad aumenta el m aximo racimo tiene un tama no que est a s olo limitado por
las dimensiones de la grilla. En este caso se trata de averiguar cual debe ser la probabilidad inicial de ocurrencia
de celdas condensadas para que suceda eso y aparezca un camino que una ambas m argenes de la grilla y que
este formado s olo por celdas vecinas (que tengan al menos un lado en com un). Hoy se sabe que este umbral
de percolaci on tiene lugar cuando p = 0.5927462. La longitud de correlaci on es, est a dada en este caso por las
dimensiones dem m aximo racimo de celdas y s olo diverge (es del mismo tama no que la grilla misma) cuando se
alcanza el umbral de percolaci on. Un ejemplo se da en la gura g. 4.7. En esa grilla se marcaron al azar algunas
celdas y se indica un camino que une ambas margenes de la grilla. En estas condiciones se dice que el sistema de
celdas percola por semejanza con lo que sucede con el ujo de alg un lquido a traves de un medio granular. El
an alisis de este modelo permite demostrar que en una grilla regular ortogonal existe una probabilidad crtica p
c
para la cual se forma alg un racimo cuyas dimensiones crecen con el tamao de la grilla.
Figura 4.7: Situacion en el umbral de percolacion p
c
.
Esta probabilidad crtica puede determinarse numericamente con gran precisi on y, en algunas redes regu-
lares se la ha podido calcular analticamente. La siguiente es una tabla de valores de los umbrales de percolaci on
para diferentes grillas regulares.
UMBRALES DE PERCOLACI

ON
Modelos economicos de m ultiples agentes 10/6/2010
68 CAP

ITULO 4. LEYES DE POTENCIAS


Grilla umbral
panal de abeja 0.6962
cuadrada 0.592746
triangular 0.5000
diamante 0.43
c ubica 0.3116
hiperc ubica (4dim.) 0.197
hiperc ubica (5dim.) 0.141
hiperc ubica (6dim.) 0.107
hiperc ubica (7dim.) 0.089
Observese que el problema de percolaci on que se acaba de plantear puede plantearse en termino de grafos
como los presentados en el captulo anterior. Basta para ello hacer corresponder una celda a un nodo del grafo
y asociar los vnculos del mismo con las vecindades de las celdas tal como se muestra en los paneles A y B de
la g. 4.8. Una vez formulado en este lenguaje es posible generalizarlo para un grafo general tal como el del
panel C de la g. 4.8. Este esquema se discuti o en el captulo anterior cuando se estudi o la difusci on de rumores,
contagios y modas. La ocurrencia de un umbral de percolaci on una grilla se corresponde con el resultado de Erd os
y Renyi sobre la ocurrencia de una componente gigantes en un grafo aleatorio construido introduciendo vnculos
al azar con una probabilidad p. En este caso tambien existe una probabilidad crtica para tal aparici on de una
componente que conecta la mayora de los nodos del grafo (ver secci on 4.3.1). En el estudio de problemas sociales
o economicos, la existencia de un umbral de percolaci on puede interpretarse como las circusntancias propicias para
que una alteraci on local pueda propagarse a una importante fracci on del sistema. Muchos de estas implicacias
fueron ya discutidas en el captulo anterior.
Figura 4.8: Representacion del problema de percolacion en una grilla y
en grafos regulares e irregulares.
En la g. 4.9 se muestran ejemplos de resultados de la densidad de probabilidad de tama no de gotas en el
modelo de condensaci on para distintas probabilidades p con la que se siembran celdas condensadas en el estado
Modelos economicos de m ultiples agentes 10/6/2010
4.2. OCURRENCIA DE LEYES DE POTENCIAS 69
inicial. Cuando p < p
c
= 0.25 se producen gotas cuyos tama nos G se distribuyen siguiendo aproximadamente
una ley exponencial como P(G) e
G
. Esto se muestra en el panel (A) en el que la distribuci on de tama nos
ha sido ajustada por una curva de ese tipo. A medida que p aumenta el tama no medio de las gotas crece, se
sigue obedeciendo a una ley similar pero con la constante cada vez menor. Para p > p
c
= 0.25, el proceso de
condensaci on de gotas invade toda la grilla produciendo una unica gota gigante que la cubre por completo. La
distribuci on de tama no de gotas para p p
c
se aproximan a una ley de potencias P(G) G

. Esto se muestra en
el panel (B) de la g. 4.9 en que se ha trazado una curva que corresponde a 1.1.
Puede observarse que la probabilidad de ocurrencia de una gota grande (una cat astrofe) comparada con la
de una gota peque na es notoriamente mayor que para valores chicos de p. Esta transici on de fase es independiente
del tama no de la grilla y un an alisis meticuloso requiere comparar resultados para grillas de tama nos crecientes.
A modo de ejemplo se muestra c omo las distribuciones para una grilla de 50X50 y p p
c
son muy similares a los
de una grilla de 60X60. Sin embargo, ambas distribuciones caen r apidamente para grandes tama nos. Este es un
efecto de tama no nito. Como las grillas que se pueden utilizar numericamente son en realidad nitas, las gotas
que se pueden llegar a observar nunca exceden el tama no de la grilla (en el ejemplo que se muestra ese lmite es
G = 2500) con lo que la probabilidad de ocurrencia de gotas mayores es cero dando as lugar a la caida que se
observa.
Figura 4.9: Distribucion de tama no de gotas. (A) Para p < p
c
la
distribucion es aproximadamente una exponencial. (B) Para p p
c
la dis-
tribucion se aproxima a una ley de potencias.
Una vez alcanzado el punto jo del aut omata se puede tratar de determinar la densidad D de gotas
para distintos valores de la probabilidad p con que se siembran celdas condensadas. Para ello, se pueden contar
cu antas gotas N(L) han quedado encerradas en una grilla de lado L. Para p < p
c
las gotas tiene un tama no
medio G y la cantidad N(L) est a bien denida y crece linealmente con L
2
. La densidad - constante - es,
simplemente D = N(L)/L
2
. Si se hace un gr aco de D como funci on de L se debe obtener una constante,
salvo para grillas muy peque nas en las que se pueden obtener resultados alterados por el tama no reducido de
las grillas. El valor de D puede, como es natual, cambiar con p. Sin embargo, la situaci on es muy diferente
para p p
c
. Para p p
c
la distribuci on de tama nos de las gotas siguiendo una ley de potencias indica que si la
grilla es sucientemente grande es posible encontrar gotas de todos los tama nos. En el umbral de condensaci on
no se puede denir un valor medio de G y es posible encontrar gotas que s olo esten parcialmente contenidas en
un dado cuadrado de lado L. Si se mide N(L) como funci on de L para p p
c
se comprobar a que no aumenta
linealmente con L
2
sino con alguna potencia diferente, o sea N(L) L

. El exponente recibe el nombre de


Modelos economicos de m ultiples agentes 10/6/2010
70 CAP

ITULO 4. LEYES DE POTENCIAS


dimensi on fractal del conglomerado de gotas
1
. Un conglomerado de gotas que se distribuyen como una ley de
potencias es estadsticamente autosemejante, esto es, una muestra cualquiera puede ser magnicada o reducida
para coincidir- estadsticamente - con el propio conglomerado del que se extrajo la muestra. Del mismo modo,
las series temporales analizadas en la secci on anterior pueden ser consideradas fractales en el tiempo, as como
las gotas generadas con el modelo de condensaci on pueden considerarse fractales en dos dimensiones espaciales.
Este c alculo de la densidad est a ejemplicado en la g. 4.10 en el que se ha gracado log[N(L)/L
2
] como
funci on de log L para p =0.15,0.20 y 0.25. Se repiti o el c alculo 40 veces para cada valor de p y L para disponer
de una estadstica mnimamente representativa y se calcul o el promedio de N(L). Para densidades muy bajas
y grillas peque nas no se consignan datos por estar fuertemente afectados por lo reducido del sistema. Si bien
estos resultados son solamente un ejemplo es possible observar que para p = 0.20 la curva se aproxima muy
satisfactoriamente a una constante pero para p = 0.25, en el umbral de la condensaci on, los puntos obtenidos se
aproximan a una recta con una leve pendiente negativa. Esto indica que N(L) L
2
con > 0, revelando que
proliferan gotas de tama nos diferentes que no llenan uniformemente el plano.
Figura 4.10: Densidad de gotas para distintos valores de p y L. Se
ha gracado D = N(L)/L
2
como funcion de L en una escala doble
logartmica, de este modo una ley de potencias del tipo [N(L)/L
2
] L

,
se aproxima a una recta de pendiente negativa. Crecientes valores de
p (roja, negra y azul) se corresponden con mayores valores de D. La
curva azul corresponde al umbral de percolacion. En la curva roja no se
incluyen valores peque nos de p y L.
1
La dimensi on fractal de Hausdor que es una generalizaci on de la nocion de dimensi on espacial, se dene
como lim
L0
log(N(L)/ log L donde N(L) es el n umero de cubrimientos de lado L que es necesario realizar para
abarcar todo el conjunto de puntos cuya dimensi on se desea establecer.
Modelos economicos de m ultiples agentes 10/6/2010
4.2. OCURRENCIA DE LEYES DE POTENCIAS 71
4.2.3 Criticalidad Autoorganizada
Cuando la densidad de probabilidad sigue una ley de potencias, suele decisre que posee colas gordas. En este caso,
la probabilidad de ocurrencia de un evento catastr oco es mucho mayor que si la distribuci on poseyera una cola
exponencial. Una de las preguntas que subyacen a la idea de la criticalidad autoorganizada es si la ocurrencia de
eventos de gran amplitud puede o no ser atribuible al funcionamiento regular y normal de propio sistema.
En la secci on anterior hemos visto ejemplos de series temporales econ omicas en las que la transformada
de Fourier de su funci on de autocorrelaci on decae m as lentamente a cero que lo que debiera esperarse de series
puramente estoc asticas. Esta transformda de Fourier suele tambien llamarse espectro de potencia. Otras series
con esta propiedad est an ligadas a indicadores macroecon omicos tales como el producto bruto per c apita, tasa de
desempleo, producci on industrial per c apita, etc. (Nelson y Plosser 1982).
Este fen omeno de persistencia es conocido tambien como ruido 1/f, ya que dichas trasformadas de Fourier
se comportan, para bajas frecuencia como f

. El ruido 1/f signica que existe una importante contribuci on de


las bajas frecuencias (que corresponde a fen omenos de deriva) en la descripci on del fen omeno.
Las series naturales de este tipo se presentan en sistemas abiertos esto es, en sistemas en que existe
un continuo aporte exterior de energa, materia u otro elemento. Un mercado puede tambien ser considerado
como un sistema abierto en el que los aportes externos m as signicativos son el dinero y la informacion. No debe
pues sorprender que la serie temporal de los precios reeje el comportamiento de cualquier otro sistema de esta
naturaleza y presente las persistencias se naladas arriba.
En a nos recientes se ha elaborado un modelo de criticalidad autoorganizada que provee una imagen de la
din amica que subyace a la ocurrencia de ruido 1/f. Se trata de un modelo para sistemas abiertos y extendidos, o
sea, con gran cantidad de componentes en interacci on y con una dimensi on en la que se p ueden denir vecindades
o, si se quiere, el alcance de las mutuas inuencias entre sus partes. Este modelo hace surgir el ruido 1/f como
la superposici on de eventos de distintas vidas medias. En lugar de colisiones individuales se preere la imagen de
avalanchas mecanismo que se encarga de disipar la energa que se le ha aportado al sisteam y que se encuentra
acumulada en distintas partes del mismo. Las avalanchas se suponen que ocurren debido a perturbaciones externas
esporadicas. Surge del modelo que dichas avalanchas pueden propagarse y afectar a porciones mayores o menores
del sistema. Pueden por consiguiente poseer distintas vidas medias segun una distribucion de probabilidades que
que involucra - con una correspondiente baja probabilidad - vidas arbitrariamente largas. De este modo a un
cuando cada proceso individual pueda dar lugar a un realajamiento exponencial este tiene lugar con tan diversas
vidas medias que su superposici on puede dar lugar a decaimientos m as lentos como los que se observan en la
realidad.
Como el sistema que se considera es abierto y extendido, los aportes externos de energa se traducen en
perturbaciones locales sobre cualquiera de sus unidades. Se supone adem as que la respuesta de cada unidad
no es una funcion lineal del estmulo sino que se trata de un fen omeno todo o nada o del tipo stick-slip o
adherencia - deslizamiento: si la perturbaci on es sucientemente debil la unidad afectada absorbe integramente
la perturbaci on sin que suceda nada m as. Si en cambio la perturbaci on supera un umbral la unidad descarga
una perturbaci on sobre todas aquellas otras unidades con las que interact ua. Ellas pueden, a su vez y siguiendo
la misma ley, perturbar a otras dando asi lugar a una avalancha cuyas dimensiones espaciales y cuya duraci on
depende del estado de las sucesivas unidades afectadas.
En este modelo resulta que la respuesta global del sistema a los estmulos recibidos del exterior es autoor-
ganizarse dinamicamente en un estado crtico en que la distribuci on de avalanchas sigue una ley de potencias y
por consiguiente no posee ni dimensiones espaciales ni temporales caractersticas. Las dimensiones espaciales de
la avalancha o su intensidad dan respectivamente una medida de la cantidad total de energa que se libera en
cada evento y la cantidad de elementos del mismo que se han visto afectados. En el marco de este modelo las
grandes cat astrofes (avalanchas que afectan a una porci on particularmente grande del sistema) no se presupone
que sean debidas a causas externas particulares sino m as bien a una combinaci on particularmente desgraciada -
e infrecuente - de acontecimientos y situaciones que de otro modo seran totalmente normales.
El modelo se lo formaliza mediante un aut omata celular que representa una idealizacion de una pila de
arena. Los aportes externos consisten en el agregado de granos de arena que, cuando se los agrega a lugares que
se encuentran colmados, dan lugar a avalanchas .
Modelos economicos de m ultiples agentes 10/6/2010
72 CAP

ITULO 4. LEYES DE POTENCIAS


Figura 4.11: Avalancha en una pila de arena unidimensional. Cada
cuadrado representa un grano de arena. Se agrega un grano en una
columna que esta en el valor crtico. Se muestra el progreso de una
avalancha.
Para realizar una simulaci on numerica se comienza por construir un estado crtico depositando en un tablero
de dimensiones establecidas una cantidad grande de granos de arena y permitiendo que los sitios descarguen en
sus vecinos los granos que exceden un valor z
crit
establecido. Si bien se han estudido numerosas variantes de este
sistema variando la dimensionalidad y naturaleza de la grilla todos los efectos se pueden observar en un tablero
regular de dos o tres simensiones.
La altura de la pila de arena en la i-esima ubicaci on del tablero se representa por una variable discreta
z
i
, z
i
z
crit
. En caso que z
i
> z
crit
se produce una descarga en la que el sitio z
i
y sus n primeros vecinos alteran
sus respectivos z
j
seg un la regla:
z
i
(t) z
i
(t + 1) = z
i
(t) n (4.24)
z
j
(t) z
j
+ 1 j |vecindad de i (4.25)
Los sitios que se encuentran en el borde del tablero descargan su exceso al exterior del sistema. La actualizaci on
de los valores de z
i
en todos los sitios de la red se realiza de manera sincr onica. Se llega de sta manera a una
estado crtico con una distribuci on de granos de arena en la que no se producen m as avalanchas y con muchos
sitios con z
i
= z
crit
. A partir de este estado crtico es que se analiza la distribuci on de avalanchas. Esto se hace
perturbandolo mediante el agregado, por turno, de un grano en cada sitio que esta con una altura z
i
= z
crit
y registrando la avalancha que se produce a partir de esa perturbaci on. La intensidad de una avalancha puede
medirse por el n umero de vecinos perturbados o por el area cubierta. Para obtener una distribuci on de tama nos de
avalanchas que sea estadsticamente representativa se repite este an alisis con numerosos estados crticos iniciales.
La simulaci on computacional de estos sistemas da lugar a funciones de distribuci on de magnitud y du-
raci on de eventos que obedecen leyes de potencias y ha permitido reproducir algunos de los fen omenos naturales
mencionados al comienzo. El exito m as signicativo de la teora ha sido la descripci on de la ley de Gutenmberg
y Richter que da la distribuci on de sismos por la energa liberada.
El exponente crtico de las distribuciones depende tan s olo de propiedades estructurales del sistema tales
como el n umero de vecinos (la dimensionalidad de la grilla que ocupan los elementos del sistema) pero de ninguna
otra caracteristica del mismo tal como su dimensi on o del tipo de interacci on que se desee poner entre vecinos.
N otese que a medida que el sistema es forzado por los aportes externos, su evoluci on presenta un importante
quiebre de la ergodicidad: Cualesquiera sea la condici on inicial que se elija, el sistema termina visitando un
subespacio muy reducido de estados que son aquellos que satisfacen la condici on de poseer la altura crtica.
Las distribuciones que siguen leyes de potencias carecen de escalas o duraciones cractersticas. Los autores
del modelo de criticalidad autoorganizada arguyen que el hecho que la probablidad de retorno al origen de
Modelos economicos de m ultiples agentes 10/6/2010
4.2. OCURRENCIA DE LEYES DE POTENCIAS 73
distribuciones de este tipo sigan una ley T
1/
necesariamente implica que la serie temporal tiene ruido 1/f. Para
ello comienzan por postular que cada evento individual (la descarga de cada sitio) que libera una cantidad
total A de energa en toda su vida presenta una funci on de autocorrelacion que decrece exponencialmente con el
tiempo c(t) = (A/T)e
t/T
. Si se supone que todos los eventos tienen la misma intensidad inicial, debe suceder
necesariamente que A T con lo que la funci on de autocorrelaci on es S(f, A) = A/(1+4
2
f
2
T
2
) T/(1+4
2
f
2
T
2
)
El espectro de potencia de una serie producida por la superposici on independiente y concurrente de eventos de
diversas vidas medias T (y por consiguiente de distintas intensidades A) se expresa como
S(f) =
Z
P(T)S(f, A)dT =
Z
P(T)TdT
1 + 4
2
f
2
T
2
f
21/
(4.26)
En esta expresi on el termino (1 + 4
2
f
2
T
2
)
1
que corresponde a la trasnfromada de Fourier de un unico evento
c(t) esa tomado simplemente como un corte para altas frecuencias que permite redenir el lmite superior de la
integral.
La plena aplicabilidad del concepto de criticalidad autoorganizada al comportamiento de mercados es
tema para una discusi on mucho m as amplia. En (Bak, Chen, Scheinkman, and Woodford 1993) se analiza el
fen omeno de criticalidad autoorganizada en un contexto econ omico sumamente estilizado y en Dab us et al, 1995,
se plantea la posibilidad de que los procesos inacionarios esten auto-organizados criticamente). El modelo de
la pila de arena y sus variantes posee, por una parte, elementos que son indiscutiblemente atractivos: se trata
de un modelo tpicamente holista que reeja caractersticas del sistema como un todo, independiz andose de sus
detalles como la frecuencia relativa de eventos peque nos y grandes o los mecanismos microsc opicos de interacci on,
esquematiz andolos como siendo del tipo todo o nada. Presenta un porceso de autoorganizaci on dinamica del
sistema sin que medien elementos o par ametros ex ogenos que deban sintonizarse para que tal organizaci on tenga
lugar. Sin embargo, por otra parte, se debe admitir que en un sistema econ omico existen agentes heterogeneos
de inuencias muy diferentes, y en el que coexisten y se superponen procesos de muy diversa naturaleza. Esto
hace inviable una visi on agregada ingenua. Adem as, admitir plenamente que los mercados se autoorganizan
crticamente puede considerarse equivalente a admitir la existencia de una ley estructural e inmutable de la cual
los agentes economicos no pueden substraterse y que, de hecho contradice sus innegables posibilidades de aprender
o adaptarse a diferentes circunstancias.
Modelos economicos de m ultiples agentes 10/6/2010
74 CAP

ITULO 4. LEYES DE POTENCIAS


Modelos economicos de m ultiples agentes 10/6/2010
Captulo 5
Redes complejas, modas y
cacerolazos
5.1 Introducci on
Uno de las innovaciones tecnol ogicas m as sobresalientes de la Era de la Informaci on, es el surgimiento de Internet,
la red m as grande creada por el hombre. Terabytes
1
de informaci on son transmitidos diariamente entre los 540
millones de servidores
2
interconectados por bra optica, satelites, cables coaxil, y lineas telef onicas. El origen de
esta formidable red de autopistas de informaci on se remonta a 1992, cuando se lanz o (gratuitamente) el programa
Mozilla.
Mozilla fue el primer programa que permita a cualquiera construir paginas con informaci on, y ,mas
interesante, denir vnculos links o otras direcciones a otras p aginas a las cuales se poda ir. Esta innovaci on abri o
la posibilidad de navegar por esa incipiente red formada esencialmente por p aginas de Universidades. Desde su
lanzamiento, la home-page de Mozilla iba anunciando que p agina nuevas iban surgiendo, hasta que al poco tiempo
surgieron muchas otras con m as listas de links. Como este proceso se torn o inmanejable, surgieron los primeros
buscadores masivos: Altavista, Lycos, Yahoo, etc. Debido a la estructura que tena la red, se desarrollaron
programas automticos (bots) que recolectaron primero los links y luego el contenido de cada p agina. Esto culmina
en tiempos recientes con el surgimiento de Google, que, por medio de su granja de m as de un millon de servidores
nos permite realizar b usquedas relativamente acotadas en un tiempo muy corto.
Internet cambi o la forma en que vivimos, y sin duda cambiar a la forma que viviremos en el futuro. La
innovaci on esencial para su exito fue que acorta las distancias y los tiempos. El acortamiento de las distancias
puede ser m as gurativo que real ya que lo que realmente hace Internet es disminuir la cantidad de pasos que
es necesario dar para establecer un contacto. Hay herramientas propias para establecer redes sociales que estan
orientadas a sugerir a caa usuario cu al otro puede ser su amigo de la infancia, haya compartido escuelas o vivan
en lugares pr oximos. Para ello se utiliza una medida de distancia que tiene en cuenta la edad, el domicilio,
los estudios realizdos, etc. En cuanto al tiempo, Internet permite realizar m as tareas por unidad de tiempo.
Actualmente se busca mucho m as frecuentemente que poco tiempo atras debido a la facilidad de hacerlo.
Matem aticamente, el estudio de redes se formaliz o por la teora de grafos, que se puede decir que naci o
cuando Euler dio en 1736 con la soluci on al Problema de los Puentes de Koenigsberg: encontrar un recorrido en
esa ciudad que atraviese todos los puentes una sola vez. Un avance importante lo dieron Erd os y colaboradores
en la decada del 50 con el estudio de redes aleatorias. En la ultima decada se puso atenci on principalmente en
las llamadas redes complejas, que han permitido modelar redes sociales y econ omicas, incluidas Internet. Los
estudios actuales est an orientados a
1
Un terabyte equivale a 1000 gigabytes o 10
6
megabytes.
2
Son datos del 2008. En el 2007 creci o un 25%.
75
76 CAP

ITULO 5. REDES COMPLEJAS, MODAS Y CACEROLAZOS


Detecci on de comunidades (individuos, paginas web, empresas) que representen intereses parecidos con
prop ositos de comercializaci on o de seguridad (detecci on de agrupaciones o actividades terroristas). El
estudio de redes de interes econ omico es mucho m as limitado.
Difusi on y diseminaci on de ideas (Bikhchandani, Hirshleifer, and Welch 1992), (Bikhchandani, Hirshleifer,
and Welch 1998)
B usquedas en redes complejas. Los problemas que se encaran es establcer cual es la manera m as eciente
de organizar una gran colecci on de documentos relacionados o c omo son los mecanismos que se usan para
buscar algo? (Adamic, Lukose, Puniyani, and Huberman 2001), (Kleinberg 2000)
Evoluci on de epidemias y protocolos de vacunaci on. El estudio del SIDA ha puesto en evidencia la im-
portancia de la estructura de la red de vinuclacin social en los modos de propagaci on de las enfermedades
infecciosas. Esta problem atica se aplica tambien a la difusi on de los virus en las computadoras.
Metodos de optimizaci on. El desarrollo de actividades en el seno de una red obliga y al mismo tiempo
facilita implementar soluciones a problemas de optimizaci on tales como determinar el recorrido m as corto
entre un conjunto de destinos tal que solo se visite cada destino una sola vez (Problema del Viajante de
Comercio), obtener la mejor distribuci on de camiones para despachar un conjunto de mercaderas (Problema
del Viajante de Comercio con multiples vehculos y restricciones de capacidad por cada uno de ellos. La
teora de grafos tambin permite optimizar el cableado en circuitos electr onicos, minimizando la energa
disipada, y las interferencias entre sus componentes.
En este captulo estamos interesados en explorar algunos fen omenos propios de redes sociales, biol ogicas,
y econ omicas y cuales son los procesos mas comunes que operan sobre las mismas. Nos interesar a principalmente
ver c omo hechos o interacciones que afectan a olo a una parte de la red pueden propagarse y manifestarse como
efectos globales. Esto nos llevara a considerar modelos de se propagacion de infecciones, la instalaci on de una
moda, el desarrollo de una revoluci on, o protestas como los cacerolazos pot-banging
3
). Si bien no se pretende tocar
todos estos temas, se repasar an algunos que son los m as representativos y se recomienda consultar referencias
m as especializadas (Albert and Barab asi 2002), (Newman 2005) o de divulgaci on (Barabasi 2003). En todo lo
que sigue, es conveniente tener presente que hay dos grupos de problemas que pueden analizarse a la luz de estas
teoras. Un grupo est a orientado al an alisis de la topologa y otras propiedades del grafo. El otro grupo enfoca
aspectos din amicos. Estos, a su vez, pueden ser de dos tipos. Uno pretende describir c omo se desarrolla un
fen omeno en un grafo que permanece inalterdo en el tiempo (p.ej. propagaci on de una enfermedad) y el otro
pretende analizar c omo y porque cambia y evoluciona el propio grafo por efecto de las interacciones entre sus
nodos (p.ej. interacciones entre las especies en un sistema ecol ogico).
5.2 Que es una red y algunas deniciones generales
Una red o grafo es un objeto muy general. Involucra un conjunto nito de nodos, que pueden representar m aquinas,
personas, empresas, u organizaciones, y sus relaciones, vnculos o links, que dependiendo de la aplicaci on puede
ser el costo entre empresas, distancia fsica entre m aquinas, la amistad entre personas o en general cualquier
otra relaci on que describan alguna propiedad entre nodos. Este conjunto de relaciones denen naturalmente la
vecindad de un nodo como aquellos nodos que est an directamente relacionado con aquel nodo.
En los aut omatas celulares de los captulos anteriores dicha relaci on estaba dada generalmente por la
vecindad fsica de las celulas o agentes. En las redes neuronales dicha vecindad se poda extender a todo el
conjunto de celulas (modelo de Hopeld) o representar un conexionado en cascada como en las redes en capas.
En la siguiente tabla se dan algunos ejemplos de redes.
EJEMPLOS DE REDES
3
Ver extensa nota en www.wikipedia.com
Modelos economicos de m ultiples agentes 10/6/2010
5.2. QU

E ES UNA RED Y ALGUNAS DEFINICIONES GENERALES 77


Red Nodos Relaciones / Vnculos
Red de distrib. Centros de generaci on lineas de transmisi on
electrica subestaciones electrica
Red tr oca en especies presa - predador
un ecosistema
Internet paginas web hiperlinks
sistema nervioso neuronas axones
coautora cientca autores artculos publicados
en com un
comercio internacional paises transacciones comerciales
Las redes de arriba no son todas iguales, y seg un lo que se desee estudiar los grafos reciben diverso tipo
de apelativos que restringen la denic on general que se dio de una red. Por ejemplo, un grafo es:
dirigido u orientado cuando la relacion entre sus nodos tiene alguna direccionalidad predeterminada. Por
ejemplo en una red de compras y ventas, la relaci on nodo A compra de nodo B especica una relaci on
que A tiene con B, pero no una que B tiene con A. Esto ocurre por ejemplo con la relaci on de proveedor a
consumidor, de prestamista a prestatario, de empleador a empleado, etc.
disconexo cuando existe un subconjunto de nodos que no se vinculan al resto o, equivalentemente, cuando
no es posible conectar cualquier par de nodos recorriendo un camino formado por relaciones consecutivas.
pesado o es un multigrafo cuando a sus vnculos se les asigna alg un peso que determine la intensidad
o importancia de la interacci on. Los tratamientos pueden cambiar si el peso se dene como un n umero
natural o uno real. Tal por ejemplo si se trata de una red de prestamistas y prestatarios, el peso del vnculo
puede estar relacionado con el monto del dinero prestado. Si se trata de una red comercial el peso puede
ser el n umero, costo o naturaleza de los bienes transados.
arbol cuando el mismo no tiene ning un ciclo. Un ciclo en un grafo es un subconjunto de nodos que cada
uno tiene por lo menos dos conexiones, y uno puede denir un orden de visita (respentando naturalmente
las conexiones existentes) tal que si sale de cualquier miembro, vuelve a pasar por el mismo.
regular cuando todos los nodos tienen el mismo n umero de vecinos y tiene una disposici on particular en
alg un espacio Euclideo. Tal es, por ejemplo el caso de las intersecciones de una grilla regular cuadrada o
hexagonal en el plano, como el tablero de un juego de ajedrez.
aleatorio cuando sus relaciones o vnculos son determinadas mediante un proceso estoc astico (digamos por
alguna distribuci on de n umeros aleatorios). En general se suele referir a una red aleatoria, aquella que
proviene de utilizar una distribucion uniforme de n umeros aleatorios (red de Erd os y Renyi ver 5.3.1).
bipartito cuando est a compuesto por nodos de dos tipos y las conexiones s olo vinculan a nodos de distinto
tipo. Tal es el ejemplo de un sistema de bancos y empresas, en que el vculo es el otorgamiento de creditos;
de directorios de empresas y de personas, en el que el vnculo es el de pertenencia; de de actores y pelculas
en que el vculo es el de formar parte del elenco.
din amico si la cantidad de nodos o sus conexiones cambian con el tiempo. Tal es por ejemplo Internet en
que los nodos son servidores que se suman al sistema constantemente o la red de relaciones interpersonales
que se establecen por un vnculo de amistad cambia en el tiempo.
Formalmente un grafo A queda denido cuando se denotan sus N nodos, y las K relaciones entre ellos.
Estas ultimas suelen especicarse mediante una matriz de adyacencia A
i,j
cuyas las y columnas est an rotuladas
por los nodos y sus elementos A
i,j
|0, 1 indican respectivamente la ausencia o presencia, respectivamente, de
un vnculo entre el nodo i y el j. Para los grafos pesados, es util denir la matriz de adjacencia con coecientes
reales A
i,j
1, indicando el peso del vnculo entre los nodos correspondientes. En la mayora de las aplicaciones
en redes complejas no se admiten auto-conexiones, por lo que A
i,i
= 0 para todo nodo i. Para el caso de un grafo
com un A
i,j
es una matriz simetrica, mientras que si el grafo es dirigido es, en general, no simetrica. Para redes
bipartitas, con N
1
nodos de una especie, y N
2
nodos de la segunda especie, cada la de la matriz corresponden
a una especie de nodos de tipo 1, y cada columna a especies de nodos de tipo 2, por lo que A
i,j
R
N
1
xN
2
no es
una matriz cuadrada.
Modelos economicos de m ultiples agentes 10/6/2010
78 CAP

ITULO 5. REDES COMPLEJAS, MODAS Y CACEROLAZOS


La representaci on gr aca de los grafos suele ser puntos para los nodos y segmentos o curvas para sus
relaciones. Actualmente est an disponibles en Internet softwares especializados para hacer estos dibujos
4
. Algunos
ejemplos de grafos se muestran en la g. ??.
Random graph
Powerlaw graph
Figura 5.1: Se muestran diverso tipo de grafos.
Como se puede apreciar los ambitos donde se puede aplicar la teora de grafos es de una enorme generalidad
y abarca una gran diversidad de situaciones. Para caracterizar los grafos es usual consideras los siguientes
elementos:
Vecindad de un nodo. Para un nodo i, su vecindad corresponde al subconjunto n(i) A de un nodo i,
tal que A
i,n(i)
= 1 (o distinto de cero para redes pesadas).
Grado o fuerza de un nodo. Para un nodo i, su grado k
i
es el n umero de vecinos o [n(i)[ la cardinalidad
de su vecindad. Especcamente
k
i
=
X
j
A
i,j
(5.1)
En el caso que se trate de un grafo pesado, la extension natural del concepto de grado es el de fuerza que
es la suma de los pesos de todos los vculos que parten de ese nodo y cumple con la denici on dada en
(5.1). Por lo general lo que se analiza es la distribuci on de pesos P(k) que es la probabilidad de ocurrencia
de un nodo con grado (o fuerza) k. Como es usual, los momentos de esta distribuci on son
k
n
) =
X
i
k
n
P(k) (5.2)
Una cantidad importante es la conectividad promedio de una red k) 2K/(N(N 1)), donde K es el
n umero total de relaciones o vnculos de la red
5
.
Distancia entre nodos La distancia d
i,j
entre los nodos i y j es el n umero mnimo de vnculos o relaciones
que es necesario recorrer para unir ambos nodos. Por lo general esta distancia tambien recibe el nombre de
camino mnimo entre nodos. Existen algoritmos para calcular las distancias mnimas, como el de Dikjistra.
4
http://vlado.fmf.uni-lj.si/pub/networks/pajek/ o http://www.graphviz.org
5
Una red de N nodos, posee un m aximo de N(N 1)/2 conexiones unicas (la conecci on A B y B A
cuentan una sola vez).
Modelos economicos de m ultiples agentes 10/6/2010
5.3. REDES ALEATORIAS, MUNDOS PEQUE

NOS Y REDES LIBRES DE


ESCALA 79
Por extensi on se suele llamar di ametro de un grafo al camino (mnimo) m as largo entre todos los nodos de
ese grafo. Por otra parte, se dene como distancia caracterstica entre los nodos de esa red al valor medio:
L = d
i,j
)
i,j
=
1
N(N 1)
X
i,j;i=j
d
i,j
(5.3)
Debe notarse que esta denici on debe ser aplicada con precauci on pues L diverge si el grafo es disconexo.
Clustering El coeciente de clustering C
i
del nodo i es la fracci on de sus vecinos que son, a su vez, vecinos
entre si. Es una medida de que tan social es el vecindario de un nodo. M as formalmente se la suele denir
como
C
i
=
E
i
k
i
(k
i
1)/2
(5.4)
donde k
i
es el el grado del nodo i y E
i
es el numero de relaciones o vnculos que unen entre si a los vecinos
de nodo i (y excluyen al nodo i). Obviamente, el clustering medio se dene como
C = C
i
) =
1
N
X
i
C
i
(5.5)
Por su denicion 0 C
i
1.
Centralidad En muchos estudios es util contar con una medida de la centralidad o importancia de un
nodo para conectar distintas partes de la red, o sea, una medida de la relevancia de un nodo en su
estructura general
6
. En una red de distribuci on de mercadera, un nodo de elevada centralidad puede ser,
por ejemplo la ocina encargada de la vinculaci on de diversos centros de acopio o reparto. En una red de
comunicaciones puede tratarse de una central de conmutaci on telef onica que vincula dos centros con gran
cantidad de telefonos.
Una manera de calcular la centralidad de un nodo es preguntarse, para ese nodo, cu antos caminos mnimos
que unen entre si a dos nodos cualesquiera de la red deben pasar necesariamente por el. Con esta idea, la
centralidad de un nodo i se dene como
B
i
=
X
j,k;j=k
n
j,k
(i)
n
j,k
(5.6)
donde n
j,k
es el n umero total de caminos mnimos que conectan los nodos j y k y n
j,k
(i) es el n umero
de caminos mnimos que unen los nodos j y k que pasan por el nodo i. Tambien se puede aplicar esta
denici on a los vnculos y denir la ligaz on de un vnculo como la fracci on de caminos mnimos del grafo
que pasan por dicha relaci on.
Varios de los par ametros denidos arriba requieren gran tiempo de c omputo para redes de cierta impor-
tancia. Para un grafo com un, de N = 1000 nodos, las computadoras actuales permiten almacenar la matriz de
adjacencia A
i,j
para denir todas las relaciones, aunque en muchas aplicaciones dicha matriz est a plagada de
ceros y es m as eciente para cada nodo guardar su lista de vecinos. Para medir distancias mnimas entre nodos
con matriz de adjacencia A
i,j
|0, 1, un metodo sencillo de aplicar es obtener sucesivas potencias A
n
, pues sus
coecientes indican el n umero de caminos de largo n entre los nodos de la red. Sin embargo este algoritmo es
muy lento para redes grandes N > 100 y es necesario recurrir a otros metodos (metodo de Dijikstra).
5.3 Redes aleatorias, mundos peque nos y redes libres de escala
Durante mucho tiempo, los grafos mas utilizados fueron los regulares y los aleatorios. Por ejemplo, los regulares
fueron utilizados en la decada del 20 por von Neumann con los aut omatas celulares, y lo mismo Fermi, Pasta
y Ulam (decada del 50) en sus primeros experimentos computacionales sobre el principio de equipartici on de
6
Tambien se lo puede llamar ligaz on (betweeness) o carga (load).
Modelos economicos de m ultiples agentes 10/6/2010
80 CAP

ITULO 5. REDES COMPLEJAS, MODAS Y CACEROLAZOS


energa. Los grafos aleatorios tuvieron su gran empuje hacia nales de la decada del 50, cuando Erd os y Renyi
7
caracterizaron la construcci on y las propiedades de los grafo aleatorio.
M as recientemente, Watts y Strogatz (Watts and Strogatz 1998), introdujeron las redes de mundo peque no,
cuya caracterstica central es que preservan la propiedades de las redes regulares, y contienen tambien alguna
propiedad de las redes aleatorias. Asi mismo Barabasi y Albert (Barab asi and Albert 1999), estudiaron como
son la distribuci on de nodos en redes reales, y notaron que eran altamente skewed: muchas de ellas posean un
regimen power-law.
5.3.1 Redes aleatorias
Erd os y Renyi (1959) dieron un metodo para generar redes aleatorias, conocidas ahora como it redes de Erd os y
Renyi o directamente redes aleatorias. Para construir un grafo aleatorio de K vertices y N nodos, se genera una
matriz de adyacencia de NxN de ceros, y se ponen unos, en posiciones elegidas al azar, que no esten ocupados
previamente, ni este en la diagonal. Otro metodo similar, es recorrer la matriz de adyacencia inicialmente con
ceros y con una probabilidad p = 2K/N(N 1) cambiar un 0 por un 1.

Este ultimo metodo genera un grafo con
K aristas s olo en promedio.
Como segundo aporte, Erd os y Renyi, estudiaron las propiedades de las redes generadas a medida que
aumentaban K o an alogamente p. Demostraron que para p = p
c
= 1/N las redes sufren cambios profundos (y
corresponde a un grado promedio crtico k
c
= k) = 1. El resultado central se puede resumir en:
si p < p
c
el grafo no tendr a componentes mayores que O(log N) con una probabilidad que tiende a 1 cuando
N
cuando p = p
c
su componente m as grande tiene un tama no O(N
2/3
) con una probabilidad O(1)
si p > p
c
el grafo tiene una componente gigante que tiene O(N) nodos y ninguna otra componente tiene
m as que O(log N) nodos.
La distribuci on P(k) para N grande y valor jo de k) puede aproximarse muy bien por una distribuci on
de Poisson
P(x) = e
k
k)
x
x!
(5.7)
Esta transici on se conoce hoy como transicion de percolaci on y fue independientemente estudiada por los fsicos
(?????).
Otro resultado importante conocido de las redes aleatorias es su dependencia de la distancia mnima media
L y el clustering C de la cantidad de nodos N y el grado promedio k). Dado que un nodo tienen en promedio
k) vecinos, y (supongamos) que esos vecinos no son vecinos entre ellos los vecinos (es decir no hay ciclos), la
cantidad de segundos vecinos son k)
2
, y en general la cantidad de n-vecinos, sera k)
n
. Como la cantidad de
vecinos es nita en la red, tenemos que existe un L tal que k)
L
= N, o,
L
rand
L =
log N
logk)
(5.8)
con lo cual a medida que aumenta linealmente la cantidad de nodos en una red, su distancia mnima media
aumenta m as lentamente. Para el clustering C, la probabilidad que dos vecinos sean vecinos entre si es es la
probabilidad que dos nodos sean vecinos:
C
rand
=
k)
N
(5.9)
7
Erd os fue un matem atico h ungaro extremadamente prolco, llegando a publicar m as de 2000 trabajos a
lo largo de su vida, con muchisimos coautores. Tan famoso termin o siendo que las generaciones posteriores
comenzaron a medir en el grafo de publicaciones matem aticas, cual es la distancia mnima entre ellos y Erd os.
Este n umero se conoce como n umero de Erd os y su promedio es 3.
Modelos economicos de m ultiples agentes 10/6/2010
5.3. REDES ALEATORIAS, MUNDOS PEQUE

NOS Y REDES LIBRES DE


ESCALA 81
5.3.2 Mundos peque nos
La noci on de mundo peque no fue introducida por el psic ologo Milgram, en la decada del 60, en su intento de
caracterizar cual es la distancia que separa dos individuos cualesquiera. El experimento consisti o en medir cuantos
contactos deban visitarse para conectar un sujeto de Nebraska con otro desconocido X de Boston. Para esto,
Milgram pidi o a algunos sujetos del estado de Nebraska, que enven cartas postales a sus conocidos, solicitando
si conocan al sujeto X y de lo contario reenven la carta utilizando sus propios conocidos. Las cartas recibidas
por el sujeto X, contenan la lista de todos los contactos visitados, y de all Milgram concluy o que en promedio
se necesitaron 6 cartas. De este experimento surgi o la idea que en promedio hay 6 grados de separacion entre
cualquier individuo elegidos al azar, un n umero que a priori, parece extremadamente peque no si pensamos cuantas
conexiones nos separan con individuos en otra parte del globo. Sin embargo, vimos que para una red aleatoria,
la distancia mnima media entre dos nodos elegidos (5.8) si tomamos la poblaci on mundial como N = 610
9
y la
cantidad de vecinos promedio que conocemos k) = 200, nos deja L
rand
4.2. Es decir, un n umero incluso menor
a 6!
M as recientemente, Watts y Strogatz (1998) (Watts and Strogatz 1998) denieron la noci on de mundo
peque no en un modelo matematico. Si bien, de acuerdo a los resultados de Milgram, las redes sociales tienen
una distancia mnima peque na, Watts y Strogats notaron estas redes tambien tienen vecindarios conectados, es
decir los vecinos de un nodo suelen ser vecinos entre si. Para caracterizar esto, introdujeron el coeciente de
clustering, denido en (5.4). Con esta denici on, podan clasicar las redes por los valores relativos de L y C: las
redes aleatorias (tiene distancia peque na L
rand
1 y C
rand
= k)/N 1), las redes regulares (L
reg
grande
8
y
C
reg
3/4
9
), mientras que las de mundo peque no (L
sw
1 y C
sw
1): la distancia entre nodos es corta como
en una red aleatoria, pero preserva la propiedad social de tener vecindarios conectados entre si.
Watts y Strogatz presentaron resultados sobre mediciones de L y C sobre redes reales muy diversas. Como
se puede observar las longitudes caractersticas reales y de un grafo aleatorio son muy semejantes pero el clustering
aleatorio es notablemente inferior al real lo que coloca a esos grafos en la categora de mundos peque nos.
EJEMPLOS DE MUNDOS PEQUE

NOS
Red N k) L) L)(rndm) C) C)(rndm)
www 153,127 35.21 3.1 3.35 0.1078 0.00023
Actores 225,226 61 3.65 2.99 0.79 0.00027
Coautores cient. 52,909 9.7 5.9 4.79 0.43 0.00018
Estuario de Ythan 134 8.7 2.43 2.26 0.22 0.06
Parque Silwood 154 4.75 3.40 3.23 0.15 0.03
co-ocurrencia palabras 460,902 70.13 2.67 3.03 0.437 0.0001
Sin onimos 22,311 13.48 4.5 3.84 0.7 0.0006
Red electrica 4,914 2.67 18.7 12.4 0.08 0.005
c.elegans 282 14 2.65 2.25 0.28 0.05
En la table N es el n umero de nodos; k) es el grado promedio del grafo, L) la distancia media entre nodos
y C) es el clustering medio. Las columnas que poseen las sigla (rndm) corresponden al valor del par ametro
correspondiente para un grafo aleatorio con igual n umero de nodos y aristas. www indica la red Internet y es
un grafo dirigido, el dato consignado es sobre una parte de toda Internet; Parque Silwood y Estuario Ythan son
redes tr ocas de ecosistemas muy estudiados; en las redes de actores o de coautores cada actor / autor es un
nodo y hay un vnculo si han rmado conjuntamente un trabajo o han participado en una misma pelcula, la la
c.elegans corresponde al sistema nervioso de esa especie.
8
Esta distancia es proporcional a N
1/d
, siendo d la dimension del espacio considerado.
9
Para un red regular de grado k en el espacio 2-D, se puede mostrar que el clustering es:
C
reg
(k) =
3
4
k 2
k 1
(5.10)
que tiende a 3/4 para k , y no depende de N.
Modelos economicos de m ultiples agentes 10/6/2010
82 CAP

ITULO 5. REDES COMPLEJAS, MODAS Y CACEROLAZOS


Un modelo de red que ejemplica estas nociones es el siguiente. Se parte de un grafo regular de k)
vecinos, y de acuerdo a un par ametro llamado probabilidad de atajos p, se lo altera mediante el siguiente
proceso estoc astico: se elije con probabilidad p una conexi on de la red regular, y se la reemplaza por otra donde
uno de los nodos es elegido al azar. En otras palabras, las conexiones intercambiados generan atajos o shortcuts,
que efectivamente acortan la distancia mnima promedio. A medida que p 1, se espera que toda las conexiones
se randomizen, por lo que en ese lmite se estara muy cerca de una red complemente aleatoria. En la g. 5.2
se muestra la distancia caracter nstica y el clustering medio para un grafo con k) = 20 como funci on de p. El
clustering se mantiene elevado y cambia relativamente poco con p hasta que cae a valores peque nos propos de un
grafo aleatorio. La distancia caracterstica en cambio decae m as o menos abruptamente aun para valores de p
peque nos.
Figura 5.2: Redes de Watts-Strogatz para distintas probabilidades de
atajos p. Parametros N = 500, k = 8. Promediado sobre 10 realiza-
ciones.
El hecho que la red tenga las caractersticas de un mundo peque no mejora la velocidad de transmisi on de
se nales a traves de la red si es que esta act ua como un sistemas de comunicaciones. Se ha pensado que el sistema
nervioso del C. elegans posee una red de neuronas con estas caractersticas pues puede ofrecer ventajas evolutivas
con respecto a un conexionado al azar.
En un estudio emprico reciente, Dodds et al (Dodds, Muhamad, and Watts 2003) rehicieron los experi-
mentos de Milgram. Usando 8 destinos, y utilizando una aplicaci on web, de 24000 individuos que participaron,
solo 384 cadenas lograron llegar a uno de los destinos. Los resultados no son del todo concluyentes, debido a la
gran cantidad de cadenas que no se concluyeron, aunque nuevamente el valor de la distancia mnima promedio es
entre 5 y 7.
Modelos economicos de m ultiples agentes 10/6/2010
5.3. REDES ALEATORIAS, MUNDOS PEQUE

NOS Y REDES LIBRES DE


ESCALA 83
5.3.3 Redes libres de escala: Preferential attachment
Cuando se comenzaron a analizar grafos reales de gran porte, particularmente Internet, se encontr o que la dis-
tribuci on P(k) no decaa exponencialmente sino que lo haca como una ley de potencias (Barab asi and Albert
1999), P(k) Ak

con 2 < < 3 lo que hace que su varianza resulte divergente con el m aximo grado de la red:
k
2
)
Z
k
max
k
2
p(k) k
3
max
(5.11)
Estas redes recibieron el nombre de redes libres de escala porque las distribuciones de potencias conservan
su forma frente a un cambio de escala de su variable dependiente (P(x) = ()P(x)). En otras palabras, estas
redes carecen de una cantidad de vecinos caracterstica.
En la tabla adjunta se enumeran algunas redes libres de escala con sus respectivos exponentes.
EJEMPLOS DE REDES LIBRES DE ESCALA
Red N k) L) C)
AS2001 11,174 4.19 3.62 0.24 2.38
Routers 228,263 2.80 9.5 0.03 2.18
Gnutella 709 3.6 4.3 0.014 2.19
WWW 10
8
7.5 16 0.11 2.1/2.17
Proteinas 2,115 6.80 2.12 0.07 2.14
metab olica 778 3.2 7.40 0.7 2.2/2.1
Math 1999 57,516 5.00 8.46 0.15 2.47
actores 225,226 61 3.65 0.79 2.3
e-mails 59,812 2.88 4.95 0.03 1.5/2.0
Todas las redes con excepci on de WWW, metabolica (de Escherichia Coli ) y los e-mails son grafos no dirigidos.
Los dos valores de cuando la red es dirigida representan a los grados de entrada y de salida a cada nodo. Tabla
sacada de la (Albert and Barab asi 2002). La red AS2001 corresponde a Internet al nivel de sistema aut onomo
mientras que Routers corresponde a la descripcion de Internet desde la perespectiva de los servidores. Gnutella
es una red de pares (P2P) que comparten archivos de un cierto tipo. WWW es Internet determinada a traves de
los hiperlinks.
Un mecanismo que produce redes libres de escalas ocurre en redes que crecen en el tiempo adicionando
nodos que se vinculan a los existentes con una probabilidad tanto mayor cuanto mayor es el grado del nodo al que
se conectan. En la literatura este mecanismo recibe el nombre de preferential attachment. Este proceso responde
a la intuici on: una nueva p agina web se vincula preferentemente a las p aginas preexistentes m as direccionadas,
o bien, un nuevo comerciante trata de tener transacciones con los centros comerciales con mayor movimiento.
Veremos en el Captulo XX un modelo de generaci on de redes libre de escala.
La distancia mnima promedio entre nodos para una red libre de escalas crece aproximadamente como las
redes aleatorias (es decir log(N)). El clustering en estas redes por lo general es un poco m as grande que para
redes aleatorias (5 veces), pero nunca como el que se observa en redes de mundo peque no.
5.3.4 Robustez y vulnerabilidad
Que sucede si a una red se la intenta romper eliminando alguno de sus nodos (y sus respectivas conexiones) o
alguno de sus vnculos? En principio, si los da nos son sucientemente grandes, uno espera que una red inicialmente
con una sola componente gigante, se fragmente.
Las redes libres de escala cobraron importancia por su robustez frente a los llamados da nos parciales.
Esto se puede cuanticar con el siguiente experimento numerico. Se dene una probabilidad p con que se cortan
vnculos (o eliminan nodos) elegidos al azar a una determinarda red con distribuci on de grado P(k), y en cada
realizaci on se efectuan los siguientes pasos:
Modelos economicos de m ultiples agentes 10/6/2010
84 CAP

ITULO 5. REDES COMPLEJAS, MODAS Y CACEROLAZOS


i Se genera una nueva realizaci on de la red (y se determina que sea conexa, sino lo es se vuelve a generar
una nueva red),
ii Una fracci on p de vnculos se cortan (o nodos se eliminan),
iii Se mide si la red resultante se fragment o en m as de una componente.
Realizando este experimento muchas veces se puede determinar cual es la probabilidad que una red de distribuci on
P(k) se fragmente. Lo que se observa es que existe una probabilidad crtica p
c
, tal que para p > p
c
la red casi
siempre se rompe. Se determin o el valor crtico para distintas distribuciones de grado, y se mostr o que para una
red innita con P(k) k

con 3 esa transici on nunca tiene lugar (p


c
1). En un ejemplo concreto, para
un tama/ no nito, y un exponente 2.5 (como el de Internet), se tiene que p
c
0.9 con lo que es necesario
eliminar al azar 90% de sus nodos para que la red se fragmente.
La vulnerabilidad de una red es un par ametro diferente a la robustez. Si bien para esta ultima se presupone
que la eliminaci on de nodos o vnculos es aleatoria, para medir la vulnerabilidad el proceso de remoci on no debe
ser aleatorio sino dirigido. Si bien Internet, resulta muy robusta a una remocion aleatoria de nodos, resulta ser
muy vulnerable, pues su componente gigante desaparece si se remueve tan solo el 1% de los nodos de m axima
grado.
Estos experimentos muestran dos caractersticas importantes de redes de tipo leyes de potencia. M as
adelante vamos a ver otras propiedades singulares, en lo que se reere a din amica de propagaci on sobre estas
redes.
5.4 Modelos de contagio en ciencias sociales
Las ciencias sociales tienen una cierta tradici on con modelos de rumores, modas y/o revoluciones. A partir de los
modelos de Schelling (Schelling 1971) sobre fenomenos de segregaci on, comenzaron los estudios sobre fen omenos de
difusi on de informacion o se nales contagiosa. Esto ultimo podra ser un rumor, un nuevo producto, una ideologa,
en n, un sin n umero de aplicaciones que requiere un marco te orico razonable para su correcta interpretaci on.
Uno de los pioneros en modelos de contagio en las ciencias sociales fue Granovetter (Granovetter 1975a),
(Granovetter 1975b). En su tesis doctoral estudi o cu ales eran los mecanismos por los cuales sus colegas y
compa neros obtenan sus nuevos trabajos, es decir que rol o inuencia tenia la red social sobre las elecciones
que tienen que hacer los empleadores. Mediante numerosas entrevistas, constat o que el modo m as frecuente era
obtener trabajo por medio de las relaciones debiles o weak links, es decir, conocidos y que no tenan un contacto
muy frecuente. La explicaci on es que las relaciones directas (familiares y amigos m as cercanos, o strong links)
temen realizar una recomendaci on muy exagerada ya que pueden da nar su propia reputaci on o su amistad directa,
si la recomendaci on no fue del todo satisfactoria. En cambio por medio de las relaciones debiles, las recomenda-
ciones si bien tal vez no son tan fundadas, son m as efectivas por que las expectativas entre el que recomend o y el
empleador son debiles.
Si bien estos modelos tratan de prescindir de muchos detalles, las preguntas interesantes son las condiciones
para que un determinado rumor pueda surgir (y contagiar una proporci on de la poblaci on) o cual es la probabilidad
que un rumor invada la totalidad del sistema. En otras aplicaciones se estudian distintos mecanismos o estrategias
para vacunar y protegerse de lo contagioso, como el caso de los virus inform aticos.
Las aplicaciones de estos modelos van desde la propagaci on de rumores durante una campa na poltica,
la implementaci on de campa nas de comercializaci on conocidas como marketing vir osico, como as tambien el
entendimiento de burbujas en mercados nancieros.
En el pasado, muchos de estos modelos utilizan la aproximaci on random-matching para denir quien
interact ua con quien: en cada paso de tiempo, se sortean al azar dos individuos para que interact uen. Esta
aproximaci on supone que los vecindarios son muy homogeos entre si, y mucho m as importante, que correlaciones
entre las acciones de los individuos decaen muy r apidamente con la distancia entre ellos. Para el caso de rumores,
modas o revoluciones, esta ultima aproximaci on resulta m as discutible, ya que justamente la ocurrencia de un
rumor en un vecino de un individuo i, tiende a aumentar la probabilidad que el rumor le llegue a i. En esta
secci on presentamos dos modelos de propagaci on de modas y epidemias, ilustrando sus principales caractersticas
y utilizando algunas herramientas de la teora de grafos.
Modelos economicos de m ultiples agentes 10/6/2010
5.4. MODELOS DE CONTAGIO EN CIENCIAS SOCIALES 85
5.4.1 Que es un contagio epidemiologico
Para jar ideas trabajemos sobre contagios epidemiol ogicos. En general los fen omenos de contagio se denominan
aquellos procesos donde un individuo suceptible (S, sano) de ser contagiado se infecta (I) de otro individuo que
previamente posea la enfermedad. Dependiendo del tipo de enfermedad, hay muchos caminos posibles para el
infectado: puede quedar con la infecci on para siempre, se puede morir (D) luego de un determinado tiempo, puede
quedar inmunizado por un lapso nito (R), transcurrido el cual vuelve a la poblaci on de suceptibles, o luego del
lapso que infecta, se recupera como suceptible nuevamente. Tipicamente se denota con las letras S, I, R, D, los
tipos de estados que la enfermedad puede tener, mientras que una secuencia de letras identica la secuencia que
sigue la enfermedad (por ejemplo SIR, SIS, SI, etc).
Estos fenomenos pueden ocurrir a distintas escalas espaciales, por ejemplo, celular, individuo, o especie. A
nivel celular el contagio podra corresponder a un c ancer; a nivel individuo a una gripe cuyo contacto es estar cerca
un determinado tiempo con otro enfermo de gripe; a nivel especie nos podemos contagiar de distintas ideologas
o incluso religiones. Las escalas de tiempo involucradas son, el tiempo caracterstico que dura un contagio, el
tiempo que dura una infecci on (y los tiempos caractersticos de otros estados si los hubiere; ver m as abajo).
La probabilidad de contagio, depende por lo general de la cantidad de infectados. Uno espera que a mayor
n umero de infectados, sea m as probable adquirir la enfermedad. Si se asume una red de contactos, el n umero de
infectados est a acotado al n umero de vecinos que tiene un agente, por lo tanto la probabilidad de infecci on puede
depender de como sea la red. Ac a se pueden distinguir dos modos de contagio muy parecidos: el individuo tiene
una probabilidad de contagio por cada contacto, o simplemente tiene una probabilidad de contagio proporcional
a la proporci on de vecinos contagiados. La mayora de las aplicaciones supone una probabilidad de contagio por
contacto.
Si bien hay procesos infecciosos complejos que involucran muchos estados intermedios de infecci on (tu-
berculosis por ejemplo), el procesos m as sencillo es suponer que el individuo est a o no infectado. Esto lo hace
an alogo a muchos otros problemas de decisi on binaria en las ciencias sociales, como ser la propagaci on de rumores
(acepto o no propagar el rumor) o modas (compro o no el vestido que veo en la vidriera). Este fen omeno puede
modelarse como un cambio de estado a partir de un determinado umbral (que puede o no depender del individuo).
Por ejemplo, si tenemos un problema social de ir o no la huelga, se puede modelar a los obreros que tienen un
umbral que depende de la cantidad de obreros que ya se adhirieron.
Las preguntas interesantes en este tipo de fen omenos son:
Cu ales son las condiciones para que se adopten las modas?
Cu al es la frecuencia con que ocurren las cascadas de modas?
5.4.2 SIS y el umbral crtico de infeccion
Veamos un ejemplo de contagio epidemiol ogico S-I-S o simplemente SIS. Tenemos una poblaci on de N individuos,
en una red aleatoria con K vnculos, por lo que el grado promedio de la poblaci on es k) = 2K/(N 1) 2K/N.
La poblacion puede estar en el estado suceptible (S), y se contagia con una probabilidad p si tiene un vecino en
estado infectado (I). Asi mismo los infectados se recuperan con una tasa probabilstica r, y vuelven a la poblaci on
de suceptibles. Dada esta tasa de recuperaci on, la duraci on media de la infecci on es del orden de 1/r.
Tomemos que i(t) representa la fracci on de infectados, y s(t) representa la fracci on de suceptibles que la
poblacion tiene a tiempo t. Podemos escribir las siguientes ecuaciones de evoluci on poblacional,
s(t + 1) = s(t) k

s(t) i(t) +r i(t) (5.12)


i(t + 1) = i(t) +k

s(t) i(t) r i(t) (5.13)


donde k

= p k) y supusimos que cada individuo tiene la misma cantidad vecinos k). Esto se conoce como
aproximaci on de campo medio, y para un red aleatoria es una aproximaci on buena en la mayora de los casos. La
explicaci on del modelo es que la poblaci on de suceptibles disminuye a una tasa k

s(t) i(t) cuando un suceptible se


interactua con un infectado, y aumenta a una tasa r i(t) cuando los infectados se recuperan. Como la poblaci on
Modelos economicos de m ultiples agentes 10/6/2010
86 CAP

ITULO 5. REDES COMPLEJAS, MODAS Y CACEROLAZOS


puede estar solo suceptible o infectado, tenemos que s(t) + i(t) = 1 es invariante, por lo que podemos eliminar
una de las dos ecuaciones y llegar a
i(t + 1) = f(i(t)) = (1 r +k

(1 i(t)) i(t) (5.14)


que tiene un equilibrio i

= i(t + 1) = i(t) cuando


i

A
= 0 (5.15)
i

B
= 1
r
k

(5.16)
Para determinar la estabilidad de estos equilibrios analizamos f

(i) = 1 r +k

2k

i en cada uno de ellos. El


origen es inestable
10
cuando r < k

, mientras que el equilibrio no trivial es estable si r < k

. En otras palabras,
para un dado r jo, si k

es sucientemente peque no, el origen es estable, y cualquier intento de propagaci on de la


infecci on concluir a en la extinci on de la misma, dado que la recuperaci on es sucientemente alta. En este regimen
de par ametros el equilibrio i

B
< 0 por lo que no es fsicamente posible. Sin embargo, a medida que aumenta k

,
para el lmite k

= r, i

A
= i

B
, y la tasa de recuperaci on es igual a la tasa de infecci on. Es aqu donde ocurre
una bifurcacion
11
en el sistema, y el equilibrio i

A
se vuelve inestable, mientras que el i

B
es positivo (fsicamente
realizable) y estable.
En conclusi on, si denimos k

= k)p como una tasa de infecci on efectiva, hay una tasa crtica
>
c
= r (5.17)
para el cual el sistema presenta asint oticamente en el tiempo una poblaci on constante i

B
> 0 de infectados.
Esto se conoce como una endemia, y su tama no i

B
depende de la red, de la probabilidad de contagio p y de la
tasa de recuperaci on r. Una cantidad analoga para la epidemiologa es R /r = k)p/r, que corresponde a
la tasa promedio de infecciones secundarias dado un suceptible. Dicha cantidad se conoce como coeciente de
reproducci on basica de la infecci on, y su interes es conocer cuando R > 1, dado que en este caso la epidemia puede
propagarse.
Ejercicio 13 Que sucede si no hay recuperaci on (r = 0) y el modelo es simplemente SI?
5.4.3 Ejemplo numerico
Veamos un ejemplo numerico de la propagaci on SIS. Denimos una funci on para generar la matriz de adjacencia
aleatoria de N nodos y grado promedio z, distribuyendo K = Nz/2 links,
function adj = adj_rand(N,z)
adj = zeros(N);
nlinks = N*z/2;
while nlinks>0,
x= floor(rand(1,2)*N) + 1;
while adj(x(1),x(2)) == 1 || x(1) == x(2),
x= floor(rand(1,2)*N) + 1;
end
adj(x(1),x(2))=1;
adj(x(2),x(1))=1;
10
Se dice que un equilibrio es inestable cuando una peque na perturbaci on al equilibrio se aleja asint oticamente
del mismo. La condici on para mapas es que el Jacobiano tenga autovalores m odulo mayores a uno, que es lo
mismo que f

(i

A
) > 1
11
Esta bifurcaci on se conoce como transcritica y suele ocurrir cuando hay algun plano invariante en el espacio
de fases, como en este caso i(t) = 0.
Modelos economicos de m ultiples agentes 10/6/2010
5.4. MODELOS DE CONTAGIO EN CIENCIAS SOCIALES 87
nlinks = nlinks - 1;
end
donde a una matriz inicialmente de ceros, se le van agregando progresivamente unos elegidos al azar (salva en las
diagonales y en lugares donde ya haba previamente un uno).
Ahora denimos la funci on sis net que realizar a el contagio SIS propuesto, con una evoluci on temporal
asincr onica: en cada paso de tiempo se elige un nodo al azar, este actualiza su estado y eso corresponde a un paso
de tiempo.
function [U, tseries, adj] = sis_net(N, z, nsteps, p, r)
global adj
adj = adj_rand(N,z);
U = zeros(1,N);
flip = randint(1,1,[1 N]);
U(flip) = 1; % select random initial node
tseries = [];
step = 0;
while step < nsteps,
U = infect_async(U, p, r);
tseries = [tseries; step mean(U) ];
step = step+1;
end
end
cuando la funci on para contagiar y recuperar solo un paso es la siguiente:
function U = infect_async(U, p, r)
global adj
N = length(U);
sel = randint(1,N,[1 N]);
for i = 1:length(sel),
x = sel(i);
if U(x) == 0,
nei = find(adj(x,:)==1); % find neighbors
inf = find(U(nei) == 1); % find infected neighbors
pp = rand(1,length(inf)) < p;
if sum(pp) > 0,
U(x) = 1;
end
else
if rand(1,1) < r, % if infected, is recovered?
Modelos economicos de m ultiples agentes 10/6/2010
88 CAP

ITULO 5. REDES COMPLEJAS, MODAS Y CACEROLAZOS


Figura 5.3: Proporcion de nodos infectados en el modelo SIS a lo largo
del tiempo para una realizacion. El resultado de campo medio da que la
poblacion endemica debera ser i

B
= 0.75. Parametros N = 100, k =
16, p = 0.1, r = 0.4.
Modelos economicos de m ultiples agentes 10/6/2010
5.4. MODELOS DE CONTAGIO EN CIENCIAS SOCIALES 89
U(x) = 0;
end
end
end
end
Un ejemplo de la variaci on de i(t) a lo largo del tiempo puede verse en g. 5.3, donde al cabo de unos pasos
de tiempo, el sistema llega a un estado estacionario, cercano al te orico de i

B
= 0.75 de la (5.16). Notese que
para cercanos a 1, muchas corridas llegan al estado estacionario, ya que la recuperaci on vence a la infecci on,
por lo que solo quedan suceptibles. Por eso es interesante ver como se compara el valor teorico de i

B
en (5.16)
con las simulaciones numericas. Partiendo de distintas condiciones iniciales (se elige una red al azar, y donde
se infecta solo un nodo), se mide el valor estacionario de i

B
, incluyendo las veces que no arranc o la infecci on
(corresponde a la curva meani

B
), y solo mirando el valor m aximo infectado (corresponde a la curva maxi

B
). En
la g. 5.4 hacemos la comparaci on. Se puede observar que el valor te orico corresponde muy de cerca para los
valores maximos de infectados en cada corrida.
Figura 5.4: Valor medio y maximo de i

B
promediado en 50 realizaciones.
La linea verde es el valor teorico (5.16) de i

B
(p). En funcion de p, su
valor crtico es p
c
= r/k = 0.09. Parametros N = 100, k = 10, r = 0.9.
5.4.4 SIS con rewiring: redes adaptativas
Una variante reciente propuesta por Gross et al (T. Gross and Blasius 2006), es un proponer que la red se adapta
dado los nodos infectados, de modo de evitar la infeccion. Proponen que los nodos suceptibles, con probabilidad
w hagan una reconnexi on de sus contactos infectados, elegiendo a otro nodo al azar. Esta modicaci on permite
a los suceptibles, ir escapando de los infectados, aunque si bien la conectividad promedio con los infectados
disminuye, aumenta la de suceptibles con suceptibles. Esto ultimo, favorece en ultima instancia una infecci on si
ese cluster recibe una infecci on, pues el contagio es m as rapido debido a una conectividad efectiva alta.
Modelos economicos de m ultiples agentes 10/6/2010
90 CAP

ITULO 5. REDES COMPLEJAS, MODAS Y CACEROLAZOS


La modicaci on al contagio est a en la funci on:
function [U] = infect_rewire_async(U, p, r, w)
global adj
N = length(U);
sel = randint(1,N,[1 N]);
for i = 1:length(sel),
x = sel(i);
if U(x) == 0,
nei = find(adj(x,:)==1); % find neighbors
inf = find(U(nei) == 1); % find infected neighbors
pp = rand(1,length(inf)) < p;
if sum(pp) > 0,
U(x) = 1;
else
% rewire stochatiscally each infected link if not infected
pp = find(rand(1,length(nei)) < w);
nn_out = nei(pp);
nn_new = randint(1,length(pp), [1 N]); % new neighbors
for kk = 1:length(pp),
adj(x,nn_out(kk)) = 0;
adj(nn_out(kk),x) = 0;
adj(x,nn_new(kk)) = 1;
adj(nn_new(kk),x) = 1;
end
end
else
if rand(1,1) < r, % if infected, is recovered?
U(x) = 0;
end
end
end
end
En la g. 5.5 se muestra una simulaci on numerica donde la tasa de reconexi on es alta. Se ve que inicialmente
el sistema intenta ir al estado endemico, pero esto no es posible debido a la reconguraci on de la red. Hace falta
una tasa de infecci on m as alta para hacer efectiva la infeccion endemica.
5.4.5 SIS en redes libres de escala: Viruses informaticos
A la luz que las red Internet es libre de escala P(k) k

, con entre 2 y 3, Pastor-Satorras y Vespignani


(Pastor-Satorras and Vespignani 2001) analizaron los virus inform aticos. Observaron una incongruencia entre
Modelos economicos de m ultiples agentes 10/6/2010
5.4. MODELOS DE CONTAGIO EN CIENCIAS SOCIALES 91
Figura 5.5: Proporcion de nodos infectados en el modelo SIS con re-
conexion a lo largo del tiempo para una realizacion. El resultado de campo
medio da que la poblacion endemica debera ser i

B
= 0.75. Parametros
N = 100, k = 10, p = 0.05, r = 0.03, w = 0.7.
Modelos economicos de m ultiples agentes 10/6/2010
92 CAP

ITULO 5. REDES COMPLEJAS, MODAS Y CACEROLAZOS


el resultado te orico (5.17) y los datos experimentales. Si bien para una tasa de recuperaci on r dada, la teora
indica que hay un
c
pk)/r = 1 crtico a partir del cual la red permite la propagaci on del virus a una
proporcion importante de la red (i

B
> 0), para el caso de virus inform atico no se observa una poblaci on importante
de computadoras infectadas. Analizando base de datos de viruses, tambien observaron que la tasa media de
decaimiento de los archivos infectados es del orden de 6-9 meses
12
, un tiempo sucientemente largo como para
indicar que la tasa de infecci on es mayor a la recuperaci on, por lo que la cantidad de infectados debera ser
importante. Esta incongruencia entre los datos y la realidad debera tener una explicaci on. Analizaron la validez
de la aproximacion campo medio utilizada para estimar el umbral crtico (5.17) para una red libre de escala
donde es probabilisticamente signicativo obtener nodos en la red con un n umero de vecinos mucho m as grande
que k).
Su resultados analticos predicen que la cantidad media de infectados es proporcional a i

B
exp(1/p), y

c
= r
k)
k
2
)
(5.18)
Para las redes aleatorias que vimos anteriormente, como la distribuci on de grado es una distribuci on de Poisson,
k) = k
2
), con los que
c
= r. Ahora para redes con leyes de potencia 2 3, k
2
) diverge por lo que
c
tiende a cero
13
. Este resultado indica que lo que se observa en Internet es un umbral innitesimal, pero con una
prevalencia de la endemia chica, porque exp(1/p) es chico para un contagio p muy grande.
5.4.6 Modelos de umbrales locales: modas y revoluciones
En los modelos epidemiol ogicos, el contagio se debe a un proceso probabilstico donde un nodo suceptible se
puede infectar debido a cada uno de sus vecinos infectados. En modelos de modas y revoluciones, parece sensato
suponer que la adopci on de la misma dependa del n umero de individuos que ya adopt o. Es decir, el contagio no
se debe a cada uno de los que adopto, sino a la cantidad total que haya adoptado. Por ejemplo en una decisi on
de ir o no a una huelga, puede ser importante la cantidad de agentes que previamente adoptaron ir a la huelga.
En particular, si suponemos que el agente solo mira a sus vecinos para tomar su decisi on, la regla es adoptar la
moda si el n umero de vecinos que adopto es mayor a un umbral [0, 1] (que para simplicar, es el mismo para
todos los agentes).
Watts (Watts 2002) analiza ese mecanismo de propagacion de modas en una redes aleatorias de N nodos,
y grado promedio k. El aspecto interesante de este modelo es que la adopcion de una moda depende de la
topologa de la red y del estado de cada agente. Esto abre la posibilidad que solamente aquellos agentes de
umbral particularmente bajo sean los que inicien la moda mientras que aquellos reticentes con umbral elevando
la adopten m as tarde, una vez que muchos de sus vecinos la hayan adoptado.
A continuaci on describimos las funciones donde se implementa este modelo. Se supone que todos los
agentes tienen el mismo umbral phi0:
function [U, step] = fads_net(N, z, phi0)
global A phi;
phi = ones(1, N)*phi0;
adj = adj_rand(N,z); % build random network
A = adj;
U = zeros(1,length(A));
flip = rand_int(1,1,[1 N]);
U(flip)=1;
12
La cantidad de archivos infectados decae con una ley exponencial exp(t/) con = 6 9 meses.
13
Para redes con > 4 el umbral
c
de las redes aleatorias vuelve aparecer.
Modelos economicos de m ultiples agentes 10/6/2010
5.4. MODELOS DE CONTAGIO EN CIENCIAS SOCIALES 93
flipped = 1;
step = 0;
while flipped > 0
[U, flipped] = infect(U);
step=step+1;
end
end
function [Unew, flipped] = infect(U)
global A phi
Unew = U;
flipped = 0;
notInf = find(U==0);
for i=1:length(notInf),
x = notInf(i);
nei = find(A(x,:)==1); % se busca a los vecinos
if length(nei)>0,
inf = mean(U(nei)==1); % halla la fraccion de vecinos convertidos
if inf > phi(i),
Unew(x) = 1;
flipped = 1;
end
end
end
La funci on principal es infect(U) donde U es el estado de cada agente: 0 si no adopt o, 1 si adopt o. El modelo
comienza construyendo una matriz aleatoria, y luego deniendo el vector U con el estado de cada agente: 0 si no
adopt o, 1 si adopt o. Inicialmente se elige un sitio al azar y se lo infecta. A partir de ahi se itera sobre la funci on
infect(U), que infecta hasta tanto no se realizen nuevas infecciones (flipped = 0). Esta funcion, el algoritmo
localiza todos los agentes que hasta ese momento no han adoptado la moda (agentes de tipo 0). Para cada uno
verica la proporci on de vecinos que la han adoptado (agentes de tipo 1) y verica la condici on de umbral. Si la
misma se ve satisfecha, el agente se transforma a tipo 1 colocando un 1 en su lugar en el vector U. Una vez que
todos los agentes de tipo 0 han sido vericados la funci on devuelve el nuevo valor de U. El c alculo mencionado
arriba se repite hasta que ning un agente de tipo 0 desea adoptar la moda, en cuyo caso el algoritmo registra el
tama no de grupo de agentes de tipo 1 y el n umero de iteraciones que se requirio para que la moda se propague
hasta reclutar a ese grupo.
Para lograr una intuici on de lo que va sucediendo, comencemos con N = 500, = 0.1 y k = 10.Se observa
que hay una gran probabilidad que todos los nodos terminen infectados. A medida que disminuye k, se ve que
no todos los nodos se contagian, aunque sean unos pocos. Una transici on abrupta ocurre cuando k 1, donde
ning un nodo se contagia. Por el otro extremo, si aumentamos k, vemos que a veces se contagian todos, y otras
ninguno: es todo o nada. Hasta un m aximo de k = 16 donde es muy improbable que se contagien todos.
Un estudio m as detallado, nos lleva a realizar un promedio de varias simulaciones numericas, o realizaciones.
Para esto vamos a estudiar las siguientes cantidades de interes:
el valor medio del tama no del grupo contaminado por la moda
el valor medio del n umero de pasos
el n umero m aximo de pasos
el tama no m aximo del grupo contaminado
Modelos economicos de m ultiples agentes 10/6/2010
94 CAP

ITULO 5. REDES COMPLEJAS, MODAS Y CACEROLAZOS


la frecuencia (probabilidad) con la que dicho tama no m aximo es alcanzado dentro de todas las repeticiones.
Esta ultima cantidad es de interes para medir cu an probable es la ocurrencia de una evento de gran tama no
dependiendo de la topologa del grafo.
Figura 5.6: Modelo de modas. (arriba) N umero promedio (mean t) y
n umero maximo (max t) de pasos de iteracion requeridos como funcion
del grado k. (Abajo) Tama no medio (mean size) y maximo del grupo
(max size), probabilidad de ocurrencia del grupo de tama no maximo
(prob max) como funcion del grado k. Parametros N = 500, = 0.10.
N umero de realizaciones 50.
En la g. 5.6 se muestran los resultados de promediar 50 simulaciones numericas por cada valor de k
elegido. Se observa que hay un rango de k donde la moda es adoptada de modo generalizada. Pero para k chicos
y grandes hay una transici on abrupta que tienen naturaleza diferente:
para bajos valores del grado se presenta un incremento similar y abrupto en el valor medio y maximo del
n umero de agentes que adoptaron la moda,
para grandes valores de k el tama no m aximo permanece constante mientras que el valor medio decrece
mon otonamente. Esto se compensa por una probabilidad de ocurrencia de grupos de gran tama no que
tambien decrece de manera monotona y proporcional al tama no de grupo promedio. Para valores su-
cientemente grandes del grado la probabilidad de ocurrencia de grupos gigantes tiende a cero, como asi
tambien el tama no del grupo m as grande tambien cae a 0, signicando con esto que el conjunto de agentes
no adopta la moda en absoluto.
La primera de las transiciones se conoce en fsica como umbral de percolacion y la hemos analizado para
redes aleatorias (ver 5.3.1). Se trata de una transici on que indica que la red subyacente de agentes contaminados
Modelos economicos de m ultiples agentes 10/6/2010
5.4. MODELOS DE CONTAGIO EN CIENCIAS SOCIALES 95
no presenta fragmentos disconexos entre si. Para valores extremadamente bajos del grado medio la probabilidad
que se pueda navegar a traves de toda la red a lo largo de sus vnculos es cero porque no hay sucientes vnculos
disponibles en el grafo. Precisamente esta transici on tiene lugar (con una probabilidad que se aproxima a la
unidad) para un grafo innito cuando se impone la condici on de un vnculo por nodo. En estas condiciones todos
los agentes adoptan la moda y conforman una componente o grupo gigante. Noten tambien que debido al tipo de
contagio, esta transici on no depende del umbral de contagio, es decir es totalmente topol ogica.
La segunda transici on es sumamente interesante porque ocurre para altos valores del grado medio o sea en
el lmite de grafos de gran conectividad. En este caso, cuando el grado promedio de los nodos es sucientemente
grande, resulta crecientemente difcil diseminar la moda; sin embargo, cuando ocurre, la misma es con probabilidad
casi uno, gigante. Este lmite es justamente el de interes para aplicaciones sociales. Notese la diferencia en el
n umero medio y m aximo de pasos de iteraci on que toma alcanzar el estado estacionario en ambos lmites. Este
n umero m aximo parece hacerse aun mayor en el momento de la transici on. Esta aparente divergencia en las
escalas de tiempo, es tambien indicativo de la ocurrencia de una transici on de fase.
Por ultimo, haciendo simulaciones con distintos valores de , se observa que el rango de adopci on de modas
parece disminuir para mayores valores de y parece desaparecer para 0.25 aproximadamente. Surge pues
que agentes con valores altos del umbral inhiben naturalmente la adopci on de la moda y esto parece ser el caso
de para la mayora de las modas sin importar para esto la topologa del grafo.
Modelos economicos de m ultiples agentes 10/6/2010
96 CAP

ITULO 5. REDES COMPLEJAS, MODAS Y CACEROLAZOS


Modelos economicos de m ultiples agentes 10/6/2010
Captulo 6
Aprendizaje y adaptaci on
En esta y subsiguientes secciones se presentar an diversos modelos para dotar a los agentes de alguna capacidad de
aprendizaje o adaptaci on. En todos los ejemplos anteriores los agentes han sido representados mediante algoritmos
simples que pretenden codicar sus posibles respuestas a estmulos del medio. Si bien dichos algoritmos procuran
representar alguna heurstica o el estereotipo de alguna conducta, est a implcito que la misma no cambia como
consecuencia de los resultados (utilidad) obtenidos de ponerla en pr actica. Los modelos de aprendizaje que
se presentar an en las proximas secciones utilizan el concepto de AC que ya se discuti o extensamente y est an
orientados a establecer un esquema de organizacion interna de cada agente.
6.1 Redes neuronales (I): Modelo de Hopeld
La capacidad de aprendizaje y de detecci on de se nales del medio que posee tanto el hombre como de otros
vertebrados superiores se basan en su sistema nervioso central. Las celulas que lo componen se denominan
neuronas y poseen un cuerpo (soma) y una membrana que se prolonga en un largo lamento (ax on)
1
. Si bien las
neuronas poseen dimensiones del orden de los micrones, los axones pueden ser muy largos ya que deben alcanzar
todos las extremidades motrices y sensoras del cuerpo.
Las celulas nerviosas tiene la capcidad de polarizar electricamente su membrana por intercambio de iones
entre el interior de la celula y su exterior. Dicha polarizaci on puede alcanzar a la membrana que rodea el soma
pero puede adem as producir pulsos de tensi on electrica que viajan por el ax on a lo largo de grandes distancias
sin distorsi on signicativa.
Tanto los extremos del axon como el resto de la membrana celular poseen una gran cantidad de rami-
caciones (dendritas) en la forma de una cabellera. La comunicaci on entre neuronas o entre una neurona y un
tejido muscular se produce por el contacto de las dendritas de la celula excitatoria co la membrana de la siguiente
celula. Dicho contacto se denomina sinapsis y tiene l nugar mediante los botones sin apticos que se encuentran
en los extremos de las dendritas de la celula excitatoria. Dicho bot on alberga diminutas vesculas que contienen
una sustancia neurotransmisora.
Cuando la membrana de una neurona est a polarizada, las vesculas sin apticas derraman su contenido en el
hendidura sin aptica. Las moleculas neurotransmisoras viajan en ese espacio e ingresa en la celula vecina a traves
de su membrana. Para ello utiliza poros cuya forma es complementaria de la de la molecula neurotransmisora de
la misma manera que una llave abre una cerradura. El ingreso de los neurotransmisores polarizan la memebrana
de la siguiente neurona dando lugar a un pulso de polarizaci on que puede a su vez transmitirse a otras celulas
produciendo de este modo la transmisi on nerviosa.
Los primeros modelos computacionales de las neuronas fueron realizados por McCulloch y Pitts en 1943 y
representan su funcionamiento mediante el esquema indicado en la gura 6.1 que comprende dos operaciones. La
1
Existen adem as otras celula denominadas gliales que no poseen funciones sensoras o de control motriz y no
son de interes en esta discusi on.
97
98 CAP

ITULO 6. APRENDIZAJE Y ADAPTACI

ON
Figura 6.1: Neurona de Mc Culloch y Pitts.
primera de ellas consiste en sumar las se nales de ingreso a la celula. Cada una est a afectada por una constante
W
i
que representa la ecacia de la conexi on sin aptica. La siguiente operaci on consiste en ltrar el resultado de la
suma por una funci on de transferencia que es una funci on escal on, signo o sigmoide:
S
i
= g
"
X
j
W
i,j
S
j

i
#
; g(.) = tanh(.), sign(.); etc. (6.1)
En 6.1 S
i
con S
i
|1, 1 o S
i
|0, 1 representa el estado de la iesima neurona. La se nal de salida de la
iesima neurona es positiva si la suma supera un umbral
i
. Las ecacias sin apticas W
i,j
pueden ser positivas
(sinapsis excitatorias) o negativas (sinapsis inhibitorias)
2
. McCulloch y Pitts demostraron que con un conjunto
de neuronas simbolicas de este tipo es posible ensamblar una MTU.
En la representaci on de McCulloch y Pitts, las neuronas pueden estar en uno de dos posibles estados
activa o en reposo. Hopeld ( 1982) propone una representaci on esquem atica del funcionamiento de una
memoria asociativa utilizando neuronas como la de McCulloch y Pitts. Una memoria asociativa posee una cierta
capacidad de procesamiento de informaci on ya que es capaz de direccionar la informaci on por su contenido y no
por su ubicaci on en un archivo de memoria.
Un ejemplo de memoria asociativa es la capacidad que poseemos de evocar a una persona contemplando
una imagen suya parcialmente deteriorada. Esta no es igual a la manera usual con la que se ordena una biblioteca
o trabaja una computadora. En estos casos se recupera el contenido de una porci on de la memoria conociendo su
ubicaci on. Es posible recuperar la informaci on contenida en un libro conociendo su ubicaci on en un anaquel de
la bilbioteca. Observese que para la operacion de una memoria asociativa es necesaria una cierta capacidad de
procesamiento, ya que se debe inferir el todo partiendo de tan s olo una parte de toda la informaci on buscada.
Para construir una memoria asociativa se representa a una red de neuronas mediante un AC y se construye
un modelo del procesamiento de la informacion utilizando para ello la propia evoluci on del AC. Se efect uan las
siguientes suposiciones:
Una neurona (una celula del AC) se comunica con muchas otras que se encuentran en distintos lugares del
sistema nervioso (SN)(no se supone un ordenamiento espacial)
Una neurona puede pasar de activa a inactiva o viceversa dependiendo de las se nales que le transmiten las
otras neuronas con las que est a conectada (cada neurona es como las que propusieron McCulloch y Pitts)
Los estados de la red quedan especicados por una palabra de N bits y estos codican la informaci on
almacenada en la red. (Se utiliza la convenci on que un 1 indica que esa neurona est a activa y un 0 o un
-1, que est a inactiva.)
Representar la elaboracion de informaci on con mediante un AC con estas caractersticas suele recibir el
nombre de enfoque conexionista del procesamiento. En su forma m as elemental, la red de Hopeld considera que
todas las N neuronas del AC estan interconectadas entre si. Esta idea no es una abstracci on demasiado distante
del sistema nervioso real ya que, al menos en el ser humano el SN cuenta con unas 10
11
neuronas cada una de las
2
Existen neurotransmisores que favorecen la polarizaci on de la membrana de la siguiente neurona y otros que
promueven su despolarizaci on. Se los llama excitatorios e inhibitorios respectivamente
Modelos economicos de m ultiples agentes 10/6/2010
6.1. REDES NEURONALES (I): MODELO DE HOPFIELD 99
cuales posee unas 10
4
terminales sin apticas con lo que en a lo sumo en tres pasos, cualquier neurona se conecta
con cualquier otra.
La din amica del AC de Hopeld con la que se produce el procesamiento de la informaci on almacenada en
la red es la siguiente:
S
i
(t + 1) = sign
"
N
X
j=1
J
i,j
S
j
(t)
#
(6.2)
donde S
j
(t) representa el estado de la jesima neurona en el instante t; J
i,j
es la matriz de ecacias sin apticas
que son n umeros reales independientes del tiempo y las neuronas del AC se actualizan asincr onicamente y en un
orden al azar. Se ha supuesto por simplicidad que el umbral de las neuronas es 0.
Consideremos ahora un conjunto de estados del AC

i
con = 1, 2 . . . p y i = 1, 2 . . . N que satifacen
la condicion de ser puntos jos de la din amica 6.2, o sea:

i
(t) = sign
"
N
X
j=1
J
i,j

j
(t)
#
. (6.3)
Estos estados cumplen un primer requisito para ser considerados recuerdos o memorias almacenados en la red ya
que su procesamiento no aparta al AC de ese mismo estado. La siguiente condicion que deben cumplir para ser
considerados legtimamente como recuerdos es es que sean el resultado de alg un proceso de evocaci on, o sea que,
posicionado el AC en un estado pr oximo a uno de ellos, la dinamica 6.2 conduza la AC a uno de esos estados.
Es posible construir una situaci on como esta en el caso elemental en que los estados

son no correla-
cionados, esto es, que surgen de un paseo al azar. En este caso los

resultan cuasi ortogonales, o sea, satisfacen

) =
1
N
X
i

i
=
,
+O(1/

N). (6.4)
En estas condiciones se puede denir la matriz de ecacias sin apticas J
i,j
utilizando las memorias

mediante
J
i,j
=
p
X
=1

j
. (6.5)
Es inmediato vericar que dadas estas deniciones los estados

i
son puntos jos de la din amica6.2 tal como
debe cumplirse y, adem as, cualesquiera sea la conguraci on inical del AC, este evolucionar a hasta converger a un
punto jo. Esto puede comprobarse deniendo una funci on que se asemeja a una energa mediante (funci on de
Lyapunov):
H =
1
2N
X
i,j
J
i,j
S
i
(t)S
j
(t) (6.6)
y comprobando que la din amica 6.2 es tal que H es mon otona decreciente y acotada inferiormente con lo que la
evoluci on conducir a necesariamente al AC a un punto jo en el cual H no puede disminuir. Observese que no es
posible asegurar que el AC converger a necesariamente a uno de los puntos jos

. Sin embargo esto s olo sucede


si la cantidad p de memorias no es demasiado grande y las condiciones inciales son parecidas a uno de los estados

.
Es pertinente aclarar algunos conceptos utilizados arriba. Cuando se habla de de estados parecidos
a otros se sobreentiende una metrica en el espacio de estados del AC que es la que prevalece en teora de la
informaci on. La metrica de uso com un en este caso es la distancia de Hamming:
Distancia de Hamming:
La distancia de Hamming d
H
(

S,

S

) entre dos palabras



S y

S

S |S
1
, S
2
. . . S
N
) de N bits es el n umero de
bits en que dieren.
Otro punto a aclarar es cu ando la cantidad p de memorias almacenadas es grande o peque na. El valor de
p se estudia en el lmite de N ; en ese caso p resulta excesivo si p N
k
con k > 1. Una cantidad aceptable
de memorias es p N con < 1 (para N resulta .2).
Modelos economicos de m ultiples agentes 10/6/2010
100 CAP

ITULO 6. APRENDIZAJE Y ADAPTACI

ON
Una propiedad de los AC de Hopeld es que no siempre la evolucion del AC lo conduce a uno de los
estados

. Dicho de otro modo, no todos los puntos jos del sistema son los estados

sino que aparecen otros


que son esp ureos. Estos estados indeseados resultan ser combinaciones de las memorias genuinas

y proliferan
exponencialmente a media que p aumenta. Cuando se supera un valor crtico de memeorias, el AC de Hpeld es
incapaz de recuperar ning un recuerdo genuino. Esta transici on es un punto crtico como el que se describi o para
el modelo de la condensaci on y suele llamarse la cat astrofe de confusi on.
Un estado

S
o
p oximo o parecido a uno de los

es uno cuya distancia de Hamming d


H
(

S
o
,

o
) N.
Esta d
H
puede interpretarse cmo informacion contenida en

o
que est a destruida (cambiada). En este caso, la
evoluci on del AC que hace que

S
o
(t = ) =

o
lo que en realidad hace es recuperar esa informaci on deteriorada
y permite que el AC act ue como una memoria asociativa.
El proceso de evocaci on de una memoria que se produce en el AC de Hopeld se puede visualizar como una
cada hacia un mnimo local en un paisaje de energa en el espacio de las 2
N
conguraciones del sistema (ver
gura 6.2). Los puntos en el interior del cuadrado representan los 2
N
estados posibles del AC. Se han representado
5 memorias

mu
, cada una de las cuales se la puede imaginar en el fondo de un valle que se separa de los vecinos por
elevaciones. El proceso de evocaci on puede representarse como una cada hacia el fondo del valle a lo largo de
la cual H disminuye hasta alcanzar un mnimo. Los estados vecinos a cada memoria conforman una cuenca de
atracci on (una est a sombreada) ya que ubicado el AC en cualquier punto de una cuenca, la dinamica lo conducir a
al fondo del valle (las trayectorias del AC en el espacio de estados se indican con lneas las trayectorias del AC).
Figura 6.2: Representacion del proceso de evocacion de recuerdos en
una red de Hopeld.
En el contexto de este modelo los recuerdos

est an almacenados en la matriz de ecacias sin apticas de


de la red. Este almacenamientono no est a localizado en ninguna sinapsis particular sino que est a embebido en
la totalidad de las conexiones. Es posible hacer el experimento de embeber algunos recuerdos y luego cortar
sinapsis al azar con una probabilidad P. Es posible comprobar que P puede ser signicativamente distinta de 0 y,
con todo, la red mantiene la capacidad de evocar exitosamente los recuerdos embebidos en ella. Esta propiedad
suele recibir el nombre de degradaci on gr acil. La red presenta crecientes dicultades para evocar todos los
recuerdos o que estos sean puntos jos. Finalmente cuando P 1 la red colapsa por completo.
Es posible interpetar que un proceso de aprendizaje o de olvido no es m as que una redenici on de la matriz
sin aptica y es asemejable a una alteraci on de la estructura del AC. La ecuaci on 6.5 permite asimismo representar
un proceso progresivo de aprendizaje. La incorporaci on del (m + 1)esimo recuerdo consiste en cambiar todas
las conexiones sin apticas seg un:
J
m+1
i,j
= J
m
i,j
+
m+1
i

m+1
j
(6.7)
La idea que los recuerdos esten embebidos en la matriz sin aptica no se aleja de lo que en realidad sucede en el
procso de aprendizaje en animales. La jaci on de recuerdos en los seres vivos se produce por una alteraci on del
arbol dendrtico de ciertas neuronas del sistema nervioso central que en algunos casos es permanente (algunas
habilidades motrices, el lenguaje) y en otras temporario (memoria de corta o larga duraci on). La hip otesis general
del aprendizaje se suele resumir en la regla de Hebb:
Modelos economicos de m ultiples agentes 10/6/2010
6.1. REDES NEURONALES (I): MODELO DE HOPFIELD 101
Regla de Hebb:
Cuando una neurona excita repetidamente a otra, las sinapsis entre ambas tiende a fortalecerse
Es conveniente destacar un ultimo punto. La capacidad de procesamiento de una red de Hopeld, lo
mismo que los recuerdos, no est a localizada en ninguna parte ni en nig un elemento particular de la red sino que
es patrimonio del conjunto de neuronas, de sus conexiones y de la dinamica propia del AC. Es por consiguiente
un ejemplo claro de que el todo es mucho m as que las partes tal como se dijo en el Captulo 1. Por esta razones
se dice que esta es una propiedad emergente del sistema en este caso, de la red de neuronas. Es de todos los
ejemplos vistos hasta ahora el m as claro de este tipo de propiedad.
Resumen de propiedades importantes:
1. El sistema de N neuronas funciona como una memoria direccionable por sus contenidos: si se incializa el
sistema en un estado que corresponde a una memoria parcialmente corrompida, durante su evoluci on, el
sistema es capaz de restaurar la parte fallada.
2. Esa propiedad computacional es una propiedad emergente, en el sentido que a) es inherente al conjunto
de las N neuronas b) no es privativo de ninguna de ellas en particular y c) esa propiedad no es parte
constitutiva de la dinamica de cada componente.
3. Existe una regla mediante la cual se puede formalizar un proceso de aprendizaje o de adaptaci on mediante
el cual el sistema puede ser entrenado para que tenga un comportamiento determinado.
4. El proceso de aprendizaje consiste en la redenici on de las interacciones entre las unidades que conforman
el sistema. Dar una regla para el aprendizaje es, desde el puntoa de vista de los sistemas din amicos, un
problema inverso: partiendo del hecho que el sistema posee una din amica establecida de evocaci on se debe
determinar cu al es la interaccion (matriz sin aptica) entre su partes constitutivas (neuronas) que conduce
al sistema a los estados que se desean.
5. Tanto la dinamica de todo el sistema como cada una de las memorias que almacena no estan localizadas
en alguna componente individual o determinada del mismo sino que se encuentran dispersas en toda su
matriz sin aptica. Como consecuencia, el sistema es tolerante frente a fallas individuales de cada una de
sus partes y se degrada grcilmente cuando se producen da nos parciales.
6.1.1 Ejemplo: Recuperacion de una imagen
En este ejemplo se muestra la recuperaci on de una imagen mediante una red de Hopeld. Las im agenes se suponen
almacendas en una grilla de 15 X 15 pixeles tal como se muestra en la gura 6.3 asociando cada pixel a cada
neurona de la red. La idea es que cada una de ellas sea una de los recuerdos

. En este contexto, una imagen


parcialmente deteriorada es una en la que algunos pixeles est an con sus valores cambiados: 0 est a como un 1
y viceversa. Esta regla permite dar una medida cuantitativa de la corrupci on dando el porcentaje de pixeles
equivocados, o, equivalentemente, la distacnia de Hamming entre la letra correcta y la corrompida.
Estas cinco im agenes pueden utilizarse para construir una matrtiz sin aptica de una red de Hopeld usando
la convencion que asocie un pixel 0 a una neurona en el estado S
i
= 1 y un pixel 1 a una neuroan en el estado
S
i
= +1 y numerando los pixeles de la imagen con algun criterio establecido. Con estas convenciones se puede
construir una matriz de 15
2
X 15
2
embebiendo de esa manera a las cinco im agenes de la gura 6.3 con la regla
dada en la ecuaci on 6.5.
Los recuerdos asociados a las letras de la gura 6.3 no cumplen con la propedad de ser cuasi ortogonales.
En la tabla adjunta se muestran los productos escalares

). Como se puede comprobar el par de letras


(C,L) tienen por ejemplo una alta correlaci on mientras que el par (I,A) son practicamente ortogonales. A pesar
de este hecho, un AC de Hopeld contruido con estos recuerdos puede operar con alg un margen satisfactorio.
TABLA DE PRODUCTOS ESCALARES
Modelos economicos de m ultiples agentes 10/6/2010
102 CAP

ITULO 6. APRENDIZAJE Y ADAPTACI

ON
Figura 6.3: Imagenes de 5 letras representadas en una grilla de 15 X 15
celdas (pixeles). Cada celda roja corresponde a un pixel 0 y cada celda
negra corresponde a un pixel 1.
I L A C O
I 1.000 0.280 0.040 0.333 0.209
L 0.280 1.000 0.280 0.769 0.307
A 0.040 0.280 1.000 0.369 0.493
C 0.333 0.769 0.369 1.000 0.413
O 0.209 0.307 0.493 0.413 1.000
Enla gura 6.4 se muestra el resultado de un proceso de evocaci on asociativa. En la columna de la derecha
se muestra el estado incial del AC y en la columna de la izquierda el resultado de la evocaci on. En las las (A)
y (B) se han embebido s olo tres recuerdos (las im agenes de la I, la L y la A). En la la rotulada (A) se muestra
el resultado de dar como condicion inicial la letra L con un 20% de corrupci on y la recuperaci on es perfecta. En
la la la (B) se eligi o como estado incial la misma letra L pero con un 60% de corrupcion. Con una corrupci on
que supera el 50% las im agenes comienzan a parecerse cada vez m as al negativo del recuerdo embebido. La
evocaci on conduce efectivam,ente a una imagen muy semejante al negativo de la L(en realidad, a una distancia
de Hamming de 1 de ese negativo). Esta es una propiedad general, es f acil vericar que si

es un recuerdo
embebido, tambien esta embebebido su negativo:

.
En la la rotulada con una (C) se muestra el efecto de abarrotar la red de recuerdos embebiendo en ella
las 5 im agenes de la gura 6.3. El abuso en el almacenamiento de recuerdos es m as notorio cuando estos no son
ortogonales tal como sucede en este ejemplo. En el ejemmplo que se muestra se inicializa el AC con la L con un
15 % de corruopci on. El proceso de evocaci on conduce a un estado esp ureo que es una mezcla de los recuerdos C
y L. Estas dos im agenes pueden confundirse f acilemente pues poseen un elevado producto escalar.
6.2 Redes neuronales (II): Redes en capas
El modelo de Hopeld puede interpretarse como un conexionado amorfo en el sentido que no presupone ning un
orden en el cual las neuronas reciben se nales o las trasnmiten ni tampoco existe ninguna direcci on porivilegiada
para el ujo de la infromaci on. Una estrategia alterantiva que recibio mucha atenci on en la literatura es el de
modelos de redes neuronales con una entrada y una salida de informaci on.
El primero y m as elemental fue el Perceptr on de Rosenblatt directamente inspirado en la neurona simb olica
de McCulloch y Pitts (ver gura 6.1. Dicho sistema recibe los patrones

en sus puertos de entrada. Cada una


Modelos economicos de m ultiples agentes 10/6/2010
6.2. REDES NEURONALES (II): REDES EN CAPAS 103
Figura 6.4: Tres ejemplos de evocacion de recuerdos con una Red de
Hopeld.
de las componentes de dichos patrones es pesada por las ecacias sin aptica W
j
y se las suma. El resultado de esta
operacion se ltra mediant de una funci on de transferencia g(.). Dicho ltrado no es m as que la compareaci on del
resultado de la suma con un umbral. El resultado de esta operaci on se entrega en el puerto de salida. En todo lo
que sigue supondremos que la funcion de trasferencia es una sigmoide que satura en 1 y que es derivable en el
origen:
S

= g[
X
j
W
j

j
] (6.8)
En realidad todo el AC de Hopeld est a construido con dipositivos de este tipo en el que los patrones de
entrada son los estados de activaci on de las restantes neuronas del automata. La unica diferencia es que para un
Perceptr on no es necesario que los patrones de entrada

sea vectores de 1s y -1s como es el patr on de activaci on


de las neuronas del AC de Hopeld.
En el lenguaje de la teora de la informaci on un dispositivo que funcione como en la ec. 6.8 se lo denomina
clasicador lineal. Es un clasicador porque a cada uno de los patrones

con = 1...p el dispositivo le asigna


ya sea S = +1 ya sea S = 1. Es adem as lineal porque los

que el dispositivo asigna a S = 1 est an separados


de los otros por el hiperplano
P
j
W
j
x
j
= 0. De esto resulta claro que la clasiaci on que efect ua el perceptr on
depende de los coecientes W
j
que son los que determinan el plano separador de las dos categoras.
Ya hemos visto que, en el contexto del modelo de Hopeld, el aprendizaje se asocia con un cambio en el
valor de los vnculos entre las neuronas de la red. Cabe pues preguntarse si es posible construir un perceptr on
para que a determinadas entradas les correspondan salidas preestablecidas, esto es, si es posible construir un
Modelos economicos de m ultiples agentes 10/6/2010
104 CAP

ITULO 6. APRENDIZAJE Y ADAPTACI

ON
perceptron que reproduzca una tabla |

, S

determinada. Como como l ogica consecuencia de esta propuesta


tambien es necesario saber cu antos pares |

, S

con S

|0, 1 pueden almacenarse en un perceptr on, o,


lo que es equivalente, cu an larga puede ser la tabla que acabamos de mencionar de asociaciones entre entradas y
salidas.
La respuesta a la primera pregunta es armativa: es efectivamente posible construir un perceptron que
relaciones un conjunto de entradas con una lista preestablecida de salidas siempre que, por supuesto, esa lista
corresponda a una clasicaci on lineal. Existe un algoritmo que permite ir ajustando progresivamente las ecacias
sin apticas esto y que converge en un numero nito de pasos.
Algoritmo de aprendizaje del perceptr on: Sean

las entradas y sean

las salidas correctas Algo-


ritmo: Recorrer la lista de entradas y para cada una de ellas comparar la salida correcta con la que efectivamente
produce el perceptr on y cambiar las ecacias sin apticas seg un la regla siguiente:
W
nueva
i
= W
vieja
i
+ W
i
(6.9)
con
W
i
= 0 si S

(6.10)
o sea, si la salida es correcta, y
W
i
= 2

si S

,=

(6.11)
si la salida es incorrecta. En ambas ecuaciones es un parametro que regula la tasa de convergencia del proceso.
Suele llam arselo tasa de aprendizaje y es menor que 1.
La segunda pregunta acerca de cu an extensa puede ser la lista de asociaciones que se le pueden exigir a un
perceptron puede en realidad asemejarse una capacidad de memoria. En el lmite en que el numero de entradas
tiende a innito y la funci on de transferencia es continua, resulta que dicha capcidad es p
max
= 2N.
La limitaci on de separabilidad lineal hizo caer en el desinteres a los perceptrones durante cierto tiempo
ya que se observ o que funciones muy sencillas no son linealemente serparbles (el ejemplo que siempre se da es la
funci on l ogica de la disyunci on XOR). El interes renaci o con la propuesta de dotar al perceptr on de una capa de
neuronas intermedias con lo que el dispositivo de c omputo pasa a ser un clasicador de grado mayor que 1. Puede
tambien actuar como un interpolador de grado elevado entre datos conocidos. En la gura 6.5 se muestra la tabla
de verdad del XOR (panel A) y su correspondiente repesentaci on (panel B) en el que se ve que los pares S = 1
y S = 0 no pueden ser separados por ninguna recta en el plano
1
,
2
. En el panel C se muestra un perceptr on
con dos entradas. Sus puertos de entrada se representan por rect angulos. El unico elemento capaz de alg un
procesamiento es la neurona que se representa con un crculo. Este dispositivo no puede reproducir el patr on de
salidas de la funci on l ogica del panel, A represntada en el panel B. En el panel D se muestra un perceptr on de
varias entradas con una capa intermedia y dos salidas. Los puertos de entrada se representan con rect angulos y
las neuronas de la capa intermedia se han resaltado con crculos de distinto color.
Los perceptrones multicapa han dado lugar a numerosas aplicaciones, en algunos campos han demostrado
ser dispositivos de c alculo muy utiles y en otros no cumplieron esa expectativa. Igual a lo dicho para un perceptr on
simple, las redes en capas puede tambien ser entrenadas para memorizar una tabla preestablecida de entradas
y salidas. El proceso de entrenamiento puede plantearse como la soluci on de un problema de optimizaci on
consistente en buscar el juego de ecacias sin apticas que minimice una funci on costo que mide el apartamiento
cuadr atico de las salidas efectivamente producidas por la red (S

j
) (j = 1, ...K) y las salidas correctas (

). El
costo se dene como:
( =
p
X
=1
K
X
i=1
[

i
S

i
]
2
(6.12)
p indica el numero de patrones y K es el n umero de puertos de salida de la red. Si se explicitan las ecacias
sin apticas poniendo W
(1)
y W
(2)
para las ecacias que conectan los N puertos de entrada con la M neuronas de
Modelos economicos de m ultiples agentes 10/6/2010
6.2. REDES NEURONALES (II): REDES EN CAPAS 105
Figura 6.5: Paneles (A) y (B): tabla de verdad de una funcion logica
que no es linealmente separable y su representacion. Paneles (C) y (D):
Perceptron simple y perceptron multicapa.
la capa oculta y las que conectan a estas con las K neuronas de salida, esta ecuaci on queda:
( =
p
X
=1
K
X
i=1
"

i
g

M
X
j=1
W
1
i,j
g[
N
X
j=1
W
1
j,k

k
]
!#
2
(6.13)
Se trata de una funci on altamente no lineal de las ecacias W. El procedimento numerico es, con variantes, el
descenso por el gradiente de (, para ello se hace la hipotesis que tanto las entradas como las salidas son n umero
reales (por lo general normalizados a alg un intervalo de referencia como [1, 1]) y que las funciones de transferencia
son continuas.
Si recordamos que frente a un cambio peque no de los W, se puede escribir:
((

W +

W) = ((

W) +

W
(


W
(6.14)
basta con elegir los cambios


W =
(


W
(6.15)
para asegurarse que ellos redundar an en una disminuci on sistem atica de (:
((

W +

W) = ((

W) [
(


W
[
2
(6.16)
Siendo que la supercie ( tiene una enorme cantidad de dimensiones un recurso de minimizaci on como el
explicado corre el riesgo cierto de quedarse atrapado en mnimos locales. Por esta raz on los procesos disponibles
Modelos economicos de m ultiples agentes 10/6/2010
106 CAP

ITULO 6. APRENDIZAJE Y ADAPTACI

ON
en diversos paquetes de software comercial recurren a elementos m as sosticados que, entre otros elementos,
contemplan variaciones aleatorias.
La constante suele llamarse tasa de aprendizaje como en el caso de los perceptrones. Los gradientes
utilizados en las ecuaciones arriba pueden escribirse de modo que las correcciones en las W se produzcan itera-
tivamente y primero en la capa de salida, luego esta correccion se propaga a la capa intermedia para terminar
en la de entrada. Por esta raz on a este algoritmo se lo suele llamar de retropropagaci on del gradiente (en ingles
gradient backpropagation).
El desarrollo de una red en un problema independiente del tiempo (o sea uno en que ni las entradas ni
las salidas son funciones del tiempo) involucra por lo general cuatro etapas que en la literatura reciben nombres
particulares:
1. Entrenamiento: Minimizaci on de la funci on costo utilizando un conjunto de pares (

) que son
conocidos
2. Memorizaci on: Comprobaci on que la red es capaz de reproducir las salidas correctas cuando se presenta
cada una de las entradas utilizadas en la etapa de Entrenamiento
3. Validacion: Ensayos de la red con entradas no utilizadas en el entrenamiento pero cuyas salidas se conocen
4. Generalizaci on: Prueba de la red con entradas no utilizadas en el entrenamiento para producir salidas
cuya validez se desconoce
Es posible - y existen diversos metodos para ello - desarrollar redes para un problema dependiente del
tiempo, por ejemplo la predicci on de los terminos sucesivos de una serie temporal a medida que se reciben datos
de ella o la adaptaci on de un sistema de control en tiempo real para regular alg un proceso fsico.
6.2.1 Ejemplo: La telara na (I): una red neuronal para estimaci on de precios
futuros. (Ejemplo elaborado por C. Parpaglione)
En esta secci on daremos ejemplos de utilizaci on de una red neuronal en capas para anticipar precios. Cuando se
trata de anticipar futuros valores de una serie temporal tal como podra ser el caso de la cotizac on de un activo
nanciero se podra utilizar una red cuya arquitectura se muestra en la gura 6.6. Esta arquitectura utiliza como
Figura 6.6: Prediccion de precios en una serie temporal: una arquitec-
tura posible para aprendizaje en tiempo real.
entradas los precios registrados en m instantes anteriores, y estima con ellos el precio en el instante subsiguiente
t. En este planteo est a implcita la hip otesis que los precios de la serie existe alguna relaci on causal que vincula
los valores sucesivos de la serie. Obs/ervese que la relacion causal que se supone es entre precios pasados y
futuros de ese activo particular y no se tiene en cuenta, por ejemplo, informaci on global del mercado, cotizaci on
de activos relacionados u otras circunstancias de signicaci on econ omica. Desde este punto de vista la red de la
Modelos economicos de m ultiples agentes 10/6/2010
6.2. REDES NEURONALES (II): REDES EN CAPAS 107
gura no hace sino un ajuste por medio de una regresi on no lineal sobre datos pasados. Una tarea m as meticulosa
de prediccion puede incluir otros datos en la entrada.
Si se dispone de una historia previa de la serie, las ecacias sin apticas de la red pueden ajustarse tomando
como se nal de error la diferencia entre el precio predicho y el efectivamente realizado en la serie temporal. Se
deberan asignar inicialmente valores arbitrarios a las ecacias sin apticas y ajustarlos reproduciendo los valores
sucesivos de la serie. Despues de reproducir los valores ya conocidos de esa serie, el ajuste puede continuarse a
medida que se van obteniendo nuevos datos. En este caso se tratara de un aprendizaje en tiempo real.
Abajo discutimos un ejemplo diferente consistente en la anticipaci on de los pasos futuros de un tanteo
entre precios esperados y precios realizados en un proceso para corregir un exceso de demanda.
Para jar ideas supondremos un pescador que sale de campaa con su bote, y pesca una determinada
cantidad con la hip otesis de un precio esperado P
esp
(t) para ese da t. A su llegada a puerto, toda su pesca es
rematada y vendida a un precio P
real
(t) ,= P
esp
(t) que es el efectivamente realizado en las transacciones que
tienen lugar en el mercado.
Primero buscaremos una red neuronal que permita determinar P
esp
(t+1) para el da siguiente, conociendo
para ello el precio que se haba esperado para el da t y el precio que efectivamentese realiz o en ese da, esto es:
P
esp
(t), P
real
(t) P
esp
(t + 1) (6.17)
La arquitectura de la red neuronal para este ejemplo debe contemplar una capa con dos entradas y una
unica salida (ver Figura ??). Se debe jar el n umero de neuronas de la capa oculta. No existe una regla universal
para esto. Por lo general este n umero surge de diversas pruebas.
Para entrenar a la red neuronal se necesitan datos de eventos anteriores en los que se conocen tanto las
entradas como las salidas de la red. Para elaborar este ejemplo se supuso que se dispone de 20 ejemplos que
corresponden a otras tantas jornadas de pesca de campa nas anteriores. No se supone que los mismos respondan a
una dada secuencia temporal de tanteos ni que esten correlacionados de ninguna manera particular. Si se deseara
utilizar ejemplos temporalmente relacionados y tener en cuenta esta informaci on se debera utilizar otro planteo
predictivo y, quiz a, otra arquitectura para la red. En el esquema que hemos elegido aqui, se supone que la curva
de oferta es bien conocida y los 20 ejemplos ofrecen tan s olo un muestreo parcial de la curva de demanda.
Para probar la habilidad de la red con situaciones de mayor y menor dicultad se construyeron conjuntos
de 20 ejemplos asociados a curvas de demandade diverso nivel de irregularidad. Destaquemos que en el presente
contexto tales irregularidades no deben considerarse como originadas en ruido estoc astico. Esto es debido a que
el n umero de ejmplos es muy reducido. Para que las irregularidades puedan ser atribuidas a perturbaciones
aleatorias el conjunto de ejemplos debiera haber contenido casos con identicas (o muy similares) entradas y con
salidas algo diferentes. Tal como fueron elaborados estos ejemplos esa situaci on no se ha dado, por consiguiente
no se debe suponer que este problema contemple una situacion de aprendizaje en presencia de ruido situaci on
para la que existen abordajes especialmente orientados.
Cada conjunto de ejemplos puede pues suponerse asociados a campa nas de pesca realizadas para otros
mercados o por otros barcos de pesca. Esos conjuntos fueron construidos para que surjan de funciones de oferta y
demanda de diferente grado de irregularidad. Con cada conjunto de ejemplos, se entren o la red ajustando sus eca-
cias sin apticas para que reproduzca los 20 ejemplos de cada campa na, utilizando un algoritmo de retropropagaci on
del gradiente. Para ello se utilizaron repetidamente todos esos ejemplos en un orden aleatorio.
En la gura (?) el eje de las abscisas corresponde a precios estimados y las lneas verticales indican cada
uno de los tripletes ejemplos (|P
esp
(t), P
real
(t), P
esp
(t + 1)) con que se entreno la red. La abscisa de cada
lnea vertical corresponde al primer termino del triplete y sobre cada una se muestran los otros dos terminos con
smbolos diferentes: el cuadrado rojo lleno corresponde al segundo termino del triplete P
real
(t), y el crculo azul
lleno al tercero, P
esp
(t + 1) o sea al precio que se debera estimar para el siguiente da.
El terecer termino del triplete es el resultado que se procura obtener con la red neuronal: hipoteticamente,
al pescador le sera posible estimar el precio esperado para el da siguiente introduciendo los precios estimados
y realizados en cada da. Por esta razon, en la gura, se representa tambien el resultado de la red mediante un
crculo verde. Estos valores representan el resultado de la etapa de memorizaci on de la red.
Modelos economicos de m ultiples agentes 10/6/2010
108 CAP

ITULO 6. APRENDIZAJE Y ADAPTACI

ON
Figura 6.7: Ejemplo de ajuste de exceso de demanda mediante tanteo
de precios. Arriba: representacion graca mediante curvas de oferta y
de demanda y correspondencia entre precios eestimados y realizados en
el da t y el precio esperado en da t + 1. Abajo: arquitectura de la red
utilizada para el tanteo.
Se puede observar que la red, una vez entrenda, es capaz de reproducir con variada delidad el conjunto
de terceros terminos de los tripletes utilizados en el aprendizaje. El caso en que la curva de demanda es muy
irregular se trata de un problema de memorizaci on m as difcil y la red no lo ajusta siempre exitosamente. Cuando
la demanda es muy irregular todos los ejemplos son casos unicos ya que no hay una ley subyacente que los unique.
El panel de la derecha, en cambio, la red es capaz de reproducir con gran delidad todos los ejemplos utilizados
en el aprendizaje y la ley que subyace a todos los ejemplos es claramente peceptible.
Una vez entrenada, la red puede ser utilizada para predecir cu al debe ser el precio que se puede jar en
una jornada de pesca cualesquiera conociendo los dos anteriores. Sin embargo ese no sera un uso apropiado ya
que, de manera sistem atica se estaran sobreestimando o subestimando precios. Teniendo en cuenta que se trata
de un tanteo, la red debera ser utilizada para investigar si dicho proceso posee un punto jo. Ese punto jo es
claramente visible, al menos, en el panel de la derecha de la gura (?).
La red desarrollada puede ser utilizada para determinar ese punto generando toda una serie temporal
virtual de tanteos consecutivos. Para ello se debe utilizar reiteradamente la red redeniendo sucesivos datos de
entrada utilizando en cada caso los resultados producidos en su salida, tal como los muestran las echas doradas
en la parte inferior de la gura ??. Este uso correspondera a una etapa de generalizacion de la red. Esta
b usqueda se puede hacer suponiendo que dos ejemplos cualesquiera son datos iniciales del tanteo y generando con
ellos tod ol tanteo virtual.
Modelos economicos de m ultiples agentes 10/6/2010
6.3. MODELOS EVOLUTIVOS 109
Figura 6.8: Se muestran los ejemplos utilizados para el entrenamiento
de la red conjuntamente con el resultado de dicho aprendizaje en dos
situaciones para una curva de demanda irregular (panel de la izquierda)
y para una curva de demanda muy regular (panel de la derecha).
El resultado de este ejercicio se muestra en la gura (?) para dos situaciones. En el panel de la izquierda
se utiliz o la red entrenada para una curva de demanda irregular y se tomaron como condiciones inciales dos
ejemplos pr oximos a la zona del equilibrio, o sea cuando P
esp
(t) P
real
(t) P
esp
(t +1). Esta red es incapaz de
determinar un precio de equilibrio y predice una serie virtual con oscilaciones de gran amplitud. Eso no sucede
con la red entrenada para una curva de demanda regular que se muestra en el panel de la derecha. La serie virtual
representa tanteos que disminuyen en amplitud progresivamente. Una b usqueda de este tipo debe en realidad
realizarse eligiendo una variedad grande de condiciones inciales y promediando sobre los resultados.
Como se puede observar la generalizaci on que efect ua la red para demandas m as regulares es altamente
satisfactorio. En esos casos la red consique extraer de los ejemplos un patr on de tanteo convergente. Este
comportamiento se deteriora con demandas muy irregulares al punto de ser incapaz de ofrecer un precio de
equilibrio. En este caso, lo unico que la red puede inferir de los ejemplos que se le han suministrado es que se
alternar a un precio alto con otro bajo pero no es posible advertir si existe o no un proceso de convergencia real.
Esa conclusi on sera tambien a la que podra haber llegado un observador inteligente. Aun retenido toda la
secuencia de datos hist oricos sera muy dicil adivinar la existencia de un valor preciso de equilibrio. Si esta fuera
la situaci on que se presenta, el pescador de la historia podra utilizar la red para efectuar estimaciones adicionales
y ampliar progresivamente el conjunto de ejemplos con el objeto de determinar un posible precio de equilibrio.
Se puede ver que el hecho que se haya conseguido una buena memorizaci on no garantiza en modo alguno
una generalizaci on que detecte un patr on aceptable del tanteo como el que se obtiene en el caso de demandas muy
regulares. En estos casos exigir que en la etapa de entrenamiento la red ajuste con excesiva precis on los datos
de una secuencia muy irregular puede conducir al error del sobreajuste (overtting) de los datos observados y
comprometer de ese modo la conabilidad de las extrapolaciones (la generalizaci on) que realiza la red.
6.3 Modelos evolutivos
Los procesos de adaptaci on y aprendizaje pueden tambien representarse por medio de modelos evolutivos en los
que sucesivas modicaciones de un sistema permiten mejorar su desempe no de acuerdo con alg un requerimiento.
Estos modelos tiene una fuerte inspiraci on biol ogica.
Modelos economicos de m ultiples agentes 10/6/2010
110 CAP

ITULO 6. APRENDIZAJE Y ADAPTACI

ON
Figura 6.9: Resultados de la etapa de generalizacion de la red gene-
ando uan serie virtual de tanteos. Los ejemplos reales y los resultados de
la red se muestran en negro y la srie virtual en rojo. Panel de la izqueirda
curva de demdan irregular, panel de la derecha, curva de demanda muy
regular.
6.3.1 Motivaci on biologica
La Teora de la Evolucion formulada por Darwin a mediados del siglo XIX provoc o un cambio profundo en el modo
de pensar sobre la diversidad biol ogica y en general sobre todos los fen omenos ligados a la vida. Hoy en da suele
decirse que nada se puede comprender en biologa fuera de dicha teora. El Origen de las Especies de Darwin
es considerado adem as como la teora que m as ha cambiado el pensamiento cientco de los a nos posteriores.
En el momento en que Darwin formula los conceptos ligados a la evoluci on de las especies existan varios
antecedentes importantes. En primer lugar era conocido el hecho que variedades de ores (rosas en particular)
o de ganado podan ser mejoradas por cruza de ejemplares seleccionados. En segundo lugar, en el estudio de la
geologa se haba adquirido conciencia de la realidad de las trasformaciones progresivas del ambiente geograco y
los lapsos extremadamente prolongados en el que los mismos haban sucedido. Otro antecedente importante son
las ideas de Lamarck (1744-1829)- bien conocidas y compartidas por Darwin - que haba propuesto la primera
teora evolutiva para los seres vivos. Segun esta las especies son capaces de sufrir cambios a lo largo de las
generaciones merced a que los descendientes heredan los caracteres que haban adquirido sus ancestros a lo largo
de su vida. Su imagen de la manera en que las jirafas adquirieron sus largos cuellos podra haber sido que a lo
largo de las generaciones aquellos ejemplares que mas se esforzaban estirando sus cuellos para alcanzar las hojas
m as altas de los arboles transmitan a su descedencia los pocos centmetros de cuello ganados de esa manera
La formulaci on evolutiva de Darwin postula en cambio la heredabilidad de los caracteres que mejor con-
tribuyen a que el individuo pueda reproducirse. La capacidad de tener descendientes es por otra parte una medida
de cuan exitoso ha sido ese individuo en su lucha por la supervivencia. Este concepto se resumi o incorrectamente
diciendo que la teora de Darwin postulaba la supervivencia del m as apto dando as lugar a un razonamiento
circular. La diferencia entre el enfoque de Darwin y el de Lamarck reside en que Darwin tiende m as a pensar que
la diversidad y la capacidad de cambio es una cualidad inherente a naturaleza misma de los individuos y que esos
cambios se producen al azar. Adem as el medio ambiente lo supone jugando el papel de seleccionar cu ales son los
cambios m as ventajosos. La manera en que Darwin habra explicado el cuello largo de la jirafas sera que aquellos
individuos que por mera casualidad han nacido con el cuello m as largo se pueden alimentar mejor y dejan por
eso m as descendencia, raz on por la cual al cabo de sucientes generaciones esa caracterstica pasa a generalizarse
en toda la poblaci on. El cambio evolutivo tal como lo entenda Lamarck qued o nalmente desacreditado por
la evidencia emprica que, al menos en organismos superiores, demuestra que los caracteres adquiridos no son
Modelos economicos de m ultiples agentes 10/6/2010
6.3. MODELOS EVOLUTIVOS 111
heredados por los descendientes.
Una objeci on importante a la teora de Darwin en momentos en que fue formulada era que el proceso
evolutivo deba converger a una perdida de diversidad y no a su aumento tal como en realidad puede constatarse
por la observaci on directa de una enorme variedad de especies. Esa objeci on pudo ser levantada luego de las
investigaciones de Mendel que hacia 1900 estableci o la naturaleza at omica de la herencia. De los estudios de
Medel surgi o que las cartactersticas heredables se concentraban en elementos que el denomin o genes. Por esta
raz on en el proceso de la reproducci on una caracterstica se transmite de los progenitores a la descendencia de
manera completa (si el gen se trasmite a la descendencia) o no se transmite (si el gen no est a presente en los
descendientes).
La moderna biologa molecular di o sustento qumico al concepto de gen cuando se estableci o que la infor-
maci on que se transmite en la herencia est a codicada en la molecula de ADN que reside en el n ucleo de las celulas.
La nueva sntesis evolutiva en la que las bases moleculares son adecuadamente tenidas en cuenta se ha dado en
llamar neodarwinismo o darwinismo molecular. El ADN contine una dos largas secuencias enfrentadas en la
disposicion de una doble helice y construidas por la repetici on de 4 compuestos qumicos diferentes (nucle otidos)
3
cuyo ordenamiento particular gobierna el proceso de sntesis de las proteinas. Estas moleculas son los ladrillos
fundmantales con los que se construyen las celulas del organismo y hacen posible todas sus funciones vitales.
Hoy en da la moderna biologa ha podido comprobar los postulados b asicos del enfoque darwiniano
observ andolo bajo el microscopio o en el laboratorio de bioquimica. Existen lneas de pensamiento en las que se
intenta trasladar estos conceptos al contexto de las neurociencias tanto en la morfogenesis de conglomerados de
neuronas en el cerebro (darwinismo neuronal) como en teoras cognitivas sobre la genesis y estabilizaci on de
conceptos. Existen en cambio intentos que no han ganado consenso sobre darwinismo social. Los conceptos de
la evoluci on darwiniana han sido tambien trasladados exitosamente a las ciencias de la computaci on dando lugar
a algoritmos de optimizaci on que veremos en la proxima secci on de este captulo y que son una herramienta util
para modelar agentes complejos y adaptivos y para encarar problemas de optimizaci on combinatoria, en los que
se requiere calcular extremos de funciones de gran complejidad en espacios de elevado n umero de dimensiones.
Resulta muy tentador utilizar el estilo de pensamiento de la teora de la evoluci on para trasladarlo a contex-
tos a veces distantes de problemas biol ogicos. Si bien nostros utilizaremos estas ideas y formularemos algunas de
estas met aforas hay que ser muy conciente de las limitaciones de las mismas. Los conceptos derivados del enfoque
evolutivo darwiniano han tenido por ejemplo un impacto enorme en la ciencia poltica a traves de extrapolaciones
en las que transgreden muchos de los conceptos b asicos de la misma. Las ideas de Darwin impresionaron mucho
a Marx quien dedic o parte de su obra al naturalista ingles. Los seguidores de Marx trasladaron la competencia
entre especies al medio social reformul andola como una lucha entre clases que deba conducir a la supervivencia y
consiguiente gobierno por la clase m as apta. Una extrapolaci on profundamente equivocada fue la del nazismo
que imagin o que el medio social es el escenario de una lucha entre razas, lucha en la cual esta llamada a prevalecer
una raza superior. Finalmente se debe mencionar que buena parte del sustento de los conceptos ligados al
liberalismo econ omico reside en visualizar la libre competencia entre rmas como un mecanismo de selecci on que
redunda en una superaci on y mejora de las mismas.
El mecanismo de evoluci on darwiniana s olo contiene los siguientes elementos b asicos:
1. Es un fen omeno poblacional: El proceso evolutivo s olo puede tener lugar en el seno de una poblaci on
que, en principio, est a formada por una gran cantidad de individuos. Jam as el mecanismo de cambio
y selecci on de aptitudes puede desenvolverse en un individuo aislado sino que tiene lugar a traves del
proceso de procreaci on que renueva la estructura de la poblaci on. Por estas razones el proceso de cambio
involucra lapsos prolongados ya que la unidad de tiempo es el requerido para renovar generacionalmente
la poblaci on.
2. Genesis de diversidad. Se supone que la diversidad se genera por mutaciones al azar en la informaci on
genetica de los miembros de una poblaci on. En la pr actica la tasa de cambios debe ser lo sucientemente
peque na como para que las variantes favorables no se vean destruidas en ulteriores mutaciones y lo sucien-
temente signicativa como para efectuar un aporte apreciable a la diversidad en la informaci on genetica
de toda la poblaci on.
3
Los mismos son Adenina, Guanina, Citosina y Timina que se abrevian por A, G, C, T. En el caso del ser
humano, esa cadena contiene 3X10
10
eslabones
Modelos economicos de m ultiples agentes 10/6/2010
112 CAP

ITULO 6. APRENDIZAJE Y ADAPTACI

ON
3. Selecci on. S olo una fracci on de los individuos son capaces de transmitir cambios a la siguiente generacion.
Los individuos de la poblaci on compiten por recursos escasos (alimento, agua, espacio, etc.) que son
indispensables para su supervivencia y reproducci on. Esa competencia hace que s olo algunos selectos
individuos puedan dejar descendencia. Por lo general la cualidad por la que los individuos son seleccionados
recibe el nombre de aptitud, desempe no o tness.
4. Heredabilidad Aquellas caractersticas que contribuyen a una mayor exito reproductivo se transmiten
por la herencia entre los progenitores y su descendencia. En realidad, la armaci on debiera ser en sen-
tido inverso: s olo aquellas caractersticas que contribuyen a una mejor tness que son heredables son
relevantes.
6.3.2 Agentes complejos adaptivos
El esquema explicado arriba induce a pensar que la evoluci on pueda imaginarse como una acumulaci on lenta y
progresiva de cambios en la informaci on genetica de los individuos de la poblaci on o, en terminos m as matem aticos
como un paseo al azar en el espacio de las secuencias gen omicas. Si bien este concepto posee sus limitaciones
(ver secciones posteriores) es una base adecuada para trasladar este mecanismo a un contexto formal que permite
visualizar el proceso evolutivo como uno de optimizaci on por el cual, a lo largo de las generaciones se maximiza
una funci on tness.
Para establecer este paralelismo conviene imaginar que un ser vivo, en interacci on con el medio ambiente,
puede representarse de modo elemental como un agente que recibe estmulos y produce respuestas. Desde un punto
de vista computacional ese comprtamiento se lo puede sintetizar en una lista de sentencias del tipo: SI[estimulo]
ENTONCES[respuesta] que podemos simbolizar como
[E] =[R] (6.18)
La respuesta R puede manifestarse a traves de sistemas motrices (p.ej. contracci on de m usculos para
provocar la caza de una presa o la huida de un predador) o de valores testigo que sirvan de control (p.ej. alteraci on
del nivel de glucosa en sangre para dar lugar a la sensaci on de hambre).
La conducta y eventualmente la estructura de un agente de un cierto nivel de complejidad podra en
consecuencia simbolizarse como una lista de sentencias del tipo 6.18. Dicha lista puede asimilarse al genoma
del individuo y pueden a su vez suponerse codicadas con valores numericos de referencia, por una lista de
caracteres cualesquiera |a
i
, o m as generalmente con 0s y 1s.
([E
1
] =[R
1
]) ([E
2
] =[R
2
]) ([E
N
] =[R
N
]) a
1
a
2
a
N
(6.19)
6.3.3 Algoritmos Geneticos
A partir de esta representacion es posible hacer un modelo computacional de un proceso evolutivo darwiniano
siguiendo los puntos 1 a 4 arriba mencionados:
1. Se parte de una poblaci on inicial en la que cada individuo es un genoma como los recien descriptos.
2. en cada nueva generaci on cada genoma es alterado produciendo un cambio al azar (mutaci on) en la infor-
maci on que contiene. Este cambio se efect ua con una probabilidad que debe respetar los lmites menciona-
dos arriba
3. Se eval ua la tness de todos los individuos de la poblaci on y se seleccionan aquellos que la tienen mejor.
4. Se construye una nueva generaci on de secuencias a partir de la existente mediante alg un mecanismo de
reproducci on del que s olo participan los individuos m as aptos.
En esta formalizaci on los individuos son asimilados a su informacion genetica, despreciando en gran medida
el papel que puede jugar el medio ambiente en la expresi on de la misma (lo que en biologa recibe el nombre de
fenotipo). Este punto es discutido m as adelante.
Modelos economicos de m ultiples agentes 10/6/2010
6.3. MODELOS EVOLUTIVOS 113
Por semejanza con lo que sucede en seres vivos, los mecanismos de reproducci on puede ser la simple copia
de la secuencia (reproducci on asexual) o puede involucrar a dos progenitores (una reproducci on sexual). Esta
cruza suele llamarse crossover. Se suele proceder de la manera siguiente:
1. Se seleccionan dos secuencias A y B aptas para reproduccion,
2. se determina al azar un punto de corte.
3. ambas secuencias son cortadas en el mismo lugar generando asi los segmentos A
1
y A
2
de la primera
secuencia y B
1
y B
2
de la segunda,
4. se generan dos descendientes componiendo dos nuevas secuencias (A
1
,B
2
) y (B
1
,A
2
).
Si las secuencias progenitoras (A) y (B) son:
Sec.A = a
1
a
2
a
3
a
n
| {z }
A
1
a
n+1
a
N1
a
N
| {z }
A
2
(6.20)
Sec.B = b
1
b
2
b
3
b
n
| {z }
B
1
b
n+1
b
N1
b
N
| {z }
B
2
(6.21)
las secuencias descendientes (1) y (2) resultan:
Sec.1 = a
1
a
2
a
3
a
n
| {z }
A
1
b
n+1
b
N1
b
N
| {z }
B
2
(6.22)
Sec.2 = b
1
b
2
b
3
b
n
| {z }
B
1
a
n+1
a
N1
a
N
| {z }
A
2
(6.23)
Tanto el crossover como la mutaci on son recursos para introducir diversidad en la poblaci on de secuencias.
La estrategia de reproducci on sexual ha sido ligada a una cierta capacidad de los algoritmos geneticos para explorar
en paralelo (de manera simultanea) distintas regiones del espacio de par ametros en el proceso de optimizaci on.
Es menester aclarar que la aplicaci on de algoritmos geneticos en un proceso de optimizaci on no obedece
a reglas precisas. Si bien siempre se deben componer generaciones sucesivas de un mismo n umero de individuos
hay libertad para establecer el mecanismo de selecci on y reproducci on. Por ejemplo, el proceso de selecci on
puede hacerse de manera determinista (reteniendo s olo los individuos de mayor tness y permitiendoles tener
descendencia hasta completar la poblaci on inicial) o de manera probabilstica (seleccionando a los miembros de la
siguiente generacion con una probabilidad proporcional a su tness). En el proceso reproductivo se puede utilizar
la reproduccion sexual o asexual, y, si se eligio la segunda alternativa, se pueden retener a los dos descendientes
o a s olo uno de ellos eligiendolo al azar. Tambien la probabilidad de mutacion puede elegirse con cierta libertad
dentro de margenes que a su vez dependen de si se utiliza la reproducci on sexual o asexual.
Es opini on de los expertos en optimizaci on que los algoritmos geneticos pueden no ser los mejores en una
variedad de problemas. Sin embargo, en el contexto que nos interesa aqui, su virtud reside precisamente en lo
que los matem aticos aplicados resaltan como un defecto: su principal merito en la formulacion de modelos multi
agente u otros ligados a la biologa es la de retener las principales caractersticas de la evoluci on biol ogica: Los
seres vivos no se corresponden con optimos absolutos. Por lo general su desempe no depende de una enorme
cantidad de grados de libertad con lo que la b usqueda de un optimo absoluto en tal espacio requiere explorar
una cantidad de alternativas que crece exponencialmente con la dimensi on del espacio de par ametros
4
El proceso
evolutivo en biologa conduce en realidad a conguraciones que, por lo general son sub optimas pero robustas.
Las metaforas evolutivas aplicadas a contextos econ omicos o sociales deben ser elaboradas con cuidado. En
lo que sigue veremos varios de estos ejemplos. En todos ellos el proceso evolutivo es utilizado para representar un
proceso de aprendizaje en que la unidad de selecci on que participa en el proceso evolutivo son estrategias, recuerdos
o informacion. Nunca son estructuras tales como organizaciones o sectores sociales, rmas o sectores econ omicos de
4
Un ejemplo sera: la b usqueda del conexionado optimo de las 10
11
neuronas del cerebro. Esto implica ajustar
unas 10
15
coexiones sin apticas. El n umero de posibles alternativas que habra que explorar sera del orden de
e
(10
15
)
con lo que se puede armar que no ha habido suciente tiempo en toda la historia del universo para
completar esa tarea .
Modelos economicos de m ultiples agentes 10/6/2010
114 CAP

ITULO 6. APRENDIZAJE Y ADAPTACI

ON
una economa compleja. Si esas fueran las unidades de selecci on se caera r apidamente en problemas por cuanto
el proceso de reproducci on o la heredabilidad de las caractersticas mas ventajosas no se pueden parangonar
directamente con nada real. En estos contextos pareciera que el proceso evolutivo debera involucrar elementos
Lamarckianos.
6.3.4 Ejemplo: Optimizacion de un portafolio de inversiones (I)
Considerese el problema de optimizaci on de un portafolio de inversiones. Un modo de plantear un modelo
esquem atico de este problema en termino de algoritmos geneticos puede ser el siguiente: supongamos que existen
N inversiones nancieras posibles, cada una de las cuales ofrece para un dado plazo (que consideraremos igual
para todas las alternativas de inversi on) un rendimiento r
i
con i = 1, 2 N. Un portafolio puede simbolizarse
mediante un vector de N componentes x con componentes x
i
, i = 1, 2 N y cumpliendo la condici on
P
i
x
i
= 1.
Para optimizar un portafolio mediante algortimos geneticos puede suponerse que el genoma que lo
especica es el vector x y la funci on de tness puede denirse por su rendimiento: =
P
i
x
i
(1 +r
i
).
Analcese el problema de un unico inversor. Puede suponerse que este tiene un conjunto de alternativas
de inversi on que se puede representar como una poblaci on de P secuencias

x

; = 1, 2, P. El proceso de
optimizaci on puede representarse como un proceso de prueba y error en el cual se va mejorando darwinianamente
la poblaci on de P individuos ensayando todos sus integrantes y generando sucesivas poblaciones (de P individuos)
reproduciendo y mutando los ejemplares m as aptos.
Para este problema, una mutaci on, que consiste en una alteraci on aleatoria y local en la composicion
del portafolio, se puede efectuar eligiendo al azar con probabilidad P
mut
una componente x

i
de alg un ejemplar y
cambi andola por un nuevo valor x

i
(nuevo) elegido al azar en el intervalo [x

i
, x

i
+] con 1
5
Si el vector de rendimientos r es siempre el mismo y los terminos de este problema son los que han sido
presentados, su soluci on es trivial. El proceso de optimizaci on debera conducir a un portafolio optimo trivial
que corresponde a un vector x
j
o
= 1 y x
i
= 0 i ,= j
o
con r
j
o
= m aximo. M as adelante se ver an extensiones no
triviales.
6.3.5 Implementaci on computacional del GA
El proceso de adaptaci on seg un el esquema de los algoritmos geneticos es una forma de aprendizaje no supervisado.
En un aprendizaje de este tipo no se trata de alcanzar un extremo en que un agente externo al sistema corrige
errores la estrcutra del sistema en base a resultados intermedios tal como se hace en las redes neuronales. El
aprendizaje no supervisado debe ser comprendido como un proceso din amico de adaptaci on en el cual algunas
caractersticas propias de la din amica (que a veces se la suele denominar de autoorganizaci on) da lugar a un
proceso de adpataci on a lo largo del cual la tness siempre tiende a aumentar. El proceso de autoorganizaci on
es tal que se aprovecha en cada momento la estructura del sistema y se le incorpore nuevo conocimiento valioso
aprovechando lo bueno que haya en el y descartando lo malo por un proceso de prueba y error.
Los algoritmos geneticos dan una formalizaci on de este tipo de aprendizaje. La versi on m as sencilla consiste
en una cadena de 1s y 0s que se dene como un gen (0 cromosoma en el c odigo de abajo). Una colecci on de
genes dene un genoma y se supone que cada gen tiene una tness asociada. Claramente la funci on de tness o de
aptitud depende da cada aplicaci on que se desee implementar y es, en general, la parte m as computacionalmente
intensiva del algoritmo.
Un genoma inical, con una estructura al azar, puede denirse f acilmente utilizando sentencias propias del
lenguaje de Matlab:
5
Es claro que si se altera una componente de x se debe luego imponer la condici on de normalizaci on
P
i
x
i
= 1.
Por otra parte debe preverse el caso en que x

i
(nuevo) resulte menor que 0 o mayor que 1. En estos casos se pueden
imponer condiciones de controno reectantes: si x

i
(nuevo) > 1 se debera elegir x

i
= 1. [ x

i
(nuevo) 1. [ y
algo an alogo para el caso en que x

i
(nuevo) < 0
Modelos economicos de m ultiples agentes 10/6/2010
6.3. MODELOS EVOLUTIVOS 115
function genome = ga_binary_new(k,m)
genome.chromos = round(rand(k,m) >= 0.5);
genome.fitness = zeros(k, 1);
El proceso adaptativo de los algoritmos geneticos contempla que el genoma evolucione mediante dos op-
eraciones: cruza y mutaci on. Para la cruza se suelen tomar dos genomas y se los combina para dar lugar a dos
descendientes imitando el mecanismo de reproducci on sexual de celulas vivas. La mutacion toma por lo general
un unico genoma y cambia al azar un 1 por un 0 o viceversa. Estas operaciones generan genomas pr oximos y s olo
cambian la aptitud levemente. De este modo el proceso adaptativo explora nuevos sistemas que se encuentran
en la vecindad del anterior, mientras que la cruza explora nuevos sistemas en el que se combinan estructuras y
caractersticas conocidas del sistema anterior
La siguientes funciones Matlab implementan esos dos operadores.
# Operador de cruza: corte y union
function chromo = chromo_cross(chromo1, chromo2)
len = length(chromo1);
cutx = randint(1,1,[1 len]);
chromo = [chromo1(1:cutx) chromo2(cutx+1 : len)];
# Operador de mutaci\on: cambia un bit
function chromo = chromo_mutate(chromo1)
len = length(chromo1);
x = randint(1,1,[1 len]);
chromo = chromo1;
chromo(x) = 1-chromo1(x);
Estos dos operadores est an gobernados por el proceso din amico que trata de mejroar las aptitudes individ-
uales. Hay varios aspectos en el modo de implementar esta parte del algoritmo. Haremos s olo breves comentarios
en resguardo de la claridad y la simplicidad.
function new_chromos = ga_evolve(genome)
# ordena la nueva lista de cromosomas por aptitud decreciente
[s,indx] = sort(genome.fitness, descend);
chromos1 = genome.chromos;
new_chromos = genome.chromos(indx, : );
len = rows(chromos1);
# selecciona dos cromosomas al azar para cruzar y reemplazar el segundo peor cromosoma
ii = randint(1,2,[1 len]);
if (ii(1) ~= ii(2))
ccross = chromo_cross(chromos1(ii(1),:), chromos1(ii(2),:));
new_chromos(len-1, :) = ccross;
end
# selecciona un cromosoma al azar para mutarlo, excepto el rpimero y reemplaza al pero cromosoma
i1 = randint(1,1,[2 len]);
cmut = chromo_mutate(chromos1(i1,:));
new_chromos(len, :) = cmut;
Modelos economicos de m ultiples agentes 10/6/2010
116 CAP

ITULO 6. APRENDIZAJE Y ADAPTACI

ON
Opbservese que hemos utilizado una probabilidad de mutaci on uniforme igual a 1/n umero de genomas.
En aplicaciones reales desearamos controlar esta probabilidad, as como la probabilidad de cruza. Tambien es
bastante normal adoptar una cruza preferencial entre los genomas de mayor tness. Todas estas caractersticas
pueden ser incluidas en mnuestro algoritmo basico
Aplicacion: el problema de la particion
Un problema de optimizaci on combinatoria bien conocido es el de particionar un conjunto de numeros. La
idea es separar un conjunto de n umeros en dos subconjuntos tales que la suma de ambos sea la misma. Por
ejemplo, tomemos el conjunto x = [4, 16, 3, 7, 8, 1, 4, 2, 11, 13, 9, 6]. Se deberan encontrar los subconjuntos x
1
=
[16, 3, 4, 2, 11, 6],y x
2
= [4, 7, 8, 1, 13, 9], cada uno de los cuales sume 42. Cuando se encuentra una tal partici on se
la llama perfecta.
Este es un problema que se enfrenta a menudo en juegos infantiles cuando se deben integrar equipos rivales:
se seleccionan dos capitanes y estos seleccionan, alternativamente, a los mejores jugadores disponibles para cada
equipo. este es en realuidad un metodo heurstico para resolver el problema de particonar un conjunto. Vease
por ejemplo el artculo en American Scientist The Easiest Hard Problem por Brian Hayes
6
.
Para resolver este problema utilizando algoritmos geneticos se procede como sigue. Se toma un genoma
binario g, tal que cada posici on sea 1 o -1. Se toma luego el producto escalar del vector x con el genoma para
comparar la suma del conjunto positivo con la del negativo. Si el producto escalar es 0, se ha obtenido una
partici on aceptable.
Tambien para que lo que el programa busque sea un m aximo, la funci on de costo se dene como M g.x,
donde M es una constante que se elige mayor que la suma de todos los n umeros del conjunto a particionar y g es
el genoma binario. La siguiente funci on computa el costo para un genoma completo g
function fitness = ga_cost(g, ori)
fitness = g.fitness;
for ii = 1:length(g.fitness),
c = g.chromos(ii,:);
x = 2*c-1;
fitness(ii) = 10000000 - abs(x*ori);
end
Para procesar el algoritmo completo podemos utilizar las siguientes instrucciones:
% Se define primero un lista incial de numeros
x = [4 16 3 7 8 1 4 2 11 13 9 6]
% Se incializa el genoma
g = ga_binary_new(30,length(x));
% Se itera por un dado n\umero fijo de pasos
step = 0
while step < 65 & g.fitness(1) < 10000000
g.fitness = ga_cost(g, x);
g.fitness
g1 = ga_evolve(g) ;
g.chromos = g1.chromos;
6
http://www.americanscientist.org/template/AssetDetail/assetid/14705/page/1
Modelos economicos de m ultiples agentes 10/6/2010
6.3. MODELOS EVOLUTIVOS 117
g.fitness = g1.fitness;
step=step+1;
end
p1 = x(find(g.chromos(1,:) == 0))
sum(p1)
p2 = x(find(g.chromos(1,:) == 1))
sum(p2)
Es intersante observar que que este problema tiene dos comportamientos lmites diferentes. Para un
conjunto jo de n umeros existe una diferencia cualitativa si el conjunto es de n umeros peque nos o si existe un
gran rango de dispersi on entre ellos. En el primer caso, parece razonablemente sencillo encontrar uno o mas
particiones perfectas. Por el contrario, en el segundo caso es casi seguor que no existen tales particiones. Este
razonamiento tan simple plantea la pregunta interesante acerca de lo que sucede en un rango intermadio. ? Es
que existe una transici on de fase?. Es interesante tener este ejemplo in mente pues el modelo de asistencia al bar
(BAM) que se explica m as adelante es una versi on extendida de este porblema simple en el que en lugar de dos
conjuntos iguales, los agentes tratan de hacer decisiones para repartirse en proporciones establecidas.
Aplicacion: decidir inversiones
Los algoritmos geneticos han sido utilizados como metodos heursticos para resolver problemas de optimzaci on
con vnculos. Una tal aplicaci on es el problema de encontrar la mejor combinaci on de proyectos con tasas de
retorno establecidas. Digamos que hay n proyectos, y x
i
= 1 si el proyecto i es aceptabla y x
i
= 0 si no es el caso.
Dado que cada proyecto tiene una tasa de retorno r
i
y un costo c
i
y el total de dinero disponible es el escalar w,
entonces el problema es
maximizar
n
X
i
r
i
x
i
(6.24)
sujeto a
n
X
i
c
i
x
i
w (6.25)
La siguiente funcion provee la implementacion de ese problema.
function [invest ret cost genome] = invest_ga(r, c, w)
genome = ga_binary_new(10, length(r));
genome.fitness = fitness(genome, r, c, w);
iter = 0; same = 0; best = 0;
do
genome.chromos = ga_evolve(genome);
genome.fitness = fitness(genome, r, c, w);
if genome.fitness(1) > best,
same = 0;
best = genome.fitness(1);
else
same++;
end
iter++;
Modelos economicos de m ultiples agentes 10/6/2010
118 CAP

ITULO 6. APRENDIZAJE Y ADAPTACI

ON
until same>50
iter
invest = genome.chromos(1,:);
ret = dot(invest,r);
cost = dot(invest,c);
function score = fitness(genome, r, c, w)
for i=1:length(genome.fitness),
chro = genome.chromos(i,:);
genome.fitness(i,1) = dot(chro,r);
constraint = dot(chro,c) - w;
if constraint > 0,
genome.fitness(i,1) -= constraint*100;
end
end
score = genome.fitness;
Como ejemplo encontramos la combinaci on optima de proyectos dadas las codiciones siguientes:
r = [2 4 3 2 1.5 1.3];
c = [3 8 2 5 3.2 2.3];
w = 10;
invest_ga(r, c, w)
Usualmente se obtiene la soluci on x = (1, 0, 1, 1, 0, 0) con una tasa de retorno de 7 y con el vnculo satisfecho
con una igualdad.
Ejercicio 14 Verique este resultado y encuentre otra combinaci on psoible que da la misma tasa de retorno.
Para hacer una comparacion hemos implementado la soluci on del mismo problema mediante programaci on
lineal:
function invest = invest_lp(r, c, w)
len = length(r);
invest = lp(-r, c, w, zeros(1,len), ones(1,len))
dot(invest,r)
dot(invest,c)-w
Procesando la funci on:
invest_lp(r, c, w)
da como resultado x = (1.00000, 0.33750, 1.00000, 0.00000, 0.00000, 1.00000), con una tasa total de retorno de 7.65.
Observe que en programaci on lineal se suponen valores reales para las decisiones de inversi on, mientras que la
implementaci on con algoritmos geneticos utiliza valores enteros. Por esta raz on la tasa de retorno provista por la
programaci on lineal es solamente una cota superior para la soluci on real.
Modelos economicos de m ultiples agentes 10/6/2010
6.4. MODELOS EVOLUTIVOS DEL APRENDIZAJE 119
6.4 Modelos evolutivos del aprendizaje
El proceso evolutivo da lugar a una adaptaci on de los individuos al medio que los rodea. Para modelos de
organizaci on o comportamiento social o econ omico la adaptacion que deriva del proceso evolutivo puede ser
considerada como un aprendizaje. Tal como lo hemos visto hasta el momento, el actor que sufre este proceso no
es un individuo sino que es toda la poblaci on. Es sin embargo posible modelizar un proceso de aprendizaje en el
sentido usual de la palabra utilizando este algoritmo.
El s olo hecho que los agentes se pueden adaptar, indica que poseen componentes o grados de libertad
internos cuya mutua interacci on puede ajustarse. Esa organizaci on es la que se encuentra codicada en la se-
cuencia genetica |a
1
a
2
a
3
a
N
. En el caso de redes neuronales visto en secciones anteriores, el aprendizaje se
maniesta con un cambio en la sus ecacias sin apticas. Estas son las vinculaciones que se adaptan en el proceso
de aprendizaje. En ese caso el cambio se resume en un algoritmo que establece mejores valores de las ecacias
sin apticas. Esta situaci on puede trasladarse f acilmente al actual contexto suponiendo que el cambio surge de un
proceso evolutivo. Para ello basta asemejar la red con un organismo vivo y suponer que en sucesivas generaciones
su desempe no se va mejorando por cambios progresivos en su estructura. Las redes pueden considerarse como
agentes adaptivos que son el agregado de agentes mas simples (neuronas) y que puedan a su vez combinarse para
dar lugar a agentes m as complejos. El ejemplo biol ogico m as directo es considerar que una celula puede agregarse
para dar lugar a tejidos u organos y estos a su vez pueden agregarse para dar lugar a todo un ser vivo.
Teniendo en cuenta este hecho es de esperar que, en general, existan procesos evolutivos anidados. En cada
uno de ellos el proceso de adaptaci on tiene lugar en escalas propias de tiempo que est a asociada con el ritmo con
el cual se presentan los estmulos y se valora el desempe no del agente.
Un ejemplo de un mecanismo evolutivo anidado dentro de otro es el de la generaci on de las respuesta del sis-
tema inmune. En ese caso el sistema inmunue de un individuo de una dada especie, reconoce agentes pat ogenos
agresivos y se adapta generando progresivamente anticuerpos cada vez mas apropiados para neutralizarlos. Por
otra parte, el individuo, en tanto miembro de una especie participa a su vez de un proceso evolutivo en el que la
especie toda se adapta al medio en que vive. Del mismo modo, un proceso de aprendizaje (tal como usualmente
es considerado) puede imaginarse como una adaptaci on darwiniana de parte (o partes) del sistema nervioso de
un individuo particular de la especie, a estmulos que provienen del medio mientras que, por su parte la especie
evoluciona en escalas de tiempo mucho m as prolongadas. En la Tabla (I) se dan algunos ejemplos de procesos
evolutivos anidados.
TABLA I
Ejemplo Proceso evolutivo Niveles de selecci on
Sistema Inmune Variaci on aleatoria de anticuerpos nivel superior:especie
y posterior seleccion y reproduccion de los nivel inferior: celular
que mejor reconocen el agente pat ogeno
Canto de aves El canto pasa de un gorgeo con gran variedad nivel superior: especie
de slabas a un canto con menor n umero nivel inferior: anatomica y celular
slabas estabilizadas
Desarrollo del Inicialmente se producen conexiones sinapticas nivel superior: especie
sistema nervioso supernumerarias y luego se produce una atricion nivel inferior: celular
central de conexiones y sinapsis in utiles
En la Tabla II se mencionan ejemplos de diversos sistemas y sus correspondientes escalas de tiempo
para evolucionar y adaptarse. En muchos casos los sistemas que se mencionan en esta tabla pueden involucrar
diversos procesos anidados. Un caso es el sistema nervioso central en el que pueden desenvolverse un proceso
evolutivo ligado a su ontogenesis y otro ligado al aprendizaje o entrenamiento para alguna tarea particular. Otro
ejemplo puede ser el proceso de adptacion de una sociedad a cambios macroecon omicos que la afectan y el de
las organizaciones que la componen para adaptarse a los cambios culturales u organizativos. La coexistencia de
escalas diversas de tiempo y espacio es una caracterstica propia de los sistemas complejos tal como se discuti o
en el Captulo 1.
TABLA II
Modelos economicos de m ultiples agentes 10/6/2010
120 CAP

ITULO 6. APRENDIZAJE Y ADAPTACI

ON
Sistema Tiempo de adaptaci on
Sistema Inmune De horas a das
Canto de aves Das
Sstema nervioso central De segundos a a nos
Empresas De meses a a nos
Epecie De das a siglos
Ecosistema De a nos a milenios
Sociedad De decadas a siglos
Ejemplo: Optimizaci on de portafolios de inversi on (II).
El problema planteado en la secci on 6.3.4 se torna interesante si se tiene en cuenta que el medio, que est a
representado por el vector de rendimientos r, puede cambiar mientras el agente inversor descubre cu al es la
mejor inversi on en un dado momento. En ese caso la optimizaci on involucra el ajuste de un portafolio contra una
serie temporal r(t). Cabe pues comparar las escalas de tiempo asociadas al aprendizaje del inversor para mejorar
el rendimiento de su portafolio y la escala asociada a la tasa de cambio de r(t). En esta situaci on, los mejores
ejemplares de la poblaci on de P estrategias de inversi on que corresponden a una generaci on deben ser probados
con los rendimientos del siguiente perodo.
6.4.1 Los individuos y el medio
Una manera simplicada de considerar la evolucion es una en que los individuos se moldean para adaptarse al
medio ambiente pero este no se ve alterado por ellos. Un logro importante de las primeras teoras evolutivas es
la distinci on conceptual entre organismos y medio ambiente, pero, al hacer esto incluso Darwin desestim o el
papel activo que cumplen los seres vivos en cambiar el ambiente que los rodea. Para las primeras teoras el medio
era simplemente el escenario en el cual los seres vivos mostraban sus diferentes capacidades de supervivencia y
reproduccion. En realidad una dada especie no puede dejar de modicar el medio en que vive y, en consecuencia,
altera de hecho su propio proceso evolutivo.
La modicaci on del medio es una cuesti on de capital importancia en modelos sociales o econ omicos. En la
teora econ omica se suele suponer que agentes individuales no pueden alterar los mercados con acciones aisladas.
El equilibrio, si existe, se supone que deriva de acciones colectivas en las que se encuentra implcito alg un proceso
mediante el cual solo son efectivos los promedios. Los modelos basados en agentes m ultiples permiten tanto
considerar situaciones intermedias como analizar c omo la acci on mancomunada de numerosos agentes que act uan
de manera descentralizada pueden dar de todos modos lugar a situaciones con un alto grado de coordinaci on.
La principal cuestion planteada en esta lnea de analisis es c omo sistemas compuestos de m ultiples agentes
que act uan de manera independiente maximizando funciones de utilidad que muchas veces son contrapuestas,
alcanzan estados con un cierto grado de orden macrosc opico en el cual las acciones individuales son aproxi-
madamente consistentes entre si.
La modicaci on de los aspectos formales de los algoritmos geneticos para tomer en cuenta estas situaciones
no es importante ya que s olo se debe limitar a tomar en cuenta el cambio del medio: antes de calcular del desempe no
de cada individuo se debe evaluar el efecto combinado de las acciones de toda la poblaci on sobre el medio y recien
cuando se hubo evaluado ese efecto se determina la tness de cada individuo. En lo que sigue veremos algunos
ejemplos en los que esta interacci on es tenida en cuenta.
6.4.2 El juego de la minora
El juego de la minora ha sido muy discutido en la literatura en dos variantes. Aqui s olo consideraremos aquella
en la que los agentes carecen de todo recuerdo de la pasada historia del sistema. Se trata de un sistema de N
jugadores(N impar). Cada uno de ellos posee una probabilidad p
i
; i = 1, 2 N de optar por una de las dos
alternativas de una opci on binaria (rotulamos las opciones con 1 y 0). Una vez efectuada la opci on se efect ua
Modelos economicos de m ultiples agentes 10/6/2010
6.4. MODELOS EVOLUTIVOS DEL APRENDIZAJE 121
un recuento y solo los jugadores que estuvieron en el bando minoritario ganan y reciben un pago de 1$. Puede
pensarse por ejemplo en el caso de conductores que deben elegir entre dos caminos: los que eligen el menos
transitado se ver an beneciados. Los perdedores deben en cambio efectuar un pago de 1$. Cada jugador posee
una cuenta corriente. Cuando la misma pasa por debajo de 0, el jugador altera su estrategia de juego cambiando
p
i
p

i
elegido al azar en el intervalo [p
i
, p
i
+ ] con 1. Todos los agentes se supone que actualizan sus
respectivos valores de p
i
de manera sincr onica.
Este esquema puede considerarse encuadrado en el modelo de algoritmos geneticos si se supone un genoma
de un unico elemento (p
i
). La funci on de tness es binaria y da o quita un punto dependiendo de los votos
reclutados para cada alternativa. Como se ve la misma depende de lo que han decidio todos los dem as jugadores.
El juego comienza asignado a cada jugador una cuenta de 0 $ y estrategias individuales p
i
elegidas al azar
0 p
i
1. Para estudiar la evoluci on del juego los pasos son los siguientes:
Figura 6.10: Resultados del Juego de la Minora para 101 agentes, 50000
iteraciones, p = .05. En el panel de la izquierda se muestra la evolucion
de la concurrencia. La horizontal marca el valor 50/101=.4950495, que
es la maxima minora posible. Notese como disminuyen el tama no de las
uctuaciones. En el panel de la derecha se muestra la funcion densidad
P(p) obtenida en una simulacion del El resultado que se muestra es un
promedio sobre 100 evoluciones independientes
1. Se recorre el conjuto de N jugadores y se determina por que opcion vota cada uno,
2. Se recuentan los votos
3. Se determinan los ganadores y perdedores
4. Se efect uan los pagos y cobros y se ajustan las cuentas corrientes que correspondan
5. Se corrigen los p
i
de los agentes que quedaron con su cuenta en saldo negativo. Se restituyen sus cuentas
a 0.
6. Se recomienza desde el punto 1.
Si se itera este proceso el sistema alcanza un equilibrio. Para mostrar el resultado de este juego sobre
la poblaci on de N jugadores se repite la iteraci on descripta arriba en un conjunto grande (un centenar) de
sistemas identicos (para poder efectuar estimaciones estadsticamente signicativas). Con esa informaci on se
Modelos economicos de m ultiples agentes 10/6/2010
122 CAP

ITULO 6. APRENDIZAJE Y ADAPTACI

ON
puede determinar la funci on de densidad P(p) que determina la fracci on de la poblaci on que posee estrategias p
i
comprendidas entre p y p +dp. Esta funci on adopta la forma de una U con dos picos simetricos en p 0 y p 1
(ver gura ??).
Resulta del modelo que la unica distribuci on estadsticamente signicativa que torna consistentes entre si
las decisiones de los N agentes es una en la que la mayor parte de la poblaci on se autosegrega en dos fracciones
aproximadamente iguales que toman decisiones opuestas, una siempre opta por (digamos) 1 y la otra que siempre
opta por 0. Puede interpretarse que el proceso de ajuste de las estrategias individuales a traves del algoritmo
iterativo que acabamos de describir representa un proceso de aprendizaje que siguen todos los individuos de la
poblacion para poder alcanzar la consistencia antedicha.
Es intersante comprobar que si bien la distribuci on de probabilidades en la poblaci on se mantiene inalterada
cada jugador, individualmente considerado, presenta grandes cambios en su conducta a lo largo del tiempo pasando
de decidirse en un sentido con probabilidad pr oxima a 1 a decidirse en el sentido opuesto alg un tiempo mas tarde.
Implementacion computacional
El problema de la monora guarda grandes semejanzas con el modelo de concurrencia al bar o Bar Attendance
Model (BAM). En esta versi on hay N0 agentes caracterizados por uan probabilidad p de ir al bar. En cada
iteraci on el barman cuenta cu antos entraron al bar y cuantos quedaron en sus casas. El grupo de la minora
acumula un punto, mientras que la mayora pierde un punto. Para que el grupo de la minora simpre exista N0
debe ser un n umero impar.
Es claro que en este problema existe una solucion estacionaria, puesto que siempre hay un grupo de agentes
que aumentan su puntaje mietras que otro conjunto lo disminuye. Despues de cada ronda las probabilidades se
adaptan al azar como si sufrieran una mutaci on: se cambia p por una variable aleatoria uniformemente distribuida
en el intervalo [0.05, 0.05]. Si p alcanza el valor 0 o 1 se aplican condiciones de copntrono reectantes.
El c odigo Matlab que implementa este modelo es el siguiente:
function nn = bam(N0)
global U N;
close all;
step = 300; % numero de computos sin mostrar resultados
N = N0;
rand(seed,1234);
% titulo de la ventana principal
titulo = [Bar Attendance Game: N=, num2str(N)];
p = rand(1,N); % asigna probabilidades al azar
s = zeros(1,N); % asigna puntajes a cero
h1 = hist(p); % prepara histograma acumulativo
s1 = hist(s); % prepara el histograma de puntajes
ave = [];
multiplot(1,3);
i=1;
while i<=90000,
i
flip = rand(1,N); % arrooja los dados para cada agente
test = flip < p;
Modelos economicos de m ultiples agentes 10/6/2010
6.4. MODELOS EVOLUTIVOS DEL APRENDIZAJE 123
if sum(test) < N/2 -1
win = test; % grupo de la monor\{\i}a
else
win = 1-test;
end
s = s + win; % la minor\{\i}a auumenta 1 punto
s = s - (1 - win); % la mayoria pierde 1 punto
ave = [ave sum(test)/N]; % agraga la ocupaci\on promedio
% aquellos agentes con puntaje negativo actualizan sus probabilidades
x = find(s <= 0);
p([x]) = p([x]) + 0.05* (rand(1,length(x))-0.5);
% se corrige si p excede la frontera superior
%p([find(p>1)]) = 1; p([find(p<0)]) = 0;
x = find(p>1); p([x]) = 2-p([x]);
x = find(p<=0); p([x]) = -p([x]);
if (mod(i,step)==0)
[his,xhis] = hist(p); h1 = h1 + his;
subplot(3,1,1), clearplot; plot(xhis,h1)
[his,xhis] = hist(s); s1 = s1 + his;
subplot(3,1,2), clearplot; plot(xhis,s1)
subplot(3,1,3), clearplot; plot(ave)
text(100,0.8,num2str([mean(ave) std(ave)]));
drawnow
end
i=i+1;
%pause;
end
Se generan tres gr acos. El de m as arriba muestra la distribuci on de las p dentro de la poblaci on. El del medio
corresponde a una distribuci on acumulada de los puntajes s que corresponderan a promediar sobre todas las
iteraciones. El gr aco nal es una serie temporal de la ocupaci on promedio del Bar que, despues de algunos
transientes converge al 50%.
6.4.3 Ejemplo (II): El modelo del Bar de Brian Arthur
El modelo de Concurrencia la Bar es un modelo can onico en el estudio de procesos de autoorganizaci on. De el
se deriv o, como caso paticular, el juego de la minora que acabamos de describir. Este es un ejemplo en el que,
a semejanza de el, la decisi on de cada agente afecta a todos los dem as y la organizaci on sobreviene cuando las
decisiones de todos los agentes son consistentes entre si.
Se trata de un sistema de N parroquianos que concurren regularmente a un Bar. La capacidad del Bar es
ja. Todos comparten el parecer que si concurre una fracci on de parroquianos que excede un umbral N
u
dado
(N
u
< N) el local se torna inc omodo. Si ese no es el caso, los parroquianos obtienen de su concurrencia una
utilidad positiva. Por otra parte si permanecen en su casa aquellos das en los que la concurrencia N
c
es tal que
N
c
< N
u
, obtienen de esa acci on una utilidad negativa. Se supone que todos los parroquianos conocen la historia
previa de concurrencias al Bar y, en base a la misma, cada uno, de manera independiente debe decidir si va a
concurrir o no.
Seg un el modelo los parroquianos toman decisiones individuales basadas en valores agregados (globales)
para todo el sistema que est an disponibles para todos los agentes por igual. Se supone que los agentes efect uan
Modelos economicos de m ultiples agentes 10/6/2010
124 CAP

ITULO 6. APRENDIZAJE Y ADAPTACI

ON
alg un razonamiento inductivo, propio de cada uno para decidir su concurrencia para el da siguiente.
Figura 6.11: Simulacion del modelo de concurrencia al Bar considerando
256 agentes, una P
mut
= 0.005, umbrales N
max
u
= 0.8 y N
min
u
= 0.2.
Los planes son para s = 10 das y la poblacion de estrategias de cada
agente es P = 20. El panel superior muestra la convergencia a una
concurrencia optima. En el inferior el sistema relaja a una conguracion
suboptima. Cada da el 10% de los agentes actualiza su estrategia vigente
evocando un algoritmo genetico.
Para encuadrar este problema en el esquema de los algoritmos geneticos
7
se puede proceder de la manera
siguiente. A cada uno de los N agentes se le puede asignar una poblaci on P de estrategias de concurrencia para
los subsiguientes s das de la semana. Cada una de esas estrategias puede codicarse en un genoma de s n umeros
c
i
con c
i
|1, 0; i = 1, 2, s con la convenci on que c
i
= 1 signica que se ha decidido concurrir al bar en el
iesimo da y que c
i
= 0 signica lo contrario. Cada agente puede entonces tener una estrategia que es la que
efectivamente aplica para concurrir al bar (la estrategia vigente) y un conjunto de otras P 1 estrategias
alternativas.
Puestos a jugar, cada uno de los N agentes aplica la estrategia vigente durante los s das de la semana. Al
cabo de la semana puede evaluar sl desempe no de dicha estrategia, sumando la utilidad obtenida en cada uno de los
s das de la semana. Sin embargo cada agente puede adem as evaluar el desempe no que habra obtenido aplicando
las restantes estrategias que posee. Este c alculo es aproximado pues debe suponer que todos los restantes agentes
no cambian sus respectivas estrategias vigentes. Esta estimaci on alcanza para asignar a cada estrategia una tness
que mide en denitiva el grado de consistencia de sus posibles decisiones individuales con las del restante conjunto
de N 1 agentes.
Existen pues todos los elementos para implementar N procesos evolutivos independientes en el seno de
cada una de las poblaciones de estrategias asignadas a cada agente. Este proceso puede asimilarse a uno de
aprendizaje por el que cada agente descarta aquellas estrategias que son menos compatibles con las de los N 1
agentes restantes y rearma aquellas que son m as consistentes
8
.
7
Este modelo ha sido resuelto en la literatura sin utilizar algoritmos geneticos. El metodo que utilizamos aqui
es una versi on iterada de un juego similar al de la minora que anticipa la concurrencia para varios das en el
futuro
8
Para evitar efectos de manada indeseados se puede establecer que distintas partes de los N agentes actualizan
sus estrategias en distintos momentos.
Modelos economicos de m ultiples agentes 10/6/2010
6.4. MODELOS EVOLUTIVOS DEL APRENDIZAJE 125
En la gura ?? se muestra el resultado de la convergencia en el caso en que se impone no solamente una
concurrencia m axima N
(>)
u
sino tambien una mnima N
(<)
u
. Este umbral inferior da lugar a soluciones en los que
un da cualquiera es descartado por los parroquianos como apropiado. Durante el proceso de convergencia y por
una circunstancia casual algunos parroquianos encuentran que en un dado da hay demasiado poco p ublico. Al
descartar ese da como apropiado, dan lugar a que en jornadas sucesivas otros parroquianos adopten la misma
tesitura. Cuando esto sucede el sistema queda connado en una situaci on sub optima de la que s olo puede salir por
el evento altamente improbable que consiste en que una cantidad apreciable de agentes sufran, simult aneamente,
una mutaci on en sus respectivas estrategias de concurrencia para el mismo da. Este tipo de connamiento es por
otra parte un hecho que podemos comprobar cotidianamente en una gran variedad de conductas sociales.
La soluci on a la que se llega representa una delicada coordinaci on entre las estrategias de concurrencia
de diversos agentes. Es importante notar que esta soluci on es estable porque entra na una gran diversidad de
estrategias. Es f acil darse cuenta que no todos los parroquianos pueden elegir la misma soluci on de concurrir al
bar en un mismo da porque si ese fuera el caso excederan la capacidad del local. En la Tabla (III) se muestra
que tipo de coordinaci on es la que se establece para el caso en que s olo hay 10 parroquianos, la concurrencia se
planea para los subsiguientes 8 das y no se tolera una concurrencia superior a 4 parroquianos. Con una cruz se
indica que el agente concurre al bar y con un blanco que no concurre.
TABLA III
Agente (da ) 1 2 3 4 5 6 7 8
1 X X X X X X X
2 X X X X X X
3 X X X X
4 X X X X
5 X X X
6 X X X
7 X X
8 X X
9 X
10
Es posible comprobar que el estado que se alcanza es un equilibrio de Nash ya que ninguno de los jugadores
puede mejorar su posici on alterando unilateralmente su estrategia. Por otra parte existe una gran cantidad de
equilibrios equivalentes. Cualquier transformaci on de la matriz de la tabla III en la que una X es intercambiada
con un lugar vaco de la misma columna lleva de un equilibrio de Nash a otro igualmente aceptable. El sistema,
una vez que alcanza su estado asint otico visita siempre las vecindades del equilibrio de Nash que logr o debido
a que ocasionalmente la tasa de mutaci on cambia un 0 por un 1 en el genoma de alg un jugador.
Implementacion computacional
Suponemos que hay N agentes que desean concurrir al Bar solamente si su ocupaci on es menor que un valor
umbral umbral. N otese que el n umero de agentes es impar de modo que siempre hay una fracci on de agentes que
gana y otra que pierde
Cada agente posee un mecanismo de aprendizaje que utiliza algoritmos geneticos: posee una colecci on P
de planes semanales que se expresan como un vector binario m y cada posici on es el compromiso de cada da
de permencer en casa (0) o ir al Bar (1). En cada iteraci on el barman cuenta cu antos visitaron el Bar y hace
p ublico ese resultado. Cada agente est a pues en condiciones de actualizar su puntaje para todos sus P planes,
sumando un punto siempre que el plan haya contemplado copncuirrir al Bar y ese da este se encontraba debajo
del umbral. Tambien suma un punto si la opci oin es quedarse en casa y el bar est a demasiado lleno de gente. Se
resta un punto en toda otra situaci on desfavorable. De este modo cada plan tiene un puntaje que se actualiza en
cada iteracion. El programa que implementa este algoritmo es el siguiente
function [st, plan, a]= bam(occupation, npop, m, niter, pevol, seed)
Modelos economicos de m ultiples agentes 10/6/2010
126 CAP

ITULO 6. APRENDIZAJE Y ADAPTACI

ON
k = 6;
% numero de genomas de cada agente
if (nargin < 3) occupation = 0.80;
seed = 1234
npop = 10
m = 4
niter = 15
endrand(seed,seed);
for i1=1:npop,
a(i1) = agent_new(i1, k, m);
endst.occ_list = [];
% ocupacion media
listst.sc_list = [];
% puntaje medio
listfor iter = 0:niter*m,
%iter;
day = mod(iter, m) + 1;
% encuentra todas las estartegias en todfos los genomas para un ado d\{\i}a
go = zeros(k,npop);
for k1 = 1:k,
for i1 = 1:npop,
go(k1,i1) = a(i1).genome.chromos(k1, day);
end
end
% los agentes van al bar eligiendo genoma 1, de modo que define quien gana
goes = go(1,:);
mgo = mean(goes);
if (mean(goes) > occupation)
wins = 1-go;
else
wins = go;
end
for i1=1:npop,
a(i1).genome.fitness = a(i1).genome.fitness + wins(:,i1);
end
%st.occ_list = [st.occ_list mgo];
if day == m,
% actiualiza la estadistica con los genomas vigentes
plan=zeros(npop, m);
for i1=1:npop,
plan(i1,:) = a(i1).genome.chromos(1,:);
end
%plan
mplan = mean(plan);
st.occ_list = [st.occ_list mean(mplan)];
sc = zeros(1,npop);
for i1=1:npop,
sc(i1) = a(i1).genome.fitness(1);
end
st.sc_list = [st.sc_list mean(sc)];
%pause
%evoluciona el genoma
for i1 = 1:npop,
if rand(1,1) < pevol,
% devuwelve los genomans ordenados de acuerdo con su fitness
Modelos economicos de m ultiples agentes 10/6/2010
6.4. MODELOS EVOLUTIVOS DEL APRENDIZAJE 127
a(i1).genome = ga_evolve(a(i1).genome);
% redefine las fitness
a(i1).genome.fitness = zeros(k,1);
end
end
end
endst.sc_list
% Define un nuevo agente
.function agent = agent_new(i, k, m)
agent.name = i;
agent.genome = ga_binary_new(k,m);
%agent.prefe = 0.80; %rand(1,1);
agent.score = 0;
Observe que la actualizaci on de estrategias no se hace simultaneamente para todos los agentes. Para
quebrar esa sincrona articial la funci on acepta un parametro pevol que corresponde a la probabilidad de actu-
alizaci on de cada agente al nal de cada semana. De esta manera, dependiendo de este par ametro, no todos los
agentes actualizan sus estrategias al mismo tiempo.
En la Figura 6.12 primero se estudia el papel de m en el sistema. Para planes m as largos, las uctuaciones
parecen ser menores.
En la Figura 6.13 se muestra como vara la evolucion cuando cambia el par ametro pevol. Para val-
ores pr oximos a 1, las uctuaciones son bastante visibles y resultan coherentes lo que corresponde a un efecto
de muchedumbres que se forman cuando la mayora de los agentes cambian simult aneamente sus estrategias
afectando de esta manera la coordinaci on de todo el sistema. Por otra parte para valores muy peque nos de pevol
se observan uctuaciones muy peque nas junto con una convergencia lenta a la maxima ocupaci on posible del Bar.
6.4.4 Ejemplo (III): Un modelo de panico
El modelo de Bar visto en el ejemplo anterior no es un modelo extendido en el sentido que no posee ninguna
dimensi on espacial o de proximidad que sea natural para el conjunto de agentes. Una modicaci on de este modelo
para tener en cuenta una variable de este tipo puede servir para introducir, por ejemplo, efectos de contagio.
Desde el punto de vista del tipo de la informaci on que manejan los agentes estos efectos pueden interpretarse
como informaci on que proviene de un n ucleo de agentes pr oximos a otro. Se la puede llamar local por oposicio on
al tipo de informaci on global del modelo tradicional en que cada agente s olo conoce el efecto agregado de lo que
decidi o todo el conjunto.
En las guras que siguen se muestra el efecto de introducir contagio en el modelo del Bar. Para ello se
supone que cada agente est a ubicado en una grilla regular con bordes identicados y en cada momento el agente
puede saber cu al ha sido la decisi on de sus cuatro vecinos ubicados al N, S, E y O de su posici on y cu ales han
sido sus respectivas utilidades
Se permite que cada agente pueda abandonar su estrategia siempre que encuentre que su desempe no no
es satisfactorio. Debe notarse que debido a este hecho se debe distinguir entre la acci on vigente
c
a
t
(i,j)
del agente
ubicado en el sitio (i, j), en el t-esimo da, y su plan vigente para el mismo da
c
#
t
(i,j)
. Para decidir un abandono
de su plan el agente determina el resultado obtenido con su estrategia y lo compara con el que habra obtenido si
hubiera imitado a sus vecinos m as inmediatos. Con este prop osito cada agente calcula la acci on media local (o
campo medio local):
h
(i,j)
=
1
4

c
a
t
(i,j+1)
+
c
a
t
(i,j1)
+
c
a
t
(i+1,j)
+
c
a
t
(i1,j)

(6.26)
Una vez que esta es conocida el agente puede determinar si va a seguir a sus vecinos o no. Es claro que la disposicion
de agentes en una grilla no es un ingrediente esencial del nmodelo salvo por el hecho que dene una vencidad. La
misma puede bien denirse por medio de un grafo general o con la misma grilla pero con vecindades diferentes.
Modelos economicos de m ultiples agentes 10/6/2010
128 CAP

ITULO 6. APRENDIZAJE Y ADAPTACI

ON
Los resultados por supuesto que cambian pero retienen sin embargo las mismas caractersticas esenciales ques e
discuten m as abajo. Puede adem as suponerse que existe alg un ruido o incertidumbre en la decisi on tomada
por el agente.

Esta puede representarse por una agitaci on termica caracterizada por un par ametro de control que
juega el papel de una temperatura T = 1/. Se la introduce por medio de una din amica denominada din amica de
Glauber que establece la probabilidad de imitar o ignorar la decis on de su entorno inmediato. Esa probabilidad
P ` a la Glauber se dene
P(acci on = 1) =
1
1 +e
2h
(i,j)
(6.27)
Por consiguiente cada agente computa cada da que es lo que habra obtenido siguiendo la acci on media de su
entorno. Si esta resulta mayor que la que obtuvo con su estrategia vigente el agente abandona su plan para da
siguiente con una probabilidad P y hace lo que hizo su entorno. Puede interpretarse que el agente se contagia
con esa probabilidad P. Si la utilidad no es mayor el agente mantiene su estrategia vigente.
Los resultados que se obtienen se muestran en la gura 6.14 donde se comparan los resultados con y sin
contagio en una situaci on en la que se agrega un shock externo entre t = 300 y t = 500. El shock consiste en
declarar que cualquier concurrencia es inaceptable (o sea, da lugar a una utilidad negativa) lo que es equivalente
a decir que el Bar cierra sus puertas sin preaviso en t = 300 y las vuelve a abrir, tambien sin preaviso, en t = 500.
El panel A de la gura muestra resultados del ordenamiento del conjunto de agentes que ya se discuti o en
la secci on anterior. En el panel B se muestra el mismo proceso agregando el intercambio de informaci on local.
En el panel C se muestra cu al es el porcentaje de agentes que decidieron su acci on contagi andose de sus vecinos,
en cada momento.
Tanto en el panel A como en el B se ha marcado con 1 y 4 la etapa de organizaci on en la que los agentes
coordinan sus conductas individuales de modo de maximizar su utilidad. El proceso de organizaci on es robusto
(sobrevive) frente a la inclusion del ruido proveniente del contagio. La coordinaci on que sobreviene despues de
este momento y hasta t = 300 no es sustancialmente diversa con o sin contagio. En promedio, durante todo ese
perodo la tasa promedio de contagio nunca supera un 20% (se lo individualiza en la gura como el intervalo (8)).
Las diferencias aparecen a partir de t = 300. El intervalo (2) muestra que el conjunto de agentes busca maximizar
sus utilidades cambiando gradualmente sus estrategias porque descubren que se obtiene una mayor utilidad si no
se concurre al bar. El aprendizaje es gradual. El intervalo (3) es enteramente semejante al (2) pero con cambios
en la direcci on contraria.
La diferencia producida por la informaci on local (contagio) surge de comparar el intervalo (2) con el (5) y
(6) del panel B. En el intervalo (5) el nivel de contagio es muy bajo y el aprendizaje es gradual tal como sucede en
el panel A. Durante el intervalo (5) no se produce contagio porque la mayora de agentes est a usando estrategias
equivocadas y no ofrecen una alternativa atractiva para que sus vecinos abandones sus planes vigentes. Este
perodo puede bien asociarse con un estado de alerta. Cuando la proporci on de agentes que aprendieron que
no concurrir es mejor negocio se produce el contagio se hace posible y da lugar a una avalancha (6) acompa nada
de otra de imitaci on (intervalo (9)) que da lugar a un brusco abandono de planes y una caida brusca en la
concurrencia. A partir de ese momento hay una creciente proporci on de agentes que ajustan sus planes vigentes
de acuerdo con la nueva situaci on y la tasa de contagio comienza a bajar gradualmente (intervalo (10)). La
concurrencia no cae hasta 0 entre t = 300 y t = 500 porque siempre existi o una proporci on de agentes que nunca
pudieron concurrir al bar y por consiguiente tienen estrategias exitosas para una situaci on como la que es vigente
durante la crisis.
El n de la crisis en t = 500 da lugar a un brusco aumento de la concurrencia. Esto es debido a que los
agentes encuentran en su bagaje de estrategias alternativas, aquellas que eran las vigentes antes de t = 300 y no
fueron completamente eliminadas. Ellas vuelven a proporcionar una excelente utilidad. El conjunto de agentes
vuelve a poner dichas estrategias en pr actica como si nada hubiera pasado entre t = 300 y t = 500. El modelo no
contiene nada que pueda asemejarse a un aprendizaje social que tenga prevenciones por la ocurrencia eventual de
una nueva crisis. Observese que justo en la transici on cae mucho el contagio debido a ese bagaje de estrategias
sobrevivi o merced a que los agentes no tuvieron tiempo de depurarlas de su memoria por la brevedad de la crisis.
Estos resultados permiten elaborar una met afora acerca de una situaci on de alerta y p anico real como
la que se di o en el sistema bancario argentino en oportunidad de la devaluaci on del peso mejicano. Para ello la
concurrencia al bar se la hace semejante a la utilizacion del sistema bancario y los par ametros del modelo (n umero
de agentes, tasa de contagio, tasas m aximas y mnimas de concurrencia, duraci on de la crisis) pueden ajustarse
normalizando para ello los montos totales m aximos y mnimas de dep ositos en el sistema bancario nacional y el
Modelos economicos de m ultiples agentes 10/6/2010
6.4. MODELOS EVOLUTIVOS DEL APRENDIZAJE 129
tiempo que medi o entre la devaluaci on y el anuncio de la garanta de los dep ositos. Los resultados del modelo y
los reales se comparan en la gura 6.15.
El sistema de multiples agentes pasa sucesivamente por estados de orden o coordinaci on (1), alerta (3),
p anico (2), un nuevo orden (1) con un mnimo monto de dinero depositado, un reordenamiento (4), y un nuevo
estado coordinado nal (1). Es claro que el modelo no pretende dar cuenta del funcionamiento de un sistema
nanciero pues prescidne de una enorme cantidad de caractersticas propias de un sistema de ese tipo. Es sin
embargo aleccionador que una met afora tan distante de esa realidad pueda dar de todos modos cuenta cualitati-
vamente de muchas de sus caractaersticas sin tener en cuenta esos elementos.
La diferencia entre el panel de la derecha y el de la izcquierda es la diversa duraci on del estado (4). En
el panel de la izquierda se aplic o el modelo tal como est a descripto arriba, o sea, sin una memoria social de
la crisis. En este caso el modelo sugiere que los agentes vuelven a concurrir al sistema bancario como si nada
hubiera pasado, hecho que claramente no se corresponde con la realidad. En el panel de la izquierda se modic o
la conducta de los agentes agregando cautela. En este caso esta se reduce a asignar una probabilidad menor que
1 a poner en pr actica una estrategia que contempla concurrir nuevamente al bar que en este caso se corresponde
con sumarse nuevamente al sistema bancario. Se logra as reproducir el incremento gradual de dep ositos posterior
al nal de la crisis.
6.4.5 Ejemplo (IV): La telara na con m ultiples agentes
Anteriormente se dio el ejemplo de una red neuronal multicapa construida para anticipar el proceso de tanteo de
precios que se da cuando se intenta compensar excesos o defectos de demanda. En ese ejemplo, la red se dise na
para anticipar el precio que debe esperar un unico agente que participa en una futura ronda de mercado. Para
desarrollar esa red es necesario conocer cu al ha sido el resultado de experincias previas de estimacion de un precio
futuro y su posterior realizaci on en distintas rondas de mercado.
Para desarrollar esa red se presupone que se trata de un unico agente y nada se dice acerca de su contexto.
En ese modelo nada se dice acerca de la coordinaci on que es necesario que se termine estableciendo entre los
distintos agentes participantes del mercado cuando este alcanza el equilibrio.
En el presente ejemplo se muestra un modelo de coordinaci on entre m ultiples agentes que participan
descentralizadamente en el mercado cuando todos ajustan su producci on para compensar excesos o defectos de
demanda. Como se obsevar a enseguida, este ejemplo de telara na puede reducirse al problema de la concurrencia
al Bar que se menciona en la secci on dedicada al Ejemplo (II). Supondremos un escenario que consta de los
siguientes elementos:
1. Un conjunto de N pescadores (productores) que, cada da, salen a pescar.
2. Cada pescador posee un plan de pesca que cubre el presente y los subsiguientes d das.
3. Cada da la totalidad de pescadores aporta su pesca a un mercado en que todo el volumen es rematado
obteniendo un precio P (no hay acumulaci on de stocks).
4. La utilidad de cada pescador es el dinero que recibe por la venta de su producci on menos su propio costo
de producci on.
5. Los pescadores ajustan sus planes de pesca con el objeto de optimizar su utilidad (ajustan su producci on
por tanteo)
Los pescadores act uan de manera descentralizada y se supone que desconocen la curva de demanda. Se
supone que esta es tal que el precio P tiende a cero con una pesca creciente. Para el ejemplo numerico se ha
supuesto que:
P =
P
o
Q

T
(6.28)
donde Q
T
es la cantidad total de pesca y = 1/2 asegura que P 0 cuando Q
T
. Se supone adem as
que cada pescador recibe una utilidad U
i
luego de afrontar una funcion de costo que es creciente con la pesca
realizada. Ponemos:
U
i
= PQ
i
C
i
(6.29)
Modelos economicos de m ultiples agentes 10/6/2010
130 CAP

ITULO 6. APRENDIZAJE Y ADAPTACI

ON
donde Q
i
es la pesca del iesimo pescador (Q
T
=
P
Q
i
) y C
i
su costo que se toma como C
i
= a
i
Q

i
con a
i
una
constante propia de cada pescador y > 0 para asegurar que diverja con Q
i
.
Para posibilitar el proceso de optimizaci on se puede encarar este modelo siguiendo un esquema enteramente
similar al que se describe para resolver el BAM. Para ello se supone que cada pescador posee un plan de pesca
vigente que es el que pone en pr actica y posee adem as una poblacion de otros planes alternativos. El cumplimiento
de los planes vigentes de todos los pescadores es lo que determina el volumen de pescado que se remata cada da.
Esa es la unica informaci on que recibe cada uno de los agentes acerca de la conducta seguida por los restantes
participantes del mercado.
Los planes de pesca pueden representarse como cadenas de n umeros (en el ejemplo numerico se utilizaron
enteros) tan largas como el n umero de das de duracion del plan. La poblaci on de planes puede pues adaptarse
periodicamente evocando un algortimo genetico en el que cada genoma est a representado por los planes de pesca.
La tness del plan de pesca vigente es la utilidad realmente obtenida y la de los planes alternativos es la que
el pescador habra obtenido de haberlo puesto en pr actica.
En cada jornada de mercado, cada pescador es seleccionado aleatoriamente y con una probabilidad p para
que evoque un algoritmo genetico y actualice sus planes. Es preferible la selecci on aleatoria de agentes para
evitar un efecto irreal de muchedumbre como se coment o m as arriba con referencia al BAM. En la gura 6.16
se muestra el equilibrio entre la oferta total y demanda total de pesca, comenzando con agentes con planes de
pesca aleatorios. En este ejemplo la optimizaci on de la utilidad conlleva la coordinaci on de planes de pesca
entre distintos pescadores.

Esta es m as evidente en el caso sencillo en el que se supone una simetra total entre
todos los pescadores asignando a todos la misma funci on de costo, esto es a
i
= a, i. Esto hace que la pesca
total sea repartida por igual entre todos los pescadores. Este reparto surge del ejemplo numerico tal como se
puede observar en la gura 6.17. Un argumento para justicar este resultado s olo basado en la simetra entre
agentes puede conducir a equivocaciones. En el BAM existen las mismas condiciones de simetra ya que todos
los concurrentes al Bar son identicos y poseen iguales funciones de utilidad. A pesar de ello convergen a planes
de concurrencia que son diferentes entre si. En el ejemplo presente aun cuando la simetra y las condiciones
iniciales son semejantes la convergencia a planes identicos se produce adem as por la dependencia que posee el
precio con la conducta agregada de los agentes (el volumen total de pesca) y la relaci on que tiene la utilidad que
recibe cada uno con ese precio. El modelo computacional no tiene requerimientos de ninguna narturaleza sobre
la homogeneidad o heterogeniedad de los agentes. En el panel de la derecha de la gura 6.17 se muestran los
resultados para el caso en que las constantes a
i
son diferentes entre si. Tal como es de esperar a mayores costos
menor participaci on en el mercado.
En la gura 6.18 se muestran algunos resultados adicionales. En el panel de la izquierda se muestra el
efecto de incrementar la cantidad de agentes preservando la simetra entre todos. Las tres curvas corresponden a
la pesca total obtenida por 1,4 y 8 pescadores. Es interesante el resultado parad ojico que el equilibrio se alcanza
antes justamente cuando el problema de coordinaci on involucra a una mayor cantidad de agentes. En el panel de
la derecha se muestra el proceso de tanteo para el caso en que todos los pescadores poseen la misma funci on de
costo C = aQ

i
pero = 3.0, 2.75, 2.5 y 2.0 respectivamente. Debe observarse que en el caso en que = 2.0 el
proceso de tanteo no converge. El ejemplo numerico reproduce ese hecho y, adem as la convergencia es tanto m as
lenta cuanto m as pr oximo es el exponente a ese valor.
6.4.6 Ejemplo (V): Coadaptacion de oferta y demanda
Este ejemplo puede ser considerado como una versi on estilizada de una telara na de ajuste de precios entre entre
oferta y demanda. Consideraremos un caso de coadaptaci on entre los procesos de aprendizaje de proveedores y
consumidores.
Consideremos un conjunto N de consumidores que deben cotidianamente aprovisionarse de un bien. Puede
adquirirlo en una proveedura o en una f abrica que lo vende siempre a un precio p. La proveedura puede proveer
un bien a un precio p o P (con p < p < P). La idea es permitir que la proveedura tenga la libertad de cambiar
los precios y que los compradores tengan la libertad de elegir el lugar donde aprovisionarse.
Para decidir la compra cada consumidor posee una poblacion de predictores. Los mismos se representan
mediante una funci on booleana F : L
in
L
out
, Los espacios L
in
y L
out
son espacios de n-tuplas de longitud D
in
D
out
de variables l ogicas. En la pr actica representaremos los valores de las funciones l ogicas por 1 (verdad) y 0
Modelos economicos de m ultiples agentes 10/6/2010
6.4. MODELOS EVOLUTIVOS DEL APRENDIZAJE 131
(falsedad) y especicaremos a una funci on booleana por su tabla de verdad que es una lista ordenada de todas
las entradas y sus correspondientes salidas. (ver Tabla IV) Como es f acil darse cuenta el n umero de posibles
funciones l ogicas crece exponencialmente. Para funciones de una unica salida y D
in
entradas el n umero de
funciones booleanas es de 2
2
D
in
Los predictores de cada agente son funciones booleanas con las que el consumidor pronostica el precio que
pondra la proveedura. Se supone que los mismos son funciones booleanas de tres entradas como la de la tabla IV.
La interpretacion de un predictor es la siguiente: las tres entradas corresponden a los precios registrados durante
los tres das anteriores (con al convenci on que a un precio p corresponde un 0 y a un precio P corresponde un 1).
La salida (0 o 1) es el precio que el predictor propone para el da siguiente. Como puede verse, si se acepta que
el ordenamiento de las tres entradas es siempre el mismo, la funci on booleana queda integramente caracterizada
por la n-tupla de los 8 bits de salida, con lo que esta puede ser considerada el genoma asociado a cada predictor
de la poblaci on de cada agente que puede ser alterado en un proceso de evoluci on Darwiniana. La proveedura
tambien debe tener una poblaci on de predictores con los que dene el precio del da siguiente. En este caso se
supone que para esta funci on la proveedura analiza los 4 das anteriores con lo que el genoma de este predictor
posee 16 componentes.
TABLA IV
entrada 1 entrada 2 entrada 3 salida
0 0 0 1
0 0 1 0
0 1 0 0
0 1 1 1
1 0 0 1
1 0 1 0
1 1 0 0
1 1 1 1
Ejemplo de tabla de verdad de una funci on booleana de tres entradas y una salida (D
in
= 3, D
out
= 1)
Resta denir cu al es la funci on de tness asociada a cada individuo de la poblaci on. La tness se dene en
todos los casos como la utilidad de la estrategia utilizada. Sin embargo la misma s olo puede denirse de manera
aproximada si se lo hace aisladamente para cada una de las partes (especies) involucradas. Para ello se procede
de la manera siguiente:
1. La tness de cada predictor de un agente aumenta (disminuye) su tness si su predicci on fue correcta
(incorrecta)
2. Los predictores de cada agente se comparan con la estrategia de precios vigente de la proveedura y luego
se los ordena seg un su tness. La acci on de cada agente es de acuerdo con el predictor de m axima tness.
Despues de T
c
pasos de tiempo la poblaci on de predictores se reformula por cruza y mutaci on. Los agentes
actualizan sus predictores de manera asincr onica: s olo una fracci on de la poblaci on invoca el algortimo
genetico al mismo tiempo de modo que la siguiente actualizaci on tendr a lugar T
c
pasos de tiempo m as
tarde.
3. La proveedura posee una poblaci on de predictores de 4 entradas (son n-tuplas de 16 bits) que se actualiza
por cruza y mutaci on al cabo de T
s
pasos de tiempo invocando un algoritmo genetico.
4. Todas las estrategias de jaci on de precios son probadas contra las estrategias de compra vigentes de una
muestra aleatoria y parcial de la poblacion de agentes compradores. Esta prueba se realiza durante T
v
pasos de tiempo virtuales.
5. Una vez nalizad la rueda de T
v
transacciones virtuales las estrategias de jaci on de precios pueden ser
ordenadas de acuerdo a la utilidad que le produjeron a la proveedura (en este caso, el total de ventas
producidas durante la rueda de T
v
transacciones virtuales). La tienda proveedora adopta como la estrategia
vigente la de m axima tness.
Modelos economicos de m ultiples agentes 10/6/2010
132 CAP

ITULO 6. APRENDIZAJE Y ADAPTACI

ON
En las guras 6.19 y 6.20 se muestran algunos resultados de una simulaci on del modelo que se acaba de
describir. En la gura 6.19 se ilustra el proceso de tanteo entre los compradores y el vendedor al cabo del cual se
ja el precio de equilibrio. En el panel superior se muestra el precio que ja el proveedor, en el siguiente se indica
el precio promedio al que compra toda la poblaci on. En el panel siguiente se muestra el porcentaje de agentes que
est an haciendo una decisi on equivocada y en el inferior el porcentaje de agentes que se abastecen en el proveedor.
Con una echa roja se muestra un intento del proveedor de jar un precio elevado. Observese c omo el n umero de
agentes equivocados es alto al comienzo pero luego decae r apidamente.
En la siguiente gura se muestra, muy ampliado, un breve momento de otra simulaci on en la que la
condici on de agentes capaces de aprender da lugar a un estado de equilibrio sub optimo que puede prolongarse
por mucho tiempo. La proveedura alterna entre un precio alto y uno bajo. Los compradores tienden a responder
comprando solamente los das en que el precio es bajo y se abastecen en la fuente alternativa los otros das
en que el precio es elevado (los picos y los valles en el panel superior se corresponden con valles y picos en el
panel inferior). Adicionalmente, en un panel central se muestra el porcentaje de agentes equivocados. Observese
que los picos en cada cambio de precio van decayendo con el tiempo mientras que el procentaje de agentes
que concurren a la proveedur en los das acertados va en aumento. Esto muestra c omo se va generalizando
en la poblaci on la estrategia de amoldarse a los cambios de precio. Este es un equilibrio din amico que no esta
contemplado en la telara na usual. La duraci on de estas metastabilidades depende de la fracci on de la poblaci on
que se equivoca impidiendo la consolidaci on de una estrategia estable de jaci on de precios. Si la totalidad
de los agentes se comprometiera en esta estrategia cambiante el sistema se encontrara connado por barreras
entr opicas similares a las que se vieron en el caso del modelo de concurencia la bar.
Modelos economicos de m ultiples agentes 10/6/2010
6.4. MODELOS EVOLUTIVOS DEL APRENDIZAJE 133
0.45
0.5
0.55
0.6
0.65
0.7
0.75
0.8
0.85
0.9
0 20 40 60 80 100 120 140 160 180 200
BAM model: N=30, pevol = 0.1, occupation = 80%
m = 10
m = 5
Figura 6.12: Modelo BAM. Probabilidad de ocupacion para cada
paso de tiempo para m={5, 10}. Parametros N = 30, pevol =
0.1, occupation = 0.80, m = 6.
Modelos economicos de m ultiples agentes 10/6/2010
134 CAP

ITULO 6. APRENDIZAJE Y ADAPTACI

ON
0.45
0.5
0.55
0.6
0.65
0.7
0.75
0.8
0.85
0.9
0 20 40 60 80 100 120 140 160 180 200
BAM model: N=30, m=6, occupation = 80%
pevol = 0.1
pevol = 0.5
Figura 6.13: Modelo BAM. Probabilidad de ocupacion para cada paso
de tiempo para pevol={0.1, 0.5}. Parametros N = 30, occupation =
0.80, m = 6.
Modelos economicos de m ultiples agentes 10/6/2010
6.4. MODELOS EVOLUTIVOS DEL APRENDIZAJE 135
Figura 6.14: Comparacion de aprendizaje con y sin informacion local.
Figura 6.15: Simulacion de la crisis bancaria por la devaluacion del peso
mejicano.
Modelos economicos de m ultiples agentes 10/6/2010
136 CAP

ITULO 6. APRENDIZAJE Y ADAPTACI

ON
Figura 6.16: Equilibrio de oferta y demanda en el mercado de pesca. Se
ha supuesto 4 pescadores, cada uno con un total de 10 planes de pesca
de 4 das de duracion.
Figura 6.17: Panel de la izquierda: reparto de la pesca total en-
tre 4 pescadores. Panel de la derecha: reparto de la pesca entre
pescadores con distintas funciones de costo C
i
= a
i
Q
2.75
i
con a
i
=
(0.10, 0.11, 0.12, 0.13) .
Modelos economicos de m ultiples agentes 10/6/2010
6.4. MODELOS EVOLUTIVOS DEL APRENDIZAJE 137
Figura 6.18: Panel de la izquierda: Equilibrio con un n umero creciente
de agentes. Resultados con 1, 4 y 8 agentes. Panel de la derecha: Tanteo
con diferentes funciones de costo C = aQ

i
para variable.
Figura 6.19: Co-evolucion entre clientes y proveedores. Con una echa
se indica la corresponencia entre la jacion de un alto precio y una dis-
minucion del numero de compradores. Ademas son pocos los clientes que
act uan equivocados.
Modelos economicos de m ultiples agentes 10/6/2010
138 CAP

ITULO 6. APRENDIZAJE Y ADAPTACI

ON
Figura 6.20: Metastabilidades en una simulacion de coadaptacion entre
los compradores y el vendedor. Las lineas verticales indican la coincidencia
entre las uctuaciones en el precio que ja el proveedor y la variacion en
la clientela del mismo.
Modelos economicos de m ultiples agentes 10/6/2010
6.5. EL DISE

NO DE AGENTES COMPLEJOS ADAPTIVOS 139


6.5 El dise no de agentes complejos adaptivos
6.5.1 El aumento de la complejidad
El mecanismo evolutivo que se describi o en secciones anteriores inducen a pensar que la evoluci on biol ogica pueda
ser pensada como una acumulaci on lenta y progresiva de cambios en la informaci on genetica de los individuos de
la poblaci on. Sin embargo, pronto se reconoci o que esta es una sobresimplicaci on.
Desde el punto de vista biol ogico, la evolucion no est a asociada a un progreso. No puede decirse que un
ser vivo cualquiera es m as evolucionado que otro ya que ambos son el resultado de del mismo proceso que comenz o
con la aparici on de las primitivas formas de vida en la Tierra. Lo que por otra parte surje de la observaci on directa
es que existen algunos organismos que son m as complejos que otros: hay una gran diferencia entre un alga y un
deln o entre una mariposa y un orangut an. Una observaci on identica puede efectuarse para organizaciones dentro
de una sociedad. Sin embargo, si se desea poner estos argumentos de manera m as precisa y cuantitativa se choca
con la dicultad de que no existe, al menos en biologa, una medida universalmente aceptada de la complejidad
de un ser vivo. Algo similar podra bien decirse de organizaciones sociales.
Curiosamente existe una tendencia antropocentrica de hablar de organismos m as evolucionados que otros
con la aceptaci on implcita que el ser humano es el m as evolucionado de todos. En realidad todos los seres vivos
que observamos, incluidos los seres humanos, son casualidades que se han encontrado a lo largo de un paseo en
el espacio de todas las secuencias gen omicas preservando en cada paso, aquellas alternativas que mejoraban sus
posibilidades de dejar descendencia. El proceso evolutivo alcanza a toda la escala biol ogica, y afecta por igual a
sistemas de muy diversa complejidad con estructuras internas tan diversas como moleculas, celulas y organismos
pluricelulares, operando sobre sus cractersticas comportamentales y en su relaci on con sus semejantes y con otras
especies.
Recientemente se ha consolidado la idea que el proceso evolutivo comprende adem as lo que se ha dado
en llamar transiciones evolutivas principales (o transiciones evolutivas mayores) que son las que marcan un salto
cualitativo de complejidad en la organizacion interna de los seres vivos. Entre dichas transiciones se pueden
mencionar:
La transicion de replicantes (genes) aislados a la conformaci on de cromosomas
Conformaci on de celulas a partir de organelas separadas.
Transici on entre procariotas y eucariotas
9
Transici on de organismos unicelulares a organismos pluricelulares
Aparici on de la diferenciaci on sexual y del mecanismo de reproducci on asociado
Transici on de individuos solitarios a la formacion de colonias (castas no reproductivas en insectos sociales)
Transici on de jauras o manadas a sociedades organizadas (aparici on del lenguaje)
Los cambios que tienen lugar en cada una de estas transiciones han sido resumidos en las siguientes 5 etapas.
Las mismas poseen una fuerte semejanza con las etapas en las que se produce un aumento en la complejidad interna
de empresas, organizaciones sociales o sistemas de producci on propios de la actividad econ omica.
1. Se comienza por una comunidad de organismos capaces de replicarse y responder a los estmulos del medio
en que se encuentran. Los denominaremos replicantes sin que importe su nivel de complejidad interna.
Dichos replicantes compiten individualmente por recursos. A traves de sucesivas generaciones ellos
optimizan su estructura para hacer un uso mas eciente de los mismos (o sea replicarse m as con menos
recursos).
2. Algunos agentes adaptan mutuamente sus estructuras, disminuyen la competencia y consiguen de esa man-
era un benecio reproductivo. Establecen y aprovechan un cierto grado de complementaridad estrategica.
Hasta este punto los replicantes no han ido mucho m as all a que organizarse en una colectividad, tal como
puede ser un card umen. En los pasos siguientes aparecen diferencias relevantes (ver gura 6.21).
9
procariotas corresponden a celulas sin nucleo mientras que las eucariotas poseen un n ucleo en el que se
almacena la informaci on genetica
Modelos economicos de m ultiples agentes 10/6/2010
140 CAP

ITULO 6. APRENDIZAJE Y ADAPTACI

ON
Figura 6.21: Los replicantes compiten por recursos, algunos se complementan y consiguen aprovechar
mejor las recursos disponibles
3. Se produce una m as estrecha vinculaci on entre individuos complementarios en las que se establece una
divisi on del trabajo y se ven afectadas las funciones reproductivas de los replicantes que se han vinculado.
Aparece de este modo una unidad simbi otica entre los miembros del grupo. Esto quiere decir que la
reproduccion de algunos s olo es posible si es ventajosa para los dem as replicantes del grupo. Esta asociaci on
es vulnerable a la amenaza de par asitos que aprovechan de los recursos obtenidos por el grupo pero no
contribuyen a las funciones que hacen posible su reproducci on. La subsiguiente etapa para acceder a una
mayor complejidad se cumple cuando la asociaci on se pone a salvo de los par asitos (free riders) y evita
de ese modo la tragedia de los comunes (ver gura 6.22).
Figura 6.22: Los replicantes se asocian y compiten exitosamente por recursos. Sin embargo el sistema
es vulnerable a parasitos
4. Los replicantes (que ahora son simbiontes) se rodean de una frontera que los conna y separa del resto del
medio. La transformacion es profunda y permanente: de esta manera ha surgido una nuevo organismo.
En su seno el trabajo se divide y los recursos se comparten. Los par asitos no pueden ingresar f acilmente al
sistema y predar en los bienes comunes. Se instala un control interno estricto para que ning un replicante
se reproduzca por las suyas. Si alguno lo hace sobreviene la muerte de todo el organismo (un ejemplo del
quiebre de esta restricci on la constituye el c ancer: un grupo de celulas de un organo perteneciente a un
organismo complejo comienzan a reproducirse sin lmites alterando de manera irreparable el funcionamiento
de todo el organismo complejo) (ver gura 6.23.
Figura 6.23: Los replicantes simbiontes se rodean de una membrana que impide el ingreso de parasitos
5. Los multi-replicantes compiten entre si por recursos escasos y amoldan su estructura para hacer un mejor
uso de ellos: la historia vuelve a comenzar, pero lo hace en un nivel jer arquico de complejida mayor que el
anterior(ver gura 6.24).
Modelos economicos de m ultiples agentes 10/6/2010
6.5. EL DISE

NO DE AGENTES COMPLEJOS ADAPTIVOS 141


Figura 6.24: Los nuevos replicantes con una mayor complejidad interna compiten entre si por recursos
reiniciando el proceso
La visi on Darwiniana m as tradicional en la que no se contemplan transiciones evolutivas mayores como
las que acabamos de ver considera la competencia como motor principal del proceso evolutivo mientras que el
altruismo es considrado como un elemento accesorio que requiere de una explicaci on particular a la luz del interes
primario del individuo que es su reproducci on.
La visi on que surje de las transiciones evolutivas principales indica que los mecanismos altruistas de coop-
eraci on son un motor tan importante como la competencia en el proceso evolutivo y es el principal responsable
en el crecimiento de la complejidad en organismos biol ogicos.
Esta visi on ayuda por otra parte a comprender mejor la estructura jer arquica de la complejidad organizativa
asi como el surgimiento de procesos evolutivos anidados que ya vimos en la secci on 2.2 con escalas de tiempo que
son muy diversas entre si.
6.5.2 Los desafos de la supervivencia
En la secci on anterior hemos mostrado c omo el proceso de lucha para obtener una descendencia exitosa puede
conducir a un incremento de la complejidad de los seres vivos o de las organizaciones dentro de la sociedad. Los
sistemas adaptivos tanto naturales como articiales deben enfrentar desafos para sobrevivir. El bi ologo S. Frank
ha reducido la lista a los siguientes 3 elementos:
1. Decaimiento de la informacion: Si las mutaciones y cambios al azar se acumulan demasiado r apidmente,
se deteriora la informaci on almacenada en el sistema y se impide el proceso de mejora en las generaciones
sucesivas que se produce por el proceso de seleccion. La transmisi on de informacion entre generaciones
debe prever mecanismos de correcci on de errores.
2. Complejidad constructiva: Cuando nace, cada sistema debe poseer la sucente complejidad interna
como para sobrevivir en un medio hostil y cambiante. Es imposible codicar toda la complejidad necesaria
para la supervivencia y la adaptaci on al medio. La informacion almacenada en el sistema y que se transmite
por la herencia debe permitir la creacion de patrones complejos a partir de un conjunto limitado de
instrucciones.
3. Adversidades impredecibles: Es imposible prever estructuras que posean respuestas pre-elaboradas al
elenco de todas las posibles situaciones adversas que se puedan presentar. El sistema debe poseer suciente
exibilidad como para ajustarse a situaciones imprevistas.
Las respuestas evolutivas a estos desafos ha sido resumida en la siguiente lista:
Fidelidad de la transmisi on de la informaci on entre generaciones A lo largo del proceso evolutivo
han emergido mecanismos que aseguran un cierto grado de redundancia y de correcci on de errores en la
informaci on genetica. Tal por ejemplo las redundancias en el c odigo genetico
10
. Otro ejemplo es el de la
diferenciaci on sexual y la reproducci on utilizando la informaci on genetica de ambos progenitores.(Responde
a la amenaza 1)
10
El genoma permite codicar el armado de protenas con los 20 amino acidos diferentes que hay en la naturaleza.

Estos son codicados utilizando 3 nucleotidos; como hay 4 tipos diferentes de nucle otidos, tres de ellos permitiran
codicar, sin redundancias, 64 alternativas diferentes
Modelos economicos de m ultiples agentes 10/6/2010
142 CAP

ITULO 6. APRENDIZAJE Y ADAPTACI

ON
Balance entre exploraci on y explotacion. En su interacci on con el medio un organismo adaptivo
exitoso debe haber logrado un equilibrio entre su capacidad de explorar nuevas conductas o posibilidades
de supervivencia y la de aprovechar soluciones incorporadas a su hardware. Por ejemplo, un animal
puede sobrevivir intentando la alterantiva de fugarse ante un predador o aprovechando la soluci on que ya
tiene incorporada de enga narlo aprovechando su mimetismo con el medio.(Responde a amenazas 1 y 3)
Emergencia de reglas generativas Las reglas generativas son reglas simples que, operando du-
rante la etapa de la morfogenesis son capaces de generar fenotipos complejos. El desarrollo de tales reglas
y su incoporaci on a la informaci on heredable apunta a resolver la imposibilidad de codicar una estruc-
tura fenotpica compleja que es necesaria para la supervivencia pues esta informaci on puede exceder la
capacidad de almacenamiento de informaci on en el sistema genetico. Un ejemplo es la constituci on del
Sistema Nervioso Central del ser humano: el genoma carece de suciente capacidad de almacenamiento
de informaci on como para codicar todas las 10
15
sinapsis nerviosas que lo conforman. La soluci on es
transmitir la informaci on de la sntesis quimica de los factores de crecimiento del mismo que hacen que el
mismo crezca, se desarrolle y conforme de manera adecuada (responde a la amenza 2).
Genesis de subsistemas exibles En el dise no de un sistema adaptivo no es dable prever todas las
variantes del medio en que se va a desarrollar ni todas las respuestas posibles a dichas variantes. La manera
de asegurar la supervivencia es mediante la genesis de subsistemas en los que, mediante un proceso de
variaci on y selecci on Darwinana, sean capaces de dar respuesta a problemas particulares. Un ejemplo es el
desarrollo de un sistema inmunitario. Este sistema es capaz de generar anticuerpos destinados a neutralizar
las amenazas qumicas del medio. Es in util transmitir la informaci on inmunitaria de los progenitores por
medio de la herencia por cuanto el medio que enfrentar an sus descendientes puede ser muy diferente al
que ellos han encontrado. La respuesta evolutiva m as exitosa es la de generar un sistema exible que sea
capaz de generar las defensas correspondientes en el momento oportuno. Otro ejemplo es la genesis de un
sistema de aprendizaje como los que se han ejemplicado con anterioridad (responde a la amenza 3).
Simbiosis Ya se vi o en la secci on anterior de que modo la cooperaci on entre entidades separadas pueden
permitir una mayor ecacia en la explotacion de los recursos del medio preservando la identidad e infor-
maci on genetica de los simbiontes (responde a la amenza 1).
Genesis de subsistemas instruccionales Cuando el medio ambiente presenta regularidades a lo largo
de generaciones, estas pueden dar lugar a respuestas autom aticas. Un ejemplo en este sentido son los los
ritmos biol ogicos de numerosos seres vivos en sincrona con la alternacia del da y la noche o las estaciones
del a no (responde a las amenzas 2 y 3)
Modelos economicos de m ultiples agentes 10/6/2010
Captulo 7
Mercados y Experimentos
7.1 Introducci on
Una de las aplicaciones m as atractivas de los sistemas complejos, es en el problema de la formaci on y fun-
cionamiento de los mercados en una economa. Este problema tiene varios aspectos interesantes como la formaci on
y evoluci on de un mercado, c omo se jan los precios en el mismo, y cu al es la distribuci on de riquezas a la cual
se llega. Este problema, central en la economa, pone en contacto los aspectos estrategicos de toma de decisiones
que enfrenta un individuo, con los aspectos sociales de interacci ones m ultiples entre muchos individuos, a lo que
cotidianamente llamamos competencia.
Dentro de los sistemas complejos, podemos decir que un mercado no es mas que la propiedad emergente de
las interacciones que realizan un conjunto de agentes utilizando recursos limitados tanto fsicos como temporales.
En este esquema, la competencia corresponde al proceso adaptativo que los individuos ejercitan para permanecer
en el mercado y no desaparecer (nuevamente por la nitud de los recursos).
Dentro de una formulaci on minimal de un mercado, quisieramos imponer que los recursos tanto fsicos,
temporales (no tienen tiempo innito para recolectar toda la informaci on relevante para determinar su mejor
acci on), como computacionales, son limitados. A nivel individual los agentes rma y consumidor enfrentan dos
problemas complementarios: la rma deber a:
denir con que precio sale al mercado cada da, y
preveer cu anto es su reposici on frente a las ventas esperadas
mientras que por el otro lado el consumidor deber a:
decidir a a que rma le compra, y
cu anto le compra o su gasto planicado
Hay que notar que en esta formulaci on estamos suponiendo que el vendedor forma el precio, y el comprador solo
decide cuanto compra a ese precio.
Dentro de las preguntas v alidas que nos gustara formular en un modelo de mercado desde los sistemas
complejos son:
Cu ales son las condiciones minimales de racionalidad e informaci on que cada individuo debe contar para
que exista un mercado?
Cu ales son las condiciones necesarias para que exista competencia y c omo depende de lo sosticado de
las estrategias utilizadas?
Que tan robusto es un mercado frente a perturbaciones exogenas?
143
144 CAP

ITULO 7. MERCADOS Y EXPERIMENTOS


A continuaci on vamos a formular un juego minimalista de mercado que apunta a resaltar c omo las car-
actersticas de racionalidad individual pueden denir un mercado. Presentamos dos variantes del mismo. Uno
en que los agentes se comportan como aut omatas, mientras que el segundo, realizan una optimizaci on local en el
tiempo para establecer su precio futuro. Mostramos asi mismo resultados de un experimento realizado sobre la
base de este modelo para calibrar par ametros del mismo y vericar el estado estacionario al cual se llega.
7.2 Juego de mercado minimal: construcci on bottom-up
Desarrollaremos un juego de mercado cuyo principal objetivo es poder discutir distintos mecanismos aut onomos
de formaci on de precio en entornos con informaci on limitada. El juego parte de un mercado donde varias rmas,
sujetas a una restricci on de capacidad en las cantidades producidas, compiten para vender un bien homogeneo a
traves de la jaci on de precios.
Esta conguraci on, que corresponde a un juego de Bertrand-Edgeworth parece tener an alogos diversos
en las actividades econ omicas cotidianas, donde la capacidad de producci on es limitada. En dichos entornos,
Edgeworth hizo notar que era imposible obtener un equilibrio de Nash en estrategias puras, con lo cual queda
la posibilidad que el mercado se organice mediante estrategias mixtas. Este tipo de an alisis no ha recibido
mucha atenci on en la literatura, y lo encontramos particularmente interesante como caso de estudio de un sistema
econ omico intrnsicamente fuera del equilibrio.
El funcionamiento del mercado en que se desarrolla el juego est a especicado de la siguiente manera:
Los intercambios se desarrollan en das de mercado o perodos, autocontenidos. No existen activos, reales
o nancieros, que permitan trasladar recursos de un perodo a otro.
La oferta del bien proviene de N rmas, cada una de las cuales puede producir hasta un m aximo de y

unidades, con un costo unitario estrictamente positivo c. En este ejercicio, (y

, c) son iguales para todos


los oferentes.
Antes de iniciarse el perodo de mercado t, cada rma i anuncia un precio p
i
t
al cual se compromete a
proveer el bien, sujeto al lmite de capacidad. Las rmas producen sobre pedido, es decir que la cantidad
producida se determina luego de que se establece la demanda dirigida a cada una de ellas. De esta manera,
en esta formulacion prescindimos por el momento de preocuparnos de inventarios y en la decisi on de c omo
reabastecerse en el futuro.
Se asume que el objetivo de la rma es la maximizaci on de benecios. Si la rma i recibe pedidos por la
cantidad z
i
t
, sus ventas son: x
i
t
= min[z
i
t
, y

], y los benecios: b
i
t
= (p
i
t
c)x
i
t
.
La demanda de bienes proviene en principio de un conjunto de consumidores. Sin embargo, en la presente
formulaci on, asumiremos que no hay limitaciones en la informaci on que el demandante tiene sobre los
precios (y eso es de conocimiento com un) y los demandantes desean visitar en el orden (t) dictado por los
precios ofrecidos

p
i
t

ascendentes (hay desempate aleatorio si hay dos vendedores con el mismo precio).
M as abajo justicamos lo que llamaremos la aproximacion de un solo comprador. Este comprador virtual
posee un gasto planicado total M, que utiliza en cada perodo t para visitar los N vendedores, en el orden
de visita (

p
i
t

).
En cada perodo el consumidor intenta gastar la totalidad de su gasto planicado M, visitando las rmas
en el orden (

p
i
t

), comprando la totalidad de la producci on y

, hasta agotar por completo su gasto


planicado M o visitar todas las rmas. Puede ocurrir que los precios

p
i
t

anunciados por las rmas no


sea posible concretar todo el gasto planeado; el hecho no inuye sobre la demanda en perodos subsiguientes
(es decir, por hip otesis, el gasto no realizado no se traslada al futuro).
Al momento de jar los precios, se supone que el conjunto de informaci on de cada rma consiste en la
historia de sus propias transacciones:
i
t
=

p
i

, x
i

, z
i

<t
, incluyendo en particular, si los hubiera, a los
pedidos no abastecidos por restricciones de capacidad. No hay informaci on global, o conocimiento sobre
los precios y ventas de otras rmas.
La aproximaci on de un solo comprador utilizada en esta formulaci on, descansa en que todos los compradores
tienen pleno conocimiento de los precios anunciados

p
i
t

, y que todos desean visitar a las rmas en el estricto


Modelos economicos de m ultiples agentes 10/6/2010
7.2. JUEGO DE MERCADO MINIMAL: CONSTRUCCI

ON BOTTOM-UP 145
orden de precios ascendentes (t). Bajo estas circunstancias, no importa como se organicen los consumidores en
visitar cada rma (sea sincr onica, asincr onica, aleatoria o orden jo), el resultado es que la demanda percibida por
las rmas es la equivalente a la de un solo comprador por la totalidad M de la masa de dinero que los consumidores
disponen como gasto planicado, y en cada perodo solo una rma vende y < y

. Esta aproximaci on simplica


notablemente el tratamiento de la demanda, diriendo el problema de quien le compra a quien para un futuro
renamiento del modelo original
1
.
7.2.1 Precio de mercado competitivo
En este juego se puede encontrar un precio de mercado competitivo que corresponde simplemente al gasto planeado
por el comprador dividido la producci on total del mercado:
p
eq
=
M
Ny

(7.1)
En lo que sigue suponemos que el costo c > 0 de cada bien, satisface p
eq
> c > 0, o
M > c Ny

> 0 (7.2)
si no estamos en caso particular no muy interesante.
Ahora, este precio de mercado no es un equilibrio de Nash. Supongamos que todas las rmas proponen
vender al precio p
eq
, recibiendo su fracci on
M
N
del gasto planeado del comprador y un benecio
b
eq
= (p
eq
c)y

=
M
N
cy

(7.3)
Cada una, preferir a aumentar su precio p, para disminuir sus ventas y < y

tal que obtenga la misma fracci on


del gasto planicado del comprador
M
N
= p y, pero que redunda en la rma en un benecio (p c)y > b
eq
porque
los costos totales c y son menores. Esto muestra la importancia que la producci on tenga costo c > 0, pues si no
existira un equilibrio de Nash donde todos los jugadores venderan a precio innito, cantidades despreciables.
Ya que el juego no tiene un equilibrio de Nash en estrategias puras, veamos como sera el precio, y las
cantidades promedio vendidas en este mercado. En cada perodo del juego, el comprador ordena el vector precios
utilizando la asignaci on en orden creciente, deniendo un nuevo vector precios p (p
(1)
, p
(2)
, .., p
(k

)
, .., p
(N)
)
y ventas y (y
(1)
, y
(2)
, .., y
(k

)
, 0, 0). Destacamos el ranking k

N de la rma (k

), que corresponde a la
rma que logr o vender una cantidad positiva y

y > 0 al precio m as alto en ese perodo. Podemos relacionar


el precio promedio del mercado con la fracci on de rmas que venden k

/N de la siguiente forma:
p) = p) =
N
X
j
p
j
/N
=
k

1
X
i
p
i
/N + p
k

+
N
X
j=k

+1
p
j
/N
=
M
Ny

+
N
X
j=k

+1
p
j
/N = p
eq
+
N
X
j=k

+1
p
j
/N (7.4)
Ahora si suponemos que la distribuci on de precios tiene varianza nita y picuda, tenemos,
p) = p
eq
+ (N k

)p)/N +
N
X
j=k

+1
(p
j
p))/N
p
eq
+ (N k

)p)/N
1
Si se generaliza la aproximaci on de un solo comprador a K consumidores que cada uno compra solo a un
subconjunto de las N rmas estableciendose una red bipartita, en este caso puede haber m as de una rma que
haga ventas parciales, como ocurre en la realidad.
Modelos economicos de m ultiples agentes 10/6/2010
146 CAP

ITULO 7. MERCADOS Y EXPERIMENTOS


y
p)
p
eq
k

/N
(7.5)
donde establecemos la relaci on entre el precio promedio del mercado con la fracci on de rmas que venden y el
precio de equilibrio. En particular cuando todas las rmas venden, k

= N, y p) p
eq
, mientras que si k

< N
el precio promedio p) > p
eq
.
Por otro lado tenemos que
y) =
N
X
y
i
/N
= (
k

1
X
j=1
y
j
+y
k

+
N
X
j=k

+1
y
j
)/N (7.6)
=
(k

1)y

+y
k

N

k

N
con lo que
y)
y

N
1 (7.7)
donde establecemos la relaci on entre la fracci on de rmas que venden una cantidad positiva y el promedio de las
ventas del mercado. Es decir, usando (7.5) y (7.7) es equivalente conocer la fracci on de rmas que venden k

/N,
el precio promedio del mercado p) o las ventas promedio del mercado q).
El estado estacionario de este sistema no tiene un equilibrio donde p
i
= cte para todos los vendedores, ya que
se puede ver facilmente que la din amica fuerza a los agentes a reveer su precio a la suba o a la baja indefectiblemente
en todos los pasos. Esto lleva a que el sistema pueda llegar a un estado estacionario, posiblemente con una
distribuci on de precios instant anea que cambia en el tiempo, pero que sea estable si se promedia temporalmente.
Uno espera que las rmas econ omicamente racionales que logran ventas totales agentes aumenten o al
menos dejen el precio constante. O que bajen el precio si no realiza ninguna venta.
7.3 Formacion de precios: modelo Brutus
Falta establecer c omo dado el conjunto de informaci on
i
t
cada rma establece p
i
t
. En este punto, sin duda
hay muchisimas posibilidades. Comenzando con algo lo m as sencillo posible, proponemos la siguiente regla de
comportamiento b asica:
Si vendo todo, aumento el precio en una constante
up
; caso contrario, lo disminuyo en una constante

down
Concretamente la regla es:
p
i
t+1
= p
i
t
+


up
, si y
i
t
= y

down
, si y
i
t
< y

donde y
i
t
y

son las ventas realizadas por la rma i en el perodo t.


Como veremos m as adelantte, esta regla totalmente pavoloviana, da resultados signicativos. La justi-
caci on es directa: tomemos como referencia en el perodo t la rma k

que hace ventas parciales (recordar que solo


una rma por perodo est a en esta situaci on). Todas aquellas que vendieron a precio p
i
t
< p
k

t
, vendieron todo y
saben que podran haber aumentado el precio para obtener mayores benecios. Cuando no vendieron la totalidad
de su producci on, saben con certeza que su precio estaba por encima de p
k

t
, por lo que irremediablemente deber an
bajar su precio para el pr oximo perodo.
Una variante sutil que exploraremos es suponer que
Si vendo todo, aumento el precio en una constante
up
; si vendo parcialmente con probabilidad h
mantengo el precio y con 1 h lo bajo; si no vendo nada, lo disminuyo en una constante
down
Modelos economicos de m ultiples agentes 10/6/2010
7.3. FORMACI

ON DE PRECIOS: MODELO BRUTUS 147


7.3.1 La cuenta
Denamos la cantidad n

t
como la cantidad de vendedores que lograron vender la totalidad de sus productos al
nal de la ronda de compra. Tenemos que debido a las ventas recientes, se debio cumplir que la cantidad total de
dinero volcada al sistema por el comprador es igual (excepto por el ultimo Mohicano) a los precios * cantidades
de los vendedores. Pero como la capacidad m axima de todos los vendedores es la misma tenemos que:
n

t
X
p
i
= M/y m (7.8)
donde para simplicar la notaci on, los p
i
est an ordenados de menor a mayor: p
n
> p
n

1
> ... > p
1
.
Ahora como todos estos vendedores vendieron, suben su precio en , por lo que podemos estimar cuanto
disminuye n

debido a que todos aumentan su precio:


m =
n
+
t
X
(p
i
+) =
n
+
t
X
p
i
+n
+
t
(7.9)
donde la nueva cantidad de vendedores n
+
es menor a la que realmente vendieron en ese paso n

debido al
aumento de todos los vendedores.
De las expresiones (7.8) y (7.9) tenemos la relaci on:
n

t
X
n
+
t
p
i
(t) = n
+
(7.10)
Ahora si consideramos los vendedores |n

+ 1, n

+ 2, ..., N que no vendieron en el paso t, estos bajar an


sus precios en . Los unicos que vendedores que pueden afectar el n
+
t
, ser an aquellos que satisfagan:
p
j
p
n
+
t
j |n

+ 1, n

+ 2, ..., N (7.11)
porque si no logran mejorar el precio del mejor vendedor, no alteran la condici on de equilibrio realizada en la
suba de precios (7.9).
Supongamos que hay r
t
< N n

t
de estos individuos que efectivamente mejoran el precio p
n
+
. Esto
introduce un nuevo cambio en la cantidad de agentes que dene quien va a vender en el paso t +1, n

t+1
. Esto se
calcula balanceando la cantidad total de dinero que introducen los que bajaron sus precios en , por la suma de
la cantidad de dinero de los vendedores m as caros:
n

t
+r
t
X
n

t
+1
(p
j
(t) ) =
n
+
t
X
n
+
t
s
t
p
i
(t) (7.12)
donde s es la cantidad de agentes que vendieron (y aumentaron), pero que quedaron muy caros frente a los que
bajaron en . En resumen la nueva cantidad de agentes que van a vender en el paso t + 1 es
n

t+1
= n
+
t
s
t
+r
t
(7.13)
7.3.2 Aproximaci on
Podemos aproximar las ecuaciones de arriba en el caso donde los precios son parecidos entre si.
Para (7.10) si los precios que vendieron son todos muy parecidos [p
i
p
j
[ ,
(n

n
+
) p
i
= n
+

n
+
=
n

1 +/ p
i
< n

(7.14)
Modelos economicos de m ultiples agentes 10/6/2010
148 CAP

ITULO 7. MERCADOS Y EXPERIMENTOS


mientras que para (7.12) tenemos algo an alogo si todos los precios son muy parecidos:
r
t
( p
j
) = s
t
p
i
s
t
= r
t
p
j

p
i
(7.15)
nos queda (7.13)
n

t+1

n

t
1 +/ p
i
+r
t

1
p
j

p
i

(7.16)
que nos queda como funci on de r
t
, y faltaria estimar una evoluci on para la misma. Tenemos la cota de r
t
< Nn

,
con lo cual quedaria
n

t+1
<
n

t
1 +/ p
i
+ (N n

t
)

1
p
j

p
i

(7.17)
Podemos decir algunas consecuencias de estas ecuaciones.
Lo que queda claro es que n

baja por la suba de los que vendieron y sube con los que bajan el precio.
De (7.16) si p
j
p
i
y es sucientemente chico, n

= N es un posible equilibrio estable, es decir, todos


venden. Esto se cumple siempre y cuando el ultimo Mohicano no se quede sin vender...
Si no es sucientemente chico, entonces (7.16) hace que n

sea menor a N y r
t
> 0, y tenemos que
n

<
N
1 +
1/ p
i
p
j

p
i
<
N
1 +
p
i

p
j

(7.18)
de donde tenemos que si = , y p
i
p
j
, sale n

= N/2, es decir la mitad de los agentes venden! Usando


(7.5) tenemos
p)
N
N/2 + 1
p
eq
p)
2
1 + 2/N
p
eq
(7.19)
es decir casi 2!
7.3.3 Precios Bertrand, inexistencia de Nash en estrategias puras
Se puede ver que la optimizaci on del precio de una rma individual dados los precios de los demas implica la
inexistencia de un equilibrio de mejores respuestas no estoc asticas. Sea p

el precio (uniforme) jado por N 1


rmas, o equivalentemente, p

el precio promedio de las N 1 rmas m as baratas. Se trata de estudiar el precio


optimo del N- esimo oferente.
Sea M < (N 1)p

, es decir p

>
N
N1
p
eq
. En ese caso, las N 1 rmas mas baratas no todas van a
lograr vender la capacidad m axima, y la rma N, no importa su precio p, obtendr a ventas y benecios
nulos.
Sea M > (N 1)p

, o bien, p

<
N
N1
p
eq
. Entonces, si la rma N ja un precio p > p

, realiza ventas
positivas, de monto dado por py = M (N 1)p

= (Np
eq
(N 1)p

) y

= M(1
N1
N
p

p
eq
). Es claro
que la elecci on de la rma es entre un precio innito (que implica ventas nulas, por lo tanto costos nulos),
o un precio algo inferior a p

. Los benecios respectivos son:

= py =
`
Np
eq
(N 1)p

p
= (p

c)y

(7.20)
Modelos economicos de m ultiples agentes 10/6/2010
7.3. FORMACI

ON DE PRECIOS: MODELO BRUTUS 149


La condicion

>
p
equivale a:
`
Np
eq
(N 1)p

> (p

c)y

(7.21)
o sea:
p

< p
eq
+
c
N
(7.22)
Finalmente, como este caso requiere p

<
N
N1
p
eq
, para
N
N1
p
eq
> c, tenemos que .
p

< p
eq
+
c
N
<
N
N 1
p
eq
(7.23)
Entonces, las decisiones optimas del N- esimo oferente seran:
(p, y) (, 0) si p

< p
eq
+
c
N
p = p

, y = y

( innitesimal ) cuando p

> p
eq
+
c
N
Se ve que estas condiciones de optimo generaran un ciclo (Edgeworth 1897): si los precios del conjunto
de las rmas son altos (respecto de la cota p
eq
+
c
N
), habra incentivos para rebajas competitivas de precios,
que reduciran el nivel medio por debajo del lnite, e induciran a alguna rma a saltar a un precio alto.
Al respecto, se observa que el precio medio p
eq
+
c
N
es un lmite para el tipo de ajuste preferido por la rma
residual, pero no calica como posible punto de reposo, porque ah, el oferente N no preere quedarse, sino
que es indiferente entre una peque na disminuci on y un gran aumento.
7.3.4 Umbral de competencia
Existe un interesante umbral en este juego. Supongamos que estamos en una situaci on donde el vendedor m as
caro del mercado debe decidir que precio p vender su mercadera, conociendo que sus N1 competidores tuvieron
un precio promedio p

, y vendieron toda su mercadera y

. Este planteo, tpico de teora de juegos, lleva a una


conclusi on interesante para este jugador particular.
Bajo estas condiciones, tenemos que la conservaci on de la masa de dinero total es
M = (N 1)p

+py (7.24)
donde el vendedor m as caro decide p y vender a y. Para que el vendedor tenga ventas y > 0 se debe cumplir,
p

<
M
(N 1)y

(7.25)
ya que de lo contrario el comprador habra agotado todo su gasto planicado en los N 1 vendedores anteriores.
Como el benecio de cada vendedor es = (p c) y, denamos el cambio de benecio =

,
como la diferencia entre en benecio del jugador m as caro, = (p c) y, y el benecio promedio del mont on

= (p

c) y

. Queremos estudiar las regiones de los par ametros donde > 0.


Desarrollando tenemos:
= (p c)y (p

c)y

= py +c(1 y) p

= M (N 1)y

+c(1 y) p

= M Ny

+c(1 y)
= N

p
eq
p

+
c
N
(1 y)

lo que nos permite estudiar como es el cambio de benecio para las ventas realizadas y, como funci on de p
eq
,
p

, c y N. Sin duda, que vender lo menos posible al precio m as alto, mejora , por lo que podemos acotar
< N

p
eq
p

+
c
N

(7.26)
De aqui que para p

= p
eq
, el m aximo cambio de benecio es max = c y es positivo. Para p
eq
+c/N > p

> p
eq
,
tenemos que max > 0, pero para p
eq
+c/N < p

, max < 0, por lo que al agente N-esimo le conviene bajar el


precio para no ser el m as caro.
Modelos economicos de m ultiples agentes 10/6/2010
150 CAP

ITULO 7. MERCADOS Y EXPERIMENTOS


7.3.5 Experimentos numericos
Los experimentos numericos muestran que efectivamente el mercado llega a un estado estacionario, donde una
proporcion (que depende del cociente
up
/
down
) de los vendedores vende todo, mientras que otros no venden
nada por lo que bajan su precio indefectiblemente.
Figura 7.1: (Arriba) Evolucion temporal del precio promedio del mer-
cado, su valor maximo y mnimo. Tambien se muestra en color magenta
el precio de un solo vendedor, mostrando su comportamiento mecanico.
(Abajo) Evolucion temporal del benecio del mercado. Parametros del ex-
perimento: N = 50, M = 50,
up
= 0.01,
down
= 0.1, c = 0.15, p
eq
=
1, y

= 1, b
eq
= 0.85
La din amica mec anica que presentan los agentes en este mercado, determinan que la varianza de precios
sea del orden de max(
down
,
up
). Adem as el precio estacionario que arriba el mercado depende de
up
/
down
.
7.4 Formacion de precios: modelo Maximizador de Benecios
Otra variante, un poco m as sosticada, es permitir al agente adaptar el precio en funci on de su cambio de
benecio a un perodo. Esto permite que el agente intente realizar una maximizaci on local, y como veremos,
permite minimamente detectar oportunidades que ofrezca el mercado.
La regla de comportamiento b asica para el modelo maximizador de benecios se puede resumir en la
siguiente tabla:
p
t
b
t
p
t+1
> 0 > 0 > 0
> 0 < 0 < 0
< 0 > 0 < 0
< 0 < 0 > 0
Modelos economicos de m ultiples agentes 10/6/2010
7.4. FORMACI

ON DE PRECIOS: MODELO MAXIMIZADOR DE


BENEFICIOS 151
es decir
Si aumento el precio y eso redund o en una mejora en el benecio o si dimuyo el precio y redunda
en una desmejora del benecio, resuelvo aumentar precios.
Esta regla es an aloga a la Win-stay, loose-shift que utiliz o Nowak y Sigmund en el Dilema de Prisionero.
Habra muchas maneras de probar esta regla. Por ahora la especicamos como:
p
i
t+1
= p
i
t
+
(p
t
p
t1
)
[p
t
p
t1
[
(b
t
b
t1
) +

( 1), si y
t
= 0, y
t1
= 0
( 1/2), caso contrario
(7.27)
donde [0, 1] es una variable aleatoria uniforme. El primer termino es una medida del cambio de benecio
actual, con el cambio de precios realizado; si la cantidad es positiva, indica que el cambio de precios fue efectivo y
vuelve a proponer un cambio de precios proporcional a ese cambio; si en cambio, el cambio no fue efectivo, busco
en precios m as bajos.
Esta especicaci on en terminos de variaci on, no resuelve el caso que el agente no perciba cambios en su
benecio, tanto porque b
t
= 0 o p
t
= 0. Por lo tanto, agentes que logran obtener un m aximo en sus benecios a
un perodo, no cambiar an de precios. Ac a introducimos una variante de tanteo aleatorio que se hace importante
cuando el agente esta cercano a su m aximo local.
7.4.1 Experimentos numericos
Los experimentos numericos revelan que este mecanismo de formaci on de precios es muy efectivo para que el
mercado obtenga en promedio el precio de equilibrio competitivo p
eq
y su correspondiente b
eq
= p
eq
c. En la
g. 7.2 se muestra la evolucion temporal del precio promedio del mercado y su benecio, y ambos coinciden con
el precio y benecios te oricos de plenas ventas y m aximos benecios.
Sin embargo, por la regla de decis on de precios, sabemos que los agentes estan continuamente modicando
sus precios, de acuerdo a su cambio de benecio b
t
y p
t
. Observando la traza temporal para un solo agente en
la g. 7.2, se observa que en terminos generales es muy parecida al caso de formacion de precios Brutus (g. 7.1),
donde a medida que logra vender todo, y dado que aument o precios, contin ua aumentando precios. Esto se ve
limitado por la restricci on monetaria y de capacidad de los vendedores, con los que cuando en un perodo no
vende, la rma obtiene un b
t
< 0 y baja indefectiblemente su precio. En este mercado, los agentes bajan su
precio proporcional a b
t1
= (p c) (si vendieron todo en t 1). Esas caidas bruscas de precio se pueden
observar en g. 7.2 en los perodos t = |3300, 5000, ...
Por otro lado, se observan ciertos momentos donde el precio no cambia (por ejemplo t (5500, 5600)),
y el agente est a dominado por el tanteo aleatorio governado por el termino . Simulaciones con = 0 se logra
llegar a un equilibrio, donde todos los agentes congelan su precio en uno que hace que en dos perodos lograron
vender todo. Esta selecci on de equilibrio (cada agente a un precio potencialmente distinto), resulta parecida a la
coordinacion que se observa en el modelo BAM.
7.4.2 Evoluci on temporal de precios depende de N
Una diferencia importante que subyace en el modelo de benecios, es que la combinaci on de b usqueda de maximo
local que ofrece el tanteo aleatorio y b
t
, es que si la cantidad de vendedores es sucientemente peque na, se
observan fen omenos oligop olicos.
En la g. 7.3 se muestra un experimento numerico donde hay solo 4 vendedores. En esta situaci on se
muestra como 3 agentes pueden vender a toda capacidad y aumentar signicativamente su precio por arriba de
p
eq
, a costa de que el agente de precio m as alto venda menos que su capacidad m axima.
Experimentos numericos para distintos muestran que el comportamiento del precio frente a N tiene un
decaimiento exponencial. La g. 7.4 muestra el promedio de 50 realizaciones, promediando los ultimos 500 precios
del mercado de todos los vendedores. Las simulaciones tuvieron una duraci on de 5000 pasos de tiempo.
Modelos economicos de m ultiples agentes 10/6/2010
152 CAP

ITULO 7. MERCADOS Y EXPERIMENTOS


Figura 7.2: (Arriba) Evolucion temporal del precio promedio del mer-
cado, su valor maximo y mnimo. Tambien se muestra en color magenta el
precio de un solo vendedor, mostrando su comportamiento maximizador
de benecios. (Abajo) Evolucion temporal del benecio promedio del
mercado. Parametros del experimento: N = 50, M = 50, = 0.2, =
0.01, c = 0.15, p
eq
= 1, y

= 1, b
eq
= 0.85
Modelos economicos de m ultiples agentes 10/6/2010
7.4. FORMACI

ON DE PRECIOS: MODELO MAXIMIZADOR DE


BENEFICIOS 153
Figura 7.3: (Arriba) Evolucion temporal del precio promedio del mer-
cado, su valor maximo y mnimo. Tambien se muestra en color magenta el
precio de un solo vendedor, mostrando su comportamiento maximizador
de benecios. (Abajo) Evolucion temporal del benecio promedio del
mercado. Parametros del experimento: N = 4, M = 4, = 0.2, =
0.01, c = 0.15, p
eq
= 1, y

= 1, b
eq
= 0.85
Modelos economicos de m ultiples agentes 10/6/2010
154 CAP

ITULO 7. MERCADOS Y EXPERIMENTOS


Figura 7.4: Precio promedio, precio promedio mas desviacion estandard
como funcion de la cantidad de vendedores N para el modelo maxi-
mizador de benecios. Se compara con los valores p
eq
+c/N y
N
N1
p
eq
.
N = M, = 0.01, = 0.01, c = 0.15, p
eq
= 1, y

= 1, b
eq
= 0.85
7.5 Competencia entre modelos de formacion de precio
Los dos modelos de formaci on de precio descriptos tienen algunas caractersticas parecidas, y otras no. A priori,
resulta tentantivo pensar que los vendedores que forman precios maximizando benecios (los llamaremos vende-
dores MaxBene) deberan poder lograr un mejor benecio si se encuentran con vendedores Brutus, debido a que
los primeros, en principio, son capaces de detectar una oportunidad de mercado mediante el tanteo que realizan.
En el siguiente experimento numerico, pusimos a competir una poblaci on de vendedores, donde la mitad
son Brutus, y la mitad restante son MaxBene. Para este experimento se eligieron los valores de comportamiento
de
up
/
down
= 1 de manera que el precio de equilibrio tentativo para los vendedores Brutus sin los vendedores
de la otra especie, sera p
eq
brutus
= 2. El experimento numerico muestra como el mercado encuentra un precio
intermedio entre el de equilibrio competitivo que correspondera a vendedores solo MaxBene y p
eq
brutus
= 2. En
color magenta, se muestra un vendedor Brutus que mec anicamente forma un precio que siempre se ubica con
precios en la mitad m as cara de todo el mercado, empujando el precio promedio del mismo por arriba de lo que
sera si el mercado est a compuesto por vendedores MaxBene, y por debajo si solo hubiera vendedores Brutus.
Modelos economicos de m ultiples agentes 10/6/2010
7.5. COMPETENCIA ENTRE MODELOS DE FORMACI

ON DE PRECIO 155
Figura 7.5: Evolucion temporal del mercado con la mitad de la poblacion
con vendedores Brutus y el resto con vendedores MaxBene. Se observa
que los vendedores MaxBene logran explotar a los Brutus. En color
magenta se indica un vendedor Brutus mostrando que estos tienden
a ser los vendedores de mayor precio en la poblacion. Parametros del
experimento: N = 40, M = 40,
down
= 0.15, = 0.10, = 0.01, c =
0.15, y

= 1
Modelos economicos de m ultiples agentes 10/6/2010
156 CAP

ITULO 7. MERCADOS Y EXPERIMENTOS


Figura 7.6: Comparacion del benecio promedio de vendedores Brutus
contra vendedores MaxBene. Se ve que para
up
0.1 ambos bene-
cios se acercan. Parametros del experimento: N = 40, M = 40,
down
=
0.15, = 0.10, = 0.01, c = 0.15, y

= 1
Modelos economicos de m ultiples agentes 10/6/2010
7.6. EXPERIMENTOS 157
7.6 Experimentos
Un ejercicio sumamente instructivo es validar los modelos te oricos descriptos anteriormente por medio de exper-
imentos con sujetos reales. Anteriormente ya se han realizado experimentos similares, ver (Kruse, Rassenti, and
Smith 1994).
Nuestro experimento se prepar o como una aplicaci on de Internet en el sitio www.elautomaeconomico.com.ar.
A los sujetos solo se les informaba el costo del bien, sus ultimas 5 jugadas (precio, cantidad vendida, benecios).
En cada paso de tiempo se les solicitaba el precio p
i
t
, y una vez que respondieran todos los del mismo experi-
mento, se le devolva el resultado de sus ventas y sus benecios. Los sujetos no conocan la cantidad de jugadores
participando en su mismo experimento, ya que el experimentador podan inicializar m as de un experimento al
mismo tiempo repartiendo los jugadores en distintos grupos independientes.
Se probaron distintas condiciones iniciales partiendo del costo del bien, o partiendo del precio de equilibrio
competitivo.
Modelos economicos de m ultiples agentes 10/6/2010
158 CAP

ITULO 7. MERCADOS Y EXPERIMENTOS


7.6.1 Partiendo del equilibrio competitivo
Figura 7.7: Series temporales del experimento 13, donde se indicaba cual
era el precio de mercado competitivo. (Arriba) Precio como funcion de
tiempo. Tambien se muestra las cantidades como fraccion de la cantidad
maxima. (Abajo) Serie temporal de los benecios promedio.Parametros
del experimento: N = 12, M = 80, p
eq
= 2.22, c = 0.90, y

= 3
Modelos economicos de m ultiples agentes 10/6/2010
7.6. EXPERIMENTOS 159
Figura 7.8: Series temporales donde se resaltan las jugadas de 3 r-
mas. (Arriba) Precio como funcion de tiempo. Tambien se mues-
tra las cantidades como fraccion de la cantidad maxima. (Abajo) Se-
rie temporal de los benecios promedio.Parametros del experimento:
N = 12, M = 80, p
eq
= 2.22, c = 0.90, y

= 3
Modelos economicos de m ultiples agentes 10/6/2010
160 CAP

ITULO 7. MERCADOS Y EXPERIMENTOS


Figura 7.9: Histogramas de precios para el experimento 13. Se descar-
taron los primeros 15 perodos. El pico alrededor de p 2.3 corresponden
a las jugadas de un solo jugador a lo largo del tiempo. Parametros del
experimento: N = 12, M = 80, p
eq
= 2.22, c = 0.90, y

= 3
Modelos economicos de m ultiples agentes 10/6/2010
7.6. EXPERIMENTOS 161
Figura 7.10: Series temporales del experimento 13, donde se muestran
la variacion de precios para un subconjunto de los agentes. La variacion
ha sido centrada alrededor de la {1, 2, 3, 4} para que sea mas clara la
variacion. Se aprecia que los cambios de precio en general disminuyen a
medida que pasa el tiempo. Parametros del experimento: N = 15, M =
200, p
eq
= 4.44, c = 0.50, y

= 3
Modelos economicos de m ultiples agentes 10/6/2010
162 CAP

ITULO 7. MERCADOS Y EXPERIMENTOS


7.6.2 Partiendo desde el precio = costo y con el ranking prendido
En este caso se informa luego de cada ronda de mercado, el ranking de precios que obtuvo en la jugada pasada.
De esta manera tienen informaci on relativa.
Figura 7.11: Series temporales del experimento 12, donde se indi-
caba cual era el precio de mercado competitivo. (Arriba) Precio como
funcion de tiempo. Tambien se muestra las cantidades como fraccion
de la cantidad maxima. (Abajo) Serie temporal de los benecios prome-
dio.Parametros del experimento: N = 15, M = 200, p
eq
= 4.44, c =
0.50, y

= 3
Modelos economicos de m ultiples agentes 10/6/2010
7.6. EXPERIMENTOS 163
Figura 7.12: Histogramas de precios para el experimento 12. Se descar-
taron los primeros 15 perodos. El pico alrededor de p 2.3 corresponden
a las jugadas de un solo jugador a lo largo del tiempo. Parametros del
experimento: N = 15, M = 200, p
eq
= 4.44, c = 0.50, y

= 3
Modelos economicos de m ultiples agentes 10/6/2010
164 CAP

ITULO 7. MERCADOS Y EXPERIMENTOS


7.6.3 Resultados estadsticos
Una manera de cuanticar las jugadas realizadas por cada jugador en cada experimento, es contar los distintos
eventos y denir probabilidades de transiciones: ej. cu al es la probabilidad que un sujeto que haya vendido toda
su producci on baje su precio el pr oximo perodo?
Analisis con antecendete de cantidades
En la siguiente tabla mostramos los resultados del experimento 13 dado el antecedente |y
t
= 0, 0 < y
t
< y

, y
t
=
y

.
Jugador 9 10 11 12 13 15 17 19 20 22 23 25 totales
y
t
= y

39 31 32 31 41 42 38 33 37 37 32 45 438
y
t
= y

y p
t+1
> 0 15 27 23 17 29 30 32 15 15 14 19 14 250
y
t
= y

y p
t+1
= 0 20 4 9 14 2 9 5 15 21 22 9 25 155
0 < y
t
< y

6 3 7 9 2 3 2 4 5 5 6 2 54
y
t
< y

y p
t+1
> 0 0 0 0 0 0 0 1 1 0 0 2 0 4
y
t
< y

y p
t+1
= 0 0 0 1 0 0 0 0 1 1 0 0 0 3
y
t
= 0 3 14 9 8 5 3 8 11 6 6 10 1 84
y
t
= 0 y p
t+1
> 0 0 1 0 0 0 0 0 0 0 0 0 0 1
y
t
= 0 y p
t+1
= 0 0 0 0 0 0 1 0 0 0 1 0 0 2
de donde obtenemos las siguientes probabilidades de transici on :
prior p
t+1
< 0 p
t+1
= 0 p
t+1
> 0 total events
y
t
= y

0.08 0.35 0.57 (438)


0 < y
t
< y

0.87 0.06 0.07 (54)


y
t
= 0 0.97 0.02 0.01 (84)
Si miramos cuanto aumentaron o disminuyeron en cada paso de tiempo los jugadores, obtenemos tomando
toda la serie temporal:
Jug. 9 10 11 12 13 15 17 19 20 22 23 25

up
0.14 0.04 0.07 0.07 0.06 0.13 0.07 0.15 0.09 0.07 0.07 0.02

down
-0.12 -0.03 -0.08 -0.04 -0.07 -0.42 -0.24 -0.12 -0.24 -0.04 -0.10 -0.09
[
up
/
down
[ 1.12 1.16 0.88 1.74 0.79 0.28 0.27 1.28 0.38 1.57 0.73 0.24
que da un promedio
up
) = 0.08,
down
) = 0.13 y [
up
/
down
[) = 0.87.
Descartando el transitorio
Si de todas las series temporales, solamente la ultima mitad de los puntos (para descartar la aproximaci on al
estado estacionario), obtenemos:
de donde obtenemos las siguientes probabilidades de transici on :
prior p
t+1
< 0 p
t+1
= 0 p
t+1
> 0 total events
y
t
= y

0.07 0.50 0.43 (218)


0 < y
t
< y

0.84 0.12 0.04 (25)


y
t
= 0 0.96 0.04 0.00 (45)
Jug. 9 10 11 12 13 15 17 19 20 22 23 25

up
0.14 0.013 0.017 0.075 0.02 0.24 0.02 0.02 0.03 0.010 0.015 0.01

down
-0.08 -0.019 -0.031 -0.014 -0.04 -0.50 -0.11 -0.02 -0.06 -0.017 -0.018 -0.01
[
up
/
down
[ 1.74 0.70 0.54 0.52 0.55 0.48 0.19 0.94 0.53 0.60 0.84 1
Modelos economicos de m ultiples agentes 10/6/2010
7.7. CONCLUSIONES 165
que da un promedio
up
) = 0.045,
down
) = 0.076 y [
up
/
down
[) = 0.72. El valor del precio estacionario
para este mercado, sera del orden de p) = p
eq
(1 h
down
+ h
up

up
/
down
) 1.19 que se compara con
p) = 1.21 0.1 del experimento 13.
En la g. 7.13 se muestra un ejemplo donde cuando vende todo con una determinada probabilidad h, no
cambia el precio.
Figura 7.13: (Arriba) Evolucion temporal del precio promedio del mer-
cado, su valor maximo y mnimo para el modelo Brutus, con prob-
abilidad h = 0.35 no cambia el precio cuando vende todo, y la mi-
tad de la poblacion tiene
up
=
down
= 0.08 y el resto tiene

up
= 0.08,
down
= 0.1. Tambien se muestra en color magenta
el precio de un solo vendedor, mostrando su comportamiento. Pre-
cio promedio en t = 200 es p
200
= 1.53. (Abajo) Evolucion tempo-
ral del benecio promedio del mercado. Parametros del experimento:
N = 15, M = 15, c = 0.15, p
eq
= 1, y

= 1, b
eq
= 0.85
7.7 Conclusiones
En este Captulo se avanz o sobre un modelo de mercado minimal, cuya principal caracterstica era su simplicidad
frente al tipo de comportamiento esperado. El mismo pudo contrastarse mediante un experimento, que arroja
resultados alentadores en cuanto permite estimar el precio promedio del mercado, y en principio sera posible
estimar como es la dependencia funcional de dicho precio cambiando el n umero de jugadores N.
Modelos economicos de m ultiples agentes 10/6/2010
166 CAP

ITULO 7. MERCADOS Y EXPERIMENTOS


Modelos economicos de m ultiples agentes 10/6/2010
Bibliografa
Adamic, L. A., R. M. Lukose, A. R. Puniyani, and B. A. Huberman (2001): Search in power-law networks,
Physica Review E, 64, 046135.
Albert, R., and A.-L. Barab asi (2002): Statistical Mechanics of Complex Networks, Rev. Modern Physics,
4, 4797.
Anderson, P. (1972): More is Dierent, Science, 177(4047), 393396.
Axelrod, R. (1984): The Evolution of Cooperation. Basic Books, New York.
Bak, P., K. Chen, J. A. Scheinkman, and M. Woodford (1993): Aggregate Fuctuations From Indepen-
dent Sectoral Shock: self-organized criticality in a model of production and inventory dynamics, Ricerche
Economiche, 47, 330.
Bak, P., C. Tang, and K. Wiesenfeld (1999): Self-Organized Criticality, Phys. Rev. A, 38(16), 364374.
Barabasi, A.-L. (2003): Linked: How Everything Is Connected to Everything Else and What It Means. Plume.
Barab asi, A.-L., and R. Albert (1999): Emergence of scaling in Random Networks, Science, 286, 509512.
Bikhchandani, S., D. Hirshleifer, and I. Welch (1992): A theory of fads, fashion, custom and cultural
change as information cascade, Journal of Political Economy, 100, 9921026.
(1998): Learning from the behavior of others: conformity, fads and informational cascades, The Journal
of Economic Perspective, 12, 151179.
Blume, L. E. (1993): The Statistical Mechanics of Strategic Interaction, Games and Strategic Behavior, 5,
387424.
Chomsky, N. (1990): Modular Approaches to the Study of the Mind. San Diego State University, San Diego,
USA.
Daniels, M. G., J. D. Farmer, G. Iori, and E. Smith (2003): Quantitative model of price diusion and
market friction based on trading as a mechanistic random process, Phys. Rev. Lett., 90, 108102.
Dodds, P. S., R. Muhamad, and D. J. Watts (2003): An Experimental Study of Search in Global Social
Networks, Science, 301, 827829.
Dragalescu, A. A. (2003): Applications of Physics to Economics and Finance: Money, Income, Wealth, and
the Stock Market, .
Edgeworth, F. Y. (1897): La teoria pura del monopolio, Giornale degli Economisti,
http://cepa.newschool.edu/het/texts/edgeworth/edgepapers.htm.
Granovetter, M. (1975a): The Strength of Weak Ties, Americal Journal of Sociology, 78(6), 13601380.
(1975b): Threshold Models of Collective Behavior, Americal Journal of Sociology, 83(6), 14201443.
Jaynes, M. O. (1957): Information Theory and Statistical Mechanics, Physical Review, 106(4), 620630.
Kadanoff, L. (1993): From Order to Chaos, Essays: Critical, Chaotic and Otherwise. World Scientic.
Khinchin, A. I. (1949): Mathematical foundations of statistical mechanics. Dover,New York.
Kirkpatrick, S., C. D. Gelatt, Jr., and M. P. Vecchi (1983): Optimization by Simulated Annealing,
Science, 220, 671680.
167
168 BIBLIOGRAF

IA
Kleinberg, J. (2000): Navigation in Small World, Nature, 406, 845.
Kruse, J., S. Rassenti, and V. Smith (1994): Bertrand-Edgeworth Competition in Experimental Markets,
Econometrica, 62, 343372.
Mantegna, R. N., and H. E. Stanley (1995): Scaling Behviour in the Dynamics of an Economic Index,
Nature, 376(6), 4649.
Newman, M. E. J. (2005): Power laws, Pareto distributions and Zipfs law, Contemporary Physics, 46, 323
351, condmat/0412004v3.
Nowak, M. A., S. Bonhoeffer, and R. M. May (1994): Spatial Games and the Maintenance of Cooperation,
Proc. Natl. Acad. Sci. USA, 91, 48774881.
Nowak, M. A., and R. M. May (1992): Evolutionary Games and Spatial Chaos, Nature, 359, 826829.
Pastor-Satorras, R., and A. Vespignani (2001): Epidemic Spreading in Scale-Free Networks, Phys. Rev.
Lett., 86(14), 32003203.
Schelling, T. (1971): Dynamic Models of Segregation, Journal of Mathematical Sociology, 1, 143186.
Shannon, C. E. (1948): A Mathematical Theory of Communication, The Bell Systema Technical Journal, 27,
379423,623656.
Silva, A. C., and V. Yakovenko (2004): Temporal Evolution of the thermal and superthermal Income
Classes in the USA During 19832001, Europhysics Letters, e-print arXiv:cond-mat/0406385v3.
Smith, E., J. D. Farmer, L. Gillemot, and S. Krishnamurthy (2002): Statistical theory of the continuous
double auction, Quantitative Finance, e-print cond-mat/0210475.
T. Gross, C. J. Dommar, D. L., and B. Blasius (2006): Epidemic Dynamics on an Adaptive Network,
Physical Review Letters, 96, 208271.
Watts, D. J. (2002): A simple model of global cascades on random networks, Proc. National Academy of
Science, 99(9), 57665771.
Watts, D. J., and S. H. Strogatz (1998): Collective dynamics of small-world networks, Nature, 393, 440
442.
Weiss, G. (1999): Multiagent Systems. A Modern Approach to Distributed Artical Intelligence. The MIT Press.
Wolfram, S. (1984): Universality and complexity in cellular automata, Physica D, 10, 135.
Modelos economicos de m ultiples agentes 10/6/2010

S-ar putea să vă placă și