Documente Academic
Documente Profesional
Documente Cultură
ON TRADICIONAL EN ECONOM
IA 7
est a claro como se extienden dichos resultados a entornos con muchos individuos, como los que ocurren en nuestra
realidad cotidiana.
Desde este punto de vista, uno de los objetivos centrales de este trabajo es mostrar como el enfasis
propuesto por los sistemas complejos sobre las conductas individuales de una mnima complejidad para focalizarse
en el problema que surgen de la agregaci on de conductas debido a las m ultiples interacciones, pueden aportar una
visi on refrescante a los modelos econ omicos, y preparar el campo para una nueva oleada de modelos focalizados en
hechos estilizados observados en la realidad. Este es el desao que queda por delante para las futuras generaciones
de cientcos.
Modelos economicos de m ultiples agentes 10/6/2010
8 CAP
ON Y COMPLEJIDAD 11
2.2 Evoluci on y complejidad
Los ejemplos anteriores indican que la evoluci on de los AC pueden poseer diverso grado de complejidad. Esta
idea est a en todos los casos ligada a la informaci on contenida en el sistema y en su evoluci on. Hay dos posibles
enfoques para acercarnos a una denici on cuantitativa. Uno es est atico y liga la complejidad a la multitud de
elementos que forman el sistema y su mutua dependencia. Por lo general se la suele medir por la cantidad de
Figura 2.2: Ejemplo de evolucion de automatas unidimensionales or-
denados. Uno es determinista y el otro es estocastico o aleatorio. La
actualizacion de cada sitio se efect ua con la funcion booleana que se
indica al costado del dibujo. Las dos entradas son el estado de los dos
sitios vecinos a la derecha y a la izquierda. Los sitios en 1 tiene color ob-
scuro e instantes sucesivos estan gracados en renglones contiguos hacia
arriba. La condicion inicial es la misma para ambas evoluciones y es que
el casillero central esta en 1 y los restantes en 0.
informaci on que es necesario dar para especicar el sistema integramente y, si se la mide en bits, se la dene como
S = log
2
() (2.4)
En esta ecuaci on es la cantidad de estados del sistema y S es la entropa del sistema. Para ligar la dencion
2.4 con la termodin amica se la debe multiplicar por la constante de Boltzmann k 1.38 Joule/
o
Kelvin.
El otro abordaje para denir cuantitativamente complejidad es din amico. Es el que se ha siguido en la
clasicaci on de los AC hecha por Wolfram y es la que seguiremos nosotros ahora. En este segundo enfoque (que
no es independiente del anterior), un comportamiento complejo est a asociado a lo intrincada que es la evolucion
Modelos economicos de m ultiples agentes 10/6/2010
12 CAP
, a
, S, a donde
1. indica el movimiento de la cabeza lectora y |I, D, H donde I (D) indica desplazamiento de un sitio
hacia la izquiera (derecha) y H indica que la cabeza se detiene.
2. S
, a
4. Escribe el caracter a
(t) y la posicion en la cinta son funciones del tiempo y las instrucciones cumplen el papel de una matriz
de transici on determinista cuyos elementos vinculan el estado, el caracter y la ubicaci on en el instante t y los
correspondientes en el instante t + 1.
EJEMPLO S
S a COMENTARIO
Ejemplo 1(*) H S
1
0 S
1
1 Parte de (S
1
,1); cambia por
(S
1
,0); se detiene
Ejemplo 2(**) D S
2
1 S
1
1 Parte de (S
1
,1); cambia por
(S
2
,1); va a la derecha
I S
1
1 S
2
1 Estaba en S
2
,lee 1; cambia por
(S
1
,1); va a la izquierda
(*) Se supone que la cabeza lectora enfrenta incialmente un 1. La instrucci on s olo cambia el contenido de la cinta
por un 0 y se detiene. (**)Se supone que la cabeza lectora enfrenta inicialmente un 1 que tiene a su derecha otro
1. Con estas instrucciones y esos datos en la cinta, el programa no se detiene nunca.
Ejercicio 1 Suponga que en la cinta hay un n umero de casilleros ocupados por 1s y la cabeza lectora est a lejos, a
la izquierda del primer 1 y en un estado S
0
Escriba una secuencia de instrucciones que agregue un 1 a la derecha
del ultimo 1.
Respuesta
1. D; S0, 0; S0, 1
2. D; S1, 1; S0, 0
3. H; S0, 1; S1, 0
4. D; S1, 1; S1, 1
Si se representa un n umero natural por igual n umero de 1s (representaci on unaria), el programa anterior
es equivalente a la instrucci on de sumar 1 al n umero inicial. De este modo se puede programar tambien operaciones
m as complejas como la substracci on, la multiplicaci on y la divisi on entera. Resulta obvio que con una MT es
Modelos economicos de m ultiples agentes 10/6/2010
2.4. AUT
) con P(S) = probabilidad de ocurrencia de una gota de tama no S). Cuando una
distribuci on posee este compatimiento es facil ver que no existe un valor medio nito. En este caso se suele decir
que esta distribuci on no posee un tama no caracterstico (ver panel central de la g. 2.6 o bien la conguraci on
limite alcanzada al cabo de 50 iteraciones en g. 2.5). Si p
c
> 0.25 el punto jo es uno en que todo el espacio
pertenece a la fase condensada. En el tercer panel del la g. 2.6 se muestra el estado del AC al cabo de 50
iteraciones, justamente antes que el espacio sea integramente ocupado por la fase condensada. Observese que en
este panel abundan las concavidades que deben ser r apidamente llenadas en sucesivas iteraciones.
2.4.2 El juego de la vida de Conway
Un at omata bidimensional extremadamente popular es el llamado juego de la vida de Conway. Este aut omata
demuestra de manera terminante c omo reglas extremadamente sencillas pueden dar lugar a comportamientos
colectivos de una enorme complejidad. Las reglas del juego condensan criterios elementales de supervivencia y
reproduccion y parte de condiciones iniciales en las que alg un n umero de sitios estan ocupados por celulas vivas
y otros sitios por celulas muertas. La din amica surge del hecho que celulas pueden nacer a la vida o morir.
Aun cuando las reglas son en extremo simples y absolutamente deterministas el AC tiene una evoluci on
que muestra un tipo particular de inestabilidad: aun partiendo de condiciones iniciales muy parecidas entre si,
la evoluci on temporal puede conducir al AC a conguraciones que se alejan arbitrariamente unas de otras. Una
manera de medir la distancia entre conguraciones es mediante la distancia de Hamming, o sea por el n umero de
celulas que est an en estados diferentes.
En alguna oportunidad este AC fue utilizado para argumentar sobre lo impredecible que puede llegar a ser
la conducta de una sociedad. En realidad, este es un excelente ejemplo para demostrar la falacidad de presuponer
Modelos economicos de m ultiples agentes 10/6/2010
18 CAP
i
P
(1)
i
. Se establece adem as que el valor imputado a una propiedad ocupada por un agente del color X,
es
P(X) = A[((X) ((X)] +B (para la alternativa 1) (2.5)
P(X) = A[((X) ((X)] +B (para la alternativa 2) (2.6)
donde ((X) indica la cantidad de agentes del color X en su vecindad inmediata (incluyendolo a el mismo). Las
constantes A y B (A y B) aseguran que P sea no negativo.
La din amica para las transacciones tiene en cuenta el hecho que las mismas deben redundar en benecio
de ambos agentes, para ello se procede la manera siguiente:
1. Dos agentes son elegidos al azar. Cada uno ja el precio que pagaran por la propiedad del otro
2. Se ja un precio de transacci on que es el promedio de ambos valores
3. Ambos agentes se intercambian sus propiedades s olo si se dan las dos siguientes condiciones: a) El agente
due no de la propiedad m as barata puede pagar la diferencia de precio, y b) Ambos agentes mejoran su
utilidad.
4. La dinamica se detiene cuando no se pueden concertar transacciones durante un n umero preestablecido de
sorteos de pares de agentes
En estas condiciones son varias las preguntas que uno se puede formular, por ejemplo: Subsiste la seg-
regaci on detectada en el modelo de Schelling?; d onde se concentran los agentes descontentos? c omo es la
convergencia?,Se alcanza un orden perfecto?, etc.
En la g. 2.11 se muestran algunos resultados en las que se analiz o la alternativa en que es favorable
pertenecer a la mayora (se utiliza la regla (2.6)). En estos experuimentos se puede observar el efecto de un
cambio en las preferencias de los agentes: en el panel (A) los agentes obtiene una mayor utilidad de una mejor
propiedad mientras que en el panel (B) y (C) preeren crecientemente disponer de un mayor capital. Para obtener
estos resultados se estableci o que todos los agentes inicialmente poseen el mismo capital (K = 1) y solamente
dieren por su color. Las curvas son de igual utilidad y la convenci on de colores es la misma que la geogr aca
(azulk, celeste, verde, marr on y rojo): los azules corresponden a valores bajos, y los rojos corresponden a valores
elevados. En todos estos casos se convirgi o a un estado estacionario. El nivel de segregaci on que se alcanza es
menor que en el modelo original de Schelling. En realidad, esta es tanto menor cuanto m as relevancia tiene el
capital en la utilidad de los agentes. La imposici on de restricciones economicas para la reubicaci on de los agentes
diculta alcanzar segregaciones mayores y la convergencia es menos ecaz ya que no siempre se pueden reubicar
agentes. Las mayores utilidades se obtienen en el medio de los ghettos y las menores utilidades se producen en
las fronteras, independientemente del valor de . Para = 0.5 (Panel B) las curvas de nivel de K y U resultan
ser muy semejantes. Los menores capitales y utilidades se concentran en las fronteras. Se trata de agentes que
no poseen recursos para buscar mejores ubicaciones aun cuando su utilidad es baja. Los m aximos de capital son
aislados y no se producen necesariamente en el medio de las zonas segregadas.
2.4.5 Dilema del Prisionero Espacial
Otro ejemplo de aut omata celular es el Dilema del Prisionero Espacial. Este juego fue propuesto en (Axelrod
1984), (Nowak and May 1992) y (Nowak, Bonhoeer, and May 1994), como un simple mecanismo por el cual la
cooperaci on tiene una posibilidad de sobrevivir frente a los free-riders.
Modelos economicos de m ultiples agentes 10/6/2010
26 CAP
ISTICOS
que las mismas siguen una distribuci on de Maxwell-Boltzmann (es una distribuci on Normal en v). A una
misma temperatura, los atomos de hidr ogeno viajan 10 veces m as rapido que las de ne on, debido a su
diferencia de masas
3
.
la presi on se debe a las colisiones entre partculas de distinta velocidad, y no como crea Newton, que se
deba a la repulsi on est atica entre ellas.
el magnetismo: se pudo entender las propiedades b asicas de materiales magneticos como un fen omeno
colectivo, debido a la interacci on local (entre los vecinos) de los campos magneticos de los atomo indi-
viduales. En particular, se pudo explicar porque haba una fuerte dependencia de los materiales con la
temperatura. En este caso, a mayor temperatura se introduca mayor desorden en la orientaci on de los
campos magneticos individuales, modulando el fen omeno colectivo. Veremos en este captulo el modelo de
Ising, como modelo arquetipo de este fen omeno.
la entropa como una medida del desorden interno de un sistema. La entropa naci o en la termodinamica,
como una variable de estado que relaciona el transporte de calor a una determinada temperatura. Asi
mismo, la segunda ley de la termodin amica postula que la entropa de un sistema cerrado o se mantiene
constante o siempre aumenta, llevando a los sistemas a un estado de m aximo desorden. Uno de los logros
m as destacados de la mec anica estadstica es darle un signicado preciso a la entropa, como el grado de
desorden interno del sistema representado por la distribuci on de probabilidad sobre los estados posibles del
sistema.
En este captulo nos proponemos explorar un camino semejante en sistemas sociales o econ omicos. Es
una propuesta altamente riesgosa, aunque creemos que los vnculos y lecciones que podemos obtener lo justican.
Ya han habido acercamientos semejantes, por ejemplo en la teora de juegos (Blume 1993) y en los mercados
nancieros (Smith, Farmer, Gillemot, and Krishnamurthy 2002, Daniels, Farmer, Iori, and Smith 2003).
Por un lado, en el estudio de sistema sociales tambien surgen par ametros de naturaleza colectiva, como
por ejemplo, los que representan valores agregados de actividades econ omicas (producto bruto interno, ahorro,
inversi on), y otros que miden el desempe no del sistema econ omico en su conjunto (tasa de interes, los ndices
de precios o la productividad). Sabemos que dichos par ametros de alg un modo est an ligados al comportamiento
individual de los agentes (personas o rmas). Justamente, como carecemos de una teora an aloga a la mec anica
de Newton que nos indique como se mueven detalladamente los elementos individuales, es que proponemos en este
captulo formalizar modelos de m ultiples agentes a partir de comportamientos y conductas individuales plausibles,
y permitan caracterizar las variables colectivas.
Antes de comenzar, es importante resaltar las siguientes cuestiones para este captulo:
Uno de los elementos centrales de la mec anica estadstica fue el uso de las distribuciones de probabilidades
como vehculo que permite retener las caractersticas colectivas del observable, abstrayendose del detalle
de cada elemento individual. Dichas distribuciones contienen esencialmente informacion sobre frecuencia
de ocurrencia del observable en cuesti on y f acilmente permite obtener el valor medio y el tama no tpico
de las uctuaciones.
La noci on de equilibrio conocida y aplicada en los sistemas sociales puede tener un signicado diferente
de la utilizada en los modelos estadsticos, y conviene en este punto detenerse por un instante. Por un
lado la teora de juegos provee una noci on de equilibrio de Nash, an aloga a la de punto jo en sistemas
din amicos. La misma descansa en resolver una ecuaci on algebr aica, obteniendo un valor jo y constante.
En los modelos estadsticos, dicho equilibrio no es alcanzable frente al componente estoc astico que tiene
dichos sistemas. La noci on de equilibrio suele por lo general estar asociada al equilibrio termodin amico
donde las distribuciones de probabilidad de las cantidades relevantes son estacionarias (no cambian en el
tiempo) y por lo tanto hay un valor medio bien denido y constante. En muchos casos, llevando el sistema
a un n umero cada vez mayor de elementos (el limite termodin amico), suele acelerar su convergencia al
equilibrio termodin amico, haciendo que las distribuciones tengan una varianza cada vez menor.
El abordaje estadstico posee adem as el atractivo de estar en buenas condiciones para salvar, o al menos
anticipar o calicar, la cat astrofe de las multitudes a las que se hizo menci on en el Captulo 1. All se
3
Para una interesante simulaci on numerica de dos gases en un contenedor, y como es su distribuci on de
velocidades, visitar http://intro.chem.okstate.edu/1314F00/Laboratory/GLP.htm
Modelos economicos de m ultiples agentes 10/6/2010
3.2. ENTROP
ON 31
enfatiz o que el mero agregado de elementos de la misma naturaleza puede dar lugar a sistemas que poseen
una nueva identidad. El grado de orden o de desorden interno que pueda alcanzar el sistema debe traslucirse
en densidades de probabilidad y los cambios abruptos en su estructura o naturaleza deben manifestarse
en comportamientos singulares de esas mismas distribuciones. Anticiparemos un ejemplo de estos cambios
abruptos en una transicion de fase.
Los punto jos en la evoluci on de un sistema as como los estados estacionarias suelen por su parte asimilarse
a situaciones de equilibrio. Existen diferencias importantes en el concepto de equilibrio propio de las ciencias de
la naturaleza y el que provienen de la economa. Mientras que el equilibrio econ omico tiende a ser concebido
como una situaci on est atica en que los agentes producen o consumen cantidades jas a precios constantes, el
equilibrio mec anico o termodin amico es compatible con uctuaciones o aun variaciones temporales que, de todos
modos, preservan constants los valores medios que denen el estado del sistema. El calculo de promedios est a por
consiguiente estrechamente ligado con el concepto y la denic on de equilibrio.
Las principales dicultades conceptuales para salvar la brecha que media entre los comportamientos in-
dividuales y los colectivos, o, lo que es equivalente, calcular valores medios en sistemas sociales son al menos
dos. Una es inherente a la complejidad de los actores elementales: mientras que en el estudio de la naturaleza
los atomos o moleculas obedecen leyes precisas y conocidas, en el caso de sistemas sociales, se trata de agentes
capaces de comportamientos elaborados y que raramente son repetitivos.
La segunda gran dicultad reside en el hecho que esos actores elementales son numerossimos en el caso
de la naturaleza donde la cantidad relevante es el n umero de Avogadro N
A
10
23
mientras que son muy pocos
en el caso de las ciencias sociales o la economa. Tengase presente que aun considerando la poblaci on mundial de
10
9
individuos se est a abrumadoramente lejos de la cantidad de partculas que hay en pocos gramos de gas.
Que las partculas sean muy numerosas hace que el calculo de promedios sea signicativo y que las uctuaciones
puedan en general ser despreciadas. Lo reducido del n umero de agentes en sistemas econ omicos puede bien hacer
que los promedios dejen de ser signicativos y las uctuaciones pasen a ser tan importantes que sean las que
efectivamente dominen.
En las secciones que siguen vamos a introducir la entropa como una medida del desorden. Luego se
introducir a el Principio de M axima Entropa que ofrece una receta sobre el tipo de distribuciones posibles seg un
las restricciones del problema. Discutimos a continuaci on dos problemas con motivaci on econ omica y un fuerte
sesgo estadstico: el primero corresponde a loteras bilaterales y se estudia una ecuaci on de evoluci on para la
distribuci on de probabilidades. El segundo es una extension de los intercambios de Edgeworth, pero repetitivos y
en una poblaci on de N jugadores. Finalmente, discutimos un modelo de los medios magneticos, que tiene posibles
aplicaciones en sistemas sociales donde se involucra una decisi on binaria, muchos jugadores e interacciones locales.
El mismo tiene como principal caracterstica una transicion de fase. Finalmente, se discute mas en general un
metodo de optimizaci on global conocido como recocido simulado.
3.2 Entropa, desorden e informacion
El concepto de entropa surgi o orginalmente en la termodin amica. Si bien era un concepto central, su inter-
pretaci on microsc opica se pudo dar gracias al surgimiento de la mec anica estadstica. La misma consista en
asociar la entropa de un sistema como una medida de desorden del sistema. Esta idea trascendi o la frontera de la
fsica y fue adoptado por Shannon para dar origen a la teora de la informaci on, interpretando la entropa como
una medida de informacion.
Comenzamos discutiendo como medir desorden en un sistema. Tomemos un automata celular (AC) con que
evoluciona de acuerdo con su regla de actualizaci on visitando en cada momento alguno de las 2
N
conguraciones
posibles. Podemos interpretar este sistema como un emisor de caracteres X
i
(las conguraciones de las N celdas)
de un alfabeto / de [/[ = 2
N
smbolos. Comparemos la situaci on (A) donde el AC alcanza un punto jo y la
secuencia de caracteres que se emiten contiene siempre un mismo smbolo, y (B) para un AC de Tipo III hemos
discutido que la secuencia de caracteres emitidos contendr a siempre smbolos diferentes y terminar a por agotar
toda la lista de los 2
N
smbolos del alfabeto.
Est a claro que la situaci on (B) es m as desordenada que la (A). Una primera medida de desorden, podra
ser por ejemplo hacerla proporcional a la cantidad de smbolos accesibles por la din amica. Para el caso (A) est a
Modelos economicos de m ultiples agentes 10/6/2010
32 CAP
ISTICOS
claro que la cantidad de smbolos es menor que el tama no del alfabeto, mientras que para el caso (B) si se itera
suciente tiempo, la cantidad de smbolos es igual al tama no del alfabeto. El desorden medido de esta forma fue
la base de la primera interpretaci on microsc opica de entropa dada por Boltzman, quien la deni o como
S(X) = log
X
(3.1)
donde
X
= [/[ es la cantidad de estados accesibles del sistema
4
. La entropa se mide en bits si el logaritmo es
base 2 y en nats en base 10. Si los mensajes transmitidos tienen = 2
N
posibles conguraciones, la entropa
m axima de Boltzman (es decir cantidad de estados accesibles) sera de N bits.
Porque la entropa es logartmica?
Las variables de estado en la termodin amica se clasican seg un sean intesivas
o extensivas. Se dice que la temperatura o presion son intensivas ya que son
independiente del tama no del sistema; mientras que las variables como volumen,
o entropa son extensivas porque son proporcionales al tama no del sistema.
Desde la termodin amica hay argumentos como para justicar que en general la
entropa debe ser extensible. En un marco general, a priori uno esperara que el
desorden sea una variable extensiva. Veremos m as adelante que hay sistemas con
fuertes correlaciones internas que al aumentar su su tama no, la entropa no se
comporta como extensiva.
Por lo tanto veamos que sucede si ponemos en contacto dos sistemas indepen-
dientes, o con correlaci on tan debil que rapidamente se anula en el tiempo. Si
uno de los sistemas emite smbolos X
i
, y el otro que emite smbolos Y
i
, el desor-
den conjunto o la entropa conjunta podra visitar
X
Y
estados, con lo que la
entropa conjunta queda
S(X, Y ) = log(
X
Y
) = log(
X
) + log(
Y
) = S(X) +S(Y ) (3.2)
Esta primera aproximaci on de medida del desorden o entropa como proporcional al n umero de estados
accesibles es, sin embargo, insuciente para distinguir el desorden entre dos sistemas que poseen la misma cantidad
de estados accesibles . Imaginemos, por caso, uno de los sistemas visita todos los estados accesibles con la
misma frecuencia, mientras que el otro sistema visita 100 veces m as frecuente una mitad de los smbolos que
la otra. Es evidente que el primer caso es m as desordenado que el segundo, y la manera de distinguirlos es
utilizando las probabilidades de ocurrencias de los smbolos: podes decir que un smbolo muy probable produce
poca sorpresa, mientras que lo contrario ocurre con aquellos smbolos poco probables. Por lo tanto si suponemos
que la sorpresa del smbolo X
i
es proporcional a log(1/P(X
i
)), Gibbs propuso como medida de entropa del
sistema al promedio de la sorpresa que aporta cada smbolo:
Denici on 7 (Entropa de Gibbs) Sea X una variable aleatoria discreta cuyas realizaciones X
i
pertenecen a
un alfabeto nito / y sea P(X
i
) la distribuci on de probabilidad de las mismas, P(X = X
i
) con X
i
/. La
entropa de la variable aleatoria X se dene como
S(X) =
X
i
P(X
i
) log(1/P(X
i
)) =
X
i
P(X
i
) log(P(X
i
)) (3.3)
Esta denicion se extiende al caso de variables continuas X con una medida (X) reemplazando la suma por una
integral
S(X) =
Z
A
P(X) log(P(X))d(X) (3.4)
4
La expresion (3.1) est a grabada en su l apida por considerarla su m aximo descubrimiento.
Modelos economicos de m ultiples agentes 10/6/2010
3.2. ENTROP
ON 33
Esta nueva denici on tiene en cuenta la frecuencia de ocurrencia, por lo que medir a el desorden contemp-
lando n umero de estados accesibles, pero tambien su importancia relativa en el curso del tiempo. Se ve que puede
haber smbolos del alfabeto de muy baja probabilidad, pero con un gran n umero, con lo que puede dominar la
entropa del sistema.
Veamos los siguientes ejemplos:
Se un sistema donde la frecuencias de ocurrencia de cada smbolo X
i
es equiprobable, P(X
i
) = 1/
X
, la
entropa de Gibbs (3.3) coincide con la denici on de Boltzman (3.1).
el valor de la entropa es m axima, cuando la distribuci on P es equiprobable o uniforme (ver ejemplo 3.3).
Si uno de los smbolos tiene probabilidad cero, este no contribuye a la entropa de Gibbs (aqu nuevamente
se ve la diferencia entre la entropa de Gibbs y de Boltzman).
Una memoria de 4 bits, tiene = 2
4
conguraciones, y si cada sbolo es equiprobable, la entropa de
Gibbs es S = log
2
2
4
= 4 bits. Supongamos que agregamos una nueva memoria de 3 bits. Si asumimos
independencia de las conguraciones de este subsistema con el original, la nueva entropa ser a de 7 bits,
ya que
= 2
4
2
3
= 2
7
.
el ADN de nuestras celulas se puede ver como una cadena de 10
10
pares de bases. Los pares de bases puede
ser: C-G,T-A,G-C,A-T, es decir 4 smbolos. La molecula puede estar por lo tanto en uno de los = 4
10
10
conguraciones, con lo que el contenido de informaci on (suponiendo independencia de la ocurrencia de
pares de bases) es S = 2
10
10
bits.
Porque la sorpresa es logaritmica?
Nuevamente veamos como la propiedad de los logaritmos y el concepto de inde-
pendencia de probabilidad motivan su uso en la denici on de sorpresa. Sabemos
que la probabilidad conjunta de dos variables aleatorias independientes x X e
y Y es factorizable (separable) en el producto de cada una,
P(x, y) = P(x)P(y) (3.5)
Nos gustara por otra parte que la medida del contenido de informaci on sea adi-
tiva, es decir que si tengo la medida de informaci on de x, y quiero agregarle
los eventos y, la medida de informaci on de x e y sea la suma. Vemos que si
calculamos la entropa de x e y:
S(x, y) = log
1
P(x, y)
= log
1
P(x)P(y)
= log
1
P(x)
+ log
1
P(y)
= S(x) +S(y) (3.6)
para variables aleatorias x e y independientes.
Verique que el mismo resultado aplica para S(X, Y ) =
P
P(X, Y ) log
1
P(X,Y )
.
Ejercicio 5 Programar un AC de cada una de las clases introducidas en el captulo 2. Permitir que evolucionen
hasta obtener una muestra representativa de los estados a los que convergen y poder asignarles una probabilidad.
Calcular numericamente la entropa asociado a cada uno.
La denci on dada arriba posee un ambito de validez mucho mayor que el originalmente pensado por
Gibbs. De hecho Shannon (1948) y Khinchin (1949) buscaron expresiones de la entropa con el requisito de
cumplir exigencias de naturaleza muy general, tales como que sea m axima cuando todas las realizaciones poseen
Modelos economicos de m ultiples agentes 10/6/2010
34 CAP
ISTICOS
la misma probabilidad, o que la inclusi on de una realizaci on de probabilidad nula no cambie su valor. En esas
condiciones demostraron que la expresi on de Gibbs es la unica que las satisface.
Distribuci on de ingreso y entropa en economa
La denic on dada arriba se utiliza en el campo economico, para caracterizar
distribuciones de ingreso o de alguna otra caracterstica. Si Y
i
es un segmento en la
distribuci on del ingreso, es posible denir la probabilidad P(Y
i
) que un habitante
seleccionado al azar de una dada poblaci on tenga un ingreso comprendido en ese
intervalo. En ese caso, la entropa S(Y ) da una idea sobre la distribuci on del
ingreso en esa poblaci on.
Ver Silva and Yakovenko (2004) para un estudio sobre la distribuci on del ingreso
en USA.
Ejercicio 6 (Entropa y distribuci on de ingreso) Discuta los siguientes
ejemplos:
El 5% de la poblaci on es analfabeta, el 70% tiene educaci on primaria, el
15% secundaria el 8% terciaria y el 2% cuaternaria. Cu al es la entropa
de la educaci on de esta sociedad?
Cual es la entropa de una distribucion del ingreso muy pareja?
Si la probabilidad de tener un ingreso y es P(y) = e
y
/A Cu al es la
entropa de la distribuci on de ingreso?
Cual es la entropa asociada a una distribuci on del ingreso que sea log-
normal?
3.3 Principio de maxima entropa
De acuerdo con la denici on de entropa de Gibbs si se pueden enumerar los estados X
i
de un sistema y se conoce
su probabilidad, o es posible hacer alguna hipotesis plausible acerca de la misma, se puede calcular la entropa
del mismo. Aqui nos vamos a ocupar de la pregunta inversa, esto es, dada alguna suposici on general sobre la
entropa, se puede obtener cu al es la distribuci on de probabilidad de una variable aleatoria X cuyas realizaciones
pueden observarse? Observese que en una multitud de casos pr acticos simplemente se supone que la variable
aleatoria cuyas realizaciones se observan obedece a una distribuci on normal y se estiman medias y varianzas como
si ese fuera efectivamente el caso. Sin embargo esta hip otesis puede ser falsa como efectivamente veremos en varios
ejemplos mas adelante.
Conocer la distribuci on de probabilidad de una variable aleatoria X permite calcular lo que se ha propuesto
desde el comienzo de este captulo, esto es, valores medios de cualquier magnitud H que sea funci on de X:
H) =
X
i
P(X
i
)H(X
i
) (3.7)
(NOTA: Observese que en la denici on de entropa se recalc o que se trata de la informaci on aportada por un
mensaje con un gran n umero de realizaciones X
i
de la variable aleatoria X. Esto indica que lo que se busca es el
valor medio de la sorpresa al observar una realizacion, o sea S(X) = log(P(X))).)
Una manera m as correcta de formular la pregunta anterior es Cu al es la distribucion de probabilidad que
s olo contiene la informaci on que se posee y que no tiene ning un otro sesgo? En respuesta a esta pregunta Jaynes
(1957) formul o el principio de m axima entropa
5
:
5
Notar Jaynes logro reescribir la mec anica estadstica a partir de este principio.
Modelos economicos de m ultiples agentes 10/6/2010
3.3. PRINCIPIO DE M
AXIMA ENTROP
IA 35
Denici on 8 (Principio de Jaynes o de maxima entropa) De todas las distribuciones de probabilidad que
son compatibles con los vnculos que operan en un sistema, la densidad de probabilidad que no contiene ning un
otro sesgo es la que maximiza la entropa.
Es util comprobar las consecuencias de este principio cuando se lo aplica a un caso en que s olo se sabe que
el sistema posee N estados y no existe vnculo adicional alguno.
Ejemplo (Maximizaci on de la entropa sin vnculos). Se trata pues que determinar P(X
i
) para i = 1, . . . N
maximizando
S(X) =
X
i=1...N
P(X
i
) log(P(X
i
)) sujeto a
X
i=1...N
P(X
i
) = 1 (3.8)
Para ello se introduce un multiplicador de Lagrange y se calcula el extremo de S +(
P
i
P(X
i
) 1). Se
obtiene:
[S +(
X
i=1...N
P(X
i
) 1)] =
X
i=1...N
P(X
i
)[log(P(X
i
) 1 +] = 0 (3.9)
con lo que log(P(X
i
)) es una constante. Una vez normalizada resulta que
P(X
i
) =
1
N
(3.10)
resultando la distribuci on uniforme.
En otras palabras, si no se imponen vnculos de ninguna naturaleza sobre el sistema, la distribuci on
resultante es la uniforme, que claramente no tiene ning un sesgo.
3.3.1 Distribuciones debidas a un vnculo
Consideremos ahora un caso en que existen vnculos impuestos al sistema debido a los cuales algunos de los
estados son inaccesibles. Dicha inaccesibilidad se puede deber a que sobre el sistema operan restricciones sobre
alguna de sus variables. Veremos a continuaci on dos ejemplos junto a sus respectivas distribuciones: cuando una
variable de interes es constante, y otra cuando el promedio de dicha variable es constante.
Para esto es util considerar las siguientes deniciones.
Denici on 9 (Microestado. Espacio de fases) Un microestado de un sistema es una conguraci on posible
del mismo y queda especicado por el estado de cada una de sus componentes. El conjunto de todos los microestados
de un sistema conguran su espacio de fases
Ejemplos:
gas de moleculas: el microestado estara especicado por las posiciones y velocidades de todas las
moleculas que lo componen.
comunidad de N individuos que interact uan econ omicamente: un microestado podra quedar
denido por una lista con los bienes de todos ellos.
Automata Celular: un microestado es una palabra de N bits y el espacio e fases del mismo son todas
las 2
N
conguraciones posibles de las N celdas.
Por lo general, la virtual imposibilidad de conocer todos los microestados de un sistema induce a consider-
arlos descriptos por una variable aleatoria X. En los ejemplos anteriores, X es necesariamente un vector de una
cantidad muy elevada de dimensiones.
Es importante tener en cuenta que el espacio de las fases abarca la totalidad de los microestados posibles.
Importa s olo que sean posibles y por el momento, no se tiene en cuenta cu ales de ellos son probables. En su
evoluci on, un sistema puede pasar de un microestado a otro. La existencia de vnculos puede bien imponer
Modelos economicos de m ultiples agentes 10/6/2010
36 CAP
ISTICOS
restricciones en este proceso evolutivo haciendo que algunas regiones del espacio de las fases sean accesibles y
otras inaccesibles y ocurran con una probabilidad nula.
El vnculo m as sencillo que se puede imponer a los microestados es que alguna magnitud tenga el mismo
valor para todos. En el ejemplo de una comunidad en el que los microestados se describen por las tenencias de
dinero de cada agente, puede imponerse que todos los microestados tengan la misma suma M de dichas tenencias.
En un sistema mec anico esa magnitud constante para todos los microestados puede ser la energa E que, al igual
que M es expresable como alguna funci on de las coordenadas y velocidades de las partculas del sistema.
La pregunta que ahora nos formulamos es cu al es la probabilidad con que ocurren todos los microestados
con la misma cantidad de dinero M o la misma energa E. La respuesta es en realidad un caso particular de
la situaci on que ya hemos analizado. Si se llama E(X) a la magnitud que se debe ser igual para todos los
microestados este problema consiste en determinar P(X
i
) para i = 1, 2 . . . N maximizando
S(X) =
X
i=1...N
P(X
i
) log(P(X
i
)) (3.11)
sujeta a dos condiciones:
X
i=1...N
P(X
i
) = 1
E(X
i
) = E = constante
Si N(E) es el n umero de estados internos que satisfacen la segunda condici on, resulta que
P(X
i
) = 1/N(E) si E(X
i
) = E (3.12)
= 0 en cualquier otro caso (3.13)
O sea que resultan equiprobables todos los microestados del sistema que satisfacen la condici on E(X
i
) = E
jada de antemano mientras que todos los dem as tienen probabilidad nula de ocurrir. Si se substituye estas
probabilidades en la denicion (3.3), la entropa de Gibbs resulta:
S = log[N(E)] (3.14)
que es la misma (3.1) y corresponde a la cantidad de estados accesibles y se la suele mencionar como el volumen
accesible del espacio de las fases.
En general, el sistema evoluciona en el tiempo visitando distintos microestados. En el caso de una comu-
nidad de agentes, que pueden hacer transacciones transriendo dinero entre ellos, lo que cede uno lo recibe el
otro, con lo que la masa total M de dinero se mantiene constante. Algo an alogo sucede en un sistema fsico como
un gas en que las moleculas colisionan entre si cambiando sus energas individuales pero manteniendo constante
la suma de ambas. Otro ejemplo que vale la pena considerar es un AC. Puede suponerse que la magnitud E
que debe ser constante es funci on de los n umeros N
1
y N
0
que indican respectivamente cu antas celdas est an en
los estados 1 y 0. Si el AC bajo consideraci on es estoc astico como se muestra en uno de los paneles de la gura
2.2, puede bien suceder que E s olo se mantenga constante en valores medios ya que ambas cantidades N
1
y N
0
cambian con cierta probabilidad.
La porcion del espacio de las fases que corresponde, por ejemplo, a mantener M constante alberga con todo
una gran diversidad de estados. Piensese que esa condici on es compatible con que los agentes puedan distribuirse
esa cantidad de muchas maneras posibles. Lo mismo sucede con las moleculas de un gas: jar la energa es
compatible con que unas pocas moleculas se desplacen a gran velocidad y las restantes esten en reposo o que
todas se muevan a una misma velocidad intermedia. Visto desde el punto de vista de una de las partculas del gas
o desde uno de los miembros de la comunidad economica cada transacci on o cada colisi on altera el valor individual
de E. El total no cambia pero los valores para cada una de las partes que interact uan uct ua. Como tanto las
colisiones como las transacciones tienen lugar al azar estamos inducidos a analzar el problema de determinar las
probabilidades con que ocurren microestados con todos los distintos valores posibles de la variable que suponemos
constante.
Modelos economicos de m ultiples agentes 10/6/2010
3.3. PRINCIPIO DE M
AXIMA ENTROP
IA 37
En el caso de un sistema mec anico se trata de la probabilidad de ocurrencia de microestados con distinta
energa. Las energas individuales uct uan porque por lo general se supone que el sistema est a en contacto con una
fuente externa que le puede aportar o quitar energa manteniedo constante el valor medio de la misma. Enseguida
veremos que la causa de dichas uctuaciones es el aporte termico de un ba no (fuente externa) en el que se supone
inmerso el sistema.
El caso de agente econ omicos es diferente ya que la probabilidad de ocurrencia de un microestado que
corresponde a la suma M de tenencias de dinero |m
i
puede expresarse como el producto de las probabilidades
de las tenencias aisladas, o sea P(M) = P(
P
m
i
) =
Q
P(m
i
) con lo que el problema se reduce a obtener las
probabilidades P(m) de ocurrencia de agentes con una dada cantidad de dinero m.
A pesar de estas diferencias, tanto la energa E
i
de los microestados de un sistema fsico como la tenencia
m de dinero de agentes individuales son soluciones del problema de maximizar la entropa de Gibbs
S(X) =
X
i=1...N
P(X
i
) log(P(X
i
)) (3.15)
sujeta a dos condiciones. Una es la normalizaci on de las probabilidades pero la otra corresponde a la conservaci on
del valor medio de una cantidad E
i
o m
i
:
X
i=1...N
P(X
i
) = 1 (3.16)
X
i
P(X
i
)E(X
i
) E) = E (3.17)
En este caso es necesario introducir dos multiplicadores de Lagrange, uno por cada uno de los dos vnculos con lo
que queda:
P(X
i
) =
e
E(X
i
)
Z
(3.18)
Z
=
X
i
e
E(X
i
)
(3.19)
Estas ecuaciones sugieren que es poco probable que cualquier medici on que se efect ue sobre el sistema permita
observarlo en un estado con una E
i
(m
i
) elevada, mientras que es en cambio exponencialmente m as probable que
se lo detecte en un estado baja E
i
(m
i
).
La ecuaci on (3.18) recibe el nombre de distribuci on de Gibbs mientras que la funci on (3.19) que asegura que
la distribuci on de probabilidad P(X
i
) est a correctamente normalizada, recibe el nombre de funci on de partici on.
Al igual que con la entropa, estas distribuciones han probado tener vastsimas aplicaciones y muchas veces, aun
cuando no existan demostraciones rigurosas, se las supone v alidas en contextos muy diversos.
En termodin amica, el multiplicador de Lagrange que se introduce en relaci on con el segundo de los
vnculos mencionados arriba, es la inversa de la temperatura y determina una escala para las energas (o de
cualquier otra variable que se supone que est a conservada en valor medio) en esa distribuci on de probabilidad.
Para convertir las escalas de grados (para T) a dimensiones propias de una energa se suele introducir la
constante de Boltzmann k y escribir:
=
1
kT
(3.20)
La constante k no es de importancia en el presente contexto y en general ser a ignorada. Es en cambio importante
la interpretaci on estadstica de T sobre lo que volveremos en una secci on posterior. Por lo general este par ametro
se asocia con el nivel de quietud o agitaci on interna de un sistema: para muy baja temperatura, s olo son
signicativamente probables unos pocos estados de mnima energa. Para temperatura elevada sucede en cambio
que todos los estados internos del sistema tiene una probabilidad signicativa de ser observados. Se puede
suponer que cuando T es elevada, el sistema visita (puede ser observado) con probabilidad comparable tanto
en microestados de baja como de alta energa mientras que si T 0 el sistema s olo se lo observar a en su estado
de mnima energa.
Si bien es cotidiano escuchar hablar sobre una economa recalentada o sobre enfriar la economa no
es sencillo hacer una correspondencia rigurosa del concepto de temperatura a sistemas sociales. Algo se insin ua
Modelos economicos de m ultiples agentes 10/6/2010
38 CAP
ISTICOS
en el ejemplo que se trata en la pr oxima secci on. De la explicacion dada arriba surje que debera existir una
temperatura asociada a cada variable conservada en un sistema econ omico. Si se restringe este concepto a la
masa de dinero, un sistema caliente sera uno en el que el dinero est a distribudo de manera uniforme entre
todos los agentes. Una economa fra es en cambio una en la que el dinero s olo est a concentrado en una fracci on
reducidad de los agentes.
3.3.2 Loteras bilaterales y la distribuci on de Gibbs
Como primer ejemplo de economa estadstica y que es lo que pueden hacer muchos jugadores en interacci on,
seguimos lo propuesto por (Dragalescu 2003) y ya discutido en los ejemplos arriba. Consideremos un sistema
compuesto por N jugadores comprometidos en una lotera donde iterativamente se sortea un par de agentes y se
decide, al azar, quien de ellos gana una cantidad m, y quien pierde una cantidad igual.
[m
i
, m
j
] [m
i
, m
j
] [m
i
m, m
j
+m] (3.21)
donde m
j
corresponde a la cantidad de dinero que tiene el jugador j, y m
j
es el dinero de j luego de la apuesta.
En caso que el agente que pierde no pueda afrontar el pago de m, la jugada queda cancelada.
Siguiendo con la analogua de mec anica newtoniana, cada sorteo es equivalente a la colisi on de dos moleculas
en un gas: la cantidad de dinero de ambos jugadores antes y despues del sorteo es la misma (m
1
+m
2
= m
1
+m
2
),
asi como lo es la energa total antes y despues de la colision (principio de la conservaci on de la energa). Se desea
averiguar cu al es la probabilidad de ocurrencia de agentes con una tenencia de dinero m que resulte estacionaria
frente ese tipo de transacciones. Claramente, este problema se encuadra en la aplicaci on del principio de Jaynes
que acabamos de enunciar y resolver en la secci on anterior, o sea
max
{m
i
}
|
X
[P(m
i
) log(P(m
i
))] sujeto a
X
P(m
i
) = 1 y
X
m
i
P(m
i
) = M
En realidad, la propiedad ya se nalada de la factorizaci on de la probabilidad permite adelantar que la unica
forma funcional que la satisface es P(m) = Ae
m
que corresponde a la distribuci on de Gibbs. Es interesante
observar que el papel de la temperatura est a desempe nado por la cantidad promedio de dinero por agente
= 1/T = N/M = 1/m
ini
, donde m
ini
es la dotaci on inicial por jugador.
Ecuaci on maestra. En esta secci on examinaremos en mayor detalle c omo es el proceso por el que se llega
a una distribuci on de probabilidades estacionaria en este problema y el correspondiente valor de la entropa.
Para ello supondemos que en el estado inicial todos los agentes comienzan con una cantidad de dinero
m
i
= m
AXIMA ENTROP
IA 39
m = 1), respectivamente. Los ultimos dos terminos corresponden a los agentes que tenan m y pierden o ganan
m respectivamente. Con la condicion de normalizaci on
P
j=0
P(m) = 1, podemos reescribir:
P(m, t)
t
= P(m1, t)(1 P(0, t)) +P(m+ 1, t) P(m, t)(1 P(0, t)) P(m, t)
= [P(m1, t) +P(m+ 1, t) 2P(m, t)]
+P(0, t)[P(m, t) P(m1, t)] (3.23)
para m > 0
6
. Esta ecuaci on se denomina ecuaci on maestra de la evolucion de la distribuci on de probabilidad.
Los primeros 3 terminos de (3.23) corresponden a un proceso de difusi on de P(m, t). La difusi on es un
proceso fsico cotidiano, y describe muchas veces el esparcimiento en forma homogenea de materia o energa. Un
ejemplo es el calor, representada por la ecuacion del calor
t
u(x, t) =
xx
u(x, t). Si se discretiza el espacio, el
calor en u(x, t) pasa a estar posiciones discretas . . . , x 1, x, x + 1 . . . y la ecuaci on se puede reescribir como la
evoluci on de diferencias nitas
u
t
= u
x+1
+ u
x1
2u
x
, por lo que corresponde en (3.23) a una difusi on por el
espacio de las tenencias monetarias m.
Inicialmente todo el m est a por partes iguales en todos los agentes, por lo que P
0
(t = 0) = P
1
(t = 0) = 0.
Mientras esto se mantenga, P
0
se mantiene constante, y la evoluci on de P(m, t) corresponde a un proceso difusivo:
aleatoriamente algunos jugadores pasan a ganar en promedio m as sorteos, con lo que van a formar parte de la
cola ganadora de P(m, t), mientras que otros jugadores, en promedio, pierden y contribuyen a la agrandar la
cola perdedora de la distribuci on. Si se graca P(m, t) en este punto, se observara una campana alrededor de
m
=
P
mP(m, t) que se ensancha a medida que pasa el tiempo, es decir difunde.
En alg un momento, comienzan haber jugadores que quedan en banca rota, por lo que P(0, t) > 0, con lo
que el segundo termino de (3.23) comienza a tener un efecto m as visible. Continuando la analoga con la ecuaci on
del calor, la discretizaci on espacial de un termino de gradiente
x
u (normalmente asociado a efectos de transporte
seg un x) corresponde a u
x
u
x1
, mientras que la importancia relativa de este termino con respecto a la difusi on
estara gobernado por un parametro de velocidad, en este caso asociado a P(0, t). Es decir, si se visualiza a P(m, t)
como funci on de m como una campana con P(0, t) > 0, la cantidad de jugadores con m correspondiente a la cola
de los perdedores en P(m, t) tiende a aumentar (P(m, t) P(m 1, t) > 0), mientras que aquellos que tengan
m del lado ganador tienden a disminuir (porque P(m, t) P(m 1, t) < 0). Como la difusi on sigue operando,
la campana se deforma con m
ISTICOS
s = [];
tim = 0;
while tim < N*tim_total,
coin = randint(1,2,[1 N]);
up = coin(1);
down = coin(2);
dm = m_step*rand(1,1);
% encuentra los intercambios prohibidos
if m(down) < dm,
continue
end
up = randperm(N);
down = randperm(N);
dm = m_step*rand(1,N);
m(up) = m(up) + dm;
m(down) = m(down) - dm;
if mod(tim, out_steps) == 0,
[tim, sum(m)]
% calcula la entropia en esta etapa
[h, hx] = hist(m, num_bins);
p = h/sum(h);
xx = find(p > 0);
s = [s; tim, -sum(p(xx).*log(p(xx)))];
end
tim = tim + 1;
end
% distribucion de probabilidades normalizada
[h, hx] = hist(m, num_bins);
p = h/sum(h);
% Distribucion de Gibbs con exponente 1/m_ini
g = exp(-hx/m_ini)/sum(exp(-hx/m_ini));
figure(1)
title(Comparacion entre el proceso aleatorio de la loter\{\i}a y
la distribucion de Gibbs);
subplot(2, 1, 1)
plot(hx, p,r+, hx, g,b)
xlabel(m); ylabel(p(m));
legend(p(x), gibbs);
subplot(2,1,2)
plot(s(:,1), s(:,2), b)
xlabel(t); ylabel(s);
end
Modelos economicos de m ultiples agentes 10/6/2010
3.3. PRINCIPIO DE M
AXIMA ENTROP
IA 41
Figura 3.1: (arriba) Distribucion de m para una lotera de intercambios.
Se superpone la funcion e
m/m
e
m/m
= 10.
Inicialmente todos los jugadores comienzan con m
ini
. En cada paso del tiempo se eligen un par de agentes,
donde el up va a ganar y el down va a perder. Luego denimos la cantidad intercambiada como una variable
aleatoria entre 0 y m
step
. Realizamos los intercambios, para aquellos pares de jugadores donde el perdedor
pueda afrontar su perdida. Al cabo de out steps realizamos un histograma y calculamos la entropa en ese
momento. Al nalizar la simulaci on, se muestra la distribuci on P(m) realizada comparada con la distribuci on
esperada exponencial con exponente 1/m
ini
. En la g. 3.1 se muestran los resultados para N = 500 jugadores. Se
ve que la distribuci on asint otica de m converge a la distribuci on de Gibbs, mientras que la entropa, que comienza
en un valor cercano a cero, aumenta y se mantiene relativamente estable alrededor de 3.
Ejercicio 7 Que sucede si elimina la restricci on de no aceptar loteras que resultaran en la bancarota de un
jugador? A que distribucion se llega?
Ejercicio 8 Que espera que suceda si comienza con una distribuci on donde no todos los jugadores tienen la
misma dotacion inicial?
3.3.3 Intercambios bilaterales entre muchos jugadores
Un ejemplo similar, aunque mucho mas interesante desde el punto de vista de la economa, es el analisis de los
intercambios bilaterales de Edgeworth entre dos bienes |x, y en una poblaci on de N jugadores. Supongamos
que cada agente tiene un vector de existencias X
i
= (x
i
, y
i
), una funci on de preferencia sobre cada bien Cobb-
Douglas tipo u(X) = u(x, y) = log(x) + log(y) donde + = 1, y en cada iteraci on se eligen un par de
jugadores al azar que tienen la posibilidad de realizar un intercambio siempre y cuando mejoren o igualen las
utilidades de ambos jugadores. Nuevamente tenemos un problema donde existe una restricci on operativa, y los
interacambios realizados aseguran que se conserva la cantidad total de cada uno de los bienes, por lo que se espera
una distribucion de Gibbs para la distribuci on de cada uno de los bienes.
Modelos economicos de m ultiples agentes 10/6/2010
42 CAP
ISTICOS
Veamos con m as detalle el juego propuesto. El cambio de utilidad sufrido por un jugador que le ofrecen
intercambiar cantidades x y y de cada producto afectan su utilidad en
u =
x
x +
y
y (3.24)
Como el jugador acepta intercambios solo si u 0, para intercambiar una unidad del bien x tiene dos posibilidades
seg un las cantidades ofrecidas o demandas del bien y:
[Compra y, vende x]: acepta intercambios solo si recibe y
/x
/y
p
y
a cambio de vender una unidad
de x (x = 1)
[Vende y, compra x]: acepta intercambios donde paga y
/x
/y
p
y
a cambio de comprar una unidad
de x (x = +1)
En otras palabras, p
y
corresponde al precio (medido en unidades del bien y) de intercambiar cada unidad de x.
Figura 3.2: Distribucion de m para intercambios bilaterales tipo Edge-
worth para cada uno de los bienes luego de 1500 pasos de tiempo.
Se superpone la funcion f(x) = e
2x/x
ini
/
e
2x/x
ini
. Parametros
N = 5000, x
ini
= 5, = 0.4, = 0.6.
Supongamos que todos los agentes tienen el mismo y . En cada paso del tiempo se generan dos vectores
|
1,2
con permutaciones al azar del vector (1, 2, .., N). Esto dene los pares de intercambio que se van a intentar
en dicho paso del tiempo. Como cada jugador aparece una vez en cada vector
1,2
, efectivamente los jugadores
pueden realizar 2 transacciones por paso de tiempo. Sean los jugadores (A, B) = (
1i
,
2i
) que computan sus
respectivos precios p
y
(A), p
y
(B). Por lo visto anteriormente, si p
y
(A) > p
y
(B) para que ambos mejoren su
utilidad (u
A
> 0 y u
B
> 0), implica que B compra de A bien y por una unidad de bien x. La cantidad del
bien y intercambiada ser a y (p
y
(A), p
y
(B)). Para simplicar, tomemos el precio realizado p como el promedio
p = (p
y
(A) +p
y
(B))/2 y si las existencias lo permiten, se intercambian una unidad del bien x por p del bien y:
X
A
(t + 1) = (x
A
+ 1, x
B
p)
X
B
(t + 1) = (x
B
1, x
B
+p)
Modelos economicos de m ultiples agentes 10/6/2010
3.3. PRINCIPIO DE M
AXIMA ENTROP
IA 43
Figura 3.3: (arriba) Serie temporal de la entropa s(t) = P
x
log P
x
del bien x. (abajo) Precio promedio de intercambios para cada paso de
tiempo. Parametros N = 5000, x
ini
= 5, = 0.4, = 0.6.
Modelos economicos de m ultiples agentes 10/6/2010
44 CAP
ISTICOS
Realizamos experimentos numericos para vericar que tipo de distribucion se llega asint oticamente sigu-
iendo el proceso descripto arriba. La g. 3.2 muestra la distribuci on de unidades del bien x, e y en toda la
poblacion de jugadores luego de 1500 pasos de tiempo (y 3000 intentos de intercambio), habiendo partido de una
condici on inicial de existencias donde cada jugador tiene un n umero aleatorio entre [0, x
ini
] para cada bien. Clara-
mente el proceso va convergiendo a una distribuci on de Gibbs, con par ametro de escala x
ini
/2 que es justamente
el promedio de existencias para cada bien de la poblaci on.
En la g. 3.3 se muestra como vara la entropa del sistema a lo largo del tiempo, junto con el precio
promedio de intercambio realizado en cada iteracion. Se observa que la entropa crece y llega a un maximo,
mientras que el precio promedio del sistema uct ua fuertemente. Los precios se disparan cuando alguno de los p
y
del intercambio diverge, y esto ocurre cuando la existencia del bien x es mnima.
3.4 La hipotesis ergodica
La idea que un sistema puede visitar una cantidad de sus microestados preservando el valor medio de alguna
cantidad como lo suponemos en la (3.17), est a directamente ligada al concepto de equilibrio tal como se anticip o
en las introducci on de este captulo.
En los sistemas fsicos que mencionamos en la secci on anterior, para asegurar que la energa promedio sea
constante, se supone que el gas est a en contacto con una fuente externa (un ba no termico) que al ser tanto m as
grande que el sistema en cuesti on, el contacto con el mismo lo afecta de modo despreciable, y asegura mantener
al sistema a temperatura constante. Por lo visto con la ecuaci on (3.18), esto garantiza mantener inalterada la
distribuci on de probabilidades de los microestados del sistema pero en ning un momento esa situaci on de equilibrio
implica que el sistema permanece en un unico microestado sin apartarse de el. De hecho el ba no termico indica
que el sistema intercambia energa con su entorno, respetando que el valor medio de la energa sea constante.
En el ejemplo de la comunidad de jugadores, la distribuci on de probabilidad llega a una situaci on esta-
cionaria que no impide que los jugadores contin uen efectuando transacciones, respetando las restricciones impues-
tas: M es constante. Esa distribuci on exponencial indica que es exponencialmente m as probable encontrar un
jugador en la ruina que muy adinerado. Dicha distribuci on permanece inalterada en tanto no se aporte dinero
(aumente M) en el sistema, ya que esta juega el papel de la temperatura de un sistema fsico.
Preservar los valores medios es pues equivalente - en cuanto a la presente discusi on - a mantenerse en
equilibrio. Podramos decir que las condiciones del sistema no cambian durante lapsos compatibles con el tiempo
que media entre mediciones sucesivas. Los promedios de los que hemos estado hablando hasta ahora, seran,
de este modo promedios temporales lo que agrega una complicaci on ya que s olo podramos calcularlos luego de
observar el sistema a traves de repetidas mediciones extendidas a lo largo de largos lapsos.
Ahora si un sistema sabemos que visita todos los microestados luego de alguna escala de tiempo su-
cientemente larga, podremos estimar la frecuencia de ocurrencia de dichos microestados. A la larga, con buena
estadstica, es factible pensar que realizar un promedio temporal (con la complicaci on que esto conlleva) es
an alogo a medir el promedio en el espacio de fases, tomando todos los microestados, y sumarlos con su respectiva
probabilidad de ocurrencia. Esto es lo que implica la siguiente
Denici on 10 (Hip otesis erg odica) Los valores medios a lo largo del tiempo (valores medios temporales) son
equivalentes a valores medios sobre densidades de probabilidad independientes del tiempo que s olo dependen de los
estados internos del sistema.
O sea por un lado podemos calcular promedios temporales observando la evoluci on del sistema y registrando
los microestados que va ocupando y por el otro, en un dado instante, podemos efectuar el promedio pesando cada
uno de los microestados de todo el volumen accesible del espacio de las fases por su probabilidad de ocurrencia.
La hip otesis erg odica dice que ambos promedios son enteramente equivalentes y dan el mismo resultado.
Esta hipotesis fue duramente cuestionada para los sistemas fsicos, pues se sabe que algunos sistemas,
dependiendo de la condici on que se parte, la din amica puede terminar atrapada en una regi on del espacio de fase
Modelos economicos de m ultiples agentes 10/6/2010
3.4. LA HIP
OTESIS ERG
ODICA 45
acotado, y nunca escaparse de ella
7
. Sin embargo, a la luz de los resultados obtenidos hasta ahora, en condiciones
reales, dichas situaciones, si ocurren, ocupan un volumen en el espacio de fases tan peque no, que a todas luces
son despreciables. Sin embargo es bueno tener en mente que para que la distribuci on de probabilidades sea la de
Gibbs, adem as de cumplir con que se mantenga constante un vnculo, se debe cumplir la hip otesis erg odica para
que dichos promedios puedan ser calculados correctamente.
Figura 3.4: Representacion esquematica de lo que implica la hipotesis
ergodica.
En la gura g. 3.4 est an representados esquem aticamente los elementos que intervienen en la hip otesis
erg odica. En la izquierda se representa la evoluci on temporal del sistema que en instantes sucesivos ocupa
microestados diferentes.
Estos est an resaltados con un crculo de mayor tama no. En la derecha se representa una
densidad de probabilidad independiente del tiempo, mostrado los estados inaccesible con probabilidad nula. Se
supone que si se observara una evoluci on sucientemente prolongada, se podra detectar al sistema visitando todas
las regiones del espacio de las fases pasando en cada una de ellas un tiempo proporcional al n umero microestados
accesibles de esa regi on. La probabilidad que se le asigna a cada porcion se toma proporcional al tiempo que el
sistema permanece en ella en el decurso de su evoluci on temporal.
En una situacion de equilibrio el sistema s olo visita una fracci on de los microestados posibles. La evoluci on
por la que el sistema relaja a esa situaci on queda afuera del concepto de ergodicidad porque el sistema no vuelve a
visitar nunca los estados de los que parti o o, si se quiere los visita con una probabilidad abritrariamente peque na.
En el modelo de intercambios bilaterales en una comunidad de jugadores de la secci on 3.3.3, el proceso de relajaci on
hasta alcanzar la distribuci on exponencial de tenencias de dinero cumple con esto: se inicializa el sistema en una
situaci on que luego no vuelve a visitar nunca m as. La hip otesis erg odica es m as plenamente aplicable a la evoluci on
posterior del sistema en la que visita distintos microestados debido a las continuas transacciones de la lotera, una
vez que la distribuci on exponencial ha sido alcanzada y esta es estacionaria.
El concepto de equilibrio que es com un en la fsica o la qumica contiene estas uctuaciones. Puede pensarse
que se trata de un equilibrio din amico ya que los elementos del sistema no cesan de evolucionar preservando de
cualquier manera una distribuci on de probabilidad. Esta idea, que en la fsica posee otros alcances, es aplicable al
7
Por ejemplo los sistemas hamiltonianos, como el que rige la din amica planetaria del sistema solar
Modelos economicos de m ultiples agentes 10/6/2010
46 CAP
ISTICOS
presente contexto. Se suele hablar de este tipo de equilibrio cuando un sistema posee una din amica que preserva
inalteradas distribuciones o valores medios de algunos parametros que lo describen.
Es en general sumamente difcil demostrar que un sistema fsico se ajusta a la hip otesis erg odica y, de hecho,
existen circunstancias en las que se ha comprobado con experimentos numericos que la misma no es aplicable.
Sin embargo la mec anica estadstica ha sido utilizada con gran exito en una variedad enorme de situaciones. Por
otro lado pareciera que esta hip otesis es particularmente util y apliable describiendo sistemas no lineales con un
n umero creciente de elementos. Esta es una situaci on relevante al tipo de interacciones que pueden tener lugar
en un sistema social.
3.5 Metodos de Monte Carlo
Por lo hasta aqu visto, la distribuci on de probabilidades P(X
i
) encierra toda la informaci on relevante para un
sistema de la mec anica estadstica. Sin embargo, en aplicaciones pr acticas la utilizaci on de dicha distribuci on
de probabilidad puede dicultarse. Por ejemplo para utilizar la distribuci on P(X
i
) para obtener los promedios
de una variable Y (X
i
),
Y =
P
i
Y (X
i
)P(X
i
), es necesario sumar sobre todos los estados del espacio de fases.
La cantidad de estados, diverge exponencialmente con el n umero de dimensiones que tiene el problema, y en la
mayora de los casos pr acticos se vuelve imposible enumerar todos los estados para calcular correctamente un
promedio.
Metodo directo para muestrear una distribuci on P(x)
En muchas aplicaciones es necesario obtener muestras x
i
de la distribuci on P(x)
donde x [a, b]. El metodo directo consiste en primero obtener una muestra
de una distribuci on uniforme en el rango [0, 1], para obtener la variable aleatoria
x
i
= a+(b a) [a, b]. Luego una segunda muestra de la distribuci on uniforme
, asegura que x
i
es una muestra si < P(x
i
); caso contrario descarto la muestra.
Est a claro que este metodo va probando uniformemente el espacio de fases, y se
torna impracticable cuando las dimensiones del espacio de fases aumentan.
Ejemplo distribuci on uniforme: Si P(x) es uniforme, como la funci on es
independiente de x, solo es necesario comparar muestras uniformes con P(x).
El siguiente ejemplo obtiene n muestras de la distribuci on uniforme en el rango
x [0, 10] y graca la distribuci on de probabilidad obtenida.
n=10000; res = [];
for i = 1:n,
rr = rand();
if rr < 1/10,
res = [res; rr];
end
end
hist(res)
[mean(res), sqrt(var(res))/sqrt(n)]
La funci on hist() genera un histograma de las muestras, y la ultima sentencia
calcula el promedio de la muestra y el error estandard de la media calculadas.
Como se puede observar, al aumentar n el error estandard decrece y la distribuci on
se aproxima a la uniforme en el rango [0, 10].
Ante este escenario, se volvi o imprescindible contar con metodos que sean capaces de aproximar promedios.
Modelos economicos de m ultiples agentes 10/6/2010
3.5. M
t
obtenidas por una din amica propia del metodo
8
y no necesariamente del sistema estudiado. En caso de no
conocer la distribuci on, evoluciones temporales de la din amica pueden servir para construir tanto la distribuci on
de probabilidades como las muestras.
3.5.1 Algoritmo de Metropolis
Partiendo de una condici on inicial elegida al azar X
0
, este algoritmo genera una sucesi on de muestras. Si en la
iteraci on t de evaluaci on tenemos la muestra X
t
, la nueva muestra X
t+1
se calcula siguiendo los siguientes pasos:
(a) Se calcula la probabilidad P(X
t
).
(b) Se elige una nueva muestra X
y se evalua P(X
).
(c) Si P(X
) > P(X
t
) se acepta como nueva muestra X
y se dene X
t+1
X
.
(c) Si P(X
) < P(X
t
) con probabilidad P(X
)/P(X
0
) se acepta como nueva muestra X
y se dene X
t+1
X
.
(c) En caso contrario, se toma como nueva muestra la anterior X
t+1
X
t
.
Este algoritmo require que se corra una serie de pasos t
min
que ser an descartados, y solo a partir de t > t
min
se considerar an muestras de la distribuci on P(X). Como se ve, este metodo puede expresarse como una cadena
de Markov, y el descarte inicial sirve para asegurarse que la distribuci on de la cadena haya convergido a P(X).
3.5.2 Dinamica de Glauber o muestreo de Gibbs
En este caso nuevamente se parte de una condici on inicial elegida al azar, y el algoritmo genera una sucesi on
de muestras |X
t
a cada paso t. A diferencia con el metodo de Metropolis, una nueva muestra no depende
de la muestra anterior. Este metodo se aplica cuando el espacio de fases tiene m as de 1 dimension; digamos
X
t
= (x
1
, x
2
, ..., x
N
), y en vez de calcular la probabilidad conjunta P(x
1
, x
2
..., x
N
), para cada nueva muestra
se elige una coordenada al azar j y se toma una muestra de esa coordenada de la probabilidad condicional
P(x
j
[|x
i
i=j
). De esta manera las muestras se van aproximando por cada coordenada elegida al azar.
3.5.3 Modelo de Ising
Consideremos por ejemplo un AC de N celdas, donde el estado de cada una de ellas est a denido por una variable
binaria s
i
con i = 1, 2 . . . N. Esta situacion, originalmente motivada para explicar el origen del magnetismo, ha sido
muy prolca en diversos campos tanto econ omicos, sociales y biol ogicos. Es usual referirse a cada variable binaria
8
Esta din amica corresponde a una cadena de Markov, con algunas propiedades que aseguren que la evoluci on
de la distribuci on de la cadena, converja a la distribuci on deseada P(X
i
).
Modelos economicos de m ultiples agentes 10/6/2010
48 CAP
ISTICOS
s
i
como espin arriba o abajo, siguiendo la analoga de los dipolos magneticos que originan el magnetismo. En un
contexto de sistemas sociales o econ omicos las variables binarias s
i
se las ha hecho representar por ejemplo, dos
opiniones opuestas sobre un tema o dos decisiones opuestas de comprar o vender. En lo subsiguiente pensaremos
que s
i
|+1, 1.
Para poder comparar distintas conguraciones posibles, introducimos un funcional energa que mide la
situaci on de cada celda con su vecindad. La idea de energa est a as asociada con la de interacci on entre celdas o
entre agentes vecinos. La energa total del sistema es una variable extensiva del sistema, o sea, que es proporcional
al tama no del mismo (medido por la masa, volumen, n umero de celdas o partculas, etc) y est a dada por
E
tot
=
1
2
X
in(j)
Js
i
s
j
h
X
i
s
i
(3.25)
donde J es una constante que mide la interacci on entre espines vecinos, h es un par ametro que mide la inuencia
de la media con respecto a la interaccion entre vecinos. En fsica es usual pensar que conguraciones de menor
energa son m as favorables. Si J > 0, dos vecinos con la misma orientaci on de espines es m as favorable que si
tienen orientaci on opuesta (caso ferromagnetico); en cambio si J < 0 es m as favorable conguraciones con espines
en direcciones opuestas (caso antiferromagnetico).
Ahora bien, supongamos que este sistema lo ponemos en contacto con una fuente termica externa a una
temperatura constante T con la que intercambia energa
9
y origina cambios espont aneos en los espines, pero
siempre manteniendo constante la energa promedio E
tot
/N. Siguiendo el principio de m axima entropa se espera
que, luego de alg un transitorio, los espines se acomoden su orientaci on al azar con una distribuci on compatible
a la de Gibbs: P(s
i
) = e
E
tot
(s
i
)
/Z
j
= 1 s
j
. La nueva muestra X
) > P(X)
o (b) si P(X
) E(X), la condici on
(a) es equivalente a E < 0,
E = 2Js
j
X
in(j)
s
i
(3.27)
Y para el caso (b) tenemos que E > 0 y la probabilidad del evento es:
P(X
)
P(X)
=
e
E(X
)
e
E(X)
= e
(E(X
)E(X))
= e
E
(3.28)
Es decir que el metodo de Metropolis toma muestras donde la energa total del sistema disminuye, o acepta
aumentar la energa, solo con una probabilidad evanescente, controlada por la temperatura externa T: a menor
temperatura son altamente improbables que se acepten muestras que aumenten energa, en cambio con altas
9
M as precisamente, se supone que la fuente es tanto mas grande que el sistema para que los intercambios
necesarios para mantener el valor medio de energa constante, no alteran la temperatura T de la fuente y ni
del sistema.
Modelos economicos de m ultiples agentes 10/6/2010
3.5. M
ISTICOS
donde la funci on compute local energy change() calcula el cambio de energa de todo el sistema debido a cambiar
un espin elegido al azar E
j
= 2Js
j
P
in(j)
s
i
, y suponemos que la vecindad de cada espin son los primeros 4
vecinos y los bordes de la grilla rectangular se conectan entre si (condiciones peri odicas de contorno) :
function e = compute_local_energy_change(U, n, J, one)
xx = one(1); yy = one(2);
xl = mod(xx-2,n)+1; % index left
xr = mod(xx,n)+1; % index right
yb = mod(yy-2,n)+1; % index bottom
yt = mod(yy,n)+1; % index top
m = U(xl,yy) + U(xr,yy) + U(xx,yb) + U(xx,yt);
e = 2 * J * U(xx,yy) * m;
end
Los cambios de energa posibles son E (8J, 4J, 0, 4J, 8J).
La evolucion temporal de la magnetizaci on M(t) es muy uctuante, y solo cuando se usa temperaturas
bajas T 1 se observa que el sistema se queda en uno de los mnimos de energa M = 1 y el promedio de
energa por espin e = E
tot
/N = 2. Para obtener con m as precisi on como inuencia la temperatura el sistema,
realizamos un experimento numerico simulamos un sistema de N = 100 espines por 10
6
iteraciones y barremos
el parametro T, promediando los ultimos valores de M(t) y e(t) = E
tot
/N de cada simulaci on. En el gr aco de
la g. 3.5 observamos que para temperaturas bajas, la magnetizaci on [M[ est a cercano a los estados de mnima
energa, mientras que al aumentar T, la magnetizaci on disminuye abruptamente hasta caer alrededor de cero.
Esta caida abrupta marca una transicion de fase en el par ametro T. Simulaciones con N creciente apuntan
a que la transici on ocurre alrededor de T
c
= 2.27. Otra caracterstica es que si medimos las uctuaciones lejos
de la transicion, disminuyen con N creciente como 1/
ISTICOS
Figura 3.6: Comparacion entre la probabilidad de transicion de Glauber
P(X
+1
) = 1/(1 + exp(E/T)) y la de Metropolis P(X
+1
) =
min(1, exp(E/T)) como funcion de la diferencia de energa E =
E
+1
E
1
. La escala de la energa es arbitraria y se comparan a 2
temperaturas diferentes.
3.6 Recocido simulado
Una de las principales caractersticas del metodo de Metropolis, es que intenta buscar muestras de la regi on
de mayor probabilidad en la funci on de distribuci on P(X) compatible con una energa promedio governada por
el par ametro T. Para el caso de una distribuci on de Gibbs, las regiones de mayor probabilidad corresponden
a las de mnima energa E(x), con lo que este metodo de muestreo estadstico estara buscando minimizar la
energa a una temperatura T dada. Kirkpatrick y colaboradores (Kirkpatrick, Gelatt, Jr., and Vecchi 1983)
observaron que si hacen tender la temperatura T a cero, el metodo podra buscar mnimos absolutos de la funci on
E(x). Familiarizados con los procesos de recocido, mediante un enfriamiento gradual ayuda a eliminar tensiones
residuales en grandes piezas met alicas, propusieron el metodo de recocido simulado para resolver problemas de
optimizaci on combinatoria. Esta clase de problemas ocurren cuando (a) se desea minimizar (maximizar) una
funci on costo que depende de la conguraci on de las partes en interacci on, y (b) la funci on costo depende de
muchas variables, por lo que el problema posee complejidad combinatoria, o sea que se necesita explorar una
cantidad exponencialmente grande de alternativas para hallar la optima.
La familia de problemas de complejidad combinatoria es muy vasto y es un campo activo de investigaci on.
Habitualmente se los denomina como problemas NP porque el tiempo para ejecutar los algoritmos para resolverlos
llevan un tiempo que crece mas r apidamente que cualquier potencia o polinomio en los datos de entrada. Problemas
con dicha naturaleza son por ejemplo, encontrar el recorrido que pasa por N ciudades que hace que la distancia
total recorrida sea mnima (problema del viajante de comercio), problemas para satisfacer restricciones temporales
como los que ocurren en la asignaci on de horarios en los turnos de un hospital, y, en general todos los problemas
de coordinaci on entre agentes economicos.
El metodo de recocido simulado permite obtener conguraciones que minimizen una funci on costo, uti-
lizando el algoritmo de Metropolis, junto a un protocolo de enfriamiento y una funci on de distribuci on de Gibbs.
Por lo visto anteriormente, una situaci on de equilibrio a una dada temperatura se debe visualizar como una
situaci on din amica en la que el sistema visita distintos microestados, manteniendo inalterado el valor medio de
la energa. Si la temperatura disminuye y se permite que el sistema relaje a un nuevo equilibrio, los microesta-
dos que se visitan son un subconjunto de los anteriores en los que las distintas partes del sistema se acomodan
respetando los mnimos de las energas de interacci on. Ahora si el proceso de enfriamiento es muy r apido, puede
Modelos economicos de m ultiples agentes 10/6/2010
3.6. RECOCIDO SIMULADO 53
ocurrir que el sistema no llegue a visitar la regi on los mnimos y quede atrapado en un mnimo local que ser a
dicil de salir si la temperatura bajo demasiado.
Por lo tanto este algoritmo deber a visitar una buena porci on del espacio de fases antes de enfriarlo,
haciendo que el metodo deba realizar muchsimas evaluaciones de la funci on de costo. Se ha visto que en los
problemas donde la funci on de costo es aditiva con las partes del sistema, este metodo puede brindar soluciones
muy buenas en tiempos de computo razonables, debido a que el c alculo de E pueda expresarse como debida al
cambio de estado de una parte limitada de todo el sistema. As por ejemplo en el caso del viajante de comercio el
costo es la suma de las distancias entre las ciudades en un dado orden. Una alteraci on consiste en una permutaci on
de dos ciudades que s olo implica corregir una parte muy limitada del recorrido dejando inalterado todo el resto.
El protocolo de enfriamiento debe en general ser ajustado para cada caso particular y pueden a veces
presentar problemas de convergencia. Por lo general se utilizan variantes en el que sucesivas temperaturas siguen
una ley del tipo T
k
= ()
k
= T
k1
con < 1.
El algoritmo comienza de una conguraci on cualquiera y a una temperatura T muy alta. Utilizando el
metodo de Metropolis se evaluan nuevas muestras de la distribucion de Gibbs, hasta que se alcance una situaci on
de equilibrio donde E) no cambie. Aqui se aplica el enfriamiento T
ISTICOS
Figura 3.7: Se ejemplica el proceso de optimizacion como la b usqueda
de un mnimo en un paisaje accidentado. Temperaturas mas elevadas
permiten explorar regiones mas amplias del espacio de las fases y suce-
sivos enfriamientos reducen esa b usqueda a microestados mas proximos
al optimo evitando quedar estancados en mnimos locales.
Modelos economicos de m ultiples agentes 10/6/2010
Captulo 4
Leyes de potencias
4.1 Distribuciones que siguen leyes de potencias
Una lista de registros o mediciones pueden ser caracterizada por alg un valor medio que es representativo de
todo el conjunto. La lista contiene tanto valores mayores como menores a esa media pero aquellas mediciones
que dan resultados proximos a ese valor son por lo general mucho m as frecuentes. Este hecho est a formalmente
representado por densidades de probabilidad Gaussianas o de Poisson que poseen un m aximo en alg un valor
intermedio de la variable aleatoria. Existen sin embargo una gran variedad de magnitudes cuyas distribuciones
no siguen este patr on.
Estas est an asociadas tanto a fen omenos naturales como a hechos sociales o econ omicos.
Tal por ejemplo es la distribuci on de tama nos de ciudades, de intensidades de terremotos, de los di ametro de los
cr ateres de la Luna, la distribuci on de frecuencias de uso de palabras en un dado idioma (ley de Zipf), n umero
de muertes en conictos belicos, n umero de citas en publicaciones cientcas, n umero de especies en taxones
biol ogicos, distribuci on de ingresos, uctuaciones de luminosidad en fuentes estelares de ondas de radio, ujo de
autom oviles en una carretera, y una enorme variedad de otros.
Muchas de estas magnitudes tienen una distribuci on de probabilidad que sigue una ley de potencias que,
tecnicamente, se puede escribir como P(x) = Ax
(4.2)
A = ( 1)a
(1)
(4.3)
= 1 +
1
C log a
(4.4)
En estas ecuaciones se ha supuesto que la ley de potencia es v alidad en el rango x [x
min
, ] ya que de otro
modo la normalizacion de la probabilidad divergera en el origen. Mandelbrot utiliz o estos argumentos para
justicar la ley de Zipf que establece que la distribici on de probabilidad de uso de las palabras en un dado
idioma es aproxiamdamente una ley de potencias en su longitud. La idea de Mandelbrot fue que maximizar la
distribici on de probabilidad deba corresponderse con optimizar la informaci on transmitida que est a relacionada
con el logaritmo de la longitud de las palabra.
55
56 CAP
dx =
A
1
h
x
+1
i
x
min
= 1 (4.5)
que dene la constante A y restringe el valor del exponente a > 1 con lo que la densidad de probabilidad
se puede escribir como
P(x) =
1
x
min
x
x
min
(4.6)
Momentos. De la misma manera se puede determinar que las distribuciones con 2 no tienen media
nita:
x) =
Z
x
m
in
xP(x)dx =
A
2
h
x
+2
i
x
min
(4.7)
De la misma manera se puede establecer que si 3 la varianza resulta innita. En general, el momento
de orden m se expresa como:
x
m
) =
1
( m1)
x
m
min
(4.8)
Hay que tener en cuenta que si se calculan los momentos sobre muestras recogidas de la realidad, tanto la
media como la varianza de distribuciones que siguen leyes de potencias pueden arrojar resultados nitos
pero eso es debido a que el c alculo se efect ua siempre sobre una muestra nita de realizaciones de la variable
aleatoria.
Las distribuciones que obedecen a leyes de potencia son libres de escala. Se suele decir que una distribuci on
p(x) es libre de escalas cuando se verica que p(bx) = g(b)p(x) o sea que la distribuci on de la variable
aleatoria afectada por un factor de dilatacion o de contracci on b es proporcional a la distribuci on original.
Observese que ese factor es irrelevante porque puede absorberse en la normalizaci on de la distribuci on. Para
demostrar la propiedad se nalada al comienzo basta poner x = 1 en la condici on de libertad de escalas, con
lo que queda p(b) = g(b)p(1). Es posible entonces escribir p(bx) = p(b)p(x)/p(1). Como esta propiedad
vale para cualquier valor arbitrario de b, puede deducirse que xp
(x) =
p
(b)p(x)
p(1)
ponendo p
por la derivada
respecto de b. Si en esta ecuacion se pone ahora b = 1 se obtiene una ecuaci on diferencial que dene la
distribuci on p(x). Epeccamente:
x
dp
dx
=
p
(1)
p(1)
p(x) (4.9)
cuya soluci on es
log p(x) =
p(1)
p
(1)
log(x) + constante (4.10)
que corresponde a una ley de potencia p(x) = p(1)x
con = p(1)/p
(1)
Observabilidad de las leyes de potencias. Los valores de las distribuciones que siguen leyes de potencias por
lo general se extienden por algunas decadas y son los valores mayores los m as importantes para determinar
tanto la dependencia funcional de la distribuci on como el exponente de la misma en el caso que ella
Modelos economicos de m ultiples agentes 10/6/2010
4.2. OCURRENCIA DE LEYES DE POTENCIAS 57
obedezcan una ley de potencias. Este hecho entra na una dicultad ya que esos valores son por lo general
los menos frecuentes y est an afectados de importantes errores de observaci on. Otro aspecto a tener en
cuenta es que distribuciones observadas varan su aspecto de manera signicativa dependiendo del ancho
de la ventana en que se agrupan las realizaciones de la variable aleatoria que se utilice para gracarlas.
Estos elementos hacen que es menester ser muy cauteloso cuando se llega al punto de aseverar que una
distribuci on sigue una ley de potencias. Este punto est a cuidadosamente discutido en la (Newman 2005).
4.2 Ocurrencia de leyes de potencias
En esta secci on presentamos diversas situaciones en las que ocurren distribuciones de probabilidad que siguen
leyes de potencias. Nos concentraremos en los siguientes casos:
1. Grafos libres de escala. En el an alisis de grafos reales de gran porte, particularmente la red de servidores
de Internet, se encontr o que la distribuci on de probabilidad del grado de los nodos de la red no decaa
exponencialmente sino que lo haca como una ley de potencias, P(k) Ak
P
nm
(x x
)P
m
(x
)dx
0 m n (4.11)
Como la transformada de Fourier del producto de convoluci on de dos funciones es el producto de las trans-
formadas, es mas c omodo trabajar con las funciones caractersticas de las distribuciones, que son, precisamente
las transformadas de Fourier de la funciones de distribuci on. Resulta entonces:
P
n
(k) = P
nm
P
m
(k) con P(k) =
Z
+
e
ikx
P(x)dx (4.12)
La variable k es la conjugada de x. Una funci on caracterstica que satisface esta condici on tiene la forma
P
n
(k) = e
(n|k|
)
(4.13)
Denici on 11 (Distribucion estable) . Las distribuciones con funciones caractersticas (4.13) se denominan
distribuciones estables y corresponde a un proceso estocastico llamado como vuelo de Levy y verican que sumas
parciales de n variables aleatorias tienen la misma funci on de distribucion. El exponente se denomina exponente
caracterstico.
Propiedades de los Vuelos de Levy.
1. Por denici on, la funci on de distribucion es:
P
n
(x) =
1
2
Z
+
e
n|k|
e
ikx
dx (4.14)
2. Para cualquier funci on caracterstica, desarrollando la exponencial compleja en series de potencias, se
demuestra que el momento de orden q de la distribuci on vale:
x
q
) = (1)
q
q
p(k)
k
q
q = 0, 1, 2 . . . (4.15)
Entonces, como P
n
(k) = p
n
(k) y p(k = 0) = 1 implica x
q
(n) = nx
q
) Con esto es posible calcular todos
los momentos de la distribucion conociendo la funci on caracterstica de la misma.
Modelos economicos de m ultiples agentes 10/6/2010
60 CAP
Z
+
e
ikx
p(x)dx
=
Z
+
e
ikx
p(x)dx =
Z
+
con = 1 + 2/ y la dimensi on fractal (de Hausdor) de una serie temporal con estas caractersticas es
D
f
= 2 1/. Cuando = 2 la correlaci on entre incrementos es nula y corresponde al caso Gaussiano.
Ejemplo:Vuelos de Levy en mercados cambiarios
A continuaci on analizaremos las series temporales de mercdos de divisas con la optica de las distribuciones estables.
Para ello denimos el rendimiento al cabo e t perodos de tiempo como
r(t) =
p(t) p(t t)
p(t t)
(4.18)
donde p(t) es el valor del tipo de cambio al cierre en t. La variable r(t) es una variable aleatoria. Veremos que
su distribuci on de probabilidad P(r, t) que ocurra un valor r para un dado t resulta ser estable. El exponente
caracterstico de la distribuci on se puede estimar de la probabilidad de retorno al origen P(r = 0) ((Mantegna
and Stanley 1995)) pero expresada como funci on de t, o sea, la probabilidad de alcanzar un rendimiento neto
nulo al cabo de t pasos del paseo al azar.
Para ello es conveniente encontrar primero una expresi on de la distribuci on de probabilidad en la que la
invariancia frente a cambios en la escala temporal sea maniesta.
El valor de n usado en la secci on anterior que indica el n umero de variables aleatorias que se suman,
en este contexto se relaciona con el intervalo de tiempo t de cada paso del paseo al azar. Podemos escribir
P
n
(r) = P(r, nt) con lo que la funci on caracterstica de una distribuci on estable se puede expresar:
P(r, nt) =
1
2
Z
+
e
nt|k|
e
ikr
dk =
1
Z
0
+
e
(nt)k
cos(kr)dk (4.19)
Se puede denir un rendimiento est andar o rendimiento normalizado r
s
mediante:
r
s
=
r
(t)
1/
(4.20)
Queda as vinculado un rendimiento r para cualqueir intervalo de tiempo t con un rendimiento est andar.
Utilizando esta nueva variable, la invariancia de escala temporal de la distribuci on (4.19) queda maniesta:
P
s
(r
s
, nt) =
P(r, nt)
(t)
1/
(4.21)
Esta ecuaci on indica que una distribuci on de probabilidad de rendimientos para cualquier intervalo nt est a
relacionada con la distribuci on de rendimientos est andar: se pueden superponer las distribuciones para diferentes
t corrigiendolas s olo por un factor relacionado con su escala temporal
Modelos economicos de m ultiples agentes 10/6/2010
4.2. OCURRENCIA DE LEYES DE POTENCIAS 61
Con la expresi on (4.19) es posible adem as calcula la probabilidad de retorno al origen. Para ello ponemos
P(0, nt) =
1
Z
0
e
(nt)k
=
(1/)
(nt)
1/
(4.22)
donde hemos utilizado
(z) =
Z
0
u
z1
e
u
du conz > 0 (4.23)
La distribuci on (4.22) sigue una ley de potencias en t con el exponente caracterstico de la distribuci on estable.
Con estas reglas se estudi o la evoluci on del tipo de cambio de la Libra Esterlina contra el D olar Americano.
La serie de datos esta formada por el tipo de cambio diario al cierre y corresponde al perodo comprendido entre
el 1ro. de junio de 1973 y el 21 de mayo de 1987, conformando una total de 3511 datos.
En la g. 4.1 mostramos P(r = 0, t) como funci on de t, en una escala log-log. Estos datos pueden
ajustarse con una recta cuya pendiente es - 0,604. Hasta los primeros 50 valores de t el ajuste da un coe-
ciente de correlaci on de 0.988. La pendiente permite determinar el exponente carcaterstico que corresponde
con un comportamiento no gaussiano - ya que = 0.60 - y por lo tanto la varianza de la distribuci on debera
ser te oricamente innita. Como hemos comentado anteriormente no es posible comprobar si la varianza de la
distribuci on es efectivamente innita ya que el tama no de la muestra es nita (3511 datos).
Figura 4.1: Probabilidad de retorno al origen P(r = 0) como funcion
de t.
De la lista de rendimientos se pueden obtener la P(r, t) para diferentes intervalos de tiempo Se tomaron
nt = 1, 2, 8 y 32 das). Un estudio estadstico m as minucioso debera usar datos en intervalos no superpuestos,
pero debido a la escasez de datos numericos esto no resulta posible. No obstante, los exponentes crticos obtenidos
con intervalos superpuestos o no son similares.
En la g. 4.2 se muestra el gr aco de P(r, t) utilizando los 4 valores distintos de t . Se ha pretendido
que estos intervalos esten aproximadamente equi-espaciados en terminos logartmicos. Como se puede observar
estas distribuciones son visiblemente simetricas y sus colas obviamente se despliegan al crecer el intervalo t,
ya que al elegir un mayor intervalo sobre el cual se calculan los rendimientos relativos, crece la probabilidad de
obtener grandes rendimientos (positivos o negativos).
Modelos economicos de m ultiples agentes 10/6/2010
62 CAP
ON
Modelos economicos de m ultiples agentes 10/6/2010
68 CAP
. Esto se muestra en
el panel (B) de la g. 4.9 en que se ha trazado una curva que corresponde a 1.1.
Puede observarse que la probabilidad de ocurrencia de una gota grande (una cat astrofe) comparada con la
de una gota peque na es notoriamente mayor que para valores chicos de p. Esta transici on de fase es independiente
del tama no de la grilla y un an alisis meticuloso requiere comparar resultados para grillas de tama nos crecientes.
A modo de ejemplo se muestra c omo las distribuciones para una grilla de 50X50 y p p
c
son muy similares a los
de una grilla de 60X60. Sin embargo, ambas distribuciones caen r apidamente para grandes tama nos. Este es un
efecto de tama no nito. Como las grillas que se pueden utilizar numericamente son en realidad nitas, las gotas
que se pueden llegar a observar nunca exceden el tama no de la grilla (en el ejemplo que se muestra ese lmite es
G = 2500) con lo que la probabilidad de ocurrencia de gotas mayores es cero dando as lugar a la caida que se
observa.
Figura 4.9: Distribucion de tama no de gotas. (A) Para p < p
c
la
distribucion es aproximadamente una exponencial. (B) Para p p
c
la dis-
tribucion se aproxima a una ley de potencias.
Una vez alcanzado el punto jo del aut omata se puede tratar de determinar la densidad D de gotas
para distintos valores de la probabilidad p con que se siembran celdas condensadas. Para ello, se pueden contar
cu antas gotas N(L) han quedado encerradas en una grilla de lado L. Para p < p
c
las gotas tiene un tama no
medio G y la cantidad N(L) est a bien denida y crece linealmente con L
2
. La densidad - constante - es,
simplemente D = N(L)/L
2
. Si se hace un gr aco de D como funci on de L se debe obtener una constante,
salvo para grillas muy peque nas en las que se pueden obtener resultados alterados por el tama no reducido de
las grillas. El valor de D puede, como es natual, cambiar con p. Sin embargo, la situaci on es muy diferente
para p p
c
. Para p p
c
la distribuci on de tama nos de las gotas siguiendo una ley de potencias indica que si la
grilla es sucientemente grande es posible encontrar gotas de todos los tama nos. En el umbral de condensaci on
no se puede denir un valor medio de G y es posible encontrar gotas que s olo esten parcialmente contenidas en
un dado cuadrado de lado L. Si se mide N(L) como funci on de L para p p
c
se comprobar a que no aumenta
linealmente con L
2
sino con alguna potencia diferente, o sea N(L) L
,
se aproxima a una recta de pendiente negativa. Crecientes valores de
p (roja, negra y azul) se corresponden con mayores valores de D. La
curva azul corresponde al umbral de percolacion. En la curva roja no se
incluyen valores peque nos de p y L.
1
La dimensi on fractal de Hausdor que es una generalizaci on de la nocion de dimensi on espacial, se dene
como lim
L0
log(N(L)/ log L donde N(L) es el n umero de cubrimientos de lado L que es necesario realizar para
abarcar todo el conjunto de puntos cuya dimensi on se desea establecer.
Modelos economicos de m ultiples agentes 10/6/2010
4.2. OCURRENCIA DE LEYES DE POTENCIAS 71
4.2.3 Criticalidad Autoorganizada
Cuando la densidad de probabilidad sigue una ley de potencias, suele decisre que posee colas gordas. En este caso,
la probabilidad de ocurrencia de un evento catastr oco es mucho mayor que si la distribuci on poseyera una cola
exponencial. Una de las preguntas que subyacen a la idea de la criticalidad autoorganizada es si la ocurrencia de
eventos de gran amplitud puede o no ser atribuible al funcionamiento regular y normal de propio sistema.
En la secci on anterior hemos visto ejemplos de series temporales econ omicas en las que la transformada
de Fourier de su funci on de autocorrelaci on decae m as lentamente a cero que lo que debiera esperarse de series
puramente estoc asticas. Esta transformda de Fourier suele tambien llamarse espectro de potencia. Otras series
con esta propiedad est an ligadas a indicadores macroecon omicos tales como el producto bruto per c apita, tasa de
desempleo, producci on industrial per c apita, etc. (Nelson y Plosser 1982).
Este fen omeno de persistencia es conocido tambien como ruido 1/f, ya que dichas trasformadas de Fourier
se comportan, para bajas frecuencia como f
NOS
Red N k) L) L)(rndm) C) C)(rndm)
www 153,127 35.21 3.1 3.35 0.1078 0.00023
Actores 225,226 61 3.65 2.99 0.79 0.00027
Coautores cient. 52,909 9.7 5.9 4.79 0.43 0.00018
Estuario de Ythan 134 8.7 2.43 2.26 0.22 0.06
Parque Silwood 154 4.75 3.40 3.23 0.15 0.03
co-ocurrencia palabras 460,902 70.13 2.67 3.03 0.437 0.0001
Sin onimos 22,311 13.48 4.5 3.84 0.7 0.0006
Red electrica 4,914 2.67 18.7 12.4 0.08 0.005
c.elegans 282 14 2.65 2.25 0.28 0.05
En la table N es el n umero de nodos; k) es el grado promedio del grafo, L) la distancia media entre nodos
y C) es el clustering medio. Las columnas que poseen las sigla (rndm) corresponden al valor del par ametro
correspondiente para un grafo aleatorio con igual n umero de nodos y aristas. www indica la red Internet y es
un grafo dirigido, el dato consignado es sobre una parte de toda Internet; Parque Silwood y Estuario Ythan son
redes tr ocas de ecosistemas muy estudiados; en las redes de actores o de coautores cada actor / autor es un
nodo y hay un vnculo si han rmado conjuntamente un trabajo o han participado en una misma pelcula, la la
c.elegans corresponde al sistema nervioso de esa especie.
8
Esta distancia es proporcional a N
1/d
, siendo d la dimension del espacio considerado.
9
Para un red regular de grado k en el espacio 2-D, se puede mostrar que el clustering es:
C
reg
(k) =
3
4
k 2
k 1
(5.10)
que tiende a 3/4 para k , y no depende de N.
Modelos economicos de m ultiples agentes 10/6/2010
82 CAP
con 2 < < 3 lo que hace que su varianza resulte divergente con el m aximo grado de la red:
k
2
)
Z
k
max
k
2
p(k) k
3
max
(5.11)
Estas redes recibieron el nombre de redes libres de escala porque las distribuciones de potencias conservan
su forma frente a un cambio de escala de su variable dependiente (P(x) = ()P(x)). En otras palabras, estas
redes carecen de una cantidad de vecinos caracterstica.
En la tabla adjunta se enumeran algunas redes libres de escala con sus respectivos exponentes.
EJEMPLOS DE REDES LIBRES DE ESCALA
Red N k) L) C)
AS2001 11,174 4.19 3.62 0.24 2.38
Routers 228,263 2.80 9.5 0.03 2.18
Gnutella 709 3.6 4.3 0.014 2.19
WWW 10
8
7.5 16 0.11 2.1/2.17
Proteinas 2,115 6.80 2.12 0.07 2.14
metab olica 778 3.2 7.40 0.7 2.2/2.1
Math 1999 57,516 5.00 8.46 0.15 2.47
actores 225,226 61 3.65 0.79 2.3
e-mails 59,812 2.88 4.95 0.03 1.5/2.0
Todas las redes con excepci on de WWW, metabolica (de Escherichia Coli ) y los e-mails son grafos no dirigidos.
Los dos valores de cuando la red es dirigida representan a los grados de entrada y de salida a cada nodo. Tabla
sacada de la (Albert and Barab asi 2002). La red AS2001 corresponde a Internet al nivel de sistema aut onomo
mientras que Routers corresponde a la descripcion de Internet desde la perespectiva de los servidores. Gnutella
es una red de pares (P2P) que comparten archivos de un cierto tipo. WWW es Internet determinada a traves de
los hiperlinks.
Un mecanismo que produce redes libres de escalas ocurre en redes que crecen en el tiempo adicionando
nodos que se vinculan a los existentes con una probabilidad tanto mayor cuanto mayor es el grado del nodo al que
se conectan. En la literatura este mecanismo recibe el nombre de preferential attachment. Este proceso responde
a la intuici on: una nueva p agina web se vincula preferentemente a las p aginas preexistentes m as direccionadas,
o bien, un nuevo comerciante trata de tener transacciones con los centros comerciales con mayor movimiento.
Veremos en el Captulo XX un modelo de generaci on de redes libre de escala.
La distancia mnima promedio entre nodos para una red libre de escalas crece aproximadamente como las
redes aleatorias (es decir log(N)). El clustering en estas redes por lo general es un poco m as grande que para
redes aleatorias (5 veces), pero nunca como el que se observa en redes de mundo peque no.
5.3.4 Robustez y vulnerabilidad
Que sucede si a una red se la intenta romper eliminando alguno de sus nodos (y sus respectivas conexiones) o
alguno de sus vnculos? En principio, si los da nos son sucientemente grandes, uno espera que una red inicialmente
con una sola componente gigante, se fragmente.
Las redes libres de escala cobraron importancia por su robustez frente a los llamados da nos parciales.
Esto se puede cuanticar con el siguiente experimento numerico. Se dene una probabilidad p con que se cortan
vnculos (o eliminan nodos) elegidos al azar a una determinarda red con distribuci on de grado P(k), y en cada
realizaci on se efectuan los siguientes pasos:
Modelos economicos de m ultiples agentes 10/6/2010
84 CAP
= p k) y supusimos que cada individuo tiene la misma cantidad vecinos k). Esto se conoce como
aproximaci on de campo medio, y para un red aleatoria es una aproximaci on buena en la mayora de los casos. La
explicaci on del modelo es que la poblaci on de suceptibles disminuye a una tasa k
A
= 0 (5.15)
i
B
= 1
r
k
(5.16)
Para determinar la estabilidad de estos equilibrios analizamos f
(i) = 1 r +k
2k
. En otras palabras,
para un dado r jo, si k
B
< 0 por lo que no es fsicamente posible. Sin embargo, a medida que aumenta k
,
para el lmite k
= r, i
A
= i
B
, y la tasa de recuperaci on es igual a la tasa de infecci on. Es aqu donde ocurre
una bifurcacion
11
en el sistema, y el equilibrio i
A
se vuelve inestable, mientras que el i
B
es positivo (fsicamente
realizable) y estable.
En conclusi on, si denimos k
= k)p como una tasa de infecci on efectiva, hay una tasa crtica
>
c
= r (5.17)
para el cual el sistema presenta asint oticamente en el tiempo una poblaci on constante i
B
> 0 de infectados.
Esto se conoce como una endemia, y su tama no i
B
depende de la red, de la probabilidad de contagio p y de la
tasa de recuperaci on r. Una cantidad analoga para la epidemiologa es R /r = k)p/r, que corresponde a
la tasa promedio de infecciones secundarias dado un suceptible. Dicha cantidad se conoce como coeciente de
reproducci on basica de la infecci on, y su interes es conocer cuando R > 1, dado que en este caso la epidemia puede
propagarse.
Ejercicio 13 Que sucede si no hay recuperaci on (r = 0) y el modelo es simplemente SI?
5.4.3 Ejemplo numerico
Veamos un ejemplo numerico de la propagaci on SIS. Denimos una funci on para generar la matriz de adjacencia
aleatoria de N nodos y grado promedio z, distribuyendo K = Nz/2 links,
function adj = adj_rand(N,z)
adj = zeros(N);
nlinks = N*z/2;
while nlinks>0,
x= floor(rand(1,2)*N) + 1;
while adj(x(1),x(2)) == 1 || x(1) == x(2),
x= floor(rand(1,2)*N) + 1;
end
adj(x(1),x(2))=1;
adj(x(2),x(1))=1;
10
Se dice que un equilibrio es inestable cuando una peque na perturbaci on al equilibrio se aleja asint oticamente
del mismo. La condici on para mapas es que el Jacobiano tenga autovalores m odulo mayores a uno, que es lo
mismo que f
(i
A
) > 1
11
Esta bifurcaci on se conoce como transcritica y suele ocurrir cuando hay algun plano invariante en el espacio
de fases, como en este caso i(t) = 0.
Modelos economicos de m ultiples agentes 10/6/2010
5.4. MODELOS DE CONTAGIO EN CIENCIAS SOCIALES 87
nlinks = nlinks - 1;
end
donde a una matriz inicialmente de ceros, se le van agregando progresivamente unos elegidos al azar (salva en las
diagonales y en lugares donde ya haba previamente un uno).
Ahora denimos la funci on sis net que realizar a el contagio SIS propuesto, con una evoluci on temporal
asincr onica: en cada paso de tiempo se elige un nodo al azar, este actualiza su estado y eso corresponde a un paso
de tiempo.
function [U, tseries, adj] = sis_net(N, z, nsteps, p, r)
global adj
adj = adj_rand(N,z);
U = zeros(1,N);
flip = randint(1,1,[1 N]);
U(flip) = 1; % select random initial node
tseries = [];
step = 0;
while step < nsteps,
U = infect_async(U, p, r);
tseries = [tseries; step mean(U) ];
step = step+1;
end
end
cuando la funci on para contagiar y recuperar solo un paso es la siguiente:
function U = infect_async(U, p, r)
global adj
N = length(U);
sel = randint(1,N,[1 N]);
for i = 1:length(sel),
x = sel(i);
if U(x) == 0,
nei = find(adj(x,:)==1); % find neighbors
inf = find(U(nei) == 1); % find infected neighbors
pp = rand(1,length(inf)) < p;
if sum(pp) > 0,
U(x) = 1;
end
else
if rand(1,1) < r, % if infected, is recovered?
Modelos economicos de m ultiples agentes 10/6/2010
88 CAP
B
= 0.75. Parametros N = 100, k =
16, p = 0.1, r = 0.4.
Modelos economicos de m ultiples agentes 10/6/2010
5.4. MODELOS DE CONTAGIO EN CIENCIAS SOCIALES 89
U(x) = 0;
end
end
end
end
Un ejemplo de la variaci on de i(t) a lo largo del tiempo puede verse en g. 5.3, donde al cabo de unos pasos
de tiempo, el sistema llega a un estado estacionario, cercano al te orico de i
B
= 0.75 de la (5.16). Notese que
para cercanos a 1, muchas corridas llegan al estado estacionario, ya que la recuperaci on vence a la infecci on,
por lo que solo quedan suceptibles. Por eso es interesante ver como se compara el valor teorico de i
B
en (5.16)
con las simulaciones numericas. Partiendo de distintas condiciones iniciales (se elige una red al azar, y donde
se infecta solo un nodo), se mide el valor estacionario de i
B
, incluyendo las veces que no arranc o la infecci on
(corresponde a la curva meani
B
), y solo mirando el valor m aximo infectado (corresponde a la curva maxi
B
). En
la g. 5.4 hacemos la comparaci on. Se puede observar que el valor te orico corresponde muy de cerca para los
valores maximos de infectados en cada corrida.
Figura 5.4: Valor medio y maximo de i
B
promediado en 50 realizaciones.
La linea verde es el valor teorico (5.16) de i
B
(p). En funcion de p, su
valor crtico es p
c
= r/k = 0.09. Parametros N = 100, k = 10, r = 0.9.
5.4.4 SIS con rewiring: redes adaptativas
Una variante reciente propuesta por Gross et al (T. Gross and Blasius 2006), es un proponer que la red se adapta
dado los nodos infectados, de modo de evitar la infeccion. Proponen que los nodos suceptibles, con probabilidad
w hagan una reconnexi on de sus contactos infectados, elegiendo a otro nodo al azar. Esta modicaci on permite
a los suceptibles, ir escapando de los infectados, aunque si bien la conectividad promedio con los infectados
disminuye, aumenta la de suceptibles con suceptibles. Esto ultimo, favorece en ultima instancia una infecci on si
ese cluster recibe una infecci on, pues el contagio es m as rapido debido a una conectividad efectiva alta.
Modelos economicos de m ultiples agentes 10/6/2010
90 CAP
B
= 0.75. Parametros
N = 100, k = 10, p = 0.05, r = 0.03, w = 0.7.
Modelos economicos de m ultiples agentes 10/6/2010
92 CAP
B
> 0), para el caso de virus inform atico no se observa una poblaci on importante
de computadoras infectadas. Analizando base de datos de viruses, tambien observaron que la tasa media de
decaimiento de los archivos infectados es del orden de 6-9 meses
12
, un tiempo sucientemente largo como para
indicar que la tasa de infecci on es mayor a la recuperaci on, por lo que la cantidad de infectados debera ser
importante. Esta incongruencia entre los datos y la realidad debera tener una explicaci on. Analizaron la validez
de la aproximacion campo medio utilizada para estimar el umbral crtico (5.17) para una red libre de escala
donde es probabilisticamente signicativo obtener nodos en la red con un n umero de vecinos mucho m as grande
que k).
Su resultados analticos predicen que la cantidad media de infectados es proporcional a i
B
exp(1/p), y
c
= r
k)
k
2
)
(5.18)
Para las redes aleatorias que vimos anteriormente, como la distribuci on de grado es una distribuci on de Poisson,
k) = k
2
), con los que
c
= r. Ahora para redes con leyes de potencia 2 3, k
2
) diverge por lo que
c
tiende a cero
13
. Este resultado indica que lo que se observa en Internet es un umbral innitesimal, pero con una
prevalencia de la endemia chica, porque exp(1/p) es chico para un contagio p muy grande.
5.4.6 Modelos de umbrales locales: modas y revoluciones
En los modelos epidemiol ogicos, el contagio se debe a un proceso probabilstico donde un nodo suceptible se
puede infectar debido a cada uno de sus vecinos infectados. En modelos de modas y revoluciones, parece sensato
suponer que la adopci on de la misma dependa del n umero de individuos que ya adopt o. Es decir, el contagio no
se debe a cada uno de los que adopto, sino a la cantidad total que haya adoptado. Por ejemplo en una decisi on
de ir o no a una huelga, puede ser importante la cantidad de agentes que previamente adoptaron ir a la huelga.
En particular, si suponemos que el agente solo mira a sus vecinos para tomar su decisi on, la regla es adoptar la
moda si el n umero de vecinos que adopto es mayor a un umbral [0, 1] (que para simplicar, es el mismo para
todos los agentes).
Watts (Watts 2002) analiza ese mecanismo de propagacion de modas en una redes aleatorias de N nodos,
y grado promedio k. El aspecto interesante de este modelo es que la adopcion de una moda depende de la
topologa de la red y del estado de cada agente. Esto abre la posibilidad que solamente aquellos agentes de
umbral particularmente bajo sean los que inicien la moda mientras que aquellos reticentes con umbral elevando
la adopten m as tarde, una vez que muchos de sus vecinos la hayan adoptado.
A continuaci on describimos las funciones donde se implementa este modelo. Se supone que todos los
agentes tienen el mismo umbral phi0:
function [U, step] = fads_net(N, z, phi0)
global A phi;
phi = ones(1, N)*phi0;
adj = adj_rand(N,z); % build random network
A = adj;
U = zeros(1,length(A));
flip = rand_int(1,1,[1 N]);
U(flip)=1;
12
La cantidad de archivos infectados decae con una ley exponencial exp(t/) con = 6 9 meses.
13
Para redes con > 4 el umbral
c
de las redes aleatorias vuelve aparecer.
Modelos economicos de m ultiples agentes 10/6/2010
5.4. MODELOS DE CONTAGIO EN CIENCIAS SOCIALES 93
flipped = 1;
step = 0;
while flipped > 0
[U, flipped] = infect(U);
step=step+1;
end
end
function [Unew, flipped] = infect(U)
global A phi
Unew = U;
flipped = 0;
notInf = find(U==0);
for i=1:length(notInf),
x = notInf(i);
nei = find(A(x,:)==1); % se busca a los vecinos
if length(nei)>0,
inf = mean(U(nei)==1); % halla la fraccion de vecinos convertidos
if inf > phi(i),
Unew(x) = 1;
flipped = 1;
end
end
end
La funci on principal es infect(U) donde U es el estado de cada agente: 0 si no adopt o, 1 si adopt o. El modelo
comienza construyendo una matriz aleatoria, y luego deniendo el vector U con el estado de cada agente: 0 si no
adopt o, 1 si adopt o. Inicialmente se elige un sitio al azar y se lo infecta. A partir de ahi se itera sobre la funci on
infect(U), que infecta hasta tanto no se realizen nuevas infecciones (flipped = 0). Esta funcion, el algoritmo
localiza todos los agentes que hasta ese momento no han adoptado la moda (agentes de tipo 0). Para cada uno
verica la proporci on de vecinos que la han adoptado (agentes de tipo 1) y verica la condici on de umbral. Si la
misma se ve satisfecha, el agente se transforma a tipo 1 colocando un 1 en su lugar en el vector U. Una vez que
todos los agentes de tipo 0 han sido vericados la funci on devuelve el nuevo valor de U. El c alculo mencionado
arriba se repite hasta que ning un agente de tipo 0 desea adoptar la moda, en cuyo caso el algoritmo registra el
tama no de grupo de agentes de tipo 1 y el n umero de iteraciones que se requirio para que la moda se propague
hasta reclutar a ese grupo.
Para lograr una intuici on de lo que va sucediendo, comencemos con N = 500, = 0.1 y k = 10.Se observa
que hay una gran probabilidad que todos los nodos terminen infectados. A medida que disminuye k, se ve que
no todos los nodos se contagian, aunque sean unos pocos. Una transici on abrupta ocurre cuando k 1, donde
ning un nodo se contagia. Por el otro extremo, si aumentamos k, vemos que a veces se contagian todos, y otras
ninguno: es todo o nada. Hasta un m aximo de k = 16 donde es muy improbable que se contagien todos.
Un estudio m as detallado, nos lleva a realizar un promedio de varias simulaciones numericas, o realizaciones.
Para esto vamos a estudiar las siguientes cantidades de interes:
el valor medio del tama no del grupo contaminado por la moda
el valor medio del n umero de pasos
el n umero m aximo de pasos
el tama no m aximo del grupo contaminado
Modelos economicos de m ultiples agentes 10/6/2010
94 CAP
ON
Figura 6.1: Neurona de Mc Culloch y Pitts.
primera de ellas consiste en sumar las se nales de ingreso a la celula. Cada una est a afectada por una constante
W
i
que representa la ecacia de la conexi on sin aptica. La siguiente operaci on consiste en ltrar el resultado de la
suma por una funci on de transferencia que es una funci on escal on, signo o sigmoide:
S
i
= g
"
X
j
W
i,j
S
j
i
#
; g(.) = tanh(.), sign(.); etc. (6.1)
En 6.1 S
i
con S
i
|1, 1 o S
i
|0, 1 representa el estado de la iesima neurona. La se nal de salida de la
iesima neurona es positiva si la suma supera un umbral
i
. Las ecacias sin apticas W
i,j
pueden ser positivas
(sinapsis excitatorias) o negativas (sinapsis inhibitorias)
2
. McCulloch y Pitts demostraron que con un conjunto
de neuronas simbolicas de este tipo es posible ensamblar una MTU.
En la representaci on de McCulloch y Pitts, las neuronas pueden estar en uno de dos posibles estados
activa o en reposo. Hopeld ( 1982) propone una representaci on esquem atica del funcionamiento de una
memoria asociativa utilizando neuronas como la de McCulloch y Pitts. Una memoria asociativa posee una cierta
capacidad de procesamiento de informaci on ya que es capaz de direccionar la informaci on por su contenido y no
por su ubicaci on en un archivo de memoria.
Un ejemplo de memoria asociativa es la capacidad que poseemos de evocar a una persona contemplando
una imagen suya parcialmente deteriorada. Esta no es igual a la manera usual con la que se ordena una biblioteca
o trabaja una computadora. En estos casos se recupera el contenido de una porci on de la memoria conociendo su
ubicaci on. Es posible recuperar la informaci on contenida en un libro conociendo su ubicaci on en un anaquel de
la bilbioteca. Observese que para la operacion de una memoria asociativa es necesaria una cierta capacidad de
procesamiento, ya que se debe inferir el todo partiendo de tan s olo una parte de toda la informaci on buscada.
Para construir una memoria asociativa se representa a una red de neuronas mediante un AC y se construye
un modelo del procesamiento de la informacion utilizando para ello la propia evoluci on del AC. Se efect uan las
siguientes suposiciones:
Una neurona (una celula del AC) se comunica con muchas otras que se encuentran en distintos lugares del
sistema nervioso (SN)(no se supone un ordenamiento espacial)
Una neurona puede pasar de activa a inactiva o viceversa dependiendo de las se nales que le transmiten las
otras neuronas con las que est a conectada (cada neurona es como las que propusieron McCulloch y Pitts)
Los estados de la red quedan especicados por una palabra de N bits y estos codican la informaci on
almacenada en la red. (Se utiliza la convenci on que un 1 indica que esa neurona est a activa y un 0 o un
-1, que est a inactiva.)
Representar la elaboracion de informaci on con mediante un AC con estas caractersticas suele recibir el
nombre de enfoque conexionista del procesamiento. En su forma m as elemental, la red de Hopeld considera que
todas las N neuronas del AC estan interconectadas entre si. Esta idea no es una abstracci on demasiado distante
del sistema nervioso real ya que, al menos en el ser humano el SN cuenta con unas 10
11
neuronas cada una de las
2
Existen neurotransmisores que favorecen la polarizaci on de la membrana de la siguiente neurona y otros que
promueven su despolarizaci on. Se los llama excitatorios e inhibitorios respectivamente
Modelos economicos de m ultiples agentes 10/6/2010
6.1. REDES NEURONALES (I): MODELO DE HOPFIELD 99
cuales posee unas 10
4
terminales sin apticas con lo que en a lo sumo en tres pasos, cualquier neurona se conecta
con cualquier otra.
La din amica del AC de Hopeld con la que se produce el procesamiento de la informaci on almacenada en
la red es la siguiente:
S
i
(t + 1) = sign
"
N
X
j=1
J
i,j
S
j
(t)
#
(6.2)
donde S
j
(t) representa el estado de la jesima neurona en el instante t; J
i,j
es la matriz de ecacias sin apticas
que son n umeros reales independientes del tiempo y las neuronas del AC se actualizan asincr onicamente y en un
orden al azar. Se ha supuesto por simplicidad que el umbral de las neuronas es 0.
Consideremos ahora un conjunto de estados del AC
i
con = 1, 2 . . . p y i = 1, 2 . . . N que satifacen
la condicion de ser puntos jos de la din amica 6.2, o sea:
i
(t) = sign
"
N
X
j=1
J
i,j
j
(t)
#
. (6.3)
Estos estados cumplen un primer requisito para ser considerados recuerdos o memorias almacenados en la red ya
que su procesamiento no aparta al AC de ese mismo estado. La siguiente condicion que deben cumplir para ser
considerados legtimamente como recuerdos es es que sean el resultado de alg un proceso de evocaci on, o sea que,
posicionado el AC en un estado pr oximo a uno de ellos, la dinamica 6.2 conduza la AC a uno de esos estados.
Es posible construir una situaci on como esta en el caso elemental en que los estados
son no correla-
cionados, esto es, que surgen de un paseo al azar. En este caso los
) =
1
N
X
i
i
=
,
+O(1/
N). (6.4)
En estas condiciones se puede denir la matriz de ecacias sin apticas J
i,j
utilizando las memorias
mediante
J
i,j
=
p
X
=1
j
. (6.5)
Es inmediato vericar que dadas estas deniciones los estados
i
son puntos jos de la din amica6.2 tal como
debe cumplirse y, adem as, cualesquiera sea la conguraci on inical del AC, este evolucionar a hasta converger a un
punto jo. Esto puede comprobarse deniendo una funci on que se asemeja a una energa mediante (funci on de
Lyapunov):
H =
1
2N
X
i,j
J
i,j
S
i
(t)S
j
(t) (6.6)
y comprobando que la din amica 6.2 es tal que H es mon otona decreciente y acotada inferiormente con lo que la
evoluci on conducir a necesariamente al AC a un punto jo en el cual H no puede disminuir. Observese que no es
posible asegurar que el AC converger a necesariamente a uno de los puntos jos
.
Es pertinente aclarar algunos conceptos utilizados arriba. Cuando se habla de de estados parecidos
a otros se sobreentiende una metrica en el espacio de estados del AC que es la que prevalece en teora de la
informaci on. La metrica de uso com un en este caso es la distancia de Hamming:
Distancia de Hamming:
La distancia de Hamming d
H
(
S,
S
S |S
1
, S
2
. . . S
N
) de N bits es el n umero de
bits en que dieren.
Otro punto a aclarar es cu ando la cantidad p de memorias almacenadas es grande o peque na. El valor de
p se estudia en el lmite de N ; en ese caso p resulta excesivo si p N
k
con k > 1. Una cantidad aceptable
de memorias es p N con < 1 (para N resulta .2).
Modelos economicos de m ultiples agentes 10/6/2010
100 CAP
ON
Una propiedad de los AC de Hopeld es que no siempre la evolucion del AC lo conduce a uno de los
estados
. Dicho de otro modo, no todos los puntos jos del sistema son los estados
y proliferan
exponencialmente a media que p aumenta. Cuando se supera un valor crtico de memeorias, el AC de Hpeld es
incapaz de recuperar ning un recuerdo genuino. Esta transici on es un punto crtico como el que se describi o para
el modelo de la condensaci on y suele llamarse la cat astrofe de confusi on.
Un estado
S
o
p oximo o parecido a uno de los
o
) N.
Esta d
H
puede interpretarse cmo informacion contenida en
o
que est a destruida (cambiada). En este caso, la
evoluci on del AC que hace que
S
o
(t = ) =
o
lo que en realidad hace es recuperar esa informaci on deteriorada
y permite que el AC act ue como una memoria asociativa.
El proceso de evocaci on de una memoria que se produce en el AC de Hopeld se puede visualizar como una
cada hacia un mnimo local en un paisaje de energa en el espacio de las 2
N
conguraciones del sistema (ver
gura 6.2). Los puntos en el interior del cuadrado representan los 2
N
estados posibles del AC. Se han representado
5 memorias
mu
, cada una de las cuales se la puede imaginar en el fondo de un valle que se separa de los vecinos por
elevaciones. El proceso de evocaci on puede representarse como una cada hacia el fondo del valle a lo largo de
la cual H disminuye hasta alcanzar un mnimo. Los estados vecinos a cada memoria conforman una cuenca de
atracci on (una est a sombreada) ya que ubicado el AC en cualquier punto de una cuenca, la dinamica lo conducir a
al fondo del valle (las trayectorias del AC en el espacio de estados se indican con lneas las trayectorias del AC).
Figura 6.2: Representacion del proceso de evocacion de recuerdos en
una red de Hopeld.
En el contexto de este modelo los recuerdos
ON
Figura 6.3: Imagenes de 5 letras representadas en una grilla de 15 X 15
celdas (pixeles). Cada celda roja corresponde a un pixel 0 y cada celda
negra corresponde a un pixel 1.
I L A C O
I 1.000 0.280 0.040 0.333 0.209
L 0.280 1.000 0.280 0.769 0.307
A 0.040 0.280 1.000 0.369 0.493
C 0.333 0.769 0.369 1.000 0.413
O 0.209 0.307 0.493 0.413 1.000
Enla gura 6.4 se muestra el resultado de un proceso de evocaci on asociativa. En la columna de la derecha
se muestra el estado incial del AC y en la columna de la izquierda el resultado de la evocaci on. En las las (A)
y (B) se han embebido s olo tres recuerdos (las im agenes de la I, la L y la A). En la la rotulada (A) se muestra
el resultado de dar como condicion inicial la letra L con un 20% de corrupci on y la recuperaci on es perfecta. En
la la la (B) se eligi o como estado incial la misma letra L pero con un 60% de corrupcion. Con una corrupci on
que supera el 50% las im agenes comienzan a parecerse cada vez m as al negativo del recuerdo embebido. La
evocaci on conduce efectivam,ente a una imagen muy semejante al negativo de la L(en realidad, a una distancia
de Hamming de 1 de ese negativo). Esta es una propiedad general, es f acil vericar que si
es un recuerdo
embebido, tambien esta embebebido su negativo:
.
En la la rotulada con una (C) se muestra el efecto de abarrotar la red de recuerdos embebiendo en ella
las 5 im agenes de la gura 6.3. El abuso en el almacenamiento de recuerdos es m as notorio cuando estos no son
ortogonales tal como sucede en este ejemplo. En el ejemmplo que se muestra se inicializa el AC con la L con un
15 % de corruopci on. El proceso de evocaci on conduce a un estado esp ureo que es una mezcla de los recuerdos C
y L. Estas dos im agenes pueden confundirse f acilemente pues poseen un elevado producto escalar.
6.2 Redes neuronales (II): Redes en capas
El modelo de Hopeld puede interpretarse como un conexionado amorfo en el sentido que no presupone ning un
orden en el cual las neuronas reciben se nales o las trasnmiten ni tampoco existe ninguna direcci on porivilegiada
para el ujo de la infromaci on. Una estrategia alterantiva que recibio mucha atenci on en la literatura es el de
modelos de redes neuronales con una entrada y una salida de informaci on.
El primero y m as elemental fue el Perceptr on de Rosenblatt directamente inspirado en la neurona simb olica
de McCulloch y Pitts (ver gura 6.1. Dicho sistema recibe los patrones
= g[
X
j
W
j
j
] (6.8)
En realidad todo el AC de Hopeld est a construido con dipositivos de este tipo en el que los patrones de
entrada son los estados de activaci on de las restantes neuronas del automata. La unica diferencia es que para un
Perceptr on no es necesario que los patrones de entrada
ON
perceptron que reproduzca una tabla |
, S
, S
con S
(6.10)
o sea, si la salida es correcta, y
W
i
= 2
si S
,=
(6.11)
si la salida es incorrecta. En ambas ecuaciones es un parametro que regula la tasa de convergencia del proceso.
Suele llam arselo tasa de aprendizaje y es menor que 1.
La segunda pregunta acerca de cu an extensa puede ser la lista de asociaciones que se le pueden exigir a un
perceptron puede en realidad asemejarse una capacidad de memoria. En el lmite en que el numero de entradas
tiende a innito y la funci on de transferencia es continua, resulta que dicha capcidad es p
max
= 2N.
La limitaci on de separabilidad lineal hizo caer en el desinteres a los perceptrones durante cierto tiempo
ya que se observ o que funciones muy sencillas no son linealemente serparbles (el ejemplo que siempre se da es la
funci on l ogica de la disyunci on XOR). El interes renaci o con la propuesta de dotar al perceptr on de una capa de
neuronas intermedias con lo que el dispositivo de c omputo pasa a ser un clasicador de grado mayor que 1. Puede
tambien actuar como un interpolador de grado elevado entre datos conocidos. En la gura 6.5 se muestra la tabla
de verdad del XOR (panel A) y su correspondiente repesentaci on (panel B) en el que se ve que los pares S = 1
y S = 0 no pueden ser separados por ninguna recta en el plano
1
,
2
. En el panel C se muestra un perceptr on
con dos entradas. Sus puertos de entrada se representan por rect angulos. El unico elemento capaz de alg un
procesamiento es la neurona que se representa con un crculo. Este dispositivo no puede reproducir el patr on de
salidas de la funci on l ogica del panel, A represntada en el panel B. En el panel D se muestra un perceptr on de
varias entradas con una capa intermedia y dos salidas. Los puertos de entrada se representan con rect angulos y
las neuronas de la capa intermedia se han resaltado con crculos de distinto color.
Los perceptrones multicapa han dado lugar a numerosas aplicaciones, en algunos campos han demostrado
ser dispositivos de c alculo muy utiles y en otros no cumplieron esa expectativa. Igual a lo dicho para un perceptr on
simple, las redes en capas puede tambien ser entrenadas para memorizar una tabla preestablecida de entradas
y salidas. El proceso de entrenamiento puede plantearse como la soluci on de un problema de optimizaci on
consistente en buscar el juego de ecacias sin apticas que minimice una funci on costo que mide el apartamiento
cuadr atico de las salidas efectivamente producidas por la red (S
j
) (j = 1, ...K) y las salidas correctas (
). El
costo se dene como:
( =
p
X
=1
K
X
i=1
[
i
S
i
]
2
(6.12)
p indica el numero de patrones y K es el n umero de puertos de salida de la red. Si se explicitan las ecacias
sin apticas poniendo W
(1)
y W
(2)
para las ecacias que conectan los N puertos de entrada con la M neuronas de
Modelos economicos de m ultiples agentes 10/6/2010
6.2. REDES NEURONALES (II): REDES EN CAPAS 105
Figura 6.5: Paneles (A) y (B): tabla de verdad de una funcion logica
que no es linealmente separable y su representacion. Paneles (C) y (D):
Perceptron simple y perceptron multicapa.
la capa oculta y las que conectan a estas con las K neuronas de salida, esta ecuaci on queda:
( =
p
X
=1
K
X
i=1
"
i
g
M
X
j=1
W
1
i,j
g[
N
X
j=1
W
1
j,k
k
]
!#
2
(6.13)
Se trata de una funci on altamente no lineal de las ecacias W. El procedimento numerico es, con variantes, el
descenso por el gradiente de (, para ello se hace la hipotesis que tanto las entradas como las salidas son n umero
reales (por lo general normalizados a alg un intervalo de referencia como [1, 1]) y que las funciones de transferencia
son continuas.
Si recordamos que frente a un cambio peque no de los W, se puede escribir:
((
W +
W) = ((
W) +
W
(
W
(6.14)
basta con elegir los cambios
W =
(
W
(6.15)
para asegurarse que ellos redundar an en una disminuci on sistem atica de (:
((
W +
W) = ((
W) [
(
W
[
2
(6.16)
Siendo que la supercie ( tiene una enorme cantidad de dimensiones un recurso de minimizaci on como el
explicado corre el riesgo cierto de quedarse atrapado en mnimos locales. Por esta raz on los procesos disponibles
Modelos economicos de m ultiples agentes 10/6/2010
106 CAP
ON
en diversos paquetes de software comercial recurren a elementos m as sosticados que, entre otros elementos,
contemplan variaciones aleatorias.
La constante suele llamarse tasa de aprendizaje como en el caso de los perceptrones. Los gradientes
utilizados en las ecuaciones arriba pueden escribirse de modo que las correcciones en las W se produzcan itera-
tivamente y primero en la capa de salida, luego esta correccion se propaga a la capa intermedia para terminar
en la de entrada. Por esta raz on a este algoritmo se lo suele llamar de retropropagaci on del gradiente (en ingles
gradient backpropagation).
El desarrollo de una red en un problema independiente del tiempo (o sea uno en que ni las entradas ni
las salidas son funciones del tiempo) involucra por lo general cuatro etapas que en la literatura reciben nombres
particulares:
1. Entrenamiento: Minimizaci on de la funci on costo utilizando un conjunto de pares (
) que son
conocidos
2. Memorizaci on: Comprobaci on que la red es capaz de reproducir las salidas correctas cuando se presenta
cada una de las entradas utilizadas en la etapa de Entrenamiento
3. Validacion: Ensayos de la red con entradas no utilizadas en el entrenamiento pero cuyas salidas se conocen
4. Generalizaci on: Prueba de la red con entradas no utilizadas en el entrenamiento para producir salidas
cuya validez se desconoce
Es posible - y existen diversos metodos para ello - desarrollar redes para un problema dependiente del
tiempo, por ejemplo la predicci on de los terminos sucesivos de una serie temporal a medida que se reciben datos
de ella o la adaptaci on de un sistema de control en tiempo real para regular alg un proceso fsico.
6.2.1 Ejemplo: La telara na (I): una red neuronal para estimaci on de precios
futuros. (Ejemplo elaborado por C. Parpaglione)
En esta secci on daremos ejemplos de utilizaci on de una red neuronal en capas para anticipar precios. Cuando se
trata de anticipar futuros valores de una serie temporal tal como podra ser el caso de la cotizac on de un activo
nanciero se podra utilizar una red cuya arquitectura se muestra en la gura 6.6. Esta arquitectura utiliza como
Figura 6.6: Prediccion de precios en una serie temporal: una arquitec-
tura posible para aprendizaje en tiempo real.
entradas los precios registrados en m instantes anteriores, y estima con ellos el precio en el instante subsiguiente
t. En este planteo est a implcita la hip otesis que los precios de la serie existe alguna relaci on causal que vincula
los valores sucesivos de la serie. Obs/ervese que la relacion causal que se supone es entre precios pasados y
futuros de ese activo particular y no se tiene en cuenta, por ejemplo, informaci on global del mercado, cotizaci on
de activos relacionados u otras circunstancias de signicaci on econ omica. Desde este punto de vista la red de la
Modelos economicos de m ultiples agentes 10/6/2010
6.2. REDES NEURONALES (II): REDES EN CAPAS 107
gura no hace sino un ajuste por medio de una regresi on no lineal sobre datos pasados. Una tarea m as meticulosa
de prediccion puede incluir otros datos en la entrada.
Si se dispone de una historia previa de la serie, las ecacias sin apticas de la red pueden ajustarse tomando
como se nal de error la diferencia entre el precio predicho y el efectivamente realizado en la serie temporal. Se
deberan asignar inicialmente valores arbitrarios a las ecacias sin apticas y ajustarlos reproduciendo los valores
sucesivos de la serie. Despues de reproducir los valores ya conocidos de esa serie, el ajuste puede continuarse a
medida que se van obteniendo nuevos datos. En este caso se tratara de un aprendizaje en tiempo real.
Abajo discutimos un ejemplo diferente consistente en la anticipaci on de los pasos futuros de un tanteo
entre precios esperados y precios realizados en un proceso para corregir un exceso de demanda.
Para jar ideas supondremos un pescador que sale de campaa con su bote, y pesca una determinada
cantidad con la hip otesis de un precio esperado P
esp
(t) para ese da t. A su llegada a puerto, toda su pesca es
rematada y vendida a un precio P
real
(t) ,= P
esp
(t) que es el efectivamente realizado en las transacciones que
tienen lugar en el mercado.
Primero buscaremos una red neuronal que permita determinar P
esp
(t+1) para el da siguiente, conociendo
para ello el precio que se haba esperado para el da t y el precio que efectivamentese realiz o en ese da, esto es:
P
esp
(t), P
real
(t) P
esp
(t + 1) (6.17)
La arquitectura de la red neuronal para este ejemplo debe contemplar una capa con dos entradas y una
unica salida (ver Figura ??). Se debe jar el n umero de neuronas de la capa oculta. No existe una regla universal
para esto. Por lo general este n umero surge de diversas pruebas.
Para entrenar a la red neuronal se necesitan datos de eventos anteriores en los que se conocen tanto las
entradas como las salidas de la red. Para elaborar este ejemplo se supuso que se dispone de 20 ejemplos que
corresponden a otras tantas jornadas de pesca de campa nas anteriores. No se supone que los mismos respondan a
una dada secuencia temporal de tanteos ni que esten correlacionados de ninguna manera particular. Si se deseara
utilizar ejemplos temporalmente relacionados y tener en cuenta esta informaci on se debera utilizar otro planteo
predictivo y, quiz a, otra arquitectura para la red. En el esquema que hemos elegido aqui, se supone que la curva
de oferta es bien conocida y los 20 ejemplos ofrecen tan s olo un muestreo parcial de la curva de demanda.
Para probar la habilidad de la red con situaciones de mayor y menor dicultad se construyeron conjuntos
de 20 ejemplos asociados a curvas de demandade diverso nivel de irregularidad. Destaquemos que en el presente
contexto tales irregularidades no deben considerarse como originadas en ruido estoc astico. Esto es debido a que
el n umero de ejmplos es muy reducido. Para que las irregularidades puedan ser atribuidas a perturbaciones
aleatorias el conjunto de ejemplos debiera haber contenido casos con identicas (o muy similares) entradas y con
salidas algo diferentes. Tal como fueron elaborados estos ejemplos esa situaci on no se ha dado, por consiguiente
no se debe suponer que este problema contemple una situacion de aprendizaje en presencia de ruido situaci on
para la que existen abordajes especialmente orientados.
Cada conjunto de ejemplos puede pues suponerse asociados a campa nas de pesca realizadas para otros
mercados o por otros barcos de pesca. Esos conjuntos fueron construidos para que surjan de funciones de oferta y
demanda de diferente grado de irregularidad. Con cada conjunto de ejemplos, se entren o la red ajustando sus eca-
cias sin apticas para que reproduzca los 20 ejemplos de cada campa na, utilizando un algoritmo de retropropagaci on
del gradiente. Para ello se utilizaron repetidamente todos esos ejemplos en un orden aleatorio.
En la gura (?) el eje de las abscisas corresponde a precios estimados y las lneas verticales indican cada
uno de los tripletes ejemplos (|P
esp
(t), P
real
(t), P
esp
(t + 1)) con que se entreno la red. La abscisa de cada
lnea vertical corresponde al primer termino del triplete y sobre cada una se muestran los otros dos terminos con
smbolos diferentes: el cuadrado rojo lleno corresponde al segundo termino del triplete P
real
(t), y el crculo azul
lleno al tercero, P
esp
(t + 1) o sea al precio que se debera estimar para el siguiente da.
El terecer termino del triplete es el resultado que se procura obtener con la red neuronal: hipoteticamente,
al pescador le sera posible estimar el precio esperado para el da siguiente introduciendo los precios estimados
y realizados en cada da. Por esta razon, en la gura, se representa tambien el resultado de la red mediante un
crculo verde. Estos valores representan el resultado de la etapa de memorizaci on de la red.
Modelos economicos de m ultiples agentes 10/6/2010
108 CAP
ON
Figura 6.7: Ejemplo de ajuste de exceso de demanda mediante tanteo
de precios. Arriba: representacion graca mediante curvas de oferta y
de demanda y correspondencia entre precios eestimados y realizados en
el da t y el precio esperado en da t + 1. Abajo: arquitectura de la red
utilizada para el tanteo.
Se puede observar que la red, una vez entrenda, es capaz de reproducir con variada delidad el conjunto
de terceros terminos de los tripletes utilizados en el aprendizaje. El caso en que la curva de demanda es muy
irregular se trata de un problema de memorizaci on m as difcil y la red no lo ajusta siempre exitosamente. Cuando
la demanda es muy irregular todos los ejemplos son casos unicos ya que no hay una ley subyacente que los unique.
El panel de la derecha, en cambio, la red es capaz de reproducir con gran delidad todos los ejemplos utilizados
en el aprendizaje y la ley que subyace a todos los ejemplos es claramente peceptible.
Una vez entrenada, la red puede ser utilizada para predecir cu al debe ser el precio que se puede jar en
una jornada de pesca cualesquiera conociendo los dos anteriores. Sin embargo ese no sera un uso apropiado ya
que, de manera sistem atica se estaran sobreestimando o subestimando precios. Teniendo en cuenta que se trata
de un tanteo, la red debera ser utilizada para investigar si dicho proceso posee un punto jo. Ese punto jo es
claramente visible, al menos, en el panel de la derecha de la gura (?).
La red desarrollada puede ser utilizada para determinar ese punto generando toda una serie temporal
virtual de tanteos consecutivos. Para ello se debe utilizar reiteradamente la red redeniendo sucesivos datos de
entrada utilizando en cada caso los resultados producidos en su salida, tal como los muestran las echas doradas
en la parte inferior de la gura ??. Este uso correspondera a una etapa de generalizacion de la red. Esta
b usqueda se puede hacer suponiendo que dos ejemplos cualesquiera son datos iniciales del tanteo y generando con
ellos tod ol tanteo virtual.
Modelos economicos de m ultiples agentes 10/6/2010
6.3. MODELOS EVOLUTIVOS 109
Figura 6.8: Se muestran los ejemplos utilizados para el entrenamiento
de la red conjuntamente con el resultado de dicho aprendizaje en dos
situaciones para una curva de demanda irregular (panel de la izquierda)
y para una curva de demanda muy regular (panel de la derecha).
El resultado de este ejercicio se muestra en la gura (?) para dos situaciones. En el panel de la izquierda
se utiliz o la red entrenada para una curva de demanda irregular y se tomaron como condiciones inciales dos
ejemplos pr oximos a la zona del equilibrio, o sea cuando P
esp
(t) P
real
(t) P
esp
(t +1). Esta red es incapaz de
determinar un precio de equilibrio y predice una serie virtual con oscilaciones de gran amplitud. Eso no sucede
con la red entrenada para una curva de demanda regular que se muestra en el panel de la derecha. La serie virtual
representa tanteos que disminuyen en amplitud progresivamente. Una b usqueda de este tipo debe en realidad
realizarse eligiendo una variedad grande de condiciones inciales y promediando sobre los resultados.
Como se puede observar la generalizaci on que efect ua la red para demandas m as regulares es altamente
satisfactorio. En esos casos la red consique extraer de los ejemplos un patr on de tanteo convergente. Este
comportamiento se deteriora con demandas muy irregulares al punto de ser incapaz de ofrecer un precio de
equilibrio. En este caso, lo unico que la red puede inferir de los ejemplos que se le han suministrado es que se
alternar a un precio alto con otro bajo pero no es posible advertir si existe o no un proceso de convergencia real.
Esa conclusi on sera tambien a la que podra haber llegado un observador inteligente. Aun retenido toda la
secuencia de datos hist oricos sera muy dicil adivinar la existencia de un valor preciso de equilibrio. Si esta fuera
la situaci on que se presenta, el pescador de la historia podra utilizar la red para efectuar estimaciones adicionales
y ampliar progresivamente el conjunto de ejemplos con el objeto de determinar un posible precio de equilibrio.
Se puede ver que el hecho que se haya conseguido una buena memorizaci on no garantiza en modo alguno
una generalizaci on que detecte un patr on aceptable del tanteo como el que se obtiene en el caso de demandas muy
regulares. En estos casos exigir que en la etapa de entrenamiento la red ajuste con excesiva precis on los datos
de una secuencia muy irregular puede conducir al error del sobreajuste (overtting) de los datos observados y
comprometer de ese modo la conabilidad de las extrapolaciones (la generalizaci on) que realiza la red.
6.3 Modelos evolutivos
Los procesos de adaptaci on y aprendizaje pueden tambien representarse por medio de modelos evolutivos en los
que sucesivas modicaciones de un sistema permiten mejorar su desempe no de acuerdo con alg un requerimiento.
Estos modelos tiene una fuerte inspiraci on biol ogica.
Modelos economicos de m ultiples agentes 10/6/2010
110 CAP
ON
Figura 6.9: Resultados de la etapa de generalizacion de la red gene-
ando uan serie virtual de tanteos. Los ejemplos reales y los resultados de
la red se muestran en negro y la srie virtual en rojo. Panel de la izqueirda
curva de demdan irregular, panel de la derecha, curva de demanda muy
regular.
6.3.1 Motivaci on biologica
La Teora de la Evolucion formulada por Darwin a mediados del siglo XIX provoc o un cambio profundo en el modo
de pensar sobre la diversidad biol ogica y en general sobre todos los fen omenos ligados a la vida. Hoy en da suele
decirse que nada se puede comprender en biologa fuera de dicha teora. El Origen de las Especies de Darwin
es considerado adem as como la teora que m as ha cambiado el pensamiento cientco de los a nos posteriores.
En el momento en que Darwin formula los conceptos ligados a la evoluci on de las especies existan varios
antecedentes importantes. En primer lugar era conocido el hecho que variedades de ores (rosas en particular)
o de ganado podan ser mejoradas por cruza de ejemplares seleccionados. En segundo lugar, en el estudio de la
geologa se haba adquirido conciencia de la realidad de las trasformaciones progresivas del ambiente geograco y
los lapsos extremadamente prolongados en el que los mismos haban sucedido. Otro antecedente importante son
las ideas de Lamarck (1744-1829)- bien conocidas y compartidas por Darwin - que haba propuesto la primera
teora evolutiva para los seres vivos. Segun esta las especies son capaces de sufrir cambios a lo largo de las
generaciones merced a que los descendientes heredan los caracteres que haban adquirido sus ancestros a lo largo
de su vida. Su imagen de la manera en que las jirafas adquirieron sus largos cuellos podra haber sido que a lo
largo de las generaciones aquellos ejemplares que mas se esforzaban estirando sus cuellos para alcanzar las hojas
m as altas de los arboles transmitan a su descedencia los pocos centmetros de cuello ganados de esa manera
La formulaci on evolutiva de Darwin postula en cambio la heredabilidad de los caracteres que mejor con-
tribuyen a que el individuo pueda reproducirse. La capacidad de tener descendientes es por otra parte una medida
de cuan exitoso ha sido ese individuo en su lucha por la supervivencia. Este concepto se resumi o incorrectamente
diciendo que la teora de Darwin postulaba la supervivencia del m as apto dando as lugar a un razonamiento
circular. La diferencia entre el enfoque de Darwin y el de Lamarck reside en que Darwin tiende m as a pensar que
la diversidad y la capacidad de cambio es una cualidad inherente a naturaleza misma de los individuos y que esos
cambios se producen al azar. Adem as el medio ambiente lo supone jugando el papel de seleccionar cu ales son los
cambios m as ventajosos. La manera en que Darwin habra explicado el cuello largo de la jirafas sera que aquellos
individuos que por mera casualidad han nacido con el cuello m as largo se pueden alimentar mejor y dejan por
eso m as descendencia, raz on por la cual al cabo de sucientes generaciones esa caracterstica pasa a generalizarse
en toda la poblaci on. El cambio evolutivo tal como lo entenda Lamarck qued o nalmente desacreditado por
la evidencia emprica que, al menos en organismos superiores, demuestra que los caracteres adquiridos no son
Modelos economicos de m ultiples agentes 10/6/2010
6.3. MODELOS EVOLUTIVOS 111
heredados por los descendientes.
Una objeci on importante a la teora de Darwin en momentos en que fue formulada era que el proceso
evolutivo deba converger a una perdida de diversidad y no a su aumento tal como en realidad puede constatarse
por la observaci on directa de una enorme variedad de especies. Esa objeci on pudo ser levantada luego de las
investigaciones de Mendel que hacia 1900 estableci o la naturaleza at omica de la herencia. De los estudios de
Medel surgi o que las cartactersticas heredables se concentraban en elementos que el denomin o genes. Por esta
raz on en el proceso de la reproducci on una caracterstica se transmite de los progenitores a la descendencia de
manera completa (si el gen se trasmite a la descendencia) o no se transmite (si el gen no est a presente en los
descendientes).
La moderna biologa molecular di o sustento qumico al concepto de gen cuando se estableci o que la infor-
maci on que se transmite en la herencia est a codicada en la molecula de ADN que reside en el n ucleo de las celulas.
La nueva sntesis evolutiva en la que las bases moleculares son adecuadamente tenidas en cuenta se ha dado en
llamar neodarwinismo o darwinismo molecular. El ADN contine una dos largas secuencias enfrentadas en la
disposicion de una doble helice y construidas por la repetici on de 4 compuestos qumicos diferentes (nucle otidos)
3
cuyo ordenamiento particular gobierna el proceso de sntesis de las proteinas. Estas moleculas son los ladrillos
fundmantales con los que se construyen las celulas del organismo y hacen posible todas sus funciones vitales.
Hoy en da la moderna biologa ha podido comprobar los postulados b asicos del enfoque darwiniano
observ andolo bajo el microscopio o en el laboratorio de bioquimica. Existen lneas de pensamiento en las que se
intenta trasladar estos conceptos al contexto de las neurociencias tanto en la morfogenesis de conglomerados de
neuronas en el cerebro (darwinismo neuronal) como en teoras cognitivas sobre la genesis y estabilizaci on de
conceptos. Existen en cambio intentos que no han ganado consenso sobre darwinismo social. Los conceptos de
la evoluci on darwiniana han sido tambien trasladados exitosamente a las ciencias de la computaci on dando lugar
a algoritmos de optimizaci on que veremos en la proxima secci on de este captulo y que son una herramienta util
para modelar agentes complejos y adaptivos y para encarar problemas de optimizaci on combinatoria, en los que
se requiere calcular extremos de funciones de gran complejidad en espacios de elevado n umero de dimensiones.
Resulta muy tentador utilizar el estilo de pensamiento de la teora de la evoluci on para trasladarlo a contex-
tos a veces distantes de problemas biol ogicos. Si bien nostros utilizaremos estas ideas y formularemos algunas de
estas met aforas hay que ser muy conciente de las limitaciones de las mismas. Los conceptos derivados del enfoque
evolutivo darwiniano han tenido por ejemplo un impacto enorme en la ciencia poltica a traves de extrapolaciones
en las que transgreden muchos de los conceptos b asicos de la misma. Las ideas de Darwin impresionaron mucho
a Marx quien dedic o parte de su obra al naturalista ingles. Los seguidores de Marx trasladaron la competencia
entre especies al medio social reformul andola como una lucha entre clases que deba conducir a la supervivencia y
consiguiente gobierno por la clase m as apta. Una extrapolaci on profundamente equivocada fue la del nazismo
que imagin o que el medio social es el escenario de una lucha entre razas, lucha en la cual esta llamada a prevalecer
una raza superior. Finalmente se debe mencionar que buena parte del sustento de los conceptos ligados al
liberalismo econ omico reside en visualizar la libre competencia entre rmas como un mecanismo de selecci on que
redunda en una superaci on y mejora de las mismas.
El mecanismo de evoluci on darwiniana s olo contiene los siguientes elementos b asicos:
1. Es un fen omeno poblacional: El proceso evolutivo s olo puede tener lugar en el seno de una poblaci on
que, en principio, est a formada por una gran cantidad de individuos. Jam as el mecanismo de cambio
y selecci on de aptitudes puede desenvolverse en un individuo aislado sino que tiene lugar a traves del
proceso de procreaci on que renueva la estructura de la poblaci on. Por estas razones el proceso de cambio
involucra lapsos prolongados ya que la unidad de tiempo es el requerido para renovar generacionalmente
la poblaci on.
2. Genesis de diversidad. Se supone que la diversidad se genera por mutaciones al azar en la informaci on
genetica de los miembros de una poblaci on. En la pr actica la tasa de cambios debe ser lo sucientemente
peque na como para que las variantes favorables no se vean destruidas en ulteriores mutaciones y lo sucien-
temente signicativa como para efectuar un aporte apreciable a la diversidad en la informaci on genetica
de toda la poblaci on.
3
Los mismos son Adenina, Guanina, Citosina y Timina que se abrevian por A, G, C, T. En el caso del ser
humano, esa cadena contiene 3X10
10
eslabones
Modelos economicos de m ultiples agentes 10/6/2010
112 CAP
ON
3. Selecci on. S olo una fracci on de los individuos son capaces de transmitir cambios a la siguiente generacion.
Los individuos de la poblaci on compiten por recursos escasos (alimento, agua, espacio, etc.) que son
indispensables para su supervivencia y reproducci on. Esa competencia hace que s olo algunos selectos
individuos puedan dejar descendencia. Por lo general la cualidad por la que los individuos son seleccionados
recibe el nombre de aptitud, desempe no o tness.
4. Heredabilidad Aquellas caractersticas que contribuyen a una mayor exito reproductivo se transmiten
por la herencia entre los progenitores y su descendencia. En realidad, la armaci on debiera ser en sen-
tido inverso: s olo aquellas caractersticas que contribuyen a una mejor tness que son heredables son
relevantes.
6.3.2 Agentes complejos adaptivos
El esquema explicado arriba induce a pensar que la evoluci on pueda imaginarse como una acumulaci on lenta y
progresiva de cambios en la informaci on genetica de los individuos de la poblaci on o, en terminos m as matem aticos
como un paseo al azar en el espacio de las secuencias gen omicas. Si bien este concepto posee sus limitaciones
(ver secciones posteriores) es una base adecuada para trasladar este mecanismo a un contexto formal que permite
visualizar el proceso evolutivo como uno de optimizaci on por el cual, a lo largo de las generaciones se maximiza
una funci on tness.
Para establecer este paralelismo conviene imaginar que un ser vivo, en interacci on con el medio ambiente,
puede representarse de modo elemental como un agente que recibe estmulos y produce respuestas. Desde un punto
de vista computacional ese comprtamiento se lo puede sintetizar en una lista de sentencias del tipo: SI[estimulo]
ENTONCES[respuesta] que podemos simbolizar como
[E] =[R] (6.18)
La respuesta R puede manifestarse a traves de sistemas motrices (p.ej. contracci on de m usculos para
provocar la caza de una presa o la huida de un predador) o de valores testigo que sirvan de control (p.ej. alteraci on
del nivel de glucosa en sangre para dar lugar a la sensaci on de hambre).
La conducta y eventualmente la estructura de un agente de un cierto nivel de complejidad podra en
consecuencia simbolizarse como una lista de sentencias del tipo 6.18. Dicha lista puede asimilarse al genoma
del individuo y pueden a su vez suponerse codicadas con valores numericos de referencia, por una lista de
caracteres cualesquiera |a
i
, o m as generalmente con 0s y 1s.
([E
1
] =[R
1
]) ([E
2
] =[R
2
]) ([E
N
] =[R
N
]) a
1
a
2
a
N
(6.19)
6.3.3 Algoritmos Geneticos
A partir de esta representacion es posible hacer un modelo computacional de un proceso evolutivo darwiniano
siguiendo los puntos 1 a 4 arriba mencionados:
1. Se parte de una poblaci on inicial en la que cada individuo es un genoma como los recien descriptos.
2. en cada nueva generaci on cada genoma es alterado produciendo un cambio al azar (mutaci on) en la infor-
maci on que contiene. Este cambio se efect ua con una probabilidad que debe respetar los lmites menciona-
dos arriba
3. Se eval ua la tness de todos los individuos de la poblaci on y se seleccionan aquellos que la tienen mejor.
4. Se construye una nueva generaci on de secuencias a partir de la existente mediante alg un mecanismo de
reproducci on del que s olo participan los individuos m as aptos.
En esta formalizaci on los individuos son asimilados a su informacion genetica, despreciando en gran medida
el papel que puede jugar el medio ambiente en la expresi on de la misma (lo que en biologa recibe el nombre de
fenotipo). Este punto es discutido m as adelante.
Modelos economicos de m ultiples agentes 10/6/2010
6.3. MODELOS EVOLUTIVOS 113
Por semejanza con lo que sucede en seres vivos, los mecanismos de reproducci on puede ser la simple copia
de la secuencia (reproducci on asexual) o puede involucrar a dos progenitores (una reproducci on sexual). Esta
cruza suele llamarse crossover. Se suele proceder de la manera siguiente:
1. Se seleccionan dos secuencias A y B aptas para reproduccion,
2. se determina al azar un punto de corte.
3. ambas secuencias son cortadas en el mismo lugar generando asi los segmentos A
1
y A
2
de la primera
secuencia y B
1
y B
2
de la segunda,
4. se generan dos descendientes componiendo dos nuevas secuencias (A
1
,B
2
) y (B
1
,A
2
).
Si las secuencias progenitoras (A) y (B) son:
Sec.A = a
1
a
2
a
3
a
n
| {z }
A
1
a
n+1
a
N1
a
N
| {z }
A
2
(6.20)
Sec.B = b
1
b
2
b
3
b
n
| {z }
B
1
b
n+1
b
N1
b
N
| {z }
B
2
(6.21)
las secuencias descendientes (1) y (2) resultan:
Sec.1 = a
1
a
2
a
3
a
n
| {z }
A
1
b
n+1
b
N1
b
N
| {z }
B
2
(6.22)
Sec.2 = b
1
b
2
b
3
b
n
| {z }
B
1
a
n+1
a
N1
a
N
| {z }
A
2
(6.23)
Tanto el crossover como la mutaci on son recursos para introducir diversidad en la poblaci on de secuencias.
La estrategia de reproducci on sexual ha sido ligada a una cierta capacidad de los algoritmos geneticos para explorar
en paralelo (de manera simultanea) distintas regiones del espacio de par ametros en el proceso de optimizaci on.
Es menester aclarar que la aplicaci on de algoritmos geneticos en un proceso de optimizaci on no obedece
a reglas precisas. Si bien siempre se deben componer generaciones sucesivas de un mismo n umero de individuos
hay libertad para establecer el mecanismo de selecci on y reproducci on. Por ejemplo, el proceso de selecci on
puede hacerse de manera determinista (reteniendo s olo los individuos de mayor tness y permitiendoles tener
descendencia hasta completar la poblaci on inicial) o de manera probabilstica (seleccionando a los miembros de la
siguiente generacion con una probabilidad proporcional a su tness). En el proceso reproductivo se puede utilizar
la reproduccion sexual o asexual, y, si se eligio la segunda alternativa, se pueden retener a los dos descendientes
o a s olo uno de ellos eligiendolo al azar. Tambien la probabilidad de mutacion puede elegirse con cierta libertad
dentro de margenes que a su vez dependen de si se utiliza la reproducci on sexual o asexual.
Es opini on de los expertos en optimizaci on que los algoritmos geneticos pueden no ser los mejores en una
variedad de problemas. Sin embargo, en el contexto que nos interesa aqui, su virtud reside precisamente en lo
que los matem aticos aplicados resaltan como un defecto: su principal merito en la formulacion de modelos multi
agente u otros ligados a la biologa es la de retener las principales caractersticas de la evoluci on biol ogica: Los
seres vivos no se corresponden con optimos absolutos. Por lo general su desempe no depende de una enorme
cantidad de grados de libertad con lo que la b usqueda de un optimo absoluto en tal espacio requiere explorar
una cantidad de alternativas que crece exponencialmente con la dimensi on del espacio de par ametros
4
El proceso
evolutivo en biologa conduce en realidad a conguraciones que, por lo general son sub optimas pero robustas.
Las metaforas evolutivas aplicadas a contextos econ omicos o sociales deben ser elaboradas con cuidado. En
lo que sigue veremos varios de estos ejemplos. En todos ellos el proceso evolutivo es utilizado para representar un
proceso de aprendizaje en que la unidad de selecci on que participa en el proceso evolutivo son estrategias, recuerdos
o informacion. Nunca son estructuras tales como organizaciones o sectores sociales, rmas o sectores econ omicos de
4
Un ejemplo sera: la b usqueda del conexionado optimo de las 10
11
neuronas del cerebro. Esto implica ajustar
unas 10
15
coexiones sin apticas. El n umero de posibles alternativas que habra que explorar sera del orden de
e
(10
15
)
con lo que se puede armar que no ha habido suciente tiempo en toda la historia del universo para
completar esa tarea .
Modelos economicos de m ultiples agentes 10/6/2010
114 CAP
ON
una economa compleja. Si esas fueran las unidades de selecci on se caera r apidamente en problemas por cuanto
el proceso de reproducci on o la heredabilidad de las caractersticas mas ventajosas no se pueden parangonar
directamente con nada real. En estos contextos pareciera que el proceso evolutivo debera involucrar elementos
Lamarckianos.
6.3.4 Ejemplo: Optimizacion de un portafolio de inversiones (I)
Considerese el problema de optimizaci on de un portafolio de inversiones. Un modo de plantear un modelo
esquem atico de este problema en termino de algoritmos geneticos puede ser el siguiente: supongamos que existen
N inversiones nancieras posibles, cada una de las cuales ofrece para un dado plazo (que consideraremos igual
para todas las alternativas de inversi on) un rendimiento r
i
con i = 1, 2 N. Un portafolio puede simbolizarse
mediante un vector de N componentes x con componentes x
i
, i = 1, 2 N y cumpliendo la condici on
P
i
x
i
= 1.
Para optimizar un portafolio mediante algortimos geneticos puede suponerse que el genoma que lo
especica es el vector x y la funci on de tness puede denirse por su rendimiento: =
P
i
x
i
(1 +r
i
).
Analcese el problema de un unico inversor. Puede suponerse que este tiene un conjunto de alternativas
de inversi on que se puede representar como una poblaci on de P secuencias
x
; = 1, 2, P. El proceso de
optimizaci on puede representarse como un proceso de prueba y error en el cual se va mejorando darwinianamente
la poblaci on de P individuos ensayando todos sus integrantes y generando sucesivas poblaciones (de P individuos)
reproduciendo y mutando los ejemplares m as aptos.
Para este problema, una mutaci on, que consiste en una alteraci on aleatoria y local en la composicion
del portafolio, se puede efectuar eligiendo al azar con probabilidad P
mut
una componente x
i
de alg un ejemplar y
cambi andola por un nuevo valor x
i
(nuevo) elegido al azar en el intervalo [x
i
, x
i
+] con 1
5
Si el vector de rendimientos r es siempre el mismo y los terminos de este problema son los que han sido
presentados, su soluci on es trivial. El proceso de optimizaci on debera conducir a un portafolio optimo trivial
que corresponde a un vector x
j
o
= 1 y x
i
= 0 i ,= j
o
con r
j
o
= m aximo. M as adelante se ver an extensiones no
triviales.
6.3.5 Implementaci on computacional del GA
El proceso de adaptaci on seg un el esquema de los algoritmos geneticos es una forma de aprendizaje no supervisado.
En un aprendizaje de este tipo no se trata de alcanzar un extremo en que un agente externo al sistema corrige
errores la estrcutra del sistema en base a resultados intermedios tal como se hace en las redes neuronales. El
aprendizaje no supervisado debe ser comprendido como un proceso din amico de adaptaci on en el cual algunas
caractersticas propias de la din amica (que a veces se la suele denominar de autoorganizaci on) da lugar a un
proceso de adpataci on a lo largo del cual la tness siempre tiende a aumentar. El proceso de autoorganizaci on
es tal que se aprovecha en cada momento la estructura del sistema y se le incorpore nuevo conocimiento valioso
aprovechando lo bueno que haya en el y descartando lo malo por un proceso de prueba y error.
Los algoritmos geneticos dan una formalizaci on de este tipo de aprendizaje. La versi on m as sencilla consiste
en una cadena de 1s y 0s que se dene como un gen (0 cromosoma en el c odigo de abajo). Una colecci on de
genes dene un genoma y se supone que cada gen tiene una tness asociada. Claramente la funci on de tness o de
aptitud depende da cada aplicaci on que se desee implementar y es, en general, la parte m as computacionalmente
intensiva del algoritmo.
Un genoma inical, con una estructura al azar, puede denirse f acilmente utilizando sentencias propias del
lenguaje de Matlab:
5
Es claro que si se altera una componente de x se debe luego imponer la condici on de normalizaci on
P
i
x
i
= 1.
Por otra parte debe preverse el caso en que x
i
(nuevo) resulte menor que 0 o mayor que 1. En estos casos se pueden
imponer condiciones de controno reectantes: si x
i
(nuevo) > 1 se debera elegir x
i
= 1. [ x
i
(nuevo) 1. [ y
algo an alogo para el caso en que x
i
(nuevo) < 0
Modelos economicos de m ultiples agentes 10/6/2010
6.3. MODELOS EVOLUTIVOS 115
function genome = ga_binary_new(k,m)
genome.chromos = round(rand(k,m) >= 0.5);
genome.fitness = zeros(k, 1);
El proceso adaptativo de los algoritmos geneticos contempla que el genoma evolucione mediante dos op-
eraciones: cruza y mutaci on. Para la cruza se suelen tomar dos genomas y se los combina para dar lugar a dos
descendientes imitando el mecanismo de reproducci on sexual de celulas vivas. La mutacion toma por lo general
un unico genoma y cambia al azar un 1 por un 0 o viceversa. Estas operaciones generan genomas pr oximos y s olo
cambian la aptitud levemente. De este modo el proceso adaptativo explora nuevos sistemas que se encuentran
en la vecindad del anterior, mientras que la cruza explora nuevos sistemas en el que se combinan estructuras y
caractersticas conocidas del sistema anterior
La siguientes funciones Matlab implementan esos dos operadores.
# Operador de cruza: corte y union
function chromo = chromo_cross(chromo1, chromo2)
len = length(chromo1);
cutx = randint(1,1,[1 len]);
chromo = [chromo1(1:cutx) chromo2(cutx+1 : len)];
# Operador de mutaci\on: cambia un bit
function chromo = chromo_mutate(chromo1)
len = length(chromo1);
x = randint(1,1,[1 len]);
chromo = chromo1;
chromo(x) = 1-chromo1(x);
Estos dos operadores est an gobernados por el proceso din amico que trata de mejroar las aptitudes individ-
uales. Hay varios aspectos en el modo de implementar esta parte del algoritmo. Haremos s olo breves comentarios
en resguardo de la claridad y la simplicidad.
function new_chromos = ga_evolve(genome)
# ordena la nueva lista de cromosomas por aptitud decreciente
[s,indx] = sort(genome.fitness, descend);
chromos1 = genome.chromos;
new_chromos = genome.chromos(indx, : );
len = rows(chromos1);
# selecciona dos cromosomas al azar para cruzar y reemplazar el segundo peor cromosoma
ii = randint(1,2,[1 len]);
if (ii(1) ~= ii(2))
ccross = chromo_cross(chromos1(ii(1),:), chromos1(ii(2),:));
new_chromos(len-1, :) = ccross;
end
# selecciona un cromosoma al azar para mutarlo, excepto el rpimero y reemplaza al pero cromosoma
i1 = randint(1,1,[2 len]);
cmut = chromo_mutate(chromos1(i1,:));
new_chromos(len, :) = cmut;
Modelos economicos de m ultiples agentes 10/6/2010
116 CAP
ON
Opbservese que hemos utilizado una probabilidad de mutaci on uniforme igual a 1/n umero de genomas.
En aplicaciones reales desearamos controlar esta probabilidad, as como la probabilidad de cruza. Tambien es
bastante normal adoptar una cruza preferencial entre los genomas de mayor tness. Todas estas caractersticas
pueden ser incluidas en mnuestro algoritmo basico
Aplicacion: el problema de la particion
Un problema de optimizaci on combinatoria bien conocido es el de particionar un conjunto de numeros. La
idea es separar un conjunto de n umeros en dos subconjuntos tales que la suma de ambos sea la misma. Por
ejemplo, tomemos el conjunto x = [4, 16, 3, 7, 8, 1, 4, 2, 11, 13, 9, 6]. Se deberan encontrar los subconjuntos x
1
=
[16, 3, 4, 2, 11, 6],y x
2
= [4, 7, 8, 1, 13, 9], cada uno de los cuales sume 42. Cuando se encuentra una tal partici on se
la llama perfecta.
Este es un problema que se enfrenta a menudo en juegos infantiles cuando se deben integrar equipos rivales:
se seleccionan dos capitanes y estos seleccionan, alternativamente, a los mejores jugadores disponibles para cada
equipo. este es en realuidad un metodo heurstico para resolver el problema de particonar un conjunto. Vease
por ejemplo el artculo en American Scientist The Easiest Hard Problem por Brian Hayes
6
.
Para resolver este problema utilizando algoritmos geneticos se procede como sigue. Se toma un genoma
binario g, tal que cada posici on sea 1 o -1. Se toma luego el producto escalar del vector x con el genoma para
comparar la suma del conjunto positivo con la del negativo. Si el producto escalar es 0, se ha obtenido una
partici on aceptable.
Tambien para que lo que el programa busque sea un m aximo, la funci on de costo se dene como M g.x,
donde M es una constante que se elige mayor que la suma de todos los n umeros del conjunto a particionar y g es
el genoma binario. La siguiente funci on computa el costo para un genoma completo g
function fitness = ga_cost(g, ori)
fitness = g.fitness;
for ii = 1:length(g.fitness),
c = g.chromos(ii,:);
x = 2*c-1;
fitness(ii) = 10000000 - abs(x*ori);
end
Para procesar el algoritmo completo podemos utilizar las siguientes instrucciones:
% Se define primero un lista incial de numeros
x = [4 16 3 7 8 1 4 2 11 13 9 6]
% Se incializa el genoma
g = ga_binary_new(30,length(x));
% Se itera por un dado n\umero fijo de pasos
step = 0
while step < 65 & g.fitness(1) < 10000000
g.fitness = ga_cost(g, x);
g.fitness
g1 = ga_evolve(g) ;
g.chromos = g1.chromos;
6
http://www.americanscientist.org/template/AssetDetail/assetid/14705/page/1
Modelos economicos de m ultiples agentes 10/6/2010
6.3. MODELOS EVOLUTIVOS 117
g.fitness = g1.fitness;
step=step+1;
end
p1 = x(find(g.chromos(1,:) == 0))
sum(p1)
p2 = x(find(g.chromos(1,:) == 1))
sum(p2)
Es intersante observar que que este problema tiene dos comportamientos lmites diferentes. Para un
conjunto jo de n umeros existe una diferencia cualitativa si el conjunto es de n umeros peque nos o si existe un
gran rango de dispersi on entre ellos. En el primer caso, parece razonablemente sencillo encontrar uno o mas
particiones perfectas. Por el contrario, en el segundo caso es casi seguor que no existen tales particiones. Este
razonamiento tan simple plantea la pregunta interesante acerca de lo que sucede en un rango intermadio. ? Es
que existe una transici on de fase?. Es interesante tener este ejemplo in mente pues el modelo de asistencia al bar
(BAM) que se explica m as adelante es una versi on extendida de este porblema simple en el que en lugar de dos
conjuntos iguales, los agentes tratan de hacer decisiones para repartirse en proporciones establecidas.
Aplicacion: decidir inversiones
Los algoritmos geneticos han sido utilizados como metodos heursticos para resolver problemas de optimzaci on
con vnculos. Una tal aplicaci on es el problema de encontrar la mejor combinaci on de proyectos con tasas de
retorno establecidas. Digamos que hay n proyectos, y x
i
= 1 si el proyecto i es aceptabla y x
i
= 0 si no es el caso.
Dado que cada proyecto tiene una tasa de retorno r
i
y un costo c
i
y el total de dinero disponible es el escalar w,
entonces el problema es
maximizar
n
X
i
r
i
x
i
(6.24)
sujeto a
n
X
i
c
i
x
i
w (6.25)
La siguiente funcion provee la implementacion de ese problema.
function [invest ret cost genome] = invest_ga(r, c, w)
genome = ga_binary_new(10, length(r));
genome.fitness = fitness(genome, r, c, w);
iter = 0; same = 0; best = 0;
do
genome.chromos = ga_evolve(genome);
genome.fitness = fitness(genome, r, c, w);
if genome.fitness(1) > best,
same = 0;
best = genome.fitness(1);
else
same++;
end
iter++;
Modelos economicos de m ultiples agentes 10/6/2010
118 CAP
ON
until same>50
iter
invest = genome.chromos(1,:);
ret = dot(invest,r);
cost = dot(invest,c);
function score = fitness(genome, r, c, w)
for i=1:length(genome.fitness),
chro = genome.chromos(i,:);
genome.fitness(i,1) = dot(chro,r);
constraint = dot(chro,c) - w;
if constraint > 0,
genome.fitness(i,1) -= constraint*100;
end
end
score = genome.fitness;
Como ejemplo encontramos la combinaci on optima de proyectos dadas las codiciones siguientes:
r = [2 4 3 2 1.5 1.3];
c = [3 8 2 5 3.2 2.3];
w = 10;
invest_ga(r, c, w)
Usualmente se obtiene la soluci on x = (1, 0, 1, 1, 0, 0) con una tasa de retorno de 7 y con el vnculo satisfecho
con una igualdad.
Ejercicio 14 Verique este resultado y encuentre otra combinaci on psoible que da la misma tasa de retorno.
Para hacer una comparacion hemos implementado la soluci on del mismo problema mediante programaci on
lineal:
function invest = invest_lp(r, c, w)
len = length(r);
invest = lp(-r, c, w, zeros(1,len), ones(1,len))
dot(invest,r)
dot(invest,c)-w
Procesando la funci on:
invest_lp(r, c, w)
da como resultado x = (1.00000, 0.33750, 1.00000, 0.00000, 0.00000, 1.00000), con una tasa total de retorno de 7.65.
Observe que en programaci on lineal se suponen valores reales para las decisiones de inversi on, mientras que la
implementaci on con algoritmos geneticos utiliza valores enteros. Por esta raz on la tasa de retorno provista por la
programaci on lineal es solamente una cota superior para la soluci on real.
Modelos economicos de m ultiples agentes 10/6/2010
6.4. MODELOS EVOLUTIVOS DEL APRENDIZAJE 119
6.4 Modelos evolutivos del aprendizaje
El proceso evolutivo da lugar a una adaptaci on de los individuos al medio que los rodea. Para modelos de
organizaci on o comportamiento social o econ omico la adaptacion que deriva del proceso evolutivo puede ser
considerada como un aprendizaje. Tal como lo hemos visto hasta el momento, el actor que sufre este proceso no
es un individuo sino que es toda la poblaci on. Es sin embargo posible modelizar un proceso de aprendizaje en el
sentido usual de la palabra utilizando este algoritmo.
El s olo hecho que los agentes se pueden adaptar, indica que poseen componentes o grados de libertad
internos cuya mutua interacci on puede ajustarse. Esa organizaci on es la que se encuentra codicada en la se-
cuencia genetica |a
1
a
2
a
3
a
N
. En el caso de redes neuronales visto en secciones anteriores, el aprendizaje se
maniesta con un cambio en la sus ecacias sin apticas. Estas son las vinculaciones que se adaptan en el proceso
de aprendizaje. En ese caso el cambio se resume en un algoritmo que establece mejores valores de las ecacias
sin apticas. Esta situaci on puede trasladarse f acilmente al actual contexto suponiendo que el cambio surge de un
proceso evolutivo. Para ello basta asemejar la red con un organismo vivo y suponer que en sucesivas generaciones
su desempe no se va mejorando por cambios progresivos en su estructura. Las redes pueden considerarse como
agentes adaptivos que son el agregado de agentes mas simples (neuronas) y que puedan a su vez combinarse para
dar lugar a agentes m as complejos. El ejemplo biol ogico m as directo es considerar que una celula puede agregarse
para dar lugar a tejidos u organos y estos a su vez pueden agregarse para dar lugar a todo un ser vivo.
Teniendo en cuenta este hecho es de esperar que, en general, existan procesos evolutivos anidados. En cada
uno de ellos el proceso de adaptaci on tiene lugar en escalas propias de tiempo que est a asociada con el ritmo con
el cual se presentan los estmulos y se valora el desempe no del agente.
Un ejemplo de un mecanismo evolutivo anidado dentro de otro es el de la generaci on de las respuesta del sis-
tema inmune. En ese caso el sistema inmunue de un individuo de una dada especie, reconoce agentes pat ogenos
agresivos y se adapta generando progresivamente anticuerpos cada vez mas apropiados para neutralizarlos. Por
otra parte, el individuo, en tanto miembro de una especie participa a su vez de un proceso evolutivo en el que la
especie toda se adapta al medio en que vive. Del mismo modo, un proceso de aprendizaje (tal como usualmente
es considerado) puede imaginarse como una adaptaci on darwiniana de parte (o partes) del sistema nervioso de
un individuo particular de la especie, a estmulos que provienen del medio mientras que, por su parte la especie
evoluciona en escalas de tiempo mucho m as prolongadas. En la Tabla (I) se dan algunos ejemplos de procesos
evolutivos anidados.
TABLA I
Ejemplo Proceso evolutivo Niveles de selecci on
Sistema Inmune Variaci on aleatoria de anticuerpos nivel superior:especie
y posterior seleccion y reproduccion de los nivel inferior: celular
que mejor reconocen el agente pat ogeno
Canto de aves El canto pasa de un gorgeo con gran variedad nivel superior: especie
de slabas a un canto con menor n umero nivel inferior: anatomica y celular
slabas estabilizadas
Desarrollo del Inicialmente se producen conexiones sinapticas nivel superior: especie
sistema nervioso supernumerarias y luego se produce una atricion nivel inferior: celular
central de conexiones y sinapsis in utiles
En la Tabla II se mencionan ejemplos de diversos sistemas y sus correspondientes escalas de tiempo
para evolucionar y adaptarse. En muchos casos los sistemas que se mencionan en esta tabla pueden involucrar
diversos procesos anidados. Un caso es el sistema nervioso central en el que pueden desenvolverse un proceso
evolutivo ligado a su ontogenesis y otro ligado al aprendizaje o entrenamiento para alguna tarea particular. Otro
ejemplo puede ser el proceso de adptacion de una sociedad a cambios macroecon omicos que la afectan y el de
las organizaciones que la componen para adaptarse a los cambios culturales u organizativos. La coexistencia de
escalas diversas de tiempo y espacio es una caracterstica propia de los sistemas complejos tal como se discuti o
en el Captulo 1.
TABLA II
Modelos economicos de m ultiples agentes 10/6/2010
120 CAP
ON
Sistema Tiempo de adaptaci on
Sistema Inmune De horas a das
Canto de aves Das
Sstema nervioso central De segundos a a nos
Empresas De meses a a nos
Epecie De das a siglos
Ecosistema De a nos a milenios
Sociedad De decadas a siglos
Ejemplo: Optimizaci on de portafolios de inversi on (II).
El problema planteado en la secci on 6.3.4 se torna interesante si se tiene en cuenta que el medio, que est a
representado por el vector de rendimientos r, puede cambiar mientras el agente inversor descubre cu al es la
mejor inversi on en un dado momento. En ese caso la optimizaci on involucra el ajuste de un portafolio contra una
serie temporal r(t). Cabe pues comparar las escalas de tiempo asociadas al aprendizaje del inversor para mejorar
el rendimiento de su portafolio y la escala asociada a la tasa de cambio de r(t). En esta situaci on, los mejores
ejemplares de la poblaci on de P estrategias de inversi on que corresponden a una generaci on deben ser probados
con los rendimientos del siguiente perodo.
6.4.1 Los individuos y el medio
Una manera simplicada de considerar la evolucion es una en que los individuos se moldean para adaptarse al
medio ambiente pero este no se ve alterado por ellos. Un logro importante de las primeras teoras evolutivas es
la distinci on conceptual entre organismos y medio ambiente, pero, al hacer esto incluso Darwin desestim o el
papel activo que cumplen los seres vivos en cambiar el ambiente que los rodea. Para las primeras teoras el medio
era simplemente el escenario en el cual los seres vivos mostraban sus diferentes capacidades de supervivencia y
reproduccion. En realidad una dada especie no puede dejar de modicar el medio en que vive y, en consecuencia,
altera de hecho su propio proceso evolutivo.
La modicaci on del medio es una cuesti on de capital importancia en modelos sociales o econ omicos. En la
teora econ omica se suele suponer que agentes individuales no pueden alterar los mercados con acciones aisladas.
El equilibrio, si existe, se supone que deriva de acciones colectivas en las que se encuentra implcito alg un proceso
mediante el cual solo son efectivos los promedios. Los modelos basados en agentes m ultiples permiten tanto
considerar situaciones intermedias como analizar c omo la acci on mancomunada de numerosos agentes que act uan
de manera descentralizada pueden dar de todos modos lugar a situaciones con un alto grado de coordinaci on.
La principal cuestion planteada en esta lnea de analisis es c omo sistemas compuestos de m ultiples agentes
que act uan de manera independiente maximizando funciones de utilidad que muchas veces son contrapuestas,
alcanzan estados con un cierto grado de orden macrosc opico en el cual las acciones individuales son aproxi-
madamente consistentes entre si.
La modicaci on de los aspectos formales de los algoritmos geneticos para tomer en cuenta estas situaciones
no es importante ya que s olo se debe limitar a tomar en cuenta el cambio del medio: antes de calcular del desempe no
de cada individuo se debe evaluar el efecto combinado de las acciones de toda la poblaci on sobre el medio y recien
cuando se hubo evaluado ese efecto se determina la tness de cada individuo. En lo que sigue veremos algunos
ejemplos en los que esta interacci on es tenida en cuenta.
6.4.2 El juego de la minora
El juego de la minora ha sido muy discutido en la literatura en dos variantes. Aqui s olo consideraremos aquella
en la que los agentes carecen de todo recuerdo de la pasada historia del sistema. Se trata de un sistema de N
jugadores(N impar). Cada uno de ellos posee una probabilidad p
i
; i = 1, 2 N de optar por una de las dos
alternativas de una opci on binaria (rotulamos las opciones con 1 y 0). Una vez efectuada la opci on se efect ua
Modelos economicos de m ultiples agentes 10/6/2010
6.4. MODELOS EVOLUTIVOS DEL APRENDIZAJE 121
un recuento y solo los jugadores que estuvieron en el bando minoritario ganan y reciben un pago de 1$. Puede
pensarse por ejemplo en el caso de conductores que deben elegir entre dos caminos: los que eligen el menos
transitado se ver an beneciados. Los perdedores deben en cambio efectuar un pago de 1$. Cada jugador posee
una cuenta corriente. Cuando la misma pasa por debajo de 0, el jugador altera su estrategia de juego cambiando
p
i
p
i
elegido al azar en el intervalo [p
i
, p
i
+ ] con 1. Todos los agentes se supone que actualizan sus
respectivos valores de p
i
de manera sincr onica.
Este esquema puede considerarse encuadrado en el modelo de algoritmos geneticos si se supone un genoma
de un unico elemento (p
i
). La funci on de tness es binaria y da o quita un punto dependiendo de los votos
reclutados para cada alternativa. Como se ve la misma depende de lo que han decidio todos los dem as jugadores.
El juego comienza asignado a cada jugador una cuenta de 0 $ y estrategias individuales p
i
elegidas al azar
0 p
i
1. Para estudiar la evoluci on del juego los pasos son los siguientes:
Figura 6.10: Resultados del Juego de la Minora para 101 agentes, 50000
iteraciones, p = .05. En el panel de la izquierda se muestra la evolucion
de la concurrencia. La horizontal marca el valor 50/101=.4950495, que
es la maxima minora posible. Notese como disminuyen el tama no de las
uctuaciones. En el panel de la derecha se muestra la funcion densidad
P(p) obtenida en una simulacion del El resultado que se muestra es un
promedio sobre 100 evoluciones independientes
1. Se recorre el conjuto de N jugadores y se determina por que opcion vota cada uno,
2. Se recuentan los votos
3. Se determinan los ganadores y perdedores
4. Se efect uan los pagos y cobros y se ajustan las cuentas corrientes que correspondan
5. Se corrigen los p
i
de los agentes que quedaron con su cuenta en saldo negativo. Se restituyen sus cuentas
a 0.
6. Se recomienza desde el punto 1.
Si se itera este proceso el sistema alcanza un equilibrio. Para mostrar el resultado de este juego sobre
la poblaci on de N jugadores se repite la iteraci on descripta arriba en un conjunto grande (un centenar) de
sistemas identicos (para poder efectuar estimaciones estadsticamente signicativas). Con esa informaci on se
Modelos economicos de m ultiples agentes 10/6/2010
122 CAP
ON
puede determinar la funci on de densidad P(p) que determina la fracci on de la poblaci on que posee estrategias p
i
comprendidas entre p y p +dp. Esta funci on adopta la forma de una U con dos picos simetricos en p 0 y p 1
(ver gura ??).
Resulta del modelo que la unica distribuci on estadsticamente signicativa que torna consistentes entre si
las decisiones de los N agentes es una en la que la mayor parte de la poblaci on se autosegrega en dos fracciones
aproximadamente iguales que toman decisiones opuestas, una siempre opta por (digamos) 1 y la otra que siempre
opta por 0. Puede interpretarse que el proceso de ajuste de las estrategias individuales a traves del algoritmo
iterativo que acabamos de describir representa un proceso de aprendizaje que siguen todos los individuos de la
poblacion para poder alcanzar la consistencia antedicha.
Es intersante comprobar que si bien la distribuci on de probabilidades en la poblaci on se mantiene inalterada
cada jugador, individualmente considerado, presenta grandes cambios en su conducta a lo largo del tiempo pasando
de decidirse en un sentido con probabilidad pr oxima a 1 a decidirse en el sentido opuesto alg un tiempo mas tarde.
Implementacion computacional
El problema de la monora guarda grandes semejanzas con el modelo de concurrencia al bar o Bar Attendance
Model (BAM). En esta versi on hay N0 agentes caracterizados por uan probabilidad p de ir al bar. En cada
iteraci on el barman cuenta cu antos entraron al bar y cuantos quedaron en sus casas. El grupo de la minora
acumula un punto, mientras que la mayora pierde un punto. Para que el grupo de la minora simpre exista N0
debe ser un n umero impar.
Es claro que en este problema existe una solucion estacionaria, puesto que siempre hay un grupo de agentes
que aumentan su puntaje mietras que otro conjunto lo disminuye. Despues de cada ronda las probabilidades se
adaptan al azar como si sufrieran una mutaci on: se cambia p por una variable aleatoria uniformemente distribuida
en el intervalo [0.05, 0.05]. Si p alcanza el valor 0 o 1 se aplican condiciones de copntrono reectantes.
El c odigo Matlab que implementa este modelo es el siguiente:
function nn = bam(N0)
global U N;
close all;
step = 300; % numero de computos sin mostrar resultados
N = N0;
rand(seed,1234);
% titulo de la ventana principal
titulo = [Bar Attendance Game: N=, num2str(N)];
p = rand(1,N); % asigna probabilidades al azar
s = zeros(1,N); % asigna puntajes a cero
h1 = hist(p); % prepara histograma acumulativo
s1 = hist(s); % prepara el histograma de puntajes
ave = [];
multiplot(1,3);
i=1;
while i<=90000,
i
flip = rand(1,N); % arrooja los dados para cada agente
test = flip < p;
Modelos economicos de m ultiples agentes 10/6/2010
6.4. MODELOS EVOLUTIVOS DEL APRENDIZAJE 123
if sum(test) < N/2 -1
win = test; % grupo de la monor\{\i}a
else
win = 1-test;
end
s = s + win; % la minor\{\i}a auumenta 1 punto
s = s - (1 - win); % la mayoria pierde 1 punto
ave = [ave sum(test)/N]; % agraga la ocupaci\on promedio
% aquellos agentes con puntaje negativo actualizan sus probabilidades
x = find(s <= 0);
p([x]) = p([x]) + 0.05* (rand(1,length(x))-0.5);
% se corrige si p excede la frontera superior
%p([find(p>1)]) = 1; p([find(p<0)]) = 0;
x = find(p>1); p([x]) = 2-p([x]);
x = find(p<=0); p([x]) = -p([x]);
if (mod(i,step)==0)
[his,xhis] = hist(p); h1 = h1 + his;
subplot(3,1,1), clearplot; plot(xhis,h1)
[his,xhis] = hist(s); s1 = s1 + his;
subplot(3,1,2), clearplot; plot(xhis,s1)
subplot(3,1,3), clearplot; plot(ave)
text(100,0.8,num2str([mean(ave) std(ave)]));
drawnow
end
i=i+1;
%pause;
end
Se generan tres gr acos. El de m as arriba muestra la distribuci on de las p dentro de la poblaci on. El del medio
corresponde a una distribuci on acumulada de los puntajes s que corresponderan a promediar sobre todas las
iteraciones. El gr aco nal es una serie temporal de la ocupaci on promedio del Bar que, despues de algunos
transientes converge al 50%.
6.4.3 Ejemplo (II): El modelo del Bar de Brian Arthur
El modelo de Concurrencia la Bar es un modelo can onico en el estudio de procesos de autoorganizaci on. De el
se deriv o, como caso paticular, el juego de la minora que acabamos de describir. Este es un ejemplo en el que,
a semejanza de el, la decisi on de cada agente afecta a todos los dem as y la organizaci on sobreviene cuando las
decisiones de todos los agentes son consistentes entre si.
Se trata de un sistema de N parroquianos que concurren regularmente a un Bar. La capacidad del Bar es
ja. Todos comparten el parecer que si concurre una fracci on de parroquianos que excede un umbral N
u
dado
(N
u
< N) el local se torna inc omodo. Si ese no es el caso, los parroquianos obtienen de su concurrencia una
utilidad positiva. Por otra parte si permanecen en su casa aquellos das en los que la concurrencia N
c
es tal que
N
c
< N
u
, obtienen de esa acci on una utilidad negativa. Se supone que todos los parroquianos conocen la historia
previa de concurrencias al Bar y, en base a la misma, cada uno, de manera independiente debe decidir si va a
concurrir o no.
Seg un el modelo los parroquianos toman decisiones individuales basadas en valores agregados (globales)
para todo el sistema que est an disponibles para todos los agentes por igual. Se supone que los agentes efect uan
Modelos economicos de m ultiples agentes 10/6/2010
124 CAP
ON
alg un razonamiento inductivo, propio de cada uno para decidir su concurrencia para el da siguiente.
Figura 6.11: Simulacion del modelo de concurrencia al Bar considerando
256 agentes, una P
mut
= 0.005, umbrales N
max
u
= 0.8 y N
min
u
= 0.2.
Los planes son para s = 10 das y la poblacion de estrategias de cada
agente es P = 20. El panel superior muestra la convergencia a una
concurrencia optima. En el inferior el sistema relaja a una conguracion
suboptima. Cada da el 10% de los agentes actualiza su estrategia vigente
evocando un algoritmo genetico.
Para encuadrar este problema en el esquema de los algoritmos geneticos
7
se puede proceder de la manera
siguiente. A cada uno de los N agentes se le puede asignar una poblaci on P de estrategias de concurrencia para
los subsiguientes s das de la semana. Cada una de esas estrategias puede codicarse en un genoma de s n umeros
c
i
con c
i
|1, 0; i = 1, 2, s con la convenci on que c
i
= 1 signica que se ha decidido concurrir al bar en el
iesimo da y que c
i
= 0 signica lo contrario. Cada agente puede entonces tener una estrategia que es la que
efectivamente aplica para concurrir al bar (la estrategia vigente) y un conjunto de otras P 1 estrategias
alternativas.
Puestos a jugar, cada uno de los N agentes aplica la estrategia vigente durante los s das de la semana. Al
cabo de la semana puede evaluar sl desempe no de dicha estrategia, sumando la utilidad obtenida en cada uno de los
s das de la semana. Sin embargo cada agente puede adem as evaluar el desempe no que habra obtenido aplicando
las restantes estrategias que posee. Este c alculo es aproximado pues debe suponer que todos los restantes agentes
no cambian sus respectivas estrategias vigentes. Esta estimaci on alcanza para asignar a cada estrategia una tness
que mide en denitiva el grado de consistencia de sus posibles decisiones individuales con las del restante conjunto
de N 1 agentes.
Existen pues todos los elementos para implementar N procesos evolutivos independientes en el seno de
cada una de las poblaciones de estrategias asignadas a cada agente. Este proceso puede asimilarse a uno de
aprendizaje por el que cada agente descarta aquellas estrategias que son menos compatibles con las de los N 1
agentes restantes y rearma aquellas que son m as consistentes
8
.
7
Este modelo ha sido resuelto en la literatura sin utilizar algoritmos geneticos. El metodo que utilizamos aqui
es una versi on iterada de un juego similar al de la minora que anticipa la concurrencia para varios das en el
futuro
8
Para evitar efectos de manada indeseados se puede establecer que distintas partes de los N agentes actualizan
sus estrategias en distintos momentos.
Modelos economicos de m ultiples agentes 10/6/2010
6.4. MODELOS EVOLUTIVOS DEL APRENDIZAJE 125
En la gura ?? se muestra el resultado de la convergencia en el caso en que se impone no solamente una
concurrencia m axima N
(>)
u
sino tambien una mnima N
(<)
u
. Este umbral inferior da lugar a soluciones en los que
un da cualquiera es descartado por los parroquianos como apropiado. Durante el proceso de convergencia y por
una circunstancia casual algunos parroquianos encuentran que en un dado da hay demasiado poco p ublico. Al
descartar ese da como apropiado, dan lugar a que en jornadas sucesivas otros parroquianos adopten la misma
tesitura. Cuando esto sucede el sistema queda connado en una situaci on sub optima de la que s olo puede salir por
el evento altamente improbable que consiste en que una cantidad apreciable de agentes sufran, simult aneamente,
una mutaci on en sus respectivas estrategias de concurrencia para el mismo da. Este tipo de connamiento es por
otra parte un hecho que podemos comprobar cotidianamente en una gran variedad de conductas sociales.
La soluci on a la que se llega representa una delicada coordinaci on entre las estrategias de concurrencia
de diversos agentes. Es importante notar que esta soluci on es estable porque entra na una gran diversidad de
estrategias. Es f acil darse cuenta que no todos los parroquianos pueden elegir la misma soluci on de concurrir al
bar en un mismo da porque si ese fuera el caso excederan la capacidad del local. En la Tabla (III) se muestra
que tipo de coordinaci on es la que se establece para el caso en que s olo hay 10 parroquianos, la concurrencia se
planea para los subsiguientes 8 das y no se tolera una concurrencia superior a 4 parroquianos. Con una cruz se
indica que el agente concurre al bar y con un blanco que no concurre.
TABLA III
Agente (da ) 1 2 3 4 5 6 7 8
1 X X X X X X X
2 X X X X X X
3 X X X X
4 X X X X
5 X X X
6 X X X
7 X X
8 X X
9 X
10
Es posible comprobar que el estado que se alcanza es un equilibrio de Nash ya que ninguno de los jugadores
puede mejorar su posici on alterando unilateralmente su estrategia. Por otra parte existe una gran cantidad de
equilibrios equivalentes. Cualquier transformaci on de la matriz de la tabla III en la que una X es intercambiada
con un lugar vaco de la misma columna lleva de un equilibrio de Nash a otro igualmente aceptable. El sistema,
una vez que alcanza su estado asint otico visita siempre las vecindades del equilibrio de Nash que logr o debido
a que ocasionalmente la tasa de mutaci on cambia un 0 por un 1 en el genoma de alg un jugador.
Implementacion computacional
Suponemos que hay N agentes que desean concurrir al Bar solamente si su ocupaci on es menor que un valor
umbral umbral. N otese que el n umero de agentes es impar de modo que siempre hay una fracci on de agentes que
gana y otra que pierde
Cada agente posee un mecanismo de aprendizaje que utiliza algoritmos geneticos: posee una colecci on P
de planes semanales que se expresan como un vector binario m y cada posici on es el compromiso de cada da
de permencer en casa (0) o ir al Bar (1). En cada iteraci on el barman cuenta cu antos visitaron el Bar y hace
p ublico ese resultado. Cada agente est a pues en condiciones de actualizar su puntaje para todos sus P planes,
sumando un punto siempre que el plan haya contemplado copncuirrir al Bar y ese da este se encontraba debajo
del umbral. Tambien suma un punto si la opci oin es quedarse en casa y el bar est a demasiado lleno de gente. Se
resta un punto en toda otra situaci on desfavorable. De este modo cada plan tiene un puntaje que se actualiza en
cada iteracion. El programa que implementa este algoritmo es el siguiente
function [st, plan, a]= bam(occupation, npop, m, niter, pevol, seed)
Modelos economicos de m ultiples agentes 10/6/2010
126 CAP
ON
k = 6;
% numero de genomas de cada agente
if (nargin < 3) occupation = 0.80;
seed = 1234
npop = 10
m = 4
niter = 15
endrand(seed,seed);
for i1=1:npop,
a(i1) = agent_new(i1, k, m);
endst.occ_list = [];
% ocupacion media
listst.sc_list = [];
% puntaje medio
listfor iter = 0:niter*m,
%iter;
day = mod(iter, m) + 1;
% encuentra todas las estartegias en todfos los genomas para un ado d\{\i}a
go = zeros(k,npop);
for k1 = 1:k,
for i1 = 1:npop,
go(k1,i1) = a(i1).genome.chromos(k1, day);
end
end
% los agentes van al bar eligiendo genoma 1, de modo que define quien gana
goes = go(1,:);
mgo = mean(goes);
if (mean(goes) > occupation)
wins = 1-go;
else
wins = go;
end
for i1=1:npop,
a(i1).genome.fitness = a(i1).genome.fitness + wins(:,i1);
end
%st.occ_list = [st.occ_list mgo];
if day == m,
% actiualiza la estadistica con los genomas vigentes
plan=zeros(npop, m);
for i1=1:npop,
plan(i1,:) = a(i1).genome.chromos(1,:);
end
%plan
mplan = mean(plan);
st.occ_list = [st.occ_list mean(mplan)];
sc = zeros(1,npop);
for i1=1:npop,
sc(i1) = a(i1).genome.fitness(1);
end
st.sc_list = [st.sc_list mean(sc)];
%pause
%evoluciona el genoma
for i1 = 1:npop,
if rand(1,1) < pevol,
% devuwelve los genomans ordenados de acuerdo con su fitness
Modelos economicos de m ultiples agentes 10/6/2010
6.4. MODELOS EVOLUTIVOS DEL APRENDIZAJE 127
a(i1).genome = ga_evolve(a(i1).genome);
% redefine las fitness
a(i1).genome.fitness = zeros(k,1);
end
end
end
endst.sc_list
% Define un nuevo agente
.function agent = agent_new(i, k, m)
agent.name = i;
agent.genome = ga_binary_new(k,m);
%agent.prefe = 0.80; %rand(1,1);
agent.score = 0;
Observe que la actualizaci on de estrategias no se hace simultaneamente para todos los agentes. Para
quebrar esa sincrona articial la funci on acepta un parametro pevol que corresponde a la probabilidad de actu-
alizaci on de cada agente al nal de cada semana. De esta manera, dependiendo de este par ametro, no todos los
agentes actualizan sus estrategias al mismo tiempo.
En la Figura 6.12 primero se estudia el papel de m en el sistema. Para planes m as largos, las uctuaciones
parecen ser menores.
En la Figura 6.13 se muestra como vara la evolucion cuando cambia el par ametro pevol. Para val-
ores pr oximos a 1, las uctuaciones son bastante visibles y resultan coherentes lo que corresponde a un efecto
de muchedumbres que se forman cuando la mayora de los agentes cambian simult aneamente sus estrategias
afectando de esta manera la coordinaci on de todo el sistema. Por otra parte para valores muy peque nos de pevol
se observan uctuaciones muy peque nas junto con una convergencia lenta a la maxima ocupaci on posible del Bar.
6.4.4 Ejemplo (III): Un modelo de panico
El modelo de Bar visto en el ejemplo anterior no es un modelo extendido en el sentido que no posee ninguna
dimensi on espacial o de proximidad que sea natural para el conjunto de agentes. Una modicaci on de este modelo
para tener en cuenta una variable de este tipo puede servir para introducir, por ejemplo, efectos de contagio.
Desde el punto de vista del tipo de la informaci on que manejan los agentes estos efectos pueden interpretarse
como informaci on que proviene de un n ucleo de agentes pr oximos a otro. Se la puede llamar local por oposicio on
al tipo de informaci on global del modelo tradicional en que cada agente s olo conoce el efecto agregado de lo que
decidi o todo el conjunto.
En las guras que siguen se muestra el efecto de introducir contagio en el modelo del Bar. Para ello se
supone que cada agente est a ubicado en una grilla regular con bordes identicados y en cada momento el agente
puede saber cu al ha sido la decisi on de sus cuatro vecinos ubicados al N, S, E y O de su posici on y cu ales han
sido sus respectivas utilidades
Se permite que cada agente pueda abandonar su estrategia siempre que encuentre que su desempe no no
es satisfactorio. Debe notarse que debido a este hecho se debe distinguir entre la acci on vigente
c
a
t
(i,j)
del agente
ubicado en el sitio (i, j), en el t-esimo da, y su plan vigente para el mismo da
c
#
t
(i,j)
. Para decidir un abandono
de su plan el agente determina el resultado obtenido con su estrategia y lo compara con el que habra obtenido si
hubiera imitado a sus vecinos m as inmediatos. Con este prop osito cada agente calcula la acci on media local (o
campo medio local):
h
(i,j)
=
1
4
c
a
t
(i,j+1)
+
c
a
t
(i,j1)
+
c
a
t
(i+1,j)
+
c
a
t
(i1,j)
(6.26)
Una vez que esta es conocida el agente puede determinar si va a seguir a sus vecinos o no. Es claro que la disposicion
de agentes en una grilla no es un ingrediente esencial del nmodelo salvo por el hecho que dene una vencidad. La
misma puede bien denirse por medio de un grafo general o con la misma grilla pero con vecindades diferentes.
Modelos economicos de m ultiples agentes 10/6/2010
128 CAP
ON
Los resultados por supuesto que cambian pero retienen sin embargo las mismas caractersticas esenciales ques e
discuten m as abajo. Puede adem as suponerse que existe alg un ruido o incertidumbre en la decisi on tomada
por el agente.
Esta puede representarse por una agitaci on termica caracterizada por un par ametro de control que
juega el papel de una temperatura T = 1/. Se la introduce por medio de una din amica denominada din amica de
Glauber que establece la probabilidad de imitar o ignorar la decis on de su entorno inmediato. Esa probabilidad
P ` a la Glauber se dene
P(acci on = 1) =
1
1 +e
2h
(i,j)
(6.27)
Por consiguiente cada agente computa cada da que es lo que habra obtenido siguiendo la acci on media de su
entorno. Si esta resulta mayor que la que obtuvo con su estrategia vigente el agente abandona su plan para da
siguiente con una probabilidad P y hace lo que hizo su entorno. Puede interpretarse que el agente se contagia
con esa probabilidad P. Si la utilidad no es mayor el agente mantiene su estrategia vigente.
Los resultados que se obtienen se muestran en la gura 6.14 donde se comparan los resultados con y sin
contagio en una situaci on en la que se agrega un shock externo entre t = 300 y t = 500. El shock consiste en
declarar que cualquier concurrencia es inaceptable (o sea, da lugar a una utilidad negativa) lo que es equivalente
a decir que el Bar cierra sus puertas sin preaviso en t = 300 y las vuelve a abrir, tambien sin preaviso, en t = 500.
El panel A de la gura muestra resultados del ordenamiento del conjunto de agentes que ya se discuti o en
la secci on anterior. En el panel B se muestra el mismo proceso agregando el intercambio de informaci on local.
En el panel C se muestra cu al es el porcentaje de agentes que decidieron su acci on contagi andose de sus vecinos,
en cada momento.
Tanto en el panel A como en el B se ha marcado con 1 y 4 la etapa de organizaci on en la que los agentes
coordinan sus conductas individuales de modo de maximizar su utilidad. El proceso de organizaci on es robusto
(sobrevive) frente a la inclusion del ruido proveniente del contagio. La coordinaci on que sobreviene despues de
este momento y hasta t = 300 no es sustancialmente diversa con o sin contagio. En promedio, durante todo ese
perodo la tasa promedio de contagio nunca supera un 20% (se lo individualiza en la gura como el intervalo (8)).
Las diferencias aparecen a partir de t = 300. El intervalo (2) muestra que el conjunto de agentes busca maximizar
sus utilidades cambiando gradualmente sus estrategias porque descubren que se obtiene una mayor utilidad si no
se concurre al bar. El aprendizaje es gradual. El intervalo (3) es enteramente semejante al (2) pero con cambios
en la direcci on contraria.
La diferencia producida por la informaci on local (contagio) surge de comparar el intervalo (2) con el (5) y
(6) del panel B. En el intervalo (5) el nivel de contagio es muy bajo y el aprendizaje es gradual tal como sucede en
el panel A. Durante el intervalo (5) no se produce contagio porque la mayora de agentes est a usando estrategias
equivocadas y no ofrecen una alternativa atractiva para que sus vecinos abandones sus planes vigentes. Este
perodo puede bien asociarse con un estado de alerta. Cuando la proporci on de agentes que aprendieron que
no concurrir es mejor negocio se produce el contagio se hace posible y da lugar a una avalancha (6) acompa nada
de otra de imitaci on (intervalo (9)) que da lugar a un brusco abandono de planes y una caida brusca en la
concurrencia. A partir de ese momento hay una creciente proporci on de agentes que ajustan sus planes vigentes
de acuerdo con la nueva situaci on y la tasa de contagio comienza a bajar gradualmente (intervalo (10)). La
concurrencia no cae hasta 0 entre t = 300 y t = 500 porque siempre existi o una proporci on de agentes que nunca
pudieron concurrir al bar y por consiguiente tienen estrategias exitosas para una situaci on como la que es vigente
durante la crisis.
El n de la crisis en t = 500 da lugar a un brusco aumento de la concurrencia. Esto es debido a que los
agentes encuentran en su bagaje de estrategias alternativas, aquellas que eran las vigentes antes de t = 300 y no
fueron completamente eliminadas. Ellas vuelven a proporcionar una excelente utilidad. El conjunto de agentes
vuelve a poner dichas estrategias en pr actica como si nada hubiera pasado entre t = 300 y t = 500. El modelo no
contiene nada que pueda asemejarse a un aprendizaje social que tenga prevenciones por la ocurrencia eventual de
una nueva crisis. Observese que justo en la transici on cae mucho el contagio debido a ese bagaje de estrategias
sobrevivi o merced a que los agentes no tuvieron tiempo de depurarlas de su memoria por la brevedad de la crisis.
Estos resultados permiten elaborar una met afora acerca de una situaci on de alerta y p anico real como
la que se di o en el sistema bancario argentino en oportunidad de la devaluaci on del peso mejicano. Para ello la
concurrencia al bar se la hace semejante a la utilizacion del sistema bancario y los par ametros del modelo (n umero
de agentes, tasa de contagio, tasas m aximas y mnimas de concurrencia, duraci on de la crisis) pueden ajustarse
normalizando para ello los montos totales m aximos y mnimas de dep ositos en el sistema bancario nacional y el
Modelos economicos de m ultiples agentes 10/6/2010
6.4. MODELOS EVOLUTIVOS DEL APRENDIZAJE 129
tiempo que medi o entre la devaluaci on y el anuncio de la garanta de los dep ositos. Los resultados del modelo y
los reales se comparan en la gura 6.15.
El sistema de multiples agentes pasa sucesivamente por estados de orden o coordinaci on (1), alerta (3),
p anico (2), un nuevo orden (1) con un mnimo monto de dinero depositado, un reordenamiento (4), y un nuevo
estado coordinado nal (1). Es claro que el modelo no pretende dar cuenta del funcionamiento de un sistema
nanciero pues prescidne de una enorme cantidad de caractersticas propias de un sistema de ese tipo. Es sin
embargo aleccionador que una met afora tan distante de esa realidad pueda dar de todos modos cuenta cualitati-
vamente de muchas de sus caractaersticas sin tener en cuenta esos elementos.
La diferencia entre el panel de la derecha y el de la izcquierda es la diversa duraci on del estado (4). En
el panel de la izquierda se aplic o el modelo tal como est a descripto arriba, o sea, sin una memoria social de
la crisis. En este caso el modelo sugiere que los agentes vuelven a concurrir al sistema bancario como si nada
hubiera pasado, hecho que claramente no se corresponde con la realidad. En el panel de la izquierda se modic o
la conducta de los agentes agregando cautela. En este caso esta se reduce a asignar una probabilidad menor que
1 a poner en pr actica una estrategia que contempla concurrir nuevamente al bar que en este caso se corresponde
con sumarse nuevamente al sistema bancario. Se logra as reproducir el incremento gradual de dep ositos posterior
al nal de la crisis.
6.4.5 Ejemplo (IV): La telara na con m ultiples agentes
Anteriormente se dio el ejemplo de una red neuronal multicapa construida para anticipar el proceso de tanteo de
precios que se da cuando se intenta compensar excesos o defectos de demanda. En ese ejemplo, la red se dise na
para anticipar el precio que debe esperar un unico agente que participa en una futura ronda de mercado. Para
desarrollar esa red es necesario conocer cu al ha sido el resultado de experincias previas de estimacion de un precio
futuro y su posterior realizaci on en distintas rondas de mercado.
Para desarrollar esa red se presupone que se trata de un unico agente y nada se dice acerca de su contexto.
En ese modelo nada se dice acerca de la coordinaci on que es necesario que se termine estableciendo entre los
distintos agentes participantes del mercado cuando este alcanza el equilibrio.
En el presente ejemplo se muestra un modelo de coordinaci on entre m ultiples agentes que participan
descentralizadamente en el mercado cuando todos ajustan su producci on para compensar excesos o defectos de
demanda. Como se obsevar a enseguida, este ejemplo de telara na puede reducirse al problema de la concurrencia
al Bar que se menciona en la secci on dedicada al Ejemplo (II). Supondremos un escenario que consta de los
siguientes elementos:
1. Un conjunto de N pescadores (productores) que, cada da, salen a pescar.
2. Cada pescador posee un plan de pesca que cubre el presente y los subsiguientes d das.
3. Cada da la totalidad de pescadores aporta su pesca a un mercado en que todo el volumen es rematado
obteniendo un precio P (no hay acumulaci on de stocks).
4. La utilidad de cada pescador es el dinero que recibe por la venta de su producci on menos su propio costo
de producci on.
5. Los pescadores ajustan sus planes de pesca con el objeto de optimizar su utilidad (ajustan su producci on
por tanteo)
Los pescadores act uan de manera descentralizada y se supone que desconocen la curva de demanda. Se
supone que esta es tal que el precio P tiende a cero con una pesca creciente. Para el ejemplo numerico se ha
supuesto que:
P =
P
o
Q
T
(6.28)
donde Q
T
es la cantidad total de pesca y = 1/2 asegura que P 0 cuando Q
T
. Se supone adem as
que cada pescador recibe una utilidad U
i
luego de afrontar una funcion de costo que es creciente con la pesca
realizada. Ponemos:
U
i
= PQ
i
C
i
(6.29)
Modelos economicos de m ultiples agentes 10/6/2010
130 CAP
ON
donde Q
i
es la pesca del iesimo pescador (Q
T
=
P
Q
i
) y C
i
su costo que se toma como C
i
= a
i
Q
i
con a
i
una
constante propia de cada pescador y > 0 para asegurar que diverja con Q
i
.
Para posibilitar el proceso de optimizaci on se puede encarar este modelo siguiendo un esquema enteramente
similar al que se describe para resolver el BAM. Para ello se supone que cada pescador posee un plan de pesca
vigente que es el que pone en pr actica y posee adem as una poblacion de otros planes alternativos. El cumplimiento
de los planes vigentes de todos los pescadores es lo que determina el volumen de pescado que se remata cada da.
Esa es la unica informaci on que recibe cada uno de los agentes acerca de la conducta seguida por los restantes
participantes del mercado.
Los planes de pesca pueden representarse como cadenas de n umeros (en el ejemplo numerico se utilizaron
enteros) tan largas como el n umero de das de duracion del plan. La poblaci on de planes puede pues adaptarse
periodicamente evocando un algortimo genetico en el que cada genoma est a representado por los planes de pesca.
La tness del plan de pesca vigente es la utilidad realmente obtenida y la de los planes alternativos es la que
el pescador habra obtenido de haberlo puesto en pr actica.
En cada jornada de mercado, cada pescador es seleccionado aleatoriamente y con una probabilidad p para
que evoque un algoritmo genetico y actualice sus planes. Es preferible la selecci on aleatoria de agentes para
evitar un efecto irreal de muchedumbre como se coment o m as arriba con referencia al BAM. En la gura 6.16
se muestra el equilibrio entre la oferta total y demanda total de pesca, comenzando con agentes con planes de
pesca aleatorios. En este ejemplo la optimizaci on de la utilidad conlleva la coordinaci on de planes de pesca
entre distintos pescadores.
Esta es m as evidente en el caso sencillo en el que se supone una simetra total entre
todos los pescadores asignando a todos la misma funci on de costo, esto es a
i
= a, i. Esto hace que la pesca
total sea repartida por igual entre todos los pescadores. Este reparto surge del ejemplo numerico tal como se
puede observar en la gura 6.17. Un argumento para justicar este resultado s olo basado en la simetra entre
agentes puede conducir a equivocaciones. En el BAM existen las mismas condiciones de simetra ya que todos
los concurrentes al Bar son identicos y poseen iguales funciones de utilidad. A pesar de ello convergen a planes
de concurrencia que son diferentes entre si. En el ejemplo presente aun cuando la simetra y las condiciones
iniciales son semejantes la convergencia a planes identicos se produce adem as por la dependencia que posee el
precio con la conducta agregada de los agentes (el volumen total de pesca) y la relaci on que tiene la utilidad que
recibe cada uno con ese precio. El modelo computacional no tiene requerimientos de ninguna narturaleza sobre
la homogeneidad o heterogeniedad de los agentes. En el panel de la derecha de la gura 6.17 se muestran los
resultados para el caso en que las constantes a
i
son diferentes entre si. Tal como es de esperar a mayores costos
menor participaci on en el mercado.
En la gura 6.18 se muestran algunos resultados adicionales. En el panel de la izquierda se muestra el
efecto de incrementar la cantidad de agentes preservando la simetra entre todos. Las tres curvas corresponden a
la pesca total obtenida por 1,4 y 8 pescadores. Es interesante el resultado parad ojico que el equilibrio se alcanza
antes justamente cuando el problema de coordinaci on involucra a una mayor cantidad de agentes. En el panel de
la derecha se muestra el proceso de tanteo para el caso en que todos los pescadores poseen la misma funci on de
costo C = aQ
i
pero = 3.0, 2.75, 2.5 y 2.0 respectivamente. Debe observarse que en el caso en que = 2.0 el
proceso de tanteo no converge. El ejemplo numerico reproduce ese hecho y, adem as la convergencia es tanto m as
lenta cuanto m as pr oximo es el exponente a ese valor.
6.4.6 Ejemplo (V): Coadaptacion de oferta y demanda
Este ejemplo puede ser considerado como una versi on estilizada de una telara na de ajuste de precios entre entre
oferta y demanda. Consideraremos un caso de coadaptaci on entre los procesos de aprendizaje de proveedores y
consumidores.
Consideremos un conjunto N de consumidores que deben cotidianamente aprovisionarse de un bien. Puede
adquirirlo en una proveedura o en una f abrica que lo vende siempre a un precio p. La proveedura puede proveer
un bien a un precio p o P (con p < p < P). La idea es permitir que la proveedura tenga la libertad de cambiar
los precios y que los compradores tengan la libertad de elegir el lugar donde aprovisionarse.
Para decidir la compra cada consumidor posee una poblacion de predictores. Los mismos se representan
mediante una funci on booleana F : L
in
L
out
, Los espacios L
in
y L
out
son espacios de n-tuplas de longitud D
in
D
out
de variables l ogicas. En la pr actica representaremos los valores de las funciones l ogicas por 1 (verdad) y 0
Modelos economicos de m ultiples agentes 10/6/2010
6.4. MODELOS EVOLUTIVOS DEL APRENDIZAJE 131
(falsedad) y especicaremos a una funci on booleana por su tabla de verdad que es una lista ordenada de todas
las entradas y sus correspondientes salidas. (ver Tabla IV) Como es f acil darse cuenta el n umero de posibles
funciones l ogicas crece exponencialmente. Para funciones de una unica salida y D
in
entradas el n umero de
funciones booleanas es de 2
2
D
in
Los predictores de cada agente son funciones booleanas con las que el consumidor pronostica el precio que
pondra la proveedura. Se supone que los mismos son funciones booleanas de tres entradas como la de la tabla IV.
La interpretacion de un predictor es la siguiente: las tres entradas corresponden a los precios registrados durante
los tres das anteriores (con al convenci on que a un precio p corresponde un 0 y a un precio P corresponde un 1).
La salida (0 o 1) es el precio que el predictor propone para el da siguiente. Como puede verse, si se acepta que
el ordenamiento de las tres entradas es siempre el mismo, la funci on booleana queda integramente caracterizada
por la n-tupla de los 8 bits de salida, con lo que esta puede ser considerada el genoma asociado a cada predictor
de la poblaci on de cada agente que puede ser alterado en un proceso de evoluci on Darwiniana. La proveedura
tambien debe tener una poblaci on de predictores con los que dene el precio del da siguiente. En este caso se
supone que para esta funci on la proveedura analiza los 4 das anteriores con lo que el genoma de este predictor
posee 16 componentes.
TABLA IV
entrada 1 entrada 2 entrada 3 salida
0 0 0 1
0 0 1 0
0 1 0 0
0 1 1 1
1 0 0 1
1 0 1 0
1 1 0 0
1 1 1 1
Ejemplo de tabla de verdad de una funci on booleana de tres entradas y una salida (D
in
= 3, D
out
= 1)
Resta denir cu al es la funci on de tness asociada a cada individuo de la poblaci on. La tness se dene en
todos los casos como la utilidad de la estrategia utilizada. Sin embargo la misma s olo puede denirse de manera
aproximada si se lo hace aisladamente para cada una de las partes (especies) involucradas. Para ello se procede
de la manera siguiente:
1. La tness de cada predictor de un agente aumenta (disminuye) su tness si su predicci on fue correcta
(incorrecta)
2. Los predictores de cada agente se comparan con la estrategia de precios vigente de la proveedura y luego
se los ordena seg un su tness. La acci on de cada agente es de acuerdo con el predictor de m axima tness.
Despues de T
c
pasos de tiempo la poblaci on de predictores se reformula por cruza y mutaci on. Los agentes
actualizan sus predictores de manera asincr onica: s olo una fracci on de la poblaci on invoca el algortimo
genetico al mismo tiempo de modo que la siguiente actualizaci on tendr a lugar T
c
pasos de tiempo m as
tarde.
3. La proveedura posee una poblaci on de predictores de 4 entradas (son n-tuplas de 16 bits) que se actualiza
por cruza y mutaci on al cabo de T
s
pasos de tiempo invocando un algoritmo genetico.
4. Todas las estrategias de jaci on de precios son probadas contra las estrategias de compra vigentes de una
muestra aleatoria y parcial de la poblacion de agentes compradores. Esta prueba se realiza durante T
v
pasos de tiempo virtuales.
5. Una vez nalizad la rueda de T
v
transacciones virtuales las estrategias de jaci on de precios pueden ser
ordenadas de acuerdo a la utilidad que le produjeron a la proveedura (en este caso, el total de ventas
producidas durante la rueda de T
v
transacciones virtuales). La tienda proveedora adopta como la estrategia
vigente la de m axima tness.
Modelos economicos de m ultiples agentes 10/6/2010
132 CAP
ON
En las guras 6.19 y 6.20 se muestran algunos resultados de una simulaci on del modelo que se acaba de
describir. En la gura 6.19 se ilustra el proceso de tanteo entre los compradores y el vendedor al cabo del cual se
ja el precio de equilibrio. En el panel superior se muestra el precio que ja el proveedor, en el siguiente se indica
el precio promedio al que compra toda la poblaci on. En el panel siguiente se muestra el porcentaje de agentes que
est an haciendo una decisi on equivocada y en el inferior el porcentaje de agentes que se abastecen en el proveedor.
Con una echa roja se muestra un intento del proveedor de jar un precio elevado. Observese c omo el n umero de
agentes equivocados es alto al comienzo pero luego decae r apidamente.
En la siguiente gura se muestra, muy ampliado, un breve momento de otra simulaci on en la que la
condici on de agentes capaces de aprender da lugar a un estado de equilibrio sub optimo que puede prolongarse
por mucho tiempo. La proveedura alterna entre un precio alto y uno bajo. Los compradores tienden a responder
comprando solamente los das en que el precio es bajo y se abastecen en la fuente alternativa los otros das
en que el precio es elevado (los picos y los valles en el panel superior se corresponden con valles y picos en el
panel inferior). Adicionalmente, en un panel central se muestra el porcentaje de agentes equivocados. Observese
que los picos en cada cambio de precio van decayendo con el tiempo mientras que el procentaje de agentes
que concurren a la proveedur en los das acertados va en aumento. Esto muestra c omo se va generalizando
en la poblaci on la estrategia de amoldarse a los cambios de precio. Este es un equilibrio din amico que no esta
contemplado en la telara na usual. La duraci on de estas metastabilidades depende de la fracci on de la poblaci on
que se equivoca impidiendo la consolidaci on de una estrategia estable de jaci on de precios. Si la totalidad
de los agentes se comprometiera en esta estrategia cambiante el sistema se encontrara connado por barreras
entr opicas similares a las que se vieron en el caso del modelo de concurencia la bar.
Modelos economicos de m ultiples agentes 10/6/2010
6.4. MODELOS EVOLUTIVOS DEL APRENDIZAJE 133
0.45
0.5
0.55
0.6
0.65
0.7
0.75
0.8
0.85
0.9
0 20 40 60 80 100 120 140 160 180 200
BAM model: N=30, pevol = 0.1, occupation = 80%
m = 10
m = 5
Figura 6.12: Modelo BAM. Probabilidad de ocupacion para cada
paso de tiempo para m={5, 10}. Parametros N = 30, pevol =
0.1, occupation = 0.80, m = 6.
Modelos economicos de m ultiples agentes 10/6/2010
134 CAP
ON
0.45
0.5
0.55
0.6
0.65
0.7
0.75
0.8
0.85
0.9
0 20 40 60 80 100 120 140 160 180 200
BAM model: N=30, m=6, occupation = 80%
pevol = 0.1
pevol = 0.5
Figura 6.13: Modelo BAM. Probabilidad de ocupacion para cada paso
de tiempo para pevol={0.1, 0.5}. Parametros N = 30, occupation =
0.80, m = 6.
Modelos economicos de m ultiples agentes 10/6/2010
6.4. MODELOS EVOLUTIVOS DEL APRENDIZAJE 135
Figura 6.14: Comparacion de aprendizaje con y sin informacion local.
Figura 6.15: Simulacion de la crisis bancaria por la devaluacion del peso
mejicano.
Modelos economicos de m ultiples agentes 10/6/2010
136 CAP
ON
Figura 6.16: Equilibrio de oferta y demanda en el mercado de pesca. Se
ha supuesto 4 pescadores, cada uno con un total de 10 planes de pesca
de 4 das de duracion.
Figura 6.17: Panel de la izquierda: reparto de la pesca total en-
tre 4 pescadores. Panel de la derecha: reparto de la pesca entre
pescadores con distintas funciones de costo C
i
= a
i
Q
2.75
i
con a
i
=
(0.10, 0.11, 0.12, 0.13) .
Modelos economicos de m ultiples agentes 10/6/2010
6.4. MODELOS EVOLUTIVOS DEL APRENDIZAJE 137
Figura 6.18: Panel de la izquierda: Equilibrio con un n umero creciente
de agentes. Resultados con 1, 4 y 8 agentes. Panel de la derecha: Tanteo
con diferentes funciones de costo C = aQ
i
para variable.
Figura 6.19: Co-evolucion entre clientes y proveedores. Con una echa
se indica la corresponencia entre la jacion de un alto precio y una dis-
minucion del numero de compradores. Ademas son pocos los clientes que
act uan equivocados.
Modelos economicos de m ultiples agentes 10/6/2010
138 CAP
ON
Figura 6.20: Metastabilidades en una simulacion de coadaptacion entre
los compradores y el vendedor. Las lineas verticales indican la coincidencia
entre las uctuaciones en el precio que ja el proveedor y la variacion en
la clientela del mismo.
Modelos economicos de m ultiples agentes 10/6/2010
6.5. EL DISE
ON
Figura 6.21: Los replicantes compiten por recursos, algunos se complementan y consiguen aprovechar
mejor las recursos disponibles
3. Se produce una m as estrecha vinculaci on entre individuos complementarios en las que se establece una
divisi on del trabajo y se ven afectadas las funciones reproductivas de los replicantes que se han vinculado.
Aparece de este modo una unidad simbi otica entre los miembros del grupo. Esto quiere decir que la
reproduccion de algunos s olo es posible si es ventajosa para los dem as replicantes del grupo. Esta asociaci on
es vulnerable a la amenaza de par asitos que aprovechan de los recursos obtenidos por el grupo pero no
contribuyen a las funciones que hacen posible su reproducci on. La subsiguiente etapa para acceder a una
mayor complejidad se cumple cuando la asociaci on se pone a salvo de los par asitos (free riders) y evita
de ese modo la tragedia de los comunes (ver gura 6.22).
Figura 6.22: Los replicantes se asocian y compiten exitosamente por recursos. Sin embargo el sistema
es vulnerable a parasitos
4. Los replicantes (que ahora son simbiontes) se rodean de una frontera que los conna y separa del resto del
medio. La transformacion es profunda y permanente: de esta manera ha surgido una nuevo organismo.
En su seno el trabajo se divide y los recursos se comparten. Los par asitos no pueden ingresar f acilmente al
sistema y predar en los bienes comunes. Se instala un control interno estricto para que ning un replicante
se reproduzca por las suyas. Si alguno lo hace sobreviene la muerte de todo el organismo (un ejemplo del
quiebre de esta restricci on la constituye el c ancer: un grupo de celulas de un organo perteneciente a un
organismo complejo comienzan a reproducirse sin lmites alterando de manera irreparable el funcionamiento
de todo el organismo complejo) (ver gura 6.23.
Figura 6.23: Los replicantes simbiontes se rodean de una membrana que impide el ingreso de parasitos
5. Los multi-replicantes compiten entre si por recursos escasos y amoldan su estructura para hacer un mejor
uso de ellos: la historia vuelve a comenzar, pero lo hace en un nivel jer arquico de complejida mayor que el
anterior(ver gura 6.24).
Modelos economicos de m ultiples agentes 10/6/2010
6.5. EL DISE
Estos son codicados utilizando 3 nucleotidos; como hay 4 tipos diferentes de nucle otidos, tres de ellos permitiran
codicar, sin redundancias, 64 alternativas diferentes
Modelos economicos de m ultiples agentes 10/6/2010
142 CAP
ON
Balance entre exploraci on y explotacion. En su interacci on con el medio un organismo adaptivo
exitoso debe haber logrado un equilibrio entre su capacidad de explorar nuevas conductas o posibilidades
de supervivencia y la de aprovechar soluciones incorporadas a su hardware. Por ejemplo, un animal
puede sobrevivir intentando la alterantiva de fugarse ante un predador o aprovechando la soluci on que ya
tiene incorporada de enga narlo aprovechando su mimetismo con el medio.(Responde a amenazas 1 y 3)
Emergencia de reglas generativas Las reglas generativas son reglas simples que, operando du-
rante la etapa de la morfogenesis son capaces de generar fenotipos complejos. El desarrollo de tales reglas
y su incoporaci on a la informaci on heredable apunta a resolver la imposibilidad de codicar una estruc-
tura fenotpica compleja que es necesaria para la supervivencia pues esta informaci on puede exceder la
capacidad de almacenamiento de informaci on en el sistema genetico. Un ejemplo es la constituci on del
Sistema Nervioso Central del ser humano: el genoma carece de suciente capacidad de almacenamiento
de informaci on como para codicar todas las 10
15
sinapsis nerviosas que lo conforman. La soluci on es
transmitir la informaci on de la sntesis quimica de los factores de crecimiento del mismo que hacen que el
mismo crezca, se desarrolle y conforme de manera adecuada (responde a la amenza 2).
Genesis de subsistemas exibles En el dise no de un sistema adaptivo no es dable prever todas las
variantes del medio en que se va a desarrollar ni todas las respuestas posibles a dichas variantes. La manera
de asegurar la supervivencia es mediante la genesis de subsistemas en los que, mediante un proceso de
variaci on y selecci on Darwinana, sean capaces de dar respuesta a problemas particulares. Un ejemplo es el
desarrollo de un sistema inmunitario. Este sistema es capaz de generar anticuerpos destinados a neutralizar
las amenazas qumicas del medio. Es in util transmitir la informaci on inmunitaria de los progenitores por
medio de la herencia por cuanto el medio que enfrentar an sus descendientes puede ser muy diferente al
que ellos han encontrado. La respuesta evolutiva m as exitosa es la de generar un sistema exible que sea
capaz de generar las defensas correspondientes en el momento oportuno. Otro ejemplo es la genesis de un
sistema de aprendizaje como los que se han ejemplicado con anterioridad (responde a la amenza 3).
Simbiosis Ya se vi o en la secci on anterior de que modo la cooperaci on entre entidades separadas pueden
permitir una mayor ecacia en la explotacion de los recursos del medio preservando la identidad e infor-
maci on genetica de los simbiontes (responde a la amenza 1).
Genesis de subsistemas instruccionales Cuando el medio ambiente presenta regularidades a lo largo
de generaciones, estas pueden dar lugar a respuestas autom aticas. Un ejemplo en este sentido son los los
ritmos biol ogicos de numerosos seres vivos en sincrona con la alternacia del da y la noche o las estaciones
del a no (responde a las amenzas 2 y 3)
Modelos economicos de m ultiples agentes 10/6/2010
Captulo 7
Mercados y Experimentos
7.1 Introducci on
Una de las aplicaciones m as atractivas de los sistemas complejos, es en el problema de la formaci on y fun-
cionamiento de los mercados en una economa. Este problema tiene varios aspectos interesantes como la formaci on
y evoluci on de un mercado, c omo se jan los precios en el mismo, y cu al es la distribuci on de riquezas a la cual
se llega. Este problema, central en la economa, pone en contacto los aspectos estrategicos de toma de decisiones
que enfrenta un individuo, con los aspectos sociales de interacci ones m ultiples entre muchos individuos, a lo que
cotidianamente llamamos competencia.
Dentro de los sistemas complejos, podemos decir que un mercado no es mas que la propiedad emergente de
las interacciones que realizan un conjunto de agentes utilizando recursos limitados tanto fsicos como temporales.
En este esquema, la competencia corresponde al proceso adaptativo que los individuos ejercitan para permanecer
en el mercado y no desaparecer (nuevamente por la nitud de los recursos).
Dentro de una formulaci on minimal de un mercado, quisieramos imponer que los recursos tanto fsicos,
temporales (no tienen tiempo innito para recolectar toda la informaci on relevante para determinar su mejor
acci on), como computacionales, son limitados. A nivel individual los agentes rma y consumidor enfrentan dos
problemas complementarios: la rma deber a:
denir con que precio sale al mercado cada da, y
preveer cu anto es su reposici on frente a las ventas esperadas
mientras que por el otro lado el consumidor deber a:
decidir a a que rma le compra, y
cu anto le compra o su gasto planicado
Hay que notar que en esta formulaci on estamos suponiendo que el vendedor forma el precio, y el comprador solo
decide cuanto compra a ese precio.
Dentro de las preguntas v alidas que nos gustara formular en un modelo de mercado desde los sistemas
complejos son:
Cu ales son las condiciones minimales de racionalidad e informaci on que cada individuo debe contar para
que exista un mercado?
Cu ales son las condiciones necesarias para que exista competencia y c omo depende de lo sosticado de
las estrategias utilizadas?
Que tan robusto es un mercado frente a perturbaciones exogenas?
143
144 CAP
], y los benecios: b
i
t
= (p
i
t
c)x
i
t
.
La demanda de bienes proviene en principio de un conjunto de consumidores. Sin embargo, en la presente
formulaci on, asumiremos que no hay limitaciones en la informaci on que el demandante tiene sobre los
precios (y eso es de conocimiento com un) y los demandantes desean visitar en el orden (t) dictado por los
precios ofrecidos
p
i
t
ascendentes (hay desempate aleatorio si hay dos vendedores con el mismo precio).
M as abajo justicamos lo que llamaremos la aproximacion de un solo comprador. Este comprador virtual
posee un gasto planicado total M, que utiliza en cada perodo t para visitar los N vendedores, en el orden
de visita (
p
i
t
).
En cada perodo el consumidor intenta gastar la totalidad de su gasto planicado M, visitando las rmas
en el orden (
p
i
t
p
i
t
p
i
, x
i
, z
i
<t
, incluyendo en particular, si los hubiera, a los
pedidos no abastecidos por restricciones de capacidad. No hay informaci on global, o conocimiento sobre
los precios y ventas de otras rmas.
La aproximaci on de un solo comprador utilizada en esta formulaci on, descansa en que todos los compradores
tienen pleno conocimiento de los precios anunciados
p
i
t
ON BOTTOM-UP 145
orden de precios ascendentes (t). Bajo estas circunstancias, no importa como se organicen los consumidores en
visitar cada rma (sea sincr onica, asincr onica, aleatoria o orden jo), el resultado es que la demanda percibida por
las rmas es la equivalente a la de un solo comprador por la totalidad M de la masa de dinero que los consumidores
disponen como gasto planicado, y en cada perodo solo una rma vende y < y
(7.1)
En lo que sigue suponemos que el costo c > 0 de cada bien, satisface p
eq
> c > 0, o
M > c Ny
> 0 (7.2)
si no estamos en caso particular no muy interesante.
Ahora, este precio de mercado no es un equilibrio de Nash. Supongamos que todas las rmas proponen
vender al precio p
eq
, recibiendo su fracci on
M
N
del gasto planeado del comprador y un benecio
b
eq
= (p
eq
c)y
=
M
N
cy
(7.3)
Cada una, preferir a aumentar su precio p, para disminuir sus ventas y < y
)
, .., p
(N)
)
y ventas y (y
(1)
, y
(2)
, .., y
(k
)
, 0, 0). Destacamos el ranking k
N de la rma (k
), que corresponde a la
rma que logr o vender una cantidad positiva y
/N de la siguiente forma:
p) = p) =
N
X
j
p
j
/N
=
k
1
X
i
p
i
/N + p
k
+
N
X
j=k
+1
p
j
/N
=
M
Ny
+
N
X
j=k
+1
p
j
/N = p
eq
+
N
X
j=k
+1
p
j
/N (7.4)
Ahora si suponemos que la distribuci on de precios tiene varianza nita y picuda, tenemos,
p) = p
eq
+ (N k
)p)/N +
N
X
j=k
+1
(p
j
p))/N
p
eq
+ (N k
)p)/N
1
Si se generaliza la aproximaci on de un solo comprador a K consumidores que cada uno compra solo a un
subconjunto de las N rmas estableciendose una red bipartita, en este caso puede haber m as de una rma que
haga ventas parciales, como ocurre en la realidad.
Modelos economicos de m ultiples agentes 10/6/2010
146 CAP
/N
(7.5)
donde establecemos la relaci on entre el precio promedio del mercado con la fracci on de rmas que venden y el
precio de equilibrio. En particular cuando todas las rmas venden, k
= N, y p) p
eq
, mientras que si k
< N
el precio promedio p) > p
eq
.
Por otro lado tenemos que
y) =
N
X
y
i
/N
= (
k
1
X
j=1
y
j
+y
k
+
N
X
j=k
+1
y
j
)/N (7.6)
=
(k
1)y
+y
k
N
k
N
con lo que
y)
y
N
1 (7.7)
donde establecemos la relaci on entre la fracci on de rmas que venden una cantidad positiva y el promedio de las
ventas del mercado. Es decir, usando (7.5) y (7.7) es equivalente conocer la fracci on de rmas que venden k
/N,
el precio promedio del mercado p) o las ventas promedio del mercado q).
El estado estacionario de este sistema no tiene un equilibrio donde p
i
= cte para todos los vendedores, ya que
se puede ver facilmente que la din amica fuerza a los agentes a reveer su precio a la suba o a la baja indefectiblemente
en todos los pasos. Esto lleva a que el sistema pueda llegar a un estado estacionario, posiblemente con una
distribuci on de precios instant anea que cambia en el tiempo, pero que sea estable si se promedia temporalmente.
Uno espera que las rmas econ omicamente racionales que logran ventas totales agentes aumenten o al
menos dejen el precio constante. O que bajen el precio si no realiza ninguna venta.
7.3 Formacion de precios: modelo Brutus
Falta establecer c omo dado el conjunto de informaci on
i
t
cada rma establece p
i
t
. En este punto, sin duda
hay muchisimas posibilidades. Comenzando con algo lo m as sencillo posible, proponemos la siguiente regla de
comportamiento b asica:
Si vendo todo, aumento el precio en una constante
up
; caso contrario, lo disminuyo en una constante
down
Concretamente la regla es:
p
i
t+1
= p
i
t
+
up
, si y
i
t
= y
down
, si y
i
t
< y
donde y
i
t
y
t
, vendieron todo y
saben que podran haber aumentado el precio para obtener mayores benecios. Cuando no vendieron la totalidad
de su producci on, saben con certeza que su precio estaba por encima de p
k
t
, por lo que irremediablemente deber an
bajar su precio para el pr oximo perodo.
Una variante sutil que exploraremos es suponer que
Si vendo todo, aumento el precio en una constante
up
; si vendo parcialmente con probabilidad h
mantengo el precio y con 1 h lo bajo; si no vendo nada, lo disminuyo en una constante
down
Modelos economicos de m ultiples agentes 10/6/2010
7.3. FORMACI
t
como la cantidad de vendedores que lograron vender la totalidad de sus productos al
nal de la ronda de compra. Tenemos que debido a las ventas recientes, se debio cumplir que la cantidad total de
dinero volcada al sistema por el comprador es igual (excepto por el ultimo Mohicano) a los precios * cantidades
de los vendedores. Pero como la capacidad m axima de todos los vendedores es la misma tenemos que:
n
t
X
p
i
= M/y m (7.8)
donde para simplicar la notaci on, los p
i
est an ordenados de menor a mayor: p
n
> p
n
1
> ... > p
1
.
Ahora como todos estos vendedores vendieron, suben su precio en , por lo que podemos estimar cuanto
disminuye n
debido al
aumento de todos los vendedores.
De las expresiones (7.8) y (7.9) tenemos la relaci on:
n
t
X
n
+
t
p
i
(t) = n
+
(7.10)
Ahora si consideramos los vendedores |n
+ 1, n
+ 1, n
+ 2, ..., N (7.11)
porque si no logran mejorar el precio del mejor vendedor, no alteran la condici on de equilibrio realizada en la
suba de precios (7.9).
Supongamos que hay r
t
< N n
t
de estos individuos que efectivamente mejoran el precio p
n
+
. Esto
introduce un nuevo cambio en la cantidad de agentes que dene quien va a vender en el paso t +1, n
t+1
. Esto se
calcula balanceando la cantidad total de dinero que introducen los que bajaron sus precios en , por la suma de
la cantidad de dinero de los vendedores m as caros:
n
t
+r
t
X
n
t
+1
(p
j
(t) ) =
n
+
t
X
n
+
t
s
t
p
i
(t) (7.12)
donde s es la cantidad de agentes que vendieron (y aumentaron), pero que quedaron muy caros frente a los que
bajaron en . En resumen la nueva cantidad de agentes que van a vender en el paso t + 1 es
n
t+1
= n
+
t
s
t
+r
t
(7.13)
7.3.2 Aproximaci on
Podemos aproximar las ecuaciones de arriba en el caso donde los precios son parecidos entre si.
Para (7.10) si los precios que vendieron son todos muy parecidos [p
i
p
j
[ ,
(n
n
+
) p
i
= n
+
n
+
=
n
1 +/ p
i
< n
(7.14)
Modelos economicos de m ultiples agentes 10/6/2010
148 CAP
t+1
n
t
1 +/ p
i
+r
t
1
p
j
p
i
(7.16)
que nos queda como funci on de r
t
, y faltaria estimar una evoluci on para la misma. Tenemos la cota de r
t
< Nn
,
con lo cual quedaria
n
t+1
<
n
t
1 +/ p
i
+ (N n
t
)
1
p
j
p
i
(7.17)
Podemos decir algunas consecuencias de estas ecuaciones.
Lo que queda claro es que n
baja por la suba de los que vendieron y sube con los que bajan el precio.
De (7.16) si p
j
p
i
y es sucientemente chico, n
sea menor a N y r
t
> 0, y tenemos que
n
<
N
1 +
1/ p
i
p
j
p
i
<
N
1 +
p
i
p
j
(7.18)
de donde tenemos que si = , y p
i
p
j
, sale n
, es decir p
>
N
N1
p
eq
. En ese caso, las N 1 rmas mas baratas no todas van a
lograr vender la capacidad m axima, y la rma N, no importa su precio p, obtendr a ventas y benecios
nulos.
Sea M > (N 1)p
, o bien, p
<
N
N1
p
eq
. Entonces, si la rma N ja un precio p > p
, realiza ventas
positivas, de monto dado por py = M (N 1)p
= (Np
eq
(N 1)p
) y
= M(1
N1
N
p
p
eq
). Es claro
que la elecci on de la rma es entre un precio innito (que implica ventas nulas, por lo tanto costos nulos),
o un precio algo inferior a p
= py =
`
Np
eq
(N 1)p
p
= (p
c)y
(7.20)
Modelos economicos de m ultiples agentes 10/6/2010
7.3. FORMACI
>
p
equivale a:
`
Np
eq
(N 1)p
> (p
c)y
(7.21)
o sea:
p
< p
eq
+
c
N
(7.22)
Finalmente, como este caso requiere p
<
N
N1
p
eq
, para
N
N1
p
eq
> c, tenemos que .
p
< p
eq
+
c
N
<
N
N 1
p
eq
(7.23)
Entonces, las decisiones optimas del N- esimo oferente seran:
(p, y) (, 0) si p
< p
eq
+
c
N
p = p
, y = y
( innitesimal ) cuando p
> p
eq
+
c
N
Se ve que estas condiciones de optimo generaran un ciclo (Edgeworth 1897): si los precios del conjunto
de las rmas son altos (respecto de la cota p
eq
+
c
N
), habra incentivos para rebajas competitivas de precios,
que reduciran el nivel medio por debajo del lnite, e induciran a alguna rma a saltar a un precio alto.
Al respecto, se observa que el precio medio p
eq
+
c
N
es un lmite para el tipo de ajuste preferido por la rma
residual, pero no calica como posible punto de reposo, porque ah, el oferente N no preere quedarse, sino
que es indiferente entre una peque na disminuci on y un gran aumento.
7.3.4 Umbral de competencia
Existe un interesante umbral en este juego. Supongamos que estamos en una situaci on donde el vendedor m as
caro del mercado debe decidir que precio p vender su mercadera, conociendo que sus N1 competidores tuvieron
un precio promedio p
+py (7.24)
donde el vendedor m as caro decide p y vender a y. Para que el vendedor tenga ventas y > 0 se debe cumplir,
p
<
M
(N 1)y
(7.25)
ya que de lo contrario el comprador habra agotado todo su gasto planicado en los N 1 vendedores anteriores.
Como el benecio de cada vendedor es = (p c) y, denamos el cambio de benecio =
,
como la diferencia entre en benecio del jugador m as caro, = (p c) y, y el benecio promedio del mont on
= (p
c) y
c)y
= py +c(1 y) p
= M (N 1)y
+c(1 y) p
= M Ny
+c(1 y)
= N
p
eq
p
+
c
N
(1 y)
lo que nos permite estudiar como es el cambio de benecio para las ventas realizadas y, como funci on de p
eq
,
p
, c y N. Sin duda, que vender lo menos posible al precio m as alto, mejora , por lo que podemos acotar
< N
p
eq
p
+
c
N
(7.26)
De aqui que para p
= p
eq
, el m aximo cambio de benecio es max = c y es positivo. Para p
eq
+c/N > p
> p
eq
,
tenemos que max > 0, pero para p
eq
+c/N < p
= 1, b
eq
= 0.85
La din amica mec anica que presentan los agentes en este mercado, determinan que la varianza de precios
sea del orden de max(
down
,
up
). Adem as el precio estacionario que arriba el mercado depende de
up
/
down
.
7.4 Formacion de precios: modelo Maximizador de Benecios
Otra variante, un poco m as sosticada, es permitir al agente adaptar el precio en funci on de su cambio de
benecio a un perodo. Esto permite que el agente intente realizar una maximizaci on local, y como veremos,
permite minimamente detectar oportunidades que ofrezca el mercado.
La regla de comportamiento b asica para el modelo maximizador de benecios se puede resumir en la
siguiente tabla:
p
t
b
t
p
t+1
> 0 > 0 > 0
> 0 < 0 < 0
< 0 > 0 < 0
< 0 < 0 > 0
Modelos economicos de m ultiples agentes 10/6/2010
7.4. FORMACI
( 1), si y
t
= 0, y
t1
= 0
( 1/2), caso contrario
(7.27)
donde [0, 1] es una variable aleatoria uniforme. El primer termino es una medida del cambio de benecio
actual, con el cambio de precios realizado; si la cantidad es positiva, indica que el cambio de precios fue efectivo y
vuelve a proponer un cambio de precios proporcional a ese cambio; si en cambio, el cambio no fue efectivo, busco
en precios m as bajos.
Esta especicaci on en terminos de variaci on, no resuelve el caso que el agente no perciba cambios en su
benecio, tanto porque b
t
= 0 o p
t
= 0. Por lo tanto, agentes que logran obtener un m aximo en sus benecios a
un perodo, no cambiar an de precios. Ac a introducimos una variante de tanteo aleatorio que se hace importante
cuando el agente esta cercano a su m aximo local.
7.4.1 Experimentos numericos
Los experimentos numericos revelan que este mecanismo de formaci on de precios es muy efectivo para que el
mercado obtenga en promedio el precio de equilibrio competitivo p
eq
y su correspondiente b
eq
= p
eq
c. En la
g. 7.2 se muestra la evolucion temporal del precio promedio del mercado y su benecio, y ambos coinciden con
el precio y benecios te oricos de plenas ventas y m aximos benecios.
Sin embargo, por la regla de decis on de precios, sabemos que los agentes estan continuamente modicando
sus precios, de acuerdo a su cambio de benecio b
t
y p
t
. Observando la traza temporal para un solo agente en
la g. 7.2, se observa que en terminos generales es muy parecida al caso de formacion de precios Brutus (g. 7.1),
donde a medida que logra vender todo, y dado que aument o precios, contin ua aumentando precios. Esto se ve
limitado por la restricci on monetaria y de capacidad de los vendedores, con los que cuando en un perodo no
vende, la rma obtiene un b
t
< 0 y baja indefectiblemente su precio. En este mercado, los agentes bajan su
precio proporcional a b
t1
= (p c) (si vendieron todo en t 1). Esas caidas bruscas de precio se pueden
observar en g. 7.2 en los perodos t = |3300, 5000, ...
Por otro lado, se observan ciertos momentos donde el precio no cambia (por ejemplo t (5500, 5600)),
y el agente est a dominado por el tanteo aleatorio governado por el termino . Simulaciones con = 0 se logra
llegar a un equilibrio, donde todos los agentes congelan su precio en uno que hace que en dos perodos lograron
vender todo. Esta selecci on de equilibrio (cada agente a un precio potencialmente distinto), resulta parecida a la
coordinacion que se observa en el modelo BAM.
7.4.2 Evoluci on temporal de precios depende de N
Una diferencia importante que subyace en el modelo de benecios, es que la combinaci on de b usqueda de maximo
local que ofrece el tanteo aleatorio y b
t
, es que si la cantidad de vendedores es sucientemente peque na, se
observan fen omenos oligop olicos.
En la g. 7.3 se muestra un experimento numerico donde hay solo 4 vendedores. En esta situaci on se
muestra como 3 agentes pueden vender a toda capacidad y aumentar signicativamente su precio por arriba de
p
eq
, a costa de que el agente de precio m as alto venda menos que su capacidad m axima.
Experimentos numericos para distintos muestran que el comportamiento del precio frente a N tiene un
decaimiento exponencial. La g. 7.4 muestra el promedio de 50 realizaciones, promediando los ultimos 500 precios
del mercado de todos los vendedores. Las simulaciones tuvieron una duraci on de 5000 pasos de tiempo.
Modelos economicos de m ultiples agentes 10/6/2010
152 CAP
= 1, b
eq
= 0.85
Modelos economicos de m ultiples agentes 10/6/2010
7.4. FORMACI
= 1, b
eq
= 0.85
Modelos economicos de m ultiples agentes 10/6/2010
154 CAP
= 1, b
eq
= 0.85
7.5 Competencia entre modelos de formacion de precio
Los dos modelos de formaci on de precio descriptos tienen algunas caractersticas parecidas, y otras no. A priori,
resulta tentantivo pensar que los vendedores que forman precios maximizando benecios (los llamaremos vende-
dores MaxBene) deberan poder lograr un mejor benecio si se encuentran con vendedores Brutus, debido a que
los primeros, en principio, son capaces de detectar una oportunidad de mercado mediante el tanteo que realizan.
En el siguiente experimento numerico, pusimos a competir una poblaci on de vendedores, donde la mitad
son Brutus, y la mitad restante son MaxBene. Para este experimento se eligieron los valores de comportamiento
de
up
/
down
= 1 de manera que el precio de equilibrio tentativo para los vendedores Brutus sin los vendedores
de la otra especie, sera p
eq
brutus
= 2. El experimento numerico muestra como el mercado encuentra un precio
intermedio entre el de equilibrio competitivo que correspondera a vendedores solo MaxBene y p
eq
brutus
= 2. En
color magenta, se muestra un vendedor Brutus que mec anicamente forma un precio que siempre se ubica con
precios en la mitad m as cara de todo el mercado, empujando el precio promedio del mismo por arriba de lo que
sera si el mercado est a compuesto por vendedores MaxBene, y por debajo si solo hubiera vendedores Brutus.
Modelos economicos de m ultiples agentes 10/6/2010
7.5. COMPETENCIA ENTRE MODELOS DE FORMACI
ON DE PRECIO 155
Figura 7.5: Evolucion temporal del mercado con la mitad de la poblacion
con vendedores Brutus y el resto con vendedores MaxBene. Se observa
que los vendedores MaxBene logran explotar a los Brutus. En color
magenta se indica un vendedor Brutus mostrando que estos tienden
a ser los vendedores de mayor precio en la poblacion. Parametros del
experimento: N = 40, M = 40,
down
= 0.15, = 0.10, = 0.01, c =
0.15, y
= 1
Modelos economicos de m ultiples agentes 10/6/2010
156 CAP
= 1
Modelos economicos de m ultiples agentes 10/6/2010
7.6. EXPERIMENTOS 157
7.6 Experimentos
Un ejercicio sumamente instructivo es validar los modelos te oricos descriptos anteriormente por medio de exper-
imentos con sujetos reales. Anteriormente ya se han realizado experimentos similares, ver (Kruse, Rassenti, and
Smith 1994).
Nuestro experimento se prepar o como una aplicaci on de Internet en el sitio www.elautomaeconomico.com.ar.
A los sujetos solo se les informaba el costo del bien, sus ultimas 5 jugadas (precio, cantidad vendida, benecios).
En cada paso de tiempo se les solicitaba el precio p
i
t
, y una vez que respondieran todos los del mismo experi-
mento, se le devolva el resultado de sus ventas y sus benecios. Los sujetos no conocan la cantidad de jugadores
participando en su mismo experimento, ya que el experimentador podan inicializar m as de un experimento al
mismo tiempo repartiendo los jugadores en distintos grupos independientes.
Se probaron distintas condiciones iniciales partiendo del costo del bien, o partiendo del precio de equilibrio
competitivo.
Modelos economicos de m ultiples agentes 10/6/2010
158 CAP
= 3
Modelos economicos de m ultiples agentes 10/6/2010
7.6. EXPERIMENTOS 159
Figura 7.8: Series temporales donde se resaltan las jugadas de 3 r-
mas. (Arriba) Precio como funcion de tiempo. Tambien se mues-
tra las cantidades como fraccion de la cantidad maxima. (Abajo) Se-
rie temporal de los benecios promedio.Parametros del experimento:
N = 12, M = 80, p
eq
= 2.22, c = 0.90, y
= 3
Modelos economicos de m ultiples agentes 10/6/2010
160 CAP
= 3
Modelos economicos de m ultiples agentes 10/6/2010
7.6. EXPERIMENTOS 161
Figura 7.10: Series temporales del experimento 13, donde se muestran
la variacion de precios para un subconjunto de los agentes. La variacion
ha sido centrada alrededor de la {1, 2, 3, 4} para que sea mas clara la
variacion. Se aprecia que los cambios de precio en general disminuyen a
medida que pasa el tiempo. Parametros del experimento: N = 15, M =
200, p
eq
= 4.44, c = 0.50, y
= 3
Modelos economicos de m ultiples agentes 10/6/2010
162 CAP
= 3
Modelos economicos de m ultiples agentes 10/6/2010
7.6. EXPERIMENTOS 163
Figura 7.12: Histogramas de precios para el experimento 12. Se descar-
taron los primeros 15 perodos. El pico alrededor de p 2.3 corresponden
a las jugadas de un solo jugador a lo largo del tiempo. Parametros del
experimento: N = 15, M = 200, p
eq
= 4.44, c = 0.50, y
= 3
Modelos economicos de m ultiples agentes 10/6/2010
164 CAP
, y
t
=
y
.
Jugador 9 10 11 12 13 15 17 19 20 22 23 25 totales
y
t
= y
39 31 32 31 41 42 38 33 37 37 32 45 438
y
t
= y
y p
t+1
> 0 15 27 23 17 29 30 32 15 15 14 19 14 250
y
t
= y
y p
t+1
= 0 20 4 9 14 2 9 5 15 21 22 9 25 155
0 < y
t
< y
6 3 7 9 2 3 2 4 5 5 6 2 54
y
t
< y
y p
t+1
> 0 0 0 0 0 0 0 1 1 0 0 2 0 4
y
t
< y
y p
t+1
= 0 0 0 1 0 0 0 0 1 1 0 0 0 3
y
t
= 0 3 14 9 8 5 3 8 11 6 6 10 1 84
y
t
= 0 y p
t+1
> 0 0 1 0 0 0 0 0 0 0 0 0 0 1
y
t
= 0 y p
t+1
= 0 0 0 0 0 0 1 0 0 0 1 0 0 2
de donde obtenemos las siguientes probabilidades de transici on :
prior p
t+1
< 0 p
t+1
= 0 p
t+1
> 0 total events
y
t
= y
up
0.14 0.04 0.07 0.07 0.06 0.13 0.07 0.15 0.09 0.07 0.07 0.02
down
-0.12 -0.03 -0.08 -0.04 -0.07 -0.42 -0.24 -0.12 -0.24 -0.04 -0.10 -0.09
[
up
/
down
[ 1.12 1.16 0.88 1.74 0.79 0.28 0.27 1.28 0.38 1.57 0.73 0.24
que da un promedio
up
) = 0.08,
down
) = 0.13 y [
up
/
down
[) = 0.87.
Descartando el transitorio
Si de todas las series temporales, solamente la ultima mitad de los puntos (para descartar la aproximaci on al
estado estacionario), obtenemos:
de donde obtenemos las siguientes probabilidades de transici on :
prior p
t+1
< 0 p
t+1
= 0 p
t+1
> 0 total events
y
t
= y
up
0.14 0.013 0.017 0.075 0.02 0.24 0.02 0.02 0.03 0.010 0.015 0.01
down
-0.08 -0.019 -0.031 -0.014 -0.04 -0.50 -0.11 -0.02 -0.06 -0.017 -0.018 -0.01
[
up
/
down
[ 1.74 0.70 0.54 0.52 0.55 0.48 0.19 0.94 0.53 0.60 0.84 1
Modelos economicos de m ultiples agentes 10/6/2010
7.7. CONCLUSIONES 165
que da un promedio
up
) = 0.045,
down
) = 0.076 y [
up
/
down
[) = 0.72. El valor del precio estacionario
para este mercado, sera del orden de p) = p
eq
(1 h
down
+ h
up
up
/
down
) 1.19 que se compara con
p) = 1.21 0.1 del experimento 13.
En la g. 7.13 se muestra un ejemplo donde cuando vende todo con una determinada probabilidad h, no
cambia el precio.
Figura 7.13: (Arriba) Evolucion temporal del precio promedio del mer-
cado, su valor maximo y mnimo para el modelo Brutus, con prob-
abilidad h = 0.35 no cambia el precio cuando vende todo, y la mi-
tad de la poblacion tiene
up
=
down
= 0.08 y el resto tiene
up
= 0.08,
down
= 0.1. Tambien se muestra en color magenta
el precio de un solo vendedor, mostrando su comportamiento. Pre-
cio promedio en t = 200 es p
200
= 1.53. (Abajo) Evolucion tempo-
ral del benecio promedio del mercado. Parametros del experimento:
N = 15, M = 15, c = 0.15, p
eq
= 1, y
= 1, b
eq
= 0.85
7.7 Conclusiones
En este Captulo se avanz o sobre un modelo de mercado minimal, cuya principal caracterstica era su simplicidad
frente al tipo de comportamiento esperado. El mismo pudo contrastarse mediante un experimento, que arroja
resultados alentadores en cuanto permite estimar el precio promedio del mercado, y en principio sera posible
estimar como es la dependencia funcional de dicho precio cambiando el n umero de jugadores N.
Modelos economicos de m ultiples agentes 10/6/2010
166 CAP
IA
Kleinberg, J. (2000): Navigation in Small World, Nature, 406, 845.
Kruse, J., S. Rassenti, and V. Smith (1994): Bertrand-Edgeworth Competition in Experimental Markets,
Econometrica, 62, 343372.
Mantegna, R. N., and H. E. Stanley (1995): Scaling Behviour in the Dynamics of an Economic Index,
Nature, 376(6), 4649.
Newman, M. E. J. (2005): Power laws, Pareto distributions and Zipfs law, Contemporary Physics, 46, 323
351, condmat/0412004v3.
Nowak, M. A., S. Bonhoeffer, and R. M. May (1994): Spatial Games and the Maintenance of Cooperation,
Proc. Natl. Acad. Sci. USA, 91, 48774881.
Nowak, M. A., and R. M. May (1992): Evolutionary Games and Spatial Chaos, Nature, 359, 826829.
Pastor-Satorras, R., and A. Vespignani (2001): Epidemic Spreading in Scale-Free Networks, Phys. Rev.
Lett., 86(14), 32003203.
Schelling, T. (1971): Dynamic Models of Segregation, Journal of Mathematical Sociology, 1, 143186.
Shannon, C. E. (1948): A Mathematical Theory of Communication, The Bell Systema Technical Journal, 27,
379423,623656.
Silva, A. C., and V. Yakovenko (2004): Temporal Evolution of the thermal and superthermal Income
Classes in the USA During 19832001, Europhysics Letters, e-print arXiv:cond-mat/0406385v3.
Smith, E., J. D. Farmer, L. Gillemot, and S. Krishnamurthy (2002): Statistical theory of the continuous
double auction, Quantitative Finance, e-print cond-mat/0210475.
T. Gross, C. J. Dommar, D. L., and B. Blasius (2006): Epidemic Dynamics on an Adaptive Network,
Physical Review Letters, 96, 208271.
Watts, D. J. (2002): A simple model of global cascades on random networks, Proc. National Academy of
Science, 99(9), 57665771.
Watts, D. J., and S. H. Strogatz (1998): Collective dynamics of small-world networks, Nature, 393, 440
442.
Weiss, G. (1999): Multiagent Systems. A Modern Approach to Distributed Artical Intelligence. The MIT Press.
Wolfram, S. (1984): Universality and complexity in cellular automata, Physica D, 10, 135.
Modelos economicos de m ultiples agentes 10/6/2010