Documente Academic
Documente Profesional
Documente Cultură
TEORIA DE JUEGOS
JUEGOS DINAMICOS DE INFORMACIN COMPLETA
Juego Dinmico
Un juego dinmico, es un juego secuencial (a diferencia de los juegos estticos), donde los
jugadores adquieren nueva informacin, respecto a lo realizado por los dems jugadores,
mientras el juego se desarrolla. En los juegos dinmicos la estructura secuencial del juego tiene
relevancia, es por ello que se recomienda utilizar la forma extensiva para poder analizar un
juego dinmico.
Juego de informacin completa
Al igual que en los juegos estticos de informacin completa, tanto la estructura del juego, la
racionalidad de los jugadores y los futuros pagos, de acuerdo a las estrategias utilizadas, son de
conocimiento comn.
Un juego dinmico de informacin completa puede ser representado mediante la forma normal
o estratgica, sin embargo al utilizar esta representacin podemos encontrar los equilibrios de
Nash, tal y como se ha estudiado en la parte de juegos estticos de informacin completa. Sin
embargo, en el caso de juegos dinmicos (como se dijo en la definicin de juego dinmico)
resulta ms apropiado contar con una representacin del juego que muestre la estructura
secuencial del juego. La representacin en su forma extensiva de un juego incorpora
explcitamente la estructura secuencial. Utilizando esta representacin de los juegos dinmicos
podemos encontrar lo que se conoce como Equilibrio de Nash perfecto en subjuegos, el cual es
el concepto de solucin en juegos dinmicos (a diferencia de los Equilibrios de Nash en juegos
estticos) que ser explicado ms adelante.
Ejemplo 14 Dilema del Prisionero (diferencia entre juegos estticos y dinmicos)
Recordemos el enunciado del dilema del prisionero, el cual se representa en su forma normal de
la siguiente manera
NC
NC
( 2,2 )
J2
( 0,3 )
J1
C
( 3,0 )
( 1,1 )
Panel A: Juego esttico
Panel B: Juego dinmico
Para poder representarlo en su forma extensiva utilizaremos el diagrama de rbol. Para este caso
como ya hemos entrado a la parte de juegos dinmicos haremos una distincin en la forma
extensiva de representar un juego esttico y dinmico, para ello representamos el dilema del
prisionero en su forma extensiva donde:
Panel A: Dilema del prisionero en juegos estticos
Panel B
: Dilema del prisionero en juegos dinmicos. Para esta versin del
dilema del prisionero, tenemos que el jugador 1 elige primero su accin, la cual es
observada por el jugador 2 antes de que l deba elegir su accin. Es por ello que se les
conoce como juegos secuenciales.
A continuacin la forma extensiva del dilema del prisionero
Pgina 1 de 15
TEORIA DE JUEGOS
J1
J1
NC
NC
J2
NC
(22)
J2
J2
(03)
NC
(30)
(11)
NC
(22)
J2
(03)
NC
(30)
(11)
Las lneas punteadas del panel A que unen los nodos de decisin del jugador 2 nos hace
referencia a que el juego es un juego esttico, donde el plan de accin se toma al inicio del
juego (por ambos jugadores) mientras que el juego representado en el panel B nos muestra la
secuencialidad del juego, donde el jugador 2 decidir qu estrategia usar dependiendo de la
estrategia tomada por el jugador 1.
Diferencia entre accin y estrategia
En los juegos estticos vistos anteriormente no exista diferencia entre accin y estrategia. La
estrategia de un jugador consista en la eleccin de una accin. Sin embargo, en los juegos
dinmicos una estrategia es muy diferente a una accin. Los jugadores pueden ir tomando
distintas acciones a lo largo del juego. La estrategia de un jugador es un plan contingente
completo de accin.
Representacin extensiva
La definicin matemtica de un juego en su forma extensiva consiste en la descripcin de los
elementos que lo componen:
1. Un conjunto finito de jugadores
Un conjunto finito de acciones
Un conjunto finito de nodos
N .
A=i N A i .
X .
A continuacin se utiliza el ejemplo anterior donde se representan los nodos los cuales estn
encerrados con un crculo rojo
Pgina 2 de 15
TEORIA DE JUEGOS
J1
J1
NC
NC
J2
NC
(22)
J2
J2
NC
(03)
2. Una funcin
p: X
NC
(30)
(22)
(11)
J2
NC
(03)
(30)
(11)
Nodos terminales
T ={ x X }
representan los resultados del juego y a los que se asocian los pagos
correspondientes de cada jugador.
X T
x0
donde el
juego empieza.
3. Una funcin
inicial)
: X { x 0 } A
y una funcin
H : X T H
que
I : H N
conjunto de informacin de
i se denota
H i={ h H :i=I ( h ) } .
TEORIA DE JUEGOS
As, podemos definir el conjunto de acciones disponibles en cada conjunto de
informacin
h : A ( h )= { a A :a A ( x ) para x h }
A continuacin se utiliza el ejemplo anterior donde se sealan los conjuntos de informacin del
jugador 1 y 2
J1
J1
NC
NC
J2
J2
J2
NC
(22)
NC
(03)
(11)
J2
NC
(30)
(22)
(03)
NC
(30)
(11)
v i :T R .
Por lo tanto, podemos definir un juego dinmico en su forma extensiva por la coleccin de todos
E= X , A , N , p ( ) , ( ) , H , H ( ) , I ( ) , v .
sus elementos:
Se han asumido
es finito
finitos)
TEORIA DE JUEGOS
prisionero que vimos anteriormente (Panel A) es un juego de informacin imperfecta, mientras
que la versin del juego en su forma dinmica (Panel B) es un juego de informacin perfecta.
Estrategia Pura
Definicin
es una funcin
si : H i A
tal que
h'
donde
jugador
h'
h'
h'
dinmico es que debe especificar qu hara el jugador en cada nodo de decisin del juego. Es
por ello que una estrategia en un juego dinmico es un plan contingente y completo de accin.
Dos planes contingentes completos de accin que se diferencian slo en una accin constituyen
dos estrategias diferentes. Por lo tanto, es comn que los jugadores tengan muchas posibles
estrategias en juegos dinmicos. Especficamente, si
| A ( h )|
es el nmero de acciones
|Si|= | A ( h )|
hHi
Ejemplo 15
Dilema
Prisionero
(estrategias en juegos
en suB:forma
extensiva)
Panel
A: del
Juego
esttico
Panel
Juego
dinmico
Recordemos el enunciado del dilema del prisionero
J1
J1
NCJ 2
NC
NC
J2 C
NCJ 2
NC
NC
J2 C
Pgina 5 de 15
(22)
(03)
(30)
(11)
(22)
(03)
(30)
(11)
TEORIA DE JUEGOS
En el juego del dilema del prisionero (Panel A), cada jugador tiene slo un conjunto de
informacin (aunque el jugador 1 tiene un nico nodo de decisin en el suyo y el jugador 2 tiene
NC
C . Sus
S 1= { NC , C }
S 2= { NC , C } . Vemos que estos son iguales a los conjuntos de acciones de los jugadores:
A 1= { NC , C }
A 2= { NC , C } .
S 1= { NC , C } .
NC
debe especificar qu accin va a tomar en cada uno de sus conjuntos de informacin. Definimos
una estrategia pura del jugador 2 como un vector
tomar si el jugador 1 juega
El
conjunto
de
NC
estrategias
( X , Y ) , donde
indica la accin a
S 1= {( NC , NC ) , ( NC , C ) , ( C , NC ) , ( C , C ) } .
del
jugador
ser
C .
entonces:
Estrategia Mixta
Definicin
Pgina 6 de 15
TEORIA DE JUEGOS
para el jugador
Si .
ts T
el nico
nodo
s .
Entonces
terminal
asociado
con
el
perfil
de
estrategias
puras
es:
U i ( )=
s S
( ( s )) v t
j N
i s
En la prctica, veremos que para juegos dinmicos es muchas veces ms conveniente considerar
las estrategias de comportamiento de los jugadores en lugar de sus estrategias mixtas.
Estrategia de Comportamiento
Definicin
Una estrategia de comportamiento
i ( A ( h) )
para el jugador
es una distribucin de
probabilidad sobre sus acciones disponibles en cada uno de sus conjuntos de informacin
CONCEPTOS DE SOLUCIN
EQUILIBRIO DE NASH
Recordemos la definicin de equilibrio de Nash dada anteriormente: un equilibrio de Nash es un
perfil
de
estrategias
tal
que
U i ( i , i
) U i ( i , i ) , i i .
Sendero de Equilibrio
Pgina 7 de 15
para
cada
jugador
i :
TEORIA DE JUEGOS
En un juego dinmico decimos que, dado un EN
, un conjunto de informacin
est
Dos personas utilizan el siguiente procedimiento para asignar dos objetos indivisibles. J2
propone una asignacin y el J1 puede aceptar la propuesta o rechazarla. Si J1 rechaza la
propuesta, ningn jugador recibe el objeto, si la acepta, la asignacin propuesta se lleva a cabo.
El pago de cada jugador es el nmero de objetos que recibe.
La representacin de este juego en su forma extensiva es la siguiente:
J2
( 20 )
( 11 )
( 02 )
J1
J1
J1
(20)
(00)
(11)
(00)
(02)
(00)
Como podemos observar, en este juego el jugador 2 tiene un solo conjunto de informacin,
mientras que el jugador 1 tiene 3 conjuntos de informacin, por lo tanto el conjunto de
estrategias puras del J2, quien tiene un nico conjunto de informacin, es:
S 2= {( 20 ) , (11 ) , ( 02 ) }
El J1 como se dijo tiene tres conjuntos de informacin. Por lo tanto definimos una estrategia
pura del J1 como
XYZ ,
donde
J2
( 20 )
( 11 )
Pgina 8 de 15
( 02 )
( 02 ) . El
TEORIA DE JUEGOS
J1
AAA
2,0
1,1
0,2
AAR
2,0
1,1
0,0
ARA
2,0
0,0
0,2
ARR
2,0
0,0
0,0
RAA
0,0
1,1
0,2
RAR
0,0
1,1
0,0
RRA
0,0
0,0
0,2
RRR
0,0
0,0
0,0
( ARR , ( 02 ) )
J2
( 20 )
( 11 )
( 02 )
J1
J1
J1
(20)
(00)
(11)
(00)
(02)
(00)
Para este caso, la lnea continua de color rojo representa un sendero de equilibrio, las lneas
discontinuas representan las otras acciones que conforman la estrategia del J1.
Un problema del concepto de equilibrio de Nash en juegos dinmicos es que pueden no ser
secuencialmente racionales. El principio de racionalidad secuencial establece que la estrategia
de cada jugador debe especificar acciones ptimas en todos sus nodos de decisin, incluso en
aquellos que se encuentran fuera del sendero de equilibrio. En el ejemplo previo, el equilibrio de
Nash
( ARR , ( 02 ) )
Pgina 9 de 15
TEORIA DE JUEGOS
de equilibrio por lo que slo constituye una amenaza de J1. Sin embargo, es una amenaza no
creble porque, de darse el caso, J1 actuara de manera ptima aceptando la propuesta
de J2. As J2 preferira jugar
( 11 )
Por su puesto, J2 puede realizar esta misma deduccin y por lo tanto, no esperaramos que el
equilibrio de Nash
( ARR , ( 02 ) ) se d en realidad.
( ARA , ( 02 ) ) :
J2
( 20 )
( 11 )
( 02 )
J1
J1
J1
(20)
(00)
(11)
(00)
(02)
(00)
luego de
( 20 ) ,
luego de
( 11 )
y tanto
como
luego de
( 02 )
tanto
como
son
ptimos para J1, debemos tratar cada uno de estos casos por separado. En caso de que J1 juegue
luego de
luego de
TEORIA DE JUEGOS
EN ={ ( AAA , ( 02 ) ) , ( AAR , ( 11 ) ) }
En base a estos resultados podemos identificar tres posibles casos de acuerdo a las acciones
ptimas para el jugador 1:
1. Siempre: Acciones de color celeste
2. Caso 1: Accin de color verde (En caso de que J1 juegue
ptimo para J2 es jugar
( 02 ) , lo
luego de
( 02 ) )
R luego de ( 02 ) , lo
( 11 ) )
De igual manera podemos identificar los casos para el jugador 2 de acuerdo a sus acciones
ptimas:
1. Caso 1: Accin de color verde (En caso de que J1 juegue
ptimo para J2 es jugar
( 02 ) , lo
luego de
( 02 ) )
R luego de ( 02 ) , lo
( 11 ) )
J2
( 20 )
( 11 )
( 02 )
J1
J1
J1
(20)
(00)
(11)
(11)
(02)
(00)
Por lo tanto los equilibrios de Nash secuencialmente racionales son los ya hallados.
Hemos visto cmo se puede aplicar el principio de racionalidad secuencial en un ejemplo de un
juego finito de informacin perfecta. El concepto de solucin que incorpora este principio de
Pgina 11 de 15
TEORIA DE JUEGOS
manera ms general es conocido como equilibrio de Nash perfecto en Subjuegos. Antes de
presentar este concepto, necesitamos primero definir qu es un subjuego.
Subjuego
Dado un juego en forma extendida, un subjuego es cualquier subconjunto de nodos que
constituye un juego por derecho propio. Ello significa que debe satisfacer dos condiciones:
1. Comienza con un conjunto de informacin que contiene un nico nodo y contiene todos
los sucesores (inmediatos y subsiguientes) de este nodo. El subjuego no contiene otros
nodos adems de stos.
2. Si el subjuego contiene el nodo
rotos)
Tenga en cuenta que el juego original tambin es un subjuego.
Ejemplo 17 Subjuegos
En la figura debajo se muestran dos juegos presentados en los apartados anteriores. El juego del
Dilema del prisionero en su forma esttica y dinmica.
Recordemos el enunciado del dilema del prisionero
Panel A: Juego esttico
J1
J1
NC
J2
NC
(22)
NC
J2
J2
(03)
NC
(30)
(11)
NC
(22)
J2
(03)
NC
(30)
(11)
Pgina 12 de 15
TEORIA DE JUEGOS
Podemos identificar que el Panel A (juego esttico) cuenta con un nico subjuego que es el
juego mismo. El panel B (juego dinmico) cuenta con tres subjuegos: el juego mismo y cada
subjuego que comienza en un nodo de decisin del jugador 2.
Puesto que un subjuego es un juego en s mismo podemos aplicarle los conceptos de solucin
usuales. Precisamente eso es lo que hace el equilibrio de Nash Perfecto en Subjuegos.
Equilibrio de Nash Perfecto en Subjuegos
Dado un juego en su forma extensiva, un perfil de estrategias
es un equilibrio de Nash
Perfecto en Subjuegos (ENPS) si induce un equilibrio de Nash (EN) en todos los subjuegos del
juego (incluyendo el juego original).
Notese que si
tambin es un subjuego). Pero no todo EN es un ENPS. Por lo tanto, el conjunto de los ENPS es
un subconjunto del conjunto de los EN:
prediccin ms precisa sobre los resultados que caben esperar en un juego dinmico.
El procedimiento de induccin hacia atrs que ilustramos previamente es clave porque brinda un
mtodo para encontrar los ENPS. Dado que en cada subjuego los jugadores eligen sus acciones
ptimas anticipando correctamente las acciones ptimas de los dems, a ningn jugador le
conviene desviarse de su estrategia y, por lo tanto, estamos encontrando un EN en cada
subjuego.
Detallamos los pasos del mtodo de induccin hacia atrs para juegos finitos de informacin
perfecta:
1. Encontrar las acciones ptimas en los ltimos nodos de decisin.
2. Encontrar las acciones ptimas en los penltimos nodos de decisin dado que los
jugadores anticipan correctamente las acciones ptimas que van a ser tomadas en los
ltimos nodos de decisin.
3. As sucesivamente hasta llegar al nodo inicial.
Si nunca se encuentra ms de una accin ptima en cada nodo, entonces el procedimiento
brinda un nico ENPS. En caso contrario, todos los ENPS se encuentran repitiendo el
procedimiento para cada accin ptima identificada.
Para esta categora de juegos, contamos con el siguiente teorema:
Teorema de Zermelo
Todo juego finito de informacin perfecta tiene un ENPS en estrategias puras que puede
obtenerse por induccin hacia atrs. Adems, si ningn jugador tiene los mismos pagos en
cualquiera de los nodos terminales, entonces hay un nico ENPS que puede ser derivado de esta
manera.
Ntese que este teorema slo se aplica a los juegos de informacin perfecta.
El procedimiento de induccin hacia atrs se puede generalizar para obtener los ENPS en todo
juego dinmico finito: no slo en aquellos con informacin perfecta, sino tambin en aquellos
Pgina 13 de 15
TEORIA DE JUEGOS
con informacin imperfecta. Los pasos del mtodo generalizado de induccin hacia atrs son los
siguientes:
1. Encontrar el EN en cada uno de los subjuegos finales.
2. Encontrar el EN en el penltimo subjuego dado que los jugadores anticipan
correctamente los EN que van a darse en los subjuegos finales.
3. As sucesivamente hasta llegar al nodo inicial.
Si nunca se encuentra ms de una accin ptima o EN, entonces el procedimiento brinda un
nico ENPS. En caso contrario, todos los ENPS se encuentran repitiendo el procedimiento para
cada caso identificado.
Equilibrio de Nash Perfecto en Subjuegos (Definicin alternativa - Emilio Cerd)
Definicin extraida del libro Teoria de Juegos - Emilio Cerd:
La estructura temporal de un juego dinmico con informacin completa obliga a cada jugador
a tener en cuenta que sus decisiones en cada momento influyen en las posibilidades y pagos
posteriores para l y para los dems, y que al mismo tiempo las decisiones futuras previsibles
suyas y de los dems condicionan sus decisiones presentes. Aparece as un elemente de vital
importancia, la credibilidad que se puede dar a las decisiones futuras a la hora de determinar
las decisiones presentes, es decir, la credibilidad de las posibles amenazas o promesas que se
pueden plantear sobre el comportamiento futuro para condicionar el comportamiento presente
de los jugadores.
vamos a plantear un concepto de equilibrio llamado equilibrio de Nash perfecto en
subjuegos. Este concepto representa, para el caso de los juegos dinmicos con informacin
completa, una adecuacin y una mejora con respecto al equilibrio de Nash, precisamente
porque tiene en cuenta ese elemento de credibilidad antes mencionado.
Ejemplo 18 Eleccin del nicho de mercado
La empresa E est considerando entrar a un mercado que en ese momento slo tiene una
empresa incumbente (empresa I). En la primera etapa, la empresa E puede decidir entrar o
quedarse fuera del mercado. Si E elige quedarse fuera el juego termina y los pagos son
para la empresa E y
si nicho grande,
1 . La
No entrar
Entrar
Pgina 14 de 15
(02)
6
NGI
NG
NP I( NP
(3
(11NP) (1NG
3 )
1)
6 )
TEORIA DE JUEGOS
( ( E , NG ) , NP) , ( ( F , NP ) , NG )
Pgina 15 de 15