Teoria de Juegos Juegos Dinamicos

Universidad Nacional del Callao - FCE
TEORIA DE JUEGOS
JUEGOS DINAMICOS DE INFORMACIN COMPLETA
Juego Dinmico
Un juego dinmico, es un juego secuencial (a diferencia de los juegos estticos), donde los
jugadores adquieren nueva informacin, respecto a lo realizado por los dems jugadores,
mientras el juego se desarrolla. En los juegos dinmicos la estructura secuencial del juego tiene
relevancia, es por ello que se recomienda utilizar la forma extensiva para poder analizar un
juego dinmico.
Juego de informacin completa
Al igual que en los juegos estticos de informacin completa, tanto la estructura del juego, la
racionalidad de los jugadores y los futuros pagos, de acuerdo a las estrategias utilizadas, son de
conocimiento comn.
Un juego dinmico de informacin completa puede ser representado mediante la forma normal
o estratgica, sin embargo al utilizar esta representacin podemos encontrar los equilibrios de
Nash, tal y como se ha estudiado en la parte de juegos estticos de informacin completa. Sin
embargo, en el caso de juegos dinmicos (como se dijo en la definicin de juego dinmico)
resulta ms apropiado contar con una representacin del juego que muestre la estructura
secuencial del juego. La representacin en su forma extensiva de un juego incorpora
explcitamente la estructura secuencial. Utilizando esta representacin de los juegos dinmicos
podemos encontrar lo que se conoce como Equilibrio de Nash perfecto en subjuegos, el cual es
el concepto de solucin en juegos dinmicos (a diferencia de los Equilibrios de Nash en juegos
estticos) que ser explicado ms adelante.
Ejemplo 14 Dilema del Prisionero (diferencia entre juegos estticos y dinmicos)
Recordemos el enunciado del dilema del prisionero, el cual se representa en su forma normal de
la siguiente manera
NC
NC
( 2,2 )
J2
( 0,3 )
J1
C
( 3,0 )
( 1,1 )
Panel A: Juego esttico
Panel B: Juego dinmico
Para poder representarlo en su forma extensiva utilizaremos el diagrama de rbol. Para este caso
como ya hemos entrado a la parte de juegos dinmicos haremos una distincin en la forma
extensiva de representar un juego esttico y dinmico, para ello representamos el dilema del
prisionero en su forma extensiva donde:
Panel A: Dilema del prisionero en juegos estticos
Panel B
: Dilema del prisionero en juegos dinmicos. Para esta versin del
dilema del prisionero, tenemos que el jugador 1 elige primero su accin, la cual es
observada por el jugador 2 antes de que l deba elegir su accin. Es por ello que se les
conoce como juegos secuenciales.
A continuacin la forma extensiva del dilema del prisionero
Pgina 1 de 15
TEORIA DE JUEGOS
J1
J1
NC
NC
J2
NC
(22)
J2
J2
(03)
NC
(30)
(11)
NC
(22)
J2
(03)
NC
(30)
(11)
Las lneas punteadas del panel A que unen los nodos de decisin del jugador 2 nos hace
referencia a que el juego es un juego esttico, donde el plan de accin se toma al inicio del
juego (por ambos jugadores) mientras que el juego representado en el panel B nos muestra la
secuencialidad del juego, donde el jugador 2 decidir qu estrategia usar dependiendo de la
estrategia tomada por el jugador 1.
Diferencia entre accin y estrategia
En los juegos estticos vistos anteriormente no exista diferencia entre accin y estrategia. La
estrategia de un jugador consista en la eleccin de una accin. Sin embargo, en los juegos
dinmicos una estrategia es muy diferente a una accin. Los jugadores pueden ir tomando
distintas acciones a lo largo del juego. La estrategia de un jugador es un plan contingente
completo de accin.
Representacin extensiva
La definicin matemtica de un juego en su forma extensiva consiste en la descripcin de los
elementos que lo componen:
1. Un conjunto finito de jugadores
Un conjunto finito de acciones
Un conjunto finito de nodos
N .
A=i N A i .
X .
A continuacin se utiliza el ejemplo anterior donde se representan los nodos los cuales estn
encerrados con un crculo rojo
Pgina 2 de 15
TEORIA DE JUEGOS
J1
J1
NC
NC
J2
NC
(22)
J2
J2
NC
(03)
2. Una funcin
p: X
NC
(30)
(22)
(11)
J2
NC
(03)
(30)
(11)
que especifica en nico inmediato predecesor de cada nodo.
Hay dos tipos de nodos:
Nodos terminales
T ={ x X }
que no pertenecen a ningn jugador, sino que
representan los resultados del juego y a los que se asocian los pagos
correspondientes de cada jugador.
Los dems nodos
X T
son los nodos de decisin, donde algn jugador es
requerido a tomar una accin. Dentro de ellos est el nodo inicial
x0
donde el
juego empieza.
3. Una funcin
inicial)
: X { x 0 } A
que asigna la accin que lleva hacia cada nodo (no
x desde su inmediato predecesor.
4. Una coleccin de conjuntos de informacin

a cada nodo de decisin
5. Una funcin
y una funcin
H : X T H
que
x le asigna un conjunto de informacin h=H ( x ) H .
I : H N
conjunto de informacin de
que a cada conjunto de informacin le asigna un jugador. El
i se denota
H i={ h H :i=I ( h ) } .
La interpretacin de un conjunto de informacin es que un jugador no puede distinguir

en qu nodo est entre los nodos que pertenecen a un mismo conjunto de informacin
cuando elige una accin cualesquiera de ellos. Por lo tanto, se requiere que todos los
nodos de decisin asignados a un mismo conjunto de informacin tengan las mismas
acciones disponibles.
Pgina 3 de 15
TEORIA DE JUEGOS
As, podemos definir el conjunto de acciones disponibles en cada conjunto de
informacin
h : A ( h )= { a A :a A ( x ) para x h }
A continuacin se utiliza el ejemplo anterior donde se sealan los conjuntos de informacin del
jugador 1 y 2
J1
J1
NC
NC
J2
J2
J2
NC
(22)
NC
(03)
(11)
J2
NC
(30)
(22)
(03)
NC
(30)
(11)
v ={v 1 ( ) , , v n ( ) } que a cada jugador le asigna un pago en
6. Una coleccin de pagos
v i :T R .
cada nodo terminal:
Por lo tanto, podemos definir un juego dinmico en su forma extensiva por la coleccin de todos
E= X , A , N , p ( ) , ( ) , H , H ( ) , I ( ) , v .
sus elementos:
Se han asumido
finitos (y por lo tanto
finito), pero la definicin se puede
extender directamente al caso ms general. Un juego dinmico se dice finito si

(que implica
es finito
finitos)
Informacin perfecta e imperfecta

Un juego extensivo es de informacin perfecta si cada conjunto de informacin contiene un
nico nodo. De lo contrario, es un juego de informacin imperfecta. As, el juego del dilema del
Pgina 4 de 15
TEORIA DE JUEGOS
prisionero que vimos anteriormente (Panel A) es un juego de informacin imperfecta, mientras
que la versin del juego en su forma dinmica (Panel B) es un juego de informacin perfecta.
Estrategia Pura
Definicin
Una estrategia pura para el jugador
es una funcin
si : H i A
tal que
s i ( h ) A ( h ) , h H i . Al conjunto de estrategias puras de i lo denotamos por S i .

Es importante enfatizar que una estrategia especifica una accin para todos y cada uno de los
conjuntos de informacin del jugador. Ello incluso si de acuerdo a la estrategia algn conjunto
de informacin no va a ser alcanzado en el juego.
En concreto, sean
h'
donde
jugador
h'
se encuentra en una etapa posterior en el juego que

debe asignar una accin a
impida que se llegue a
h'
dos conjuntos de informacin que pertenecen al jugador
h'
h . Una estrategia del
aun cuando la accin especificada en
durante el juego. La idea detrs de una estrategia en un juego
dinmico es que debe especificar qu hara el jugador en cada nodo de decisin del juego. Es
por ello que una estrategia en un juego dinmico es un plan contingente y completo de accin.
Dos planes contingentes completos de accin que se diferencian slo en una accin constituyen
dos estrategias diferentes. Por lo tanto, es comn que los jugadores tengan muchas posibles
estrategias en juegos dinmicos. Especficamente, si
disponibles del jugador
| A ( h )|
es el nmero de acciones
en el conjunto de informacin h , entonces el nmero de
estrategias puras de dicho jugador es
|Si|= | A ( h )|
hHi
Ejemplo 15
Dilema
Prisionero
(estrategias en juegos
en suB:forma
extensiva)
Panel
A: del
Juego
esttico
Panel
Juego
dinmico
Recordemos el enunciado del dilema del prisionero
J1
J1
NCJ 2
NC
NC
J2 C
NCJ 2
NC
NC
J2 C
Pgina 5 de 15
(22)
(03)
(30)
(11)
(22)
(03)
(30)
(11)
TEORIA DE JUEGOS
En el juego del dilema del prisionero (Panel A), cada jugador tiene slo un conjunto de
informacin (aunque el jugador 1 tiene un nico nodo de decisin en el suyo y el jugador 2 tiene
NC
dos nodos de decisin), en el cual dos acciones estn disponibles:
C . Sus
estrategias deben especificar qu accin tomar en dicho conjunto de informacin. El conjunto

de todas las estrategias puras posibles de cada jugador son entonces:
S 1= { NC , C }
S 2= { NC , C } . Vemos que estos son iguales a los conjuntos de acciones de los jugadores:
A 1= { NC , C }
A 2= { NC , C } .
Es en este sentido que mencionamos anteriormente que
no hay diferencia prctica entre accin y estrategia en los juegos estticos.

En cambio, el juego del dilema del prisionero presentado en el Panel B es un juego dinmico.
En este caso el jugador 1 sigue teniendo un nico conjunto de informacin y su conjunto de
estrategias puras sigue siendo
S 1= { NC , C } .
Sin embargo, el jugador dos tiene dos
conjuntos de informacin: aqul al que se llega luego de que el jugador 1 juegue

aqul al que se llega luego de que el jugador 1 juegue
NC
C . Una estrategia pura del jugador 2
debe especificar qu accin va a tomar en cada uno de sus conjuntos de informacin. Definimos
una estrategia pura del jugador 2 como un vector
tomar si el jugador 1 juega
El
conjunto
de
NC
estrategias
( X , Y ) , donde
indica la accin a
indica la accin a tomar si el jugador 1 juega

puras
S 1= {( NC , NC ) , ( NC , C ) , ( C , NC ) , ( C , C ) } .
del
jugador
ser
C .
entonces:
El nmero de estrategias puras del jugador 2
es 4, que es lo que se obtiene al calcular
|S2|= | A ( h )|=2 2=4

h H 2
Estrategia Mixta
Definicin
Pgina 6 de 15
TEORIA DE JUEGOS
Una estrategia mixta
para el jugador
es (al igual que para juegos estticos) una
distribucin de probabilidad sobre su conjunto de estrategias puras
Si .
Representacin Normal de Juegos Extensivos

Siempre es posible reducir un juego en su forma extensiva a un juego en su forma normal o
estratgica, donde los pagos estn asociados a perfiles de estrategias en lugar de a nodos
terminales. Un perfil de estrategias puras lleva a un nico nodo terminal. Sea
ts T
el nico
nodo
s .
Entonces
terminal
asociado
con
el
perfil
de
estrategias
puras
ui ( s )=vi ( t s ) , i N . Asimismo, el pago esperado asociado al perfil de estrategias mixtas
es:
U i ( )=
s S
( ( s )) v t
j N
i s
En la prctica, veremos que para juegos dinmicos es muchas veces ms conveniente considerar
las estrategias de comportamiento de los jugadores en lugar de sus estrategias mixtas.
Estrategia de Comportamiento
Definicin
Una estrategia de comportamiento
i ( A ( h) )
para el jugador
es una distribucin de
probabilidad sobre sus acciones disponibles en cada uno de sus conjuntos de informacin
h H i . En otras palabras, asumimos que un jugador asigna probabilidades a sus decisiones

en cada uno de sus conjuntos de informacin, en lugar de asignar probabilidades a sus
estrategias puras. Ambas definiciones son equivalentes bajo el supuesto, que vamos a mantener,
que los jugadores tienen memoria perfecta: un jugador no puede olvidar lo que hizo en una
etapa anterior del juego (este resultado es conocido como el teorema de Kuhn).
CONCEPTOS DE SOLUCIN
EQUILIBRIO DE NASH
Recordemos la definicin de equilibrio de Nash dada anteriormente: un equilibrio de Nash es un
perfil
de
estrategias
tal
que
U i ( i , i
) U i ( i , i ) , i i .
Sendero de Equilibrio
Pgina 7 de 15
para
cada
jugador
i :
TEORIA DE JUEGOS
En un juego dinmico decimos que, dado un EN
, un conjunto de informacin
est
en el sendero de equilibrio si y slo si se alcanza con probabilidad positiva al jugar

Ejemplo 16 Juego del Ultimtum
Dos personas utilizan el siguiente procedimiento para asignar dos objetos indivisibles. J2
propone una asignacin y el J1 puede aceptar la propuesta o rechazarla. Si J1 rechaza la
propuesta, ningn jugador recibe el objeto, si la acepta, la asignacin propuesta se lleva a cabo.
El pago de cada jugador es el nmero de objetos que recibe.
La representacin de este juego en su forma extensiva es la siguiente:
J2
( 20 )
( 11 )
( 02 )
J1
J1
J1
(20)
(00)
(11)
(00)
(02)
(00)
Como podemos observar, en este juego el jugador 2 tiene un solo conjunto de informacin,
mientras que el jugador 1 tiene 3 conjuntos de informacin, por lo tanto el conjunto de
estrategias puras del J2, quien tiene un nico conjunto de informacin, es:
S 2= {( 20 ) , (11 ) , ( 02 ) }
El J1 como se dijo tiene tres conjuntos de informacin. Por lo tanto definimos una estrategia
pura del J1 como
XYZ ,
donde
indica la accin a tomar si J2 juega
conjunto de estrategias puras de J1 es:
S 1= { AAA , AAR , ARA , ARR , RAA , RAR , RRA , RRR }

La representacin normal del juego ser:
J2
( 20 )
( 11 )
Pgina 8 de 15
( 02 )
( 02 ) . El
TEORIA DE JUEGOS
J1
AAA
2,0
1,1
0,2
AAR
2,0
1,1
0,0
ARA
2,0
0,0
0,2
ARR
2,0
0,0
0,0
RAA
0,0
1,1
0,2
RAR
0,0
1,1
0,0
RRA
0,0
0,0
0,2
RRR
0,0
0,0
0,0
Tenemos nueve equilibrios de Nash en estrategias puras:
EN =( ARR , ( 20 ) ) , ( AAR , ( 11 ) ) , ( RAR , ( 11 ) ) , ( AAA , ( 02 ) ) , ( ARA , ( 02 )) , ( ARR , ( 02 ) ) , ( RAA , ( 02 )

Analicemos uno de estos EN, por ejemplo
( ARR , ( 02 ) )
J2
( 20 )
( 11 )
( 02 )
J1
J1
J1
(20)
(00)
(11)
(00)
(02)
(00)
Para este caso, la lnea continua de color rojo representa un sendero de equilibrio, las lneas
discontinuas representan las otras acciones que conforman la estrategia del J1.
Un problema del concepto de equilibrio de Nash en juegos dinmicos es que pueden no ser
secuencialmente racionales. El principio de racionalidad secuencial establece que la estrategia
de cada jugador debe especificar acciones ptimas en todos sus nodos de decisin, incluso en
aquellos que se encuentran fuera del sendero de equilibrio. En el ejemplo previo, el equilibrio de
Nash
( ARR , ( 02 ) )
no es secuencialmente racional. De acuerdo a este equilibrio, aunque
Pgina 9 de 15
TEORIA DE JUEGOS
( 11 ) . Este nodo no est en el sendero
no sea ptimo para J1, J1 jugara rechazar si J2 juega
de equilibrio por lo que slo constituye una amenaza de J1. Sin embargo, es una amenaza no
creble porque, de darse el caso, J1 actuara de manera ptima aceptando la propuesta
de J2. As J2 preferira jugar
( 11 )
( 11 ) y obtener 1 en lugar de jugar ( 02 ) y obtener 0 .
Por su puesto, J2 puede realizar esta misma deduccin y por lo tanto, no esperaramos que el
equilibrio de Nash
( ARR , ( 02 ) ) se d en realidad.
Analicemos otro de estos EN, por ejemplo
( ARA , ( 02 ) ) :
J2
( 20 )
( 11 )
( 02 )
J1
J1
J1
(20)
(00)
(11)
(00)
(02)
(00)
Es este equilibrio secuencialmente racional?

Para encontrar los equilibrios de Nash que son secuencialmente racionales podemos aplicar el
procedimiento conocido como induccin hacia atrs. Posteriormente vamos a explicar
detalladamente este procedimiento. Por ahora, slo lo ilustramos aplicndolo al ejemplo
anterior. Empezamos determinando las acciones ptimas de J1 en los ltimos nodos de decisin:
luego de
( 20 ) ,
luego de
( 11 )
y tanto
como
luego de
( 02 ) . En seguida vamos hacia atrs y determinamos qu es lo ptimo para J2 en el primer

nodo de decisin dado que anticipa correctamente lo que ptimamente va a hacer J1 en cada
uno de los nodos finales de decisin. Como luego de
( 02 )
tanto
como
son
ptimos para J1, debemos tratar cada uno de estos casos por separado. En caso de que J1 juegue
luego de
luego de
( 02 ) , lo ptimo para J2 es jugar
( 02 ) . En caso de que J1 juegue
( 02 ) , lo ptimo para J2 es jugar ( 11 ) . As, vemos que en el ejemplo
previo slo hay dos EN secuencialmente racionales:

Pgina 10 de 15
TEORIA DE JUEGOS
EN ={ ( AAA , ( 02 ) ) , ( AAR , ( 11 ) ) }
En base a estos resultados podemos identificar tres posibles casos de acuerdo a las acciones
ptimas para el jugador 1:
1. Siempre: Acciones de color celeste
2. Caso 1: Accin de color verde (En caso de que J1 juegue
ptimo para J2 es jugar
( 02 ) , lo
luego de
( 02 ) )
3. Caso 2: Accin de color naranja (En caso de que J1 juegue

R luego de ( 02 ) , lo
( 11 ) )
De igual manera podemos identificar los casos para el jugador 2 de acuerdo a sus acciones
ptimas:
1. Caso 1: Accin de color verde (En caso de que J1 juegue
( 02 ) , lo
luego de
( 02 ) )
2. Caso 2: Accin de color naranja (En caso de que J1 juegue

R luego de ( 02 ) , lo
( 11 ) )
El juego en su forma extensiva quedara de la forma
J2
( 20 )
( 11 )
( 02 )
J1
J1
J1
(20)
(00)
(11)
(11)
(02)
(00)
Por lo tanto los equilibrios de Nash secuencialmente racionales son los ya hallados.
Hemos visto cmo se puede aplicar el principio de racionalidad secuencial en un ejemplo de un
juego finito de informacin perfecta. El concepto de solucin que incorpora este principio de
Pgina 11 de 15
TEORIA DE JUEGOS
manera ms general es conocido como equilibrio de Nash perfecto en Subjuegos. Antes de
presentar este concepto, necesitamos primero definir qu es un subjuego.
Subjuego
Dado un juego en forma extendida, un subjuego es cualquier subconjunto de nodos que
constituye un juego por derecho propio. Ello significa que debe satisfacer dos condiciones:
1. Comienza con un conjunto de informacin que contiene un nico nodo y contiene todos
los sucesores (inmediatos y subsiguientes) de este nodo. El subjuego no contiene otros
nodos adems de stos.
2. Si el subjuego contiene el nodo
x , entonces contiene todos los nodos que estn en el
mismo conjunto de informacin que
x . (Es decir, no hay conjuntos de informacin
rotos)
Tenga en cuenta que el juego original tambin es un subjuego.
Ejemplo 17 Subjuegos
En la figura debajo se muestran dos juegos presentados en los apartados anteriores. El juego del
Dilema del prisionero en su forma esttica y dinmica.
Recordemos el enunciado del dilema del prisionero
J1
J1
NC
J2
NC
(22)
NC
J2
J2
(03)
NC
(30)
(11)
NC
(22)
J2
(03)
NC
(30)
(11)
En base a la definicin de subjuego Cuntos subjuegos tiene el Panel A y cuantos subjuegos

tiene el Panel B?
Pgina 12 de 15
TEORIA DE JUEGOS
Podemos identificar que el Panel A (juego esttico) cuenta con un nico subjuego que es el
juego mismo. El panel B (juego dinmico) cuenta con tres subjuegos: el juego mismo y cada
subjuego que comienza en un nodo de decisin del jugador 2.
Puesto que un subjuego es un juego en s mismo podemos aplicarle los conceptos de solucin
usuales. Precisamente eso es lo que hace el equilibrio de Nash Perfecto en Subjuegos.
Equilibrio de Nash Perfecto en Subjuegos
Dado un juego en su forma extensiva, un perfil de estrategias
es un equilibrio de Nash
Perfecto en Subjuegos (ENPS) si induce un equilibrio de Nash (EN) en todos los subjuegos del
juego (incluyendo el juego original).
Notese que si
es un ENPS, entonces tambin es un EN (dado que el juego original
tambin es un subjuego). Pero no todo EN es un ENPS. Por lo tanto, el conjunto de los ENPS es
un subconjunto del conjunto de los EN:
{ ENPS } { EN } . As, el ENPS nos brinda una
prediccin ms precisa sobre los resultados que caben esperar en un juego dinmico.
El procedimiento de induccin hacia atrs que ilustramos previamente es clave porque brinda un
mtodo para encontrar los ENPS. Dado que en cada subjuego los jugadores eligen sus acciones
ptimas anticipando correctamente las acciones ptimas de los dems, a ningn jugador le
conviene desviarse de su estrategia y, por lo tanto, estamos encontrando un EN en cada
subjuego.
Detallamos los pasos del mtodo de induccin hacia atrs para juegos finitos de informacin
perfecta:
1. Encontrar las acciones ptimas en los ltimos nodos de decisin.
2. Encontrar las acciones ptimas en los penltimos nodos de decisin dado que los
jugadores anticipan correctamente las acciones ptimas que van a ser tomadas en los
ltimos nodos de decisin.
3. As sucesivamente hasta llegar al nodo inicial.
Si nunca se encuentra ms de una accin ptima en cada nodo, entonces el procedimiento
brinda un nico ENPS. En caso contrario, todos los ENPS se encuentran repitiendo el
procedimiento para cada accin ptima identificada.
Para esta categora de juegos, contamos con el siguiente teorema:
Teorema de Zermelo
Todo juego finito de informacin perfecta tiene un ENPS en estrategias puras que puede
obtenerse por induccin hacia atrs. Adems, si ningn jugador tiene los mismos pagos en
cualquiera de los nodos terminales, entonces hay un nico ENPS que puede ser derivado de esta
manera.
Ntese que este teorema slo se aplica a los juegos de informacin perfecta.
El procedimiento de induccin hacia atrs se puede generalizar para obtener los ENPS en todo
juego dinmico finito: no slo en aquellos con informacin perfecta, sino tambin en aquellos
Pgina 13 de 15
TEORIA DE JUEGOS
con informacin imperfecta. Los pasos del mtodo generalizado de induccin hacia atrs son los
siguientes:
1. Encontrar el EN en cada uno de los subjuegos finales.
2. Encontrar el EN en el penltimo subjuego dado que los jugadores anticipan
correctamente los EN que van a darse en los subjuegos finales.
Si nunca se encuentra ms de una accin ptima o EN, entonces el procedimiento brinda un
nico ENPS. En caso contrario, todos los ENPS se encuentran repitiendo el procedimiento para
cada caso identificado.
Equilibrio de Nash Perfecto en Subjuegos (Definicin alternativa - Emilio Cerd)
Definicin extraida del libro Teoria de Juegos - Emilio Cerd:
La estructura temporal de un juego dinmico con informacin completa obliga a cada jugador
a tener en cuenta que sus decisiones en cada momento influyen en las posibilidades y pagos
posteriores para l y para los dems, y que al mismo tiempo las decisiones futuras previsibles
suyas y de los dems condicionan sus decisiones presentes. Aparece as un elemente de vital
importancia, la credibilidad que se puede dar a las decisiones futuras a la hora de determinar
las decisiones presentes, es decir, la credibilidad de las posibles amenazas o promesas que se
pueden plantear sobre el comportamiento futuro para condicionar el comportamiento presente
de los jugadores.
vamos a plantear un concepto de equilibrio llamado equilibrio de Nash perfecto en
subjuegos. Este concepto representa, para el caso de los juegos dinmicos con informacin
completa, una adecuacin y una mejora con respecto al equilibrio de Nash, precisamente
porque tiene en cuenta ese elemento de credibilidad antes mencionado.
Ejemplo 18 Eleccin del nicho de mercado
La empresa E est considerando entrar a un mercado que en ese momento slo tiene una
empresa incumbente (empresa I). En la primera etapa, la empresa E puede decidir entrar o
quedarse fuera del mercado. Si E elige quedarse fuera el juego termina y los pagos son
para la empresa E y
para la empresa I. Si E elige entrar al juego va a una segunda etapa.
En la segunda etapa ambas empresas eligen simultneamente su nicho de mercado (grande o

pequeo). Si ambas eligen el mismo nicho de mercado, ambas empresas incurren en prdidas (
si nicho grande,
si nicho pequeo). Si eligen nichos diferentes, la empresa en el
nicho grande gana 1 , mientras que la empresa en el nicho pequeo pierde
1 . La
representacin extensiva de este juego es el siguiente (donde NP es nicho pequeo y NG es

nicho grande):
No entrar
Entrar
Pgina 14 de 15
(02)
6
NGI
NG
NP I( NP
(3
(11NP) (1NG
3 )
1)
6 )
TEORIA DE JUEGOS
Encontrar los ENPS.

Induccin hacia atrs generalizada: Juegos dinmicos con informacin completa pero
imperfecta
El algoritmo de induccin hacia atrs se aplica para juegos de informacin perfecta, pero
podemos generalizar este mtodo para juegos de informacin imperfecta.
Para juegos finitos, la induccin hacia atrs generalizada se realiza de la siguiente forma:
1. Encontrar el EN en los ltimos subjuegos.
2. Encontrar el EN en los penltimos subjuegos dado que los jugadores anticipan
correctamente los EN que van a darse en los ltimos nodos de decisin.
Si en cada nodo hay solo una accin ptima o EN entonces este ser el nico ENPS.
En caso contrario, todos los ENPS se encuentran repitiendo el procedimiento para cada caso.
Para el ejemplo 18 (Eleccin del nicho de mercado) Una estrategia de la empresa I es
simplemente la accin que elige luego de que la empresa E entra en el mercado. Definimos una
estrategia de la empresa E como (X,Y), donde X indica si E entra o no al mercado en la primera
etapa e Y indica qu juega en la segunda etapa si entra. Los ENPS son
( ( E , NG ) , NP) , ( ( F , NP ) , NG )
Pgina 15 de 15

Teoria de Juegos Juegos Dinamicos

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Teoria de Juegos Juegos Dinamicos

Încărcat de

Drepturi de autor:

Formate disponibile

Universidad Nacional del Callao - FCE

Universidad Nacional del Callao - FCE

Universidad Nacional del Callao - FCE

Panel A: Juego esttico

Panel B: Juego dinmico

que especifica en nico inmediato predecesor de cada nodo.

Hay dos tipos de nodos:

que no pertenecen a ningn jugador, sino que

Los dems nodos

son los nodos de decisin, donde algn jugador es

requerido a tomar una accin. Dentro de ellos est el nodo inicial

que asigna la accin que lleva hacia cada nodo (no

x desde su inmediato predecesor.

4. Una coleccin de conjuntos de informacin

x le asigna un conjunto de informacin h=H ( x ) H .

que a cada conjunto de informacin le asigna un jugador. El

La interpretacin de un conjunto de informacin es que un jugador no puede distinguir

Universidad Nacional del Callao - FCE

Panel A: Juego esttico

Panel B: Juego dinmico

v ={v 1 ( ) , , v n ( ) } que a cada jugador le asigna un pago en

6. Una coleccin de pagos

cada nodo terminal:

finitos (y por lo tanto

finito), pero la definicin se puede

extender directamente al caso ms general. Un juego dinmico se dice finito si

Informacin perfecta e imperfecta

Universidad Nacional del Callao - FCE

Una estrategia pura para el jugador

s i ( h ) A ( h ) , h H i . Al conjunto de estrategias puras de i lo denotamos por S i .

se encuentra en una etapa posterior en el juego que

impida que se llegue a

dos conjuntos de informacin que pertenecen al jugador

h . Una estrategia del

aun cuando la accin especificada en

durante el juego. La idea detrs de una estrategia en un juego

disponibles del jugador

en el conjunto de informacin h , entonces el nmero de

estrategias puras de dicho jugador es

Universidad Nacional del Callao - FCE

dos nodos de decisin), en el cual dos acciones estn disponibles:

estrategias deben especificar qu accin tomar en dicho conjunto de informacin. El conjunto

Es en este sentido que mencionamos anteriormente que

no hay diferencia prctica entre accin y estrategia en los juegos estticos.

Sin embargo, el jugador dos tiene dos

conjuntos de informacin: aqul al que se llega luego de que el jugador 1 juegue

C . Una estrategia pura del jugador 2

indica la accin a tomar si el jugador 1 juega

El nmero de estrategias puras del jugador 2

es 4, que es lo que se obtiene al calcular

|S2|= | A ( h )|=2 2=4

Universidad Nacional del Callao - FCE

Una estrategia mixta

es (al igual que para juegos estticos) una

distribucin de probabilidad sobre su conjunto de estrategias puras

Representacin Normal de Juegos Extensivos

ui ( s )=vi ( t s ) , i N . Asimismo, el pago esperado asociado al perfil de estrategias mixtas

h H i . En otras palabras, asumimos que un jugador asigna probabilidades a sus decisiones

Universidad Nacional del Callao - FCE

en el sendero de equilibrio si y slo si se alcanza con probabilidad positiva al jugar

indica la accin a tomar si J2 juega

conjunto de estrategias puras de J1 es:

S 1= { AAA , AAR , ARA , ARR , RAA , RAR , RRA , RRR }

Universidad Nacional del Callao - FCE