Sunteți pe pagina 1din 111

Apuntes de Estudio

Teorı́a de Juegos
*
Pablo Cristi Worm

30 de octubre de 2018

*
Este documento corresponde a apuntes y notas de estudio. Cualquier error es responsabilidad del autor.
pablo.cristi@mail.udp.cl

1
Índice
Página

1. Intruducción 3

2. Juegos Estáticos con Información Completa 5


2.1. Eliminación Iterativa de Estrategias Estrictamente Dominadas . . . . . . . . . . . . . 5
2.2. El Equilibrio de Nash . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.3. Equilibrio de Nash Aplicado a los Mercados . . . . . . . . . . . . . . . . . . . . . . . . 8
2.3.1. Modelo de Cournot con firmas homogenas . . . . . . . . . . . . . . . . . . . . . 8
2.3.2. Modelo de Cournot con firmas heterogeneas . . . . . . . . . . . . . . . . . . . . 12
2.3.3. Modelo de Bertrand simple o Bertrand standar . . . . . . . . . . . . . . . . . . 14
2.3.4. Modelo de Bertrand con asimetrı́a en costos . . . . . . . . . . . . . . . . . . . . 14
2.3.5. Modelo de Bertrand con restricciones de capacidad . . . . . . . . . . . . . . . . 15
2.3.6. Competencia en precios con bienes diferenciados: Modelo de Hotelling . . . . . 17
2.4. El Problema de los Recursos Comunes . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.4.1. Modelo simple: Un jugador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.4.2. Bien común con dos jugadores . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.4.3. Bien común con n jugadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.4.4. Modelo general de la tragedia de los recursos comunes. . . . . . . . . . . . . . . 24
2.5. Estratégicos Sustitutos y Estratégicos Complementarios . . . . . . . . . . . . . . . . . 25
2.6. Estratégias Mixtas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

3. Juegos Dinámicos con información completa y perfecta 32


3.1. Equilibrio de Nash Perfecto en Subjuegos . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.2. El Modelo de Duopolio de Stackelberg . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.3. Juego Repetidos al Infinito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

4. Juegos Dinámicos con Información Completa pero Imperfecta 47

5. Juegos Estáticos con Información Incompleta y perfecta 48

6. Ejercicios 51
6.1. Eliminación Iterativa de Estrategias Estrictamente Dominadas y Equilibrio de Nash . 51
6.2. Equilibrio de Nash Aplicado a los Mercados . . . . . . . . . . . . . . . . . . . . . . . . 61
6.3. Subastas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
6.4. Estrategias Mixtas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
6.5. Juegos Dinámicos con Información Completa y Perfecta . . . . . . . . . . . . . . . . . 88
6.6. Juegos Dinámicos con Información Imperfecta . . . . . . . . . . . . . . . . . . . . . . . 92
6.7. Juegos Repetidos al Infinito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
6.8. Juegos con Información Incompleta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

2
1. Intruducción
La teorı́a de juegos nos permite entender las interacciones estratégicas entre dos o más jugadores
o agentes, por ejemplo dos personas o dos empresas, la cual puede ser de forma cooperativa o no
cooperativa. Una interacción estratégica es cuando el comportamiento de un agente altera el com-
portamiento de otro agente. Es decir, al momento de tomar una decisión, un individuo ya no puede
considerar sólo lo que es mejor para él, sino también las decisiones que los otros jugadores tomarán
y cómo estas decisiones lo afectarán a él. Los modelos de teorı́a de juegos en Economı́a se utilizan,
entre otras cosas, para determinar precios o comprender la interacción entre empresas de un oligopolio.

Resolver un juego resulta en una predicción respecto a lo que ocurrirá. Esto implica encontrar un
equilibrio. Un juego es un modelo abstracto de una situación estratégica. Un juego puede ser re-
presentado en forma normal o en forma extensiva. Para describir un juego en su totalidad, en la
representación de un juego en forma normal, cada jugador elige de forma simultánea una estrategia, y
la combinación de las estratégicas elegidas por los jugadores determina la ganancia de cada jugador.
Para representar de forma normal un juego es necesario conocer (1) los jugadores, (2) las estrategias
de cada jugador, (3) las ganancias o pagos que recibe cada jugador en cada combinación posible de
estrategias. En los juegos en forma extensiva es necesario además, identificar la secuencia de movi-
mientos, es decir, el turno en que cada jugador juega, y la información que tienen los jugadores al
moverse, es decir, quién sabe qué y cuándo lo sabe.

Los jugadores son todos los agentes que toman decisiones en un juego. Los jugadores pueden ser
individuos, como los jugadores de poker o los consumidores, empresas, como las que participan en un
oligopolio, o paı́ses que interactúan frente a una negociación de tratados comerciales o un conflicto
bélico. Un jugador se caracteriza por tener la posibilidad de elegir entre una serie de acciones posible.
Un juego puede poseer n jugadores. De esta forma los jugadores se ordenan desde 1, 2, ..., n y a un
jugador genérico se le puede representar como i.

Se denomina estrategias a cada curso de acción del que dispones un jugador durante la ejecución de
un juego. Dependiendo el tipo de juego, una estrategia puede ser una acción simple (hacer trampa o
jugar limpio), o un plan complejo de acciones que puede ser contingente de una jugada anterior en el
juego.

Por lo general, una estrategia es representada como si y una serie de estrategias como Si , luego si ∈ Si
es una estrategia particular escogida por el jugador i entre el conjunto de posibilidades. Un perfil de
estrategias remitirá a una lista de estrategias particulares elegidas por cada uno de los miembros de
un grupo de jugadores.

Los beneficios son el pago final que recibe un jugador al concluir el juego. Es el nivel de utilidad que
recibe un jugador. En un juego con dos jugadores, se denomina la función de beneficio del jugador 1
como u1 (s1 , s2 ), donde u1 es la utilidad obtenida por el jugador 1 en función de su estrategia escogida
s1 y la estrategia escogida por el jugador dos s2 . El hecho de que la utilidad del jugador 1 dependa

3
de las decisiones del jugador 2 (s2 ) implica que es una interacción estratégica. De forma general, en
un juego con n jugadores, denotamos la función de utilidad como un (si , s−i ) donde s−i 1 representa a
todos los otros jugadores que no son i. El perfil de estrategias de todos los demás jugadores que no
son i queda representado como s−i = (si , ..., si−1 , si+1 , ..., sn ).

Se dice que un jugador juega una estrategia pura si escoge esta estrategia con probabilidad uno, y
juega una estrategia mixta si escoge una estrategia de manera aleatoria dentro de un set de estra-
tegias disponibles. Un juego tiene información completa cuando se conocen los pagos asociados a
cada acción, y tiene información perfecta si se conoce la historia, es decir, todo lo que se ha jugados
en el pasado. Un juego es estático si sólo se juega una vez, en t = 1, y es dinámico si incorpora varios
tiempo; se juega repetidas veces. Un juego dinámico puede ser finito, si se conoce cuando termina
la interacción estratégica entre los jugadores, por ejemplo en un partido de futbol los equipos sólo se
enfrentan mientras dure el partido, o infinito, si es que no es posible conocer cuántas veces se juega
el juego, por ejemplo, dos empresas que compiten en un mercado, las cuales pueden durar por muchos
años en el mercado y no es posible conocer si alguna quebrará o saldrá del mercado.
1
Otra forma de denotar al jugador -i es como j. En este caso j representa a todos los otros jugadores que no son i

4
2. Juegos Estáticos con Información Completa
Se dice que un juego tiene información completa cuando la función de ganancia de cada jugador es
conocida por todos los jugadores. La representación en forma normal de un juego estático y con infor-
mación completa con n jugadores especifica los espacios de estrategia de los jugadores S1 , ..., Su y sus
funciones de ganancias u1 , ..., un . Luego, podemos denotar este juego como G = {S1 , ..., Sn ; u1 , ...un }.
En este tipo de juegos se dice que los jugadores escogen sus estrategias de forma simultánea, pero bas-
ta con que un jugador escoja una acción sin conocer las decisiones que los otros jugadores han tomado.

Uno de los juegos más famosos en la teorı́a de juegos es el introducido por A. W. Tucker en la
década de 1940 conocido como el dilema del prisionero. Suponga que dos sospechosos son arres-
tados por un crimen. El juez tiene pocas evidencias del caso y ansı́a extraer una confesión. Separa a
los sospechosos y le dice a cada uno ”Si delatas a tu compañero, pero él no te delata a ti, te prometo
una sentencia reducida, por ejemplo de un año, mientras que tu compañero obtendrá cuatro años.
Si ambos se delatan entre sı́, cada uno obtendrá una sentencia de tres años”. Si ninguno de los dos
delata, la falta de pruebas resultará en una sentencia de dos años.

El dilema del prisionero tiene dos jugadores; el prisionero 1 y el prisionero 2. Como el juego se trata
sobre la decisión de delatar o no delatar a su compañero, el juez no es un jugador estratégico en este
juego. Las estrategias de cada jugador son, como ya se dijo, delatar o no-delatar. Luego S1 = S2 =
(delatar, no-delatar). En este caso, los pagos son niveles de desutilidad, ya que representan años de
cárcel. Se entiende que 1 año de cárcel es mejor que 2 años de cárcel y ası́ sucesivamente. En este caso,
para representar los pagos, también se podrı́an utilizar números negativos.

Prisionero 2
No delatar Delatar
No delatar 1, 1 3, 0
Prisionero 1
Delatar 0, 3 2, 2

Por convención el jugador 1 siempre va a la izquierda y el jugador 2 va arriba. Cada cuadro repre-
senta una combinación diferente de estrategias y muestra los beneficios de los jugadores para cada
combinación. El en primer cuadrante, donde los pagos son (1, 1), el primer pago, el de la izquierda,
corresponde al jugador 1 y el pago de la derecha corresponde al jugador 2. Es decir, cuando el jugador
1 escoge no delatar, y el jugador 2 escoge no delatar, los pagos para cada uno son iguales a 1. En el
segundo cuadrante, donde los pagos son (3, 0), el pago del jugador 1 por escoger no delatar es u1 = 3
y el pago para el jugador 2 por escoger delatar es u2 = 0. Y ası́ sucesivamente para todos los otros
cuadrantes. De esta forma, para resolver el juego, el jugador 1 escoge columnas y el jugador 2 escoge
filas.

2.1. Eliminación Iterativa de Estrategias Estrictamente Dominadas


Los supuestos que están detrás del modelo de eliminación iterativa de estrategias estrictamente domi-
nadas (EIEED) son que (1) los jugadores racionales no utilizan estrategias estrictamente dominadas,

5
y que (2) es información de dominio público que los jugadores son racionales. En el caso del dilema
del prisionero si uno de los prisioneros va a delatar, serı́a mejor que el otro también delatara y con
ello sólo obtienen 2 años de cárcel cada uno. Del mismo modo, si un prisionero va a callar, es decir,
no delata, para el otro jugador serı́a mejor delatar y con ello quedar en libertad, en lugar de callar y
quedar en prisión por un año. Ası́, para el prisionero i, la estrategia de callar está dominada por la
de confesar; para cada estrategia que el jugador -i puede elegir, la ganancia del jugador i es menor si
calla que si delata.

0 00
En otras palabras, una estrategia si está estrictamente dominada por una estrategia si si para cada
0
combinación posible de estrategias de los restante jugadores, la ganancia del jugador i por utilizar si
00 0 00
es estrictamente menor que la ganancia del mismo jugador i por utilizar si . Esto es, ui (si ) < ui (si ).

Los jugadores racionales no utilizan estrategias estrictamente dominadas, puesto que bajo ninguna
conjetura que un jugador pudiera formarse sobre las estrategias que elegirán los demás jugadores, serı́a
óptimo utilizar esa estrategia. Para un jugador, una estrategia que domine estrictamente a otra reporta
pagos estrictamente mayores. Una estrategia que domina debilmente a otra reporta pagos iguales o
mayores a otra. Es por esta razón que en el dilema del prisionero, los jugadores llegan al resultado de
(delatar, delatar).

Suponga el siguiente juego.

Jugador 2
Izquierda Centro Derecha
Alta 1, 0 1, 2 0, 1
Jugador 1
Baja 0, 3 0, 1 2, 0

En este juego, el jugador 1 tiene dos estrategias y el jugador 2 tiene tres. En otras palabras s1 =
{alta, baja} y s2 = {izquierda, centro, derecha}. Para el jugador 2, Derecha es una estrategia es-
trictamente dominada ya que, independientemente de lo que juegue el jugador 1, el jugador 2
nunca jugará Derecha. Luego, podemos eliminar Derecha del espacio de estrategias y el juego quedarı́a
representado de la siguiente forma.

Jugador 2
Izquierda Centro
Alta 1, 0 1, 2
Jugador 1
Baja 0, 3 0, 1

En este caso se puede observar que, independientemente de lo que juegue el jugador 2, el jugador 1
va a jugar Alta, ya que esta estrategia le reporta mayores pagos que Baja. Luego, podemos decir que
Baja es una estrategia estrictamente dominada por Alta. O también, que Alta es una estrategia
dominante, ya que, independientemente de lo que el jugador 2 juegue, el jugador 1 siempre jugará
Alta. Luego, podemos descartar Baja del set de estrategias, y el juego quedarı́a representado de la
siguiente forma.

6
Jugador 2
Izquierda Centro
Jugador 1 Alta 1, 0 1, 2

En este caso, el jugador 2 sabe que el jugador 1 jugará Alta, y entre jugar Izquierda o Centro, el
jugador 2 escogerá Centro ya que esta reporta un mayor pago que Izquierda. Luego, podemos afirmar
que (Alta, Centro) es el resultado del juego.

El proceso de eliminación de estrategias estrictamente dominadas tiene dos desventajas importantes.


La primera de ella es que (1) exige que el juego sea de información completa. Y la segunda de ella es
que (2) no todos los juegos pueden ser resueltos utilizando esta técnica, ya que no todos los juegos
poseen estrategias que son estrictamente dominadas. Por tanto, se dice que este es un instrumento
débil para resolver un juego.

Un concepto de equilibrio mucho más poderoso y que permite resolver los juegos de forma mucho más
precisa, es el concepto del Equilibrio de Nash. Las estrategias de los jugadores en un equilibrio de
Nash, siempre sobreviven a la eliminación iterativa de las estrategias estrictamente dominadas.

2.2. El Equilibrio de Nash


Si la teorı́a de juegos ofrece una solución única a un determinado problema, esta solución debe ser
un equilibrio de Nash. Esto necesariamente implica que la solución es una mejor respuesta de cada
jugador a las estrategias predichas de los otros jugadores. Luego, esta es una estrategia estable en
cuanto ningún jugador querrá desviarse de esta estrategia.

Al oponer a los jugadores entre sı́ en situaciones estratégicas lleva, a veces, a resultados ineficientes
para ellos. El equilibrio de Nash implica decisiones estratégicas que, una vez tomadas, no dan incen-
tivos a los jugadores para alterar su comportamiento. Es decir, es la mejor decisión de cada jugador
y donde no existen incentivos a desviarse. Los equilibrios de Nash surgen debido a la incertidumbre
de las estrategias inherentes a una situación. No hay nada que garantice que estos equilibrios sean
especialmente deseables desde el punto de vista de los jugadores.

En algunas situaciones, un equilibrio de Nash puede diferir de un equilibrio de Pareto. Una situación
es Pareto-óptima cuando no es posible mejorar el bienestar de los jugadores sin empeorar el bienestar
de alguno. Por ejemplo, en el dilema del prisionero, ambos jugadores estarı́an mejor si no delataran a
su compañero, ya que entonces obtendrı́an sólo 1 año de cárcel en vez de los 2 que obtienen al delatar.
Sin embargo, dada la estructura e incentivos del juego, el equilibrio de Nash (delatar, delatar) no es
un equilibrio de Pareto (no delatar, no delatar).

Sin embargo, es posible que el equilibrio de Pareto se convierta en un equilibrio de Nash, por ejemplo,
mediante un convenio. Si los jugadores concertan un acuerdo, el cual debe cumplir ciertas caracterı́sti-

7
cas especiales que veremos más adelante, es posible que ambos jugadores, los prisioneros, mejoren su
bienestar reduciendo los años que estarán en la cárcel. Este tipo de acuerdos es el que las empresas
alcanzan para lograr una colusión o un cartel.

2.3. Equilibrio de Nash Aplicado a los Mercados


En 1950 John Nash demostró que en cualquier juego finito2 existe al menos un equilibrio de Nash.
En 1838 Antoine A. Cournot propuso la misma noción de equilibrio en el contexto de un modelo
particular de duopolio y demostró que existe un equilibrio en este modelo.

2.3.1. Modelo de Cournot con firmas homogenas

Consideremos el siguiente ejemplo.

La demanda del mercado de manzanas verdes es Q = 10 − P2 y Q =


P
qi , es decir, la demanda de
mercado Q es igual a la suma de las demandas individuales qi de cada empresa. La función de costos
de cada empresa productora de manzanas es C(q) = 10 + q(q + 1). Suponga que las manzanas verdes
son bienes homogeneos, y existen dos empresas de manzanas en el mercado.

Encuentre las funciones de mejor respuesta o funciones de reacción de cada empresa.

Encuentre la cantidad de equilibrio de Cournot de cada empresa.

Encuentre la cantidad de equilibrio de Cournot del mercado.

Encuentre los beneficios de equilibrio de Cournot de cada empresa.

El problema de maximización de beneficios de la firma viene dado por:

M ax πi = P × qi − C × qi

Reemplazando la función de demanda inversa y la función de costos3 :

M ax πi = (20 − 2Q)qi − (10 + qi (qi + 1))

Multiplicando, obtenemos que:

M ax πi = 19qi − 3qi2 − 2qi qj − 10

La condición de primer orden es:


∂πi
= 19 − 6qi − 2qj = 0
∂qi
Luego, la función de mejor respuesta de la firma 1 frente a la firma 2 serı́a:
19 2qj
qi (qj ) = −
6 6
2
Un juego es finito si el número de jugadores n y los conjuntos de estrategias Sn son todos finitos.
3
La ecuación queda sólo en función de la cantidad q1

8
Por simetrı́a4 ,
19 2qi

qj (qi ) =
6 6
Al interceptar las funciones de mejor respuesta, obtenemos que:
19 2 19 2qi
qi = − ( − )
6 6 6 6
Desarrollando el álgebra podemos obtener la cantidad de equilibrio de Cournot de cada firma.

qi∗ = 19
8 y qj∗ = 19
8

La cantidad de equilibrio del mercado la podemos obtener mediante

Q∗M DO = qi∗ + qj∗

19
Q∗M DO =
4
Para obtener el precio de equilibrio del mercado se debe reemplazar la cantidad de equilibrio del
mercado en la función de demanda inversa. Esto es:

P (Q∗M DO ) = 20 − 2Q∗M DO
19
P = 20 − 2( )
4
21
P∗ =
2
Por último, los beneficios de la empresa se obtienen al reemplazar

πi = P × qi − C × qi

Formalmente, un modelo de competencia a la Cournot con bienes y firmas homogeneas lo podemos


describir de la siguiente forma.
Supuestos del modelo:

Existen 2 firmas en el mercado; F1 y F2

La demanda inversa del mercado es P (Q) = a − bQ

La cantidad total producida en el mercado es la suma de las cantidades que produce cada fima;
Q = q1 + q2

La función de costos de cada empresa es lineal y el costo marginal es constantes e igual a c;


C(qi ) = cqi

Se transa un solo bien en la economı́a y este es homogéneo.

La tecnologı́a es conocida por todos, es decir, existe información perfecta.


4
Podemos asumir simetrı́a ya que todas las empresas enfrentan la misma función de demanda y costos.

9
Sea πi = IT − CT la función de beneficios de la empresa i, donde π es el beneficios, IT es el ingreso
total y CT es el costo total.
La maximización de beneficios de la empresa F1 viene dada por:

max π1 = max{IT − CT }

Al reemplazar la función de ingreso total IT = p × q y la función de costo total CT = c × q, se obtiene

max π1 = max{P × q1 − c × q1 }

Reemplazando la función de demanda inversa P (Q) = a − bQ, se obtiene

max π1 = max{[a − bQ]q1 − c × q1 }

Pero sabes que Q = q1 + q2 , entonces

max π1 = max{[a − b(q1 + q2 )]q1 − c × q1 }

Multiplicado la expresión se obtiene

max π1 = max{aq1 − bq12 − bq1 q2 − cq1 }

Luego, para encontrar el máximo de la función de beneficio es necesario derivar la función de beneficios
respecto a la cantidad de producción de la empresa. Es decir, queremos encontrar la cantidad qi de
producción que permite a la empresa maximizar sus beneficios. Al derivar la función se obtiene la
condición de primer orden, es decir, la condición necesaria para alcanzar un óptimo.
∂π1
= a − 2bq1 − bq2 − c = 0
∂q1
Luego, despejamos las variables dependientes,
a − c − bq2
q1 =
2b
a − c − bq1
q2 =
2b
Estas son las funciones de mejor respuesta o funciones de reacción de una empresa frente a la
otra empresa. Es decir, si la empresa F1 quiere producir q1 debe tener en consideración la cantidad q2
que va a producir la otra empresa. En términos más precisos, éstas deberı́an escribirse como funciones
de forma
a − c − bq2
q1 (q2 ) =
2b
a − c − bq1
q2 (q1 ) =
2b
Para encontrar el equilibrio de Nash, es necesario encontrar el punto donde se intersectan las funciones
de mejor respuesta de cada empresa. Esto se puede ver representado por el punto Eq Cournot en la
figura 1.

Algebráicamente, reemplazamos la función de q2 en la función de q1 . Esto es,

10
q2

q Competencia
Perfecta

Ca
nt
id
ad
de
pr
od
uc
ció
n
en
q Monopolio co
m
pe
te
n cia
Ca pe
nt rfe
id ct
ad Eq Cournot a
q Cournot de
pr
od
uc
ci ó
n
en
m
on
op
ol
io

q Monopolio q Competencia
q Cournot
Perfecta q2

Figura 1: Interseccion de las funciones de mejor respuesta

a−c b a − c − bq1
q1 = − ( )
2b 2b 2b
Al resolver, se obtiene que

a−c
q1∗ =
3b
Obsérvese que este resultado depende de sólo parámetros y no de otras variables, es decir, es un
resultado final.
Como las empresas son simétricas, es decir, enfrentan la misma función de demanda y tienen la mista
estructura de costos, podemos afirmar que
a−c
q2∗ =
3b
Esto es la cantidad de producción óptima que soluciona la maximización es beneficios de la empresa.
Luego,
a−c
Q∗ = n( )
3b
es la demanda agregada del mercado, la cual sabemos que es equivalente a

Q∗ = q1∗ + q2∗

Para conocer la el precio de mercado, reemplazamos la cantidad de mercado Q∗ en la función de


demanda inversa, tal que
P ∗ = a − bQ∗

11
Finalmente, para conocer los beneficios de las empresas, reemplazamos los resultados encontrados en
la función de beneficio de cada empresa.

π1 = p∗ q1∗ − c1 q1∗

π2 = p∗ q2∗ − c2 q2∗

Nótese que q2 puede representar todas las otras empresas del mercado. De hecho, si se plantea un
problema para n firmas, el problema se resuelve de la misma forma, pero debemos multiplicar (n−1)q2
para que q2 represente a todas las otras empresas del mercado. De esta forma, la función de mejor
respuesta de la firma i serı́a,

a − c − b(n − 1)q2
qi =
2b
Y la cantidad de producción óptima de la empresa qi serı́a,

a−c
qi∗ =
b(n + 1)

2.3.2. Modelo de Cournot con firmas heterogeneas

Supuestos del modelo:

Mercado de bienes homogeoneos

n firmas heterogeneas; ci 6= cj

La firma i produce qi

Σni=1 qi ; La cantidad total del mercado es la suma de las cantidades producidas por cada firma

La demanda inversa del mercado está dada por P (Q) = a − bQ, donde a, b > 0.

La función de costo de cada empresa es ci (qi ) = ci qi , donde ci es el costo marginal y 0 6 ci < a

Sea q−i = Q−qi la suma de todas las cantidades producidas excepto por la firma i, tal que Q = qi +q−i .
Entonces, la demanda inversa del mercado puede ser escrita como

P (qi , q−i ) = (a − bq−i )qi = di (q−i )

Mientras la firma i conjetura que las otras firmas no modificarán su elección de cantidad sin importar
lo que éstas decidan producir (esto es conocido como la Conjetura de Cournot), la función di (q−i )
puede interpretarse como la demanda residual que enfrenta la firma i. Debido a que la función de
reacción en un modelo de Cournot es sustituto estratégico, si la firma i cree que la cantidad total
producida por todas las otras firmas va a aumentar, la firma i enfrenta una demanda residual menor.
Luego, la firma i escoge qi para maximizar su función de beneficios.

M ax πi = P (Q) × qi − ci × qi

12
M ax πi = (a − b(Q)) × qi − ci × qi

M ax πi = (a − b(qi + q−i )) × qi − ci × qi

La condición de primer orden viene dada por:


∂πi
= a − 2bqi − bq−i − ci = 0
∂qi
Por tanto, la función de mejor respuesta de la firma i a las f irmas−i
a − bq−i − ci
qi (q−i ) =
2b
Donde, si q−i aumenta, entonces qi disminuye, ya que Fi enfrenta una demanda residual con pendiente
negativa.
Sumando las ecuaciones para las n firmas
−bq−i
Σni=1 qi = Σni=1 ( a−ci2b ) ; donde Σni=1 qi = Q

Luego,
a ci bq−i
Q = Σni=1 − Σni=1 − Σni=1
2b 2b 2b
Recordando que Σni=1 qi = Q, esto implica que Σni=1 q−i = (n − 1)Q. Además, supongamos que Σni=1 ci =
C. Luego,
1 b(n − 1Q)
Q = (an − C) −
2b 2b
Al despejar Q, obtenemos la cantidad de equilibrio del mercado.
an − c
Q∗ =
b(1 + n)

Recordar que Q = qi + q−i , por tanto, Q − qi = q−i . Luego reemplzando en qi (q−i ),


1
qi = [a − ci − b(Q − qi )]
2b
Despejando qi , y considerando que C = ci + c−i , se obtiene la cantidad de equilibrio de Cournot que
produce la firma i
a − nci − ci + C
qi =
b(n + 1)
a − nci + c−i
qi∗ =
b(n + 1)
Luego, reemplazado la cantidad de equilibrio de mercado en la función de demanda inversa, es posible
encontrar el precio de equilibrio del mercado.
an − C
P (Q) = a − b( )
b(1 + n)
a+C
P∗ =
1+n
Los beneficios de la firma i vienen dador por

πi = (P ∗ − ci )qi∗

13
a+C a − nci + c−i
πi = [ − ci ][ ]
1+n b(n + 1)
Luego,
(a − nci + c−i )2
πi∗ =
b(n + 1)2

2.3.3. Modelo de Bertrand simple o Bertrand standar

Supuestos del modelo:

Existen n firmas en el mercado las cuales buscan maximizar su beneficio escogiendo precios de
forma simultánea.

Los costos marginales son constantes e idénticos entre las firma; Cmg = c

La firma con el menor precio se lleva todo el mercado.

si pi = pj , entonces el mercado se reparte entre las firmas de formas iguales.

La demanda tipo de la firma i viene dada por,



 Q(p) si pi < pj

Q(p)
qi (pi ) = n si pi = pj

0 si pi > pj

En este modelo simple de competencia en precios existe un único equilibrio en estratégicas puras en
donde ambas firmas fijan el precio igual al costo marginal P = Cmg. Para cualquier otro precio existe
al menos una firma que tiene incentivos a desviarse.

A este resultado se le conoce como la Paradoja de Bertrand, ya que el equilibrio de Nash resultante
de una competencia a la Bertrand simple es el mismo que en competencia perfecta, esto es, p = cmg,
lo que implica π = 0. Esto es, el mismo resultado que en competencia perfecta. Este equilibrio resulta
de estrategias débilmente dominadas.

Las funciones de reacción, o funciones de mejor respuesta del modelo de duopolio con competencia
en precios tienen pendiente positiva, esto implica que, cuando una forma sube el precio, la mejor
respuesta de la otro firma es subir el precio también.

2.3.4. Modelo de Bertrand con asimetrı́a en costos

Supuestos del modelo:

Las firmas tiene acceso a diferentes tecnologı́as de producción, ergo, tiene costos marginales
distintos; Cmgi 6= Cmgj

14
Existen n firmas en el mercado ordenadas desde la que tiene el mejor costo marginal hasta la
con mayor costos marginal; ci < ci+1 < ci+2 < ...ci+n−1 .

Las firmas escogen precios simultáneamente.

Si dos firmas escogen el mismo precio, la más eficiente se lleva el mercado.

El equilibrio de este juego es cualquier P ∈ [ci , ci+1 − ], donde  es un número muy pequeño, lo que
permite que la segunda empresa más eficiente (en términos de costos) salga del mercado y la empresa
más eficiente maximice su beneficios siendo la única empresa que participa en el mercado.

2.3.5. Modelo de Bertrand con restricciones de capacidad

En un modelo de Bertrand simple suponemos que las empresas pueden satisfacer el 100 % de la de-
manda a P = Cmg, lo que no es real ya que las empresas enfrentan restricciones de capacidad.

Una aproximación más real es que el modelo de Capacity-then-price model. Esto es, las empresas pri-
mero escogen cantidad en términos de capacidad de producción y luego escogen precios.

Supuestos del modelo:

Juego en dos etapas:

• Etapa 1: Las empresas escogen capacidad de forma simultánea; q¯i


• Etapa 2: Las empresas escogen precios de forma simultánea; pi

El costo marginal de la capacidad de producción es constante e igual a c, y se incurre en la etapa


1. En la etapa 2, una vez instalada la capacidad productiva de la empresa, el Cmg = 0. Esto
implica que la elección de capacidad afecta el precio de equilibrio.

La elección de capacidad en la etapa 1 afecta su elección del precio en la etapa 2

Los jugadores observan la elección de capacidad de la otra firma.

Si una firma escoge un precio muy bajo, es posible que la demanda sea mayor que la capacidad
de producción de la empresa. Luego, los consumidores son divididos (racionalizados). Esto es,
los consumidores con mayor disposición a pagar compran primero.

• Si la firma 1 tiene una restricción de capacidad de q¯i unidades, estas unidades son vendidads
a los qi primeros consumidores con la mayor disposición a pagar.
• Si pi < pj , entonces q¯i es insuficiente para cubrir todo el mercado y Q(pi ) > q¯i . Por
tanto, algunos consumidores son racionalizados y la firma 2 enfrenta una demanda residual
positiva.

Establecer una capacidad de producción muy grande es costos.

15
Supongamos una función de demanda lineal Q(p) = a − p.

El problema de la firma viene dado por escoger una cantidad que maximice el beneficio de la empresa.

M ax π = p(q)q

La condición de primer orden es


∂π
= a − 2q
∂q
a
q∗ =
2
Los costos de la etapa 1 deben ser menores que los ingresos. Esto es,

a2
cq¯i 6
4
Luego, la maximización de beneficios de la elección de capacidad debe satisfacer que

a2
q¯i 6
4c
Luego, analizamos la segunda etapa, donde la firma escoge precio para las capacidades que satisfacen
la inequidad anterior. Si pi < pj , la firma j enfrenta la demanda residual.

(
Q(pj ) − q¯i si Q(pj ) − q¯i > 0
Q̂(pj ) =
0 si todo lo demas

Tal que, Q̂(pj ) = Q(pj ) − q¯i

Luego,
(
πi = pi q¯i − cq¯i
Si pi < pj =
πj = pj Q̄(pj ) − cq¯j

El equilibrio en el la etapa 2 se alcanza cuando las empresas fijan un precio que permite satisfacer
toda la demanda. A esto se le conoce como el market-clearing price. Esto es pi = pj = p∗ = a − q¯i − q¯j .
Con este precio se satisface toda la demanda del mercado.

? En un modelo de capacity-then price game con una racionalización eficiente de consumidores y


con demandan lineal y costos marginales constantes, la capacidad elegida es igual a la de un modelo
standar de competencia a la Cournot.

16
2.3.6. Competencia en precios con bienes diferenciados: Modelo de Hotelling

Supuestos del modelo:

Existen 2 firmas que venden dos productos diferenciados.

Las firmas se posicionan en los extretmos de una recta de intervalo [0,1].

El costo marginal es constante e igual a c; Cmg = c

Las firmas maximizan utilidades tal que

πi = pi Q(pi , pj ) − ci Q(pi , pj )

Los consumidores se distribuyen uniformemente a través del intervalo [0,1]

Los consumidores obtienen desutilidad de viajar a la largo del intervalo [0,1] para obtener el
preducto

la distancia es lineal

la utilidad del consumidor es


U (x) = v − τ |`i − x| − pi

donde, v es la disposición a pagar del consumidor, τ es el costo de transporte, es decir, qué tan
facil se puede sustituir una unidad del bien 1 por una unidad del bien 2. `i es la posición de la
firma 1. x es la posición del consumidor. y pi es el precio que cobra la firma i.

supongamos que al consumidor sólo le interesa comprar una unidad del bien i. Por ejemplo,
unidades adicionales del bien no le reportan mayor nivel de utilidad.

Firma 1 Firma 2

0 1
X

Figura 2: Representacion grafica del modelo de Hotelling

En la figura, representamos al consumidor indiferente como X̂. Es decir, el consumidor que está justo
en medio entre las dos firmas y está indiferente entre comprar a la firma 1 o a la firma 2. Sabemos
que la utilidad del consumidor indiferente U (x) = v − τ |`i − x| − pi , luego podemos resolver de la
siguiente forma.
v − τ (` + x̂) − pi = v − τ [`i + (1 − x̂)] − pj

−τ ` − τ x̂ − pi = −τ ` − τ + τ x̂ − pj

pj − pi − τ ` + τ ` + τ = τ x̂ + τ x̂

17
pj − pi + τ = 2τ x̂

Luego,
1 pj − pi
x̂ = +
2 2τ
Una forma alternativa de plantear este problema es:

X̂ : v − τ x − p1 = v − τ (1 − x) − p2

p2 − p1 = τ x − τ (1 − x)

p2 − p1 = τ x − τ + τ x

p2 − p1 = 2τ x − τ

p2 − p1 + τ = 2τ x
p2 − p1 + τ
=x

p2 − p1 τ
+ =x
2τ 2τ
p2 − p1 1
+ =x
2τ 2

Luego, la demanda que enfrenta cada firma es

1 pj − pi
Qi (pi , pj ) = +
2 2τ

Por tanto, la función de beneficio se puede expresar como


  1 p − p 
j i
πi = pi − c +
2 2τ

Para obtener la función de mejor respuesta de la firma i, debemos encontrar las condiciones de primer
orden, esto es

∂π 1 pj pi 2
= + − + =0
∂pi 2 2τ τ 2τ

Despejando pi , obtenemos que

τ + pj + c
pi (pj ) =
2

18
Esto es la función de mejor respuesta de la firma i y a la firma j. Recuerde que las firmas son simétricas
y están escogiendo precio. Interceptando las funciones de mejor respuesta, esto es, resolviendo el
sistema de ecuaciones, encontramos que

pi = τ + c

Por simetrı́a,
pj = τ + c

Por tanto, el precio que cobran las firmas es igual al costo marginal más el costo de transporte.
Mientras mayor sea τ , mayor será la diferencia de productos, es decir, mayor es el mark up de la
empresa. En otros palabras, a mayor diferenciación, mayor es el poder de mercado.

Una variante de este modelo es donde el consumidor está fijo en una posición y las empresas se mue-
ven para capturar una mayor demanda. Imagine, por ejemplo, que usted está en la playa, y en cada
extremo de la playa hay un vendedor de helados con un carrito. Si el vendedor de la derecha se corre
un poco hacia el centro, entonces le restará demanda al vendedor de la izquierda. Si usted esta justo
en el centro estaba indiferente entre comprarle al vendedor de la izquierda o al vendedor de la derecha,
pero ahora el vendedor de la derecha está más cerca de usted, por lo que usted prefiere comprarle
al vendedor de la derecha. Decimos entonces que el “centro” se corrió hacia la izquierda. Como el
vendedor de la izquierda ahora enfrenta una demanda menor, también decide correrse un poco hacia
el centro, a fin de recuperar la demanda que le fue quitada. Naturalmente, todas las personas que
quedan desde los vendedores de helado hacia los extremos de la playa prefieren comprar al vendedor
más cercano; es decir, si el vendedor de la derecha se corre un poco hacia el centro, las personas que
quedan a la derecha del vendedor, prefieren comprarle a él (realmente no tienen otra opción, por que
sólo hay dos vendedores y este sigue estando más cerca). Los vendedores continúan en esta dinámica
y el equilibrio del juego se encuentra cuando ambos vendedores se posicionan justo en el centro. De
esta forma, todos los consumidores que están a la derecha, le compran al vendedor de la derecha y
todos los consumidores que están a la izquierda le comprar al vendedor de la izquierda.
En Ciencia Polı́tica existe una aplicación del modelo de Hotelling y se conoce como El Teorema del
Votante Mediano. Imagine que los vendedores de helados son candidatos y los consumidores son vo-
tantes. Luego, a medida que los candidatos se van acercando al centro le van robando votantes al otro
candidato. Si asumimos que los votantes se distribuyen de forma normal5 , entonces la mayorı́a de los
votantes se concentran en el centro.

Cuando analizamos el modelo de Hotelling desde el posicionamiento de las empresas, podemos rescatar
la existencia de dos efectos

1. Efecto directo: La demanda de la firma 1 aumenta en la medida que se posiciona más cerca de
la firma 2.
5
Una distribución normal tiene la forma de una Campana de Gauss

19
2. Efecto estratégico: Mientras más cerca están las firmas, mayor es la competencia en precios.

Si las firmas están posicionadas muy cerca, entonces cobran P = Cmg, ya que los productos ho-
mogéneos. Por tanto, si la competencia en precios es fuerte, las firmas tienen a alejarse y diferenciar
sus productos.

2.4. El Problema de los Recursos Comunes


Un bien común es aquel que es rival pero no excluyente. Rival quiere decir que su consumo por parte
de uno, disminuye la posibilidad de consumo por parte de otros. No excluyente implica que no se
puede evitar que los otros consuman ese bien. Por ejemplo, si estamos en una cena y sobre la mesa
hay una botella de vino, mientras más vino tomo yo, menos vino puede tomar el resto, sin embargo
yo no puedo evitar que el resto tome vino. El ejemplo históricamente más conocido de bien común es
el de los ejidos, tierras de pastos propiedad de los habitantes de una determinada localidad.

En general, la consecuencia de que un recurso sea común es que puede sufrir una sobreexplotación.
Ello también ocurre en recursos naturales de libre acceso como los recursos de pesca en aguas inter-
nacionales que estén abiertos a cualquier empresa de pesca.

2.4.1. Modelo simple: Un jugador

En este caso un jugador debe administrar un bien privado que se comporta como recurso común. Su-
pongamos que un ganadero dispone de un pastizal al que llevar sus vacas. El costo de llevar cada vaca
es de c. Por otra parte, el valor o utilidad v que obtiene de cada vaca depende del número de vacas M
que envı́a al pastizal (obsérvese que si envı́a solamente una, podrá comer lo que quiera y volverá sana y
con mucho peso, mientras que si envı́a muchas no habrá comida para todas, y volverán débiles y flacas).

Sea v(M ) = a − M 2 el valor que obtiene por cada vaca, y sea c < a. El problema de decisión es cuántas
vacas M ∗ ha de llevar para maximizar su ganancia o utilidad total

u(M ) = (v(M ) − c)M = (a − M 2 − c)M

Para simplificar el problemas, supongamos que las vacas son perfectamente divisibles. Luego, la con-
dición de primer orden se alcanza cuando:

du(M )
=0
dM
M ∂(v(M ))
(v(M ) − c) + =0
∂M
de donde se deduce que:
(a − M 2 − c) + (−2M )M = 0

∂u(M )
El problema es equivalente a ∂M = 0. Luego,

20
a − c = 3M 2
r
a−c
M =+
3
Al analizar a condición de segundo orden ∂ 2 u(M )/∂M 2 = −6M < 0 podemos observar que corres-
ponde a un máximo.
En conclusión, la cantidad óptima de vacas es:
r
∗ a−c
M =+
3
Luego, la ganancia máxima es:
u∗ = (a − M ∗2 − c)M ∗
r
∗ a−c a−c
u = (a − − c)
3 3
r
a−c 3 
u∗ = 2
3

2.4.2. Bien común con dos jugadores

En este caso, son dos los ganaderos que comparten el pastizal al que llevar sus vacas. El primero, J1 ,
lleva m1 unidades y el segundo, J2 , lleva m2 . El coste de llevar cada unidad es c, y el valor v que
obtiene cualquiera de ellos de cada unidad que lleve depende del número de unidades M = m1 + m2
que vayan al pastizal.

Sea v(M ) = a − M 2 el valor que obtiene cada ganadero llevar a pastar a una vaca. El problema de
decisión de J1 , suponiendo que J2 lleva a pastar m2 vacas, es cuántas vacas m1 ha de llevar para
maximizar su ganancia o utilidad total:

u1 (m1 , m2 ) = (v(M ) − c)m1

u1 (m1 , m2 ) = (a − M 2 − c)m1

Análogamente, el problema de decisión para el J2 , suponiendo que J1 lleva m1 vacas, es cuántas


vacas m2 ha de llevar para maximizar su ganancia o utilidad total u2 (m1 , m2 ) = (v(M ) − c)m2 =
(a − M 2 − c)m2 .

A diferencia del caso con un jugador y un bien privado, la respuesta a estas preguntas contiene un
elemento estratégico, pues cada ganadero influye con sus decisiones en el rendimiento que el otro puede
obtener del pastizal; es decir, existe interacción estratégica.

Para simplificar el problema, supongamos que las vacas son perfectamente divisibles.

21
La condición de primer orden resulta de derivar la función de utilidad respecto a la cantidad de vacas
e igualar a cero; ∂ui (m 1 ,m2 )
∂mi =0

∂(v(M ))
(v(M ) − c) + mi = 0 ; ∀i = 1, 2
∂mi
(a − (m1 + m2 )2 − c) + mi (−2(m1 + m2 )) = 0 ; ∀i = 1, 2

Sumando obtenemos que,

2a − 2(m1 + m2 )2 − 2c − 2(m1 + m2 )(m1 + m2 ) = 0

a − c − 2(m1 + m2 )2 = 0
(a − c)
(m1 + m2 )2 =
2
r
a−c
m1 + m2 =
2
Por tanto, las cantidades individuales de equilibrio son:
r
∗ ∗ a−c
m1 = m2 =
8
La cantidad total es: r
∗ a−c
M =
2
Y la ganancia total es:
 a−c r a − c r a − c 3
a− −c =
2 2 2
∂ 2 ui (m1 ,m2 )
Las condiciones de segundo orden son ∂m2i
= −4M − 2mi < 0 ∀i = 1, 2, por lo que corresponde
a un máximo.

2.4.3. Bien común con n jugadores

Supongamos ahora que, en vez de dos jugadores, existen n. J1 lleva mi vacas a pastar ∀i = 1, 2, ..., n
y M es la cantidad total de m1 + m2 + ... + mn . El costo de llevar cada vaca a pastar es de c. El valor
v que obtiene cualquier jugador de cada vaca que lleve a pastar es v(M ) = a − M 2 . tal que c < a. La
utilidad para el ganadero i viene dada por:

ui (mi , m2 , ..., mn ) = (v(M ) − c)mi

ui (mi , m2 , ..., mn ) = (a − M 2 − c)mi

El problema de decisión del Ji , suponiendo que los otros jugadores llevan a pastar sus vacas m−i =
(m1 , ..., mi−1 , mi+1 , ..., mn ), es maximizar su función de utilidad tal que:

ui (m1 , m2 , ..., mn ) = (v(M ) − c)mi

ui (m1 , m2 , ..., mn ) = (a − M 2 − c)mi

22
Las condiciones de primer orden son:

∂ui (m1 , m2 , ..., mn )


= 0 ; ∀i = 1, 2, ..., n
∂mi
Es decir,
∂(v(M ))
(v(M ) − c) + mi =0
∂mi
Reemplazando obtenemos,

(a − (m1 , m2 , ..., mn )2 − c) + (−2(m1 , m2 , ..., mn ))mi = 0

Resolviendo se obtiene que


na − nM 2 − nc − 2M 2 = 0

n(a − c) − (n + 2)M 2 = 0

Despejando, se obtiene que


n(a − c)
M2 =
n+2
La cantidad total de equilibrio es r
n(a − c)
M∗ =
n+2
Luego, las cantidades individuales de equilibrio son
r
∗ ∗ ∗ 1 n(a − c)
m1 = m2 = ... = mn =
n n+2
La ganancia total es s
 n(a − c) r n(a − c) (a − c)3 n
a− −c =2
n+2 n+2 (n + 2)3

∂ 2 ui (m1 ,m2 ,...,mn )


Las condiciones de segundo orden son ∂m2i
= −4M − 2mi < 0, por tanto es un máximo.

De la condición de primer orden podemos extraer la siguiente interpretación. El primer sumando del
primer miembro de la ecuación, (v(M ) − c), es la rentabilidad directa para el usuario Ji de usar una
unidad adicional, mientras que el segundo término, mi ∂(v(M ))/∂mi , es el efecto (negativo) que el uso
de esa unidad adicional causa en la rentabilidad de las unidades ya utilizadas por Ji . Ası́ pues, en el
equilibrio al usar una unidad más, Ji compensa exactamente con dicha rentabilidad positiva directa la
rentabilidad negativa indirectamente ocasionada al usuario Ji (y sólo a él). Además, al igual que en el
oligopolio a la Cournot, existe una externalidad negativa creada entre los usuarios del recurso común
al decidir la intensidad de su explotación de dicho recurso. Esta externalidad queda de manifiesto en el
hecho de que cada usuario Ji compense mediante su rentabilidad positiva directa únicamente el efecto
negativo que a él le causa dicho uso de una unidad adicional, mi ∂(v(M ))/∂mi , en lugar de compensar
el efecto negativo causado a todo el conjunto de usuarios, M ∂(v(M ))/∂mi .

23
2.4.4. Modelo general de la tragedia de los recursos comunes.

Considere un modelo con n jugadores pero sin asumir una forma funcional para la función de valor
v(M ). De esta forma,

Ji utiliza mi unidades ∀i = 1, 2, ..., n, donde mi ∈ [0, ∞).

Sea M = Σni mi

Sea v(M ) el valor que obtiene cualquiera de los usuarios de cada unidad donde v es estrictamente
decreciente y cóncava. Es decir, v 0 (M ) < 0 y v 00 (M ) < 0.

El costo de usar cada unidad es c, con c < v(0).

Las funciones de ganancias son: u(m1 , ..., mi , ..., mn ) = mi (v(M ) − c).

Supondremos que las variables m1 , m2 , ..., mn son reales. Por ser v(M ) una función estrictamente
decreciente y cóncava, existen dos valores de M, a los que llamaremos crı́tico y máximo, y
denotaremos Mcrit y Mmax , respectivamente, que cumplen v(Mcrit ) = c y v(Mmax ) = 0.

La combinación (m∗1 , ..., m∗i , ..., m∗n ) es un equilibrio de Nash si y sólo si para todo i, m∗i es una
respuesta óptima a m∗−i , lo que ocurre si m∗i es solución de Maximizar ui (m∗1 , ..., mi , ..., m∗n ) en la
variable en mi , ∀i = 1, 2, ..., n.

Las condiciones de primer orden son:


∂ui (mi , m∗−i )
= v(mi + m∗−i ) − c + mi v 0 (mi + m∗ −i) = 0
∂mi
Esto es
v(M ∗ ) − c + m∗i v 0 (M ∗ ) = 0

Sumando las n ecuaciones y dividiendo por n, obtenemos que


M ∗ v 0 (M ∗ )
v(M ∗ ) − c + =0
n
M ∗ es la solución a la ecuación anterior y el número total de unidades de equilibrio. Nótese que M ∗
0
es la raı́z de la función Fn (M ) = v(M ) − c + M vn(M ) .

Las cantidades individuales m∗i , los beneficios individuales u∗i , y los beneficios totales de equilibrio son:

M∗
m∗i = ; ∀i = 1, 2, ..., n
n
M ∗ (v(M ∗ ) − c)
u∗i = ui (m∗1 , ..., m∗n ) = m∗i (v(M ∗ ) − c) =
n
u∗ = M ∗ (v(M ∗ ) − c)

La conclusión es la misma que en el caso anterior. El beneficio directo de usar una unidad adicional
∗ 0 ∗
del recurso v(M ∗ ) − c compensa el perjuicio M vn(M ) que, desde el punto de vista de cada jugador
(por eso el denominador n), ocasiona indirectamente ese uso adicional.

24
El cantidad socialmente óptima tiene dos propiedades importantes; ser única y ser estrictamente me-
nor que el valor crı́tico Mcrit .

Es interesante analizar cómo varı́a M ∗ con el número de jugadores. Sea Mn∗ la cantidad de equilbrio
correspondiente a n jugadores, es decir, la raı́z de Fn (M ).

M v 0 (M )
Puesto que n < 0, ∀M > 06 , es claro que Fn (M ) < F m(M ) si n < m. Por tanto, Mn∗ < Mm
∗ si

n < m.

Al analizar los casos extremos, tenemos que:

Si n = 1
M1∗ es la solución de v(M ) − c + M v 0 (M ) = 0, y la ganancia total de u∗1 es M1∗ (v 0 (M1∗ ) − c).

Si n = ∞
M∞ ∗ es la solución de v(M ) − c = 0, por tanto M ∗ = M ∗
∞ crit . La ganancia total u es nula ya que
u∗∞ = M∞ ∗ (v(M ∗ ) − c) = M
∞ crit (v(Mcrit ) − c) = 0.

Por tanto, la sobreexplotación se produce cuando el número n de usuarios del recurso es mayor que
1, y se agrava conforme dicho número aumenta.

2.5. Estratégicos Sustitutos y Estratégicos Complementarios


Los concepto de estratégicos sustitutos y estratégicos complementarios se refieren a la dirección de la
reacción de las empresas, es decir, a las funciones de mejor respuesta de las empresas.

A. Complementos Estratégicos

Sea πi (xi ) la función de beneficios de la firma i, donde xi es la variable estratégica que escoge, la firma
i. Esto es, precio o cantidad.
Sea x−i la variable estratégica que escogen las otras firmas del mercado que no son i.

∂πi
Una variable es estratégica complementaria si, al aumentar x−i , aumenta ∂xi , es decir, aumenta el
producto marginal.

Complementos estratégicos implica que las funciones de mejor respuesta tienen pendiente positiva.
Si la variable de elección de la empresa son complementos estratégicos, y el aumento de un parámetro
exógeno en el mercado produce un aumento del ingreso marginal, entonces el aumento de este paráme-
tro produce un aumento en la elección estratégica de equilibrio.

La competencia en precios a la Bertrand es un ejemplo de estratégicos complementarios. Es decir, si


la firma 1 aumenta el precio, la firma dos reacciona aumentando el precio. Esto se puede observar en
la pendiente positiva de la función de reacción de las firmas.
6
Ya que v 0 (M ) < 0

25
P2

R1(P2)

R2(P1)

P1

Figura 3: Representacion grafica Funciones de reaccion complementarios estrategicos

B. Sustitutos Estratégicos

En el caso de los estratégicos sustitutos, si la derivada cruzada es negativa, entonces la función de


mejor respuesta de la firma tiene pendiente negativa. Es decir, si la derivada cruzada es menor a cero,
la función de reacción de la firma es estratégico sustituto. Un bien puede ser complementario, y la
función de reacción de la empresa puede ser estratégico sustituto.

q2

R1(q2)

R2(q1)

q1

Figura 4: Representacion grafica Funciones de reaccion sustitutos estrategicos

26
La competencia en cantidades a la Cournot es un ejemplo de sustitutos estratégicos. Es decir, si la
firma 1 aumenta la cantidad de producción, la firma dos reaccionará disminuyendo su cantidad de
producción. Esto es fácilmente observable en la función de reacción de la empresa, donde la cantidad
de producción de la otra firma aparece restando. Por ejemplo,

a − c1 − bq2
q1 =
2b

2.6. Estratégias Mixtas


El concepto de solución equilibrio de Nash (EN), tal como se ha definido, tiene una dificultad muy
importante ya que su existencia no está garantizada, ni siquiera en juegos tan sencillos como los juegos
finitos. Por ejemplo, el juego de las monedas (cara o sello) carece de EN (en estrategias puras). Si
ampliamos el concepto de estrategia, el conjunto de equilibrios de Nash se amplı́a también, de tal
modo que podremos afirmar que todos los juegos finitos poseen al menos un EN. Para ello, debemos
incorporar la posibilidad de estrategias mixtas.

Hasta ahora hemos utilizado la palabra estrategia para referirnos a un plan completo de acciones
ciertas de cada jugador. En el caso de juegos estáticos con información completa, dicho plan se reduce
a elegir una, y sólo una, de las acciones disponibles. Por ejemplo, en el juego de las monedas (cara o
sello) las únicas estrategias de cada jugador son jugar Cara y jugar Cruz. A tales estrategias las hemos
denominado estrategias puras. La ampliación del concepto de estrategia consiste en permitir que los
jugadores no sólo puedan elegir entre acciones ciertas y concretas, sino que también puedan seleccionar
acciones aleatorias, es decir, puedan tomar acciones inciertas, que asignan distintas probabilidades a
las distintas acciones ciertas. Por ejemplo, en el juego de las monedas el jugador 1 podrı́a decidir lo
siguiente: jugar Cara con probabilidad 1/4 y jugar Cruz con probabilidad 3/4. A las estrategias que
deciden de manera aleatoria sobre acciones ciertas se las denomina estrategias mixtas.

Consideremos el siguiente juego.

J2
Derecha Izquierda
Derecha 0, 0 1, -1
J1
Izquierda 1, -1 0, 0

En este juego, existen dos jugadores, el espacio de estrategias de cada jugador es {derecha, izquierda},
y si se observa bien es un juego de suma cero, es decir, lo que gana uno es lo que pierde el otro. Si in-
tentamos encontrar un equilibrio en este juego, podemos notar que no existe ningún par de estrategias
que pueda cumplir un Equilibrio de Nash, ya que si las estrategias de los jugadores coinciden (dere-
cha, derecha) o (izquierda, izquierda), el jugador que prefiere cambiar su estrategia, tiene incentivos a
desviarse, mientras que si las estrategias no coinciden (derecha, izquierda) o (izquierda, derecha), es

27
el jugador 2 quien prefiere cambiar su estrategia.

El rasgo distintivo de este juego es que a cada jugador le gustarı́a adivinar la jugada del otro jugador
y que el otro no adivinara la suya. En cualquier jugo en el cual a cada jugador le convenga adivinar
la jugada del otro y que el otro no adivine la suya, no existe ningún equilibrio de Nash en estrategias
puras, porque la solución de tal juego incluye necesariamente un elemento de incertidumbre sobre lo
que harán los jugadores.

Para resolver este juego debemos aplicar estrategias mixtas que entendemos como la incertidumbre
de un jugador respecto a lo que otro jugador hará.

Formalmente; para el jugador i, una estrategia mixta es una distribución de probabilidades sobre las
estrategias Si 7 . En este juego Si consiste en las dos estrategias puras derecha e izquierda, ası́ una
estrategias mixta para el jugador i es la distribución de probabilidades (p, 1 − p), donde p es la pro-
babilidad de escoger derecha y (1 − p) es la probabilidad de escoger izquierda, ya que 0 6 p 6 1. La
estrategia mixta (0,1) es simplemente una estrategia pura izquierda, es decir, se juega con un 100 %
de probabilidad izquierda. De la misma forma, una estrategia mixta (1,0) implica que se juega con un
100 % de probabilidad la estrategia pura derecha.

Considere la siguiente matriz con la distribución de probabilidades de cada jugador.

q (1 − q)
J2
Derecha Izquierda
p Derecha pq p(1 − q)
J1
(1 − p) Izquierda (1 − p)q (1 − p)(1 − q)

Luego, podemos expresar la utilidad esperada del jugador 1 como,

UJ1 (p, q) = p · q · 0 + p · (1 − q) · 1 + (1 − p) · q · 1 + (1 − p)(1 − q) · 0


UJ1 (p, q) = p(1 − 2q) + q
Análogamente para el jugador 2,

UJ2 (p, q) = p · q · 0 + p · (1 − q) · (−1) + (1 − p) · q · (−1) + (1 − p)(1 − q) · 0

UJ2 (p, q) = q(2p − 1) − p

Realicemos ahora el siguiente análisis:


J1 conjetura lo que J2 va a jugar:

E[UJ1 (D)] = 0q + 1(1 − q) = 1 − q


7
Recuerde que las Si se refiere a las estrategias puras del jugador i, esto es, las deciciones que el jugador puede tomar

28
E[UJ1 (I)] = 1q + 0(1 − q) = q

Luego,
1−q =q
1
q=
2
Entonces, q = 12 es un punto crı́tico. Esto quiere decir que, cuando q = 12 , el jugador 1 es indiferente
entre jugar Derecha o Izquierda. Ahora bien, si q > 21 , entonces el jugador 1 juega D con probabilidad
p = 0, lo que es equivalente decir que juega I con probabilidad (1−p) = 1. También podemos analizarlo
como, si q < 12 , entonces el jugador 1 juega D con probabilidad P = 1, lo que es equivalente a decir
que juega I con probabilidad (1 − p) = 0. De este análisis, podemos construir la función de reacción
del jugador 1 como,

1
 1
 si q < 2
p(q) = 1
0 si q > 2
 1
[0, 1] si q =

2

Lo mismo es posible para el jugador 2, donde su función de reacción viene dada por,

1
 0
 si p < 2
q(p) = 1
1 si p > 2
 1
[0, 1] si p =

2

Por tanto, el par de estrategias (p, q) = ( 21 , 12 ) es un equilibrio de Nash, en tanto ningún jugador tiene
incentivos unilaterales a cambiar de estrategia.

Formalicemos el análisis anterior.


Sea Si = {s1i , s2i , ..., ski } el conjunto de estrategias puras del jugador i. Llamamos estrategias mixtas

29
del jugador i a toda loterı́a σi = (σi1 , σi2 , ..., σik ) sobre Si , es decir, a toda distribución de probabilidad
sobre Si , y por tanto, a todo conjunto (σi1 , σi2 , ..., σik ) cuyos componentes son no negativos y suman 1.
Se interpreta σi como la estrategia consistente en jugar la estrategia pura s1i con probabilidad σi1 , s2i
con probabilidad σi2 , ..., ski con probabilidad σik , donde σij > 0, para cada j = 1, 2, ..., k y kj=1 σij = 1.
P

Sea 4(Si ) el conjunto de estrategias mixtas del jugador i, indicando que el conjunto de estrategias
mixtas de un jugador está formado por todas las loterı́as sobre Si . Entre las estrategias mixtas están
aquellas que asignan probabilidad 1 a una de las estrategias puras y probabilidad cero a todas las
demás. Por tanto, toda estrategia pura es también estrategia mixta: ası́ la estrategia pura sji se puede
identificar con la estrategia mixta (0, ..., 1, ..., 0), en donde el 1 corresponde a la componente j-ésima de
dicho vector. La ampliación del concepto de estrategia para dar cabida a las estrategias mixtas supo-
ne además convertir en estrategia a toda combinación lineal convexa de al menos dos estrategias puras.

La definición del equilibrio de Nash cuando permitimos la existencia de estrategias mixtas no es más
que una extensión del concepto visto para estrategias puras.

Sea G = {S1 , ..., Sn ; u1 , ..., un }, decimos que el perfil de estrategias mixtas σ ∗ = (σ1∗ , σi∗ , ..., σn∗ ) es un
Equilibrio de Nash si para cada jugador i Ui (σ1∗ , ..., σi−1 ∗ , σ ∗ , σ ∗ , ..., σ ∗ ) > U (σ ∗ , ..., σ ∗ , σ , σ ∗ , ..., σ ∗ )
i i+1 n i 1 i−1 i i+1 n

para todo σi de 4(Si ). Es decir, para cada jugador i, σi es una solución al problema

max Ui (σ1∗ , ..., σi−1


∗ ∗
, σi , σi+1 , ..., σn∗ )

en la variable σi , donde σi pertenece a 4(Si ) o dicho de otro modo, para cada jugador i, σi∗ es una
respuesta óptima a σ−i∗ .

Téngase en cuenta que una estrategia mixta no es más que una loterı́a sobre estrategias puras y que
la función de pagos o ganancias es lineal, para cada jugador, en las probabilidades de sus distintas
estrategias puras. Por tanto, el pago esperado para un jugador de una estrategia mixta, suponiendo
fijas las estrategias de los otros jugadores, resulta ser una combinación convexa de los pagos de las
estrategias puras contenidas en dicha estrategia mixta, y en consecuencia, la ganancia esperada de
una estrategia mixta tiene como lı́mites inferior y superior las ganancias mı́nima y máxima de las
estrategias puras de dicha estrategia mixta.

Un perfil de estrategias mixtas es un equilibrio de Nash si y sólo si para cada jugador, todas las
estrategias puras contenidas de su estrategia mixta son una respuesta óptima a la combinación de
estrategias de equilibrio del resto de los jugadores.

Esto significa que las estrategias mixtas de equilibrio asignan una probabilidad estrictamente positiva
sólo a aquellas estrategias puras que son respuesta óptima a las estrategias del resto de jugadores.
De ello se deduce que una estrategia mixta es respuesta óptima a estrategias (puras o mixtas) dadas,
sólo si sus estrategias puras lo son también. En consecuencia, las estrategias puras soporte de una
estrategia mixta de equilibrio producen ganancias iguales.

30
En realidad, esta propiedad es generalizable a cualquier perfil de estrategias y no sólo a aquellas que
forman parte de un EN. En efecto, si un jugador tiene una estrategia mixta σi que es respuesta óptima
a una combinación de estrategias del resto de jugadores, entonces cualquier estrategia pura contenida
en σi o cualquier estrategia mixta que se pueda formar con algunas o todas las estrategias puras de
dicho conjunto, son también respuestas óptimas.

31
3. Juegos Dinámicos con información completa y perfecta
Los juegos estáticos son un caso particular de juegos dinámicos donde los jugadores toman decisiones
de forma simultánea, o bien, donde ningún jugador conoce la decisión que toma el otro jugador. En
el caso de los juegos dinámicos o secuenciales se especifica el tiempo en que cada jugador toma una
decisión. Aun ası́, mantenemos los supuestos de información completa, es decir, se conocen los pagos
asociados a cada acción, e información perfecta, es decir, se conoce la historia de todo lo que se ha
jugados en el pasado.

Para representar un juego en forma extensiva, debemos identificar los siguientes aspectos:

1. Quiénes son los jugadores.

2. Cuándo tiene que jugar cada jugador.

3. Qué cosas puede hacer cuando le toca jugar; acciones.

4. Qué sabe dicho jugador, cuando le toca jugar, acera del desarrollo previo del juego.

5. Cuáles son los pagos esperados de cada jugador para cada posible desarrollo del juego.

La representación en forma extensiva de un juego finito se realiza mediante un árbol constituido por
ramas y nodos. El nodo inicial representa el comienzo del juego y no es precedido por ningún
otro. Los nodos finales o terminales representan el final del juego. Los nodos intermedios pueden
ser nodos de azar, que representan una jugada del azar o la naturaleza, o nodos de decisión, que
representan una jugada de decisión de uno de los jugadores. En los nodos terminales se informan los
pagos asociados a cada jugador. El primer pago corresponde al jugador que comienza jugado, y el
segundo pago al jugador que juega en segundo lugar. De tales vectores de pagos puede decirse que son
los resultados del juego, interpretando aquı́ la palabra resultados como las consecuencias en términos
de utilidad del juego.

Los conjuntos de información permiten representar el conocimiento que cada jugador tiene (en el
momento de decidir en un nodo) del desarrollo previo del juego. Una estrategia pura de un jugador
es un plan de acción completo. Especifica una acción factible de dicho jugador para cada uno de sus
conjuntos de información. Un perfil estratégico es un vector de estrategias, una por cada uno de los
jugadores.

Todo camino que, siguiendo las ramas del árbol, conduce desde el nodo inicial a un nodo terminal es
una senda, resultado o trayectoria posible del juego. Cada vez que se juega efectivamente un juego
se recorre uno, y sólo uno, de los desarrollos posibles (cuál sea este desarrollo depende de cómo hayan
jugado los jugadores y de qué resultados se hayan producido en las jugadas de azar). Ası́ pues, todos
los desarrollos posibles del juego han de estar a la vista en el árbol del juego, y hay tantos como nodos
terminales.

32
Es importante recordar que un juego G tiene información completa si la estructura y los pagos
del juego son de dominio público, es decir, conocido por todos los jugadores. Y decimos que G es de
información perfecta si cada conjunto de información de cualquiera de sus jugadores es unitario. Si,
por el contrario, existe un jugador con algún conjunto de información no unitario, decimos que el juego
G es de información imperfecta. En otras palabras, un juego es de información perfecta que todos
los jugadores conocen con precisión lo que se ha jugado anteriormente. Un juego tiene información
imperfecta si, al menos, un jugador no conoce la historia del juego. Algunos juegos de salón famosos,
como el ajedrez y las damas, son juegos de información perfecta, mientras que los juegos de cartas
no suelen serlo (cada jugador desconoce, al menos parcialmente, las cartas de los demás, es decir,
desconoce el resultado de algunas jugadas de azar, y ello le impide saber, en el momento de realizar
su jugada, en qué nodo se encuentra).

Suponga una empresa incumbente que ejerce un monopolio en el mercado de softwares, lo que genera un
beneficio de $7 millones. Una segunda empresa quiere desafiar al monopolio y entrar al mercado ya que
sabe que, si entra, podrá aumentar sus beneficios de $3 a $5 millones. Si la empresa desafiante ingresa
al mercado, los beneficios del monopolio disminuirán a $5 millones. Sin embargo, una competencia
dura, por ejemplo una guerra de precios, harı́a que ambas empresas se quedaran sin beneficios. La
representación de este juego en su forma extensiva serı́a de la siguiente forma:

  


 

Guerra de precios Competir

   

En este juego, las estrategias de la firma desafiante son Entrar y No entrar, y las de la firma incum-
bente son Competir y Guerra de Precios. Por tanto, su representación en forma estratégica es:

33
Incumbente
Guerra de precios Competir
Desafiante Entrar 0, 0 5, 5
No entrar 3, 7 3, 7

Los EN en estrategias puras son s∗ =(Entrar, Competir ) y s0∗ =(No entrar, Guerra de precios). Aun-
que ambos EN parecen razonables a la vista de la matriz de pagos aquı́ representada, veremos que
el primero de ellos es más razonable que el segundo si analizamos ambos en su desarrollo temporal.
Supongamos que un juez neutral propone que se ponga en práctica el perfil s∗ =(Entrar, Competir ).
En ese caso sabemos que a cualquiera de los jugadores le interesa atenerse a su estrategia particular
en dicho perfil, siempre que el otro haga lo mismo, ya que este perfil es un EN.

La realización práctica del perfil s∗ tendrı́a el siguiente desarrollo razonado: la firma desafiante hace
su jugada prevista Entrar y a continuación la firma incumbente (que acaba de observar que la firma
desafiante ha entrado) decide competir, que es respuesta óptima a Entrar (la que realmente le conviene
suponiendo que la firma entrante juegue Entrar ), mientras que Entrar también es respuesta óptima de
la firma desafiante a la jugada prevista por la firma incumbente. Todo se conforma al sentido común
en este caso y, a la vista de este razonamiento, los jugadores confirman su interés en no desviarse
unilateralmente de ese desarrollo previsto.

Sin embargo, si el juez propusiera poner en práctica el perfil s0∗ =(No entrar, Guerra de Precios),
el desarrollo propuesto serı́a el siguiente: la firma desafiante hace su jugada prevista No entrar la
firma incumebte no se ve obligado a hacer su jugada prevista Guerra de Precios, ya que el juego se
ha acabado. No todo aquı́ se aviene tan fácilmente al sentido común, pues la firma desafiante podrı́a
pensar lo siguiente: “Yo juego No entrar porque es mi respuesta óptima a la jugada prevista Guerra
de precios de la firma incumbente, pero la firma incumbente anuncia Guerra de precios porque si yo
juego No entrar no tendrá que ejecutarla con lo cual la Guerra de Precios sı́ es respuesta óptima a
No entrar. Sin embargo, si yo jugara Entrar no le convendrı́a ejecutar la jugada anunciada Guerra
de Precios, pues obtendrı́a un pago nulo en lugar de un pago $5. En conclusión, la jugada anunciada
Guerra de precios sólo le conviene si no tiene que ejecutarla, por lo que ese anuncio no tiene verdadera
credibilidad, o lo que es lo mismo, la estrategia Guerra de Precios es una amenaza no creı́ble”.

Otro modo de describir esa caracterı́stica intuitivamente insatisfactoria del EN s0 ∗=(No entrar, Guerra
de Precios) es decir que hay una cierta incoherencia entre el juicio que merece s0∗ al analizarlo desde
la perspectiva del juego global y el juicio que merece al analizarlo desde la perspectiva de un momento
particular del juego. En efecto, Competir duro es una respuesta óptima de la firma incumbente a No
entrar desde la perspectiva del juego global, pero no lo es si nos situamos en el nodo de decisión en
que la firma incumbente le toca jugar. Ası́ pues, hay dos EN en estrategias puras pero sólo uno de
ellos, s∗ , parece plenamente satisfactorio. Luego, s∗ =(Entrar, Competir ) es un Equilibrio de Nash
Perfecto en Subjuegos o EPS para abreviar.

34
3.1. Equilibrio de Nash Perfecto en Subjuegos
Cada juego en forma extensiva puede representarse en forma normal o estratégica donde imaginamos a
los jugadores escogiendo simultáneamente las estrategias que pondrán en práctica. Esa representación
en forma estratégica del juego original en forma extensiva consiste simplemente en enumerar, para
cada jugador, todas sus estrategias, e indicar, para cada perfil de estrategias, los pagos que correspon-
derı́an a cada jugador si el juego se desarrollara de acuerdo con dicho perfil estratégico. Las jugadas
de azar o juegos de la naturaleza, se tienen en cuenta calculando los correspondientes pagos espera-
dos. Se dispone ası́ de un esquema de representación matricial, o bimatricial en el caso de dos jugadores.

Este juego en forma normal puede considerarse una especie de resumen estático del juego dinámico
original. Es cierto que al representar en forma normal un juego que originalmente estaba en forma
extensiva puede perderse algo (y en general se pierde) de la información original del juego, pero aun ası́
dicha representación puede ser útil para el análisis del juego, ya que pone a nuestra disposición todos
los instrumentos de análisis del juego, y en particular los conceptos de dominación de estrategias, de
dominación de Pareto, de estrategias mixtas y de equilibrio de Nash.

La estructura temporal de un juego dinámico con información completa obliga a cada jugador a tener
en cuenta que sus decisiones en cada momento influyen en las posibilidades y pagos posteriores para
él y para los demás, y que al mismo tiempo las decisiones futuras previsibles suyas y de los demás
condicionan sus decisiones presentes. Aparece ası́ un elemento de vital importancia, la credibilidad
que se puede dar a las decisiones futuras a la hora de determinar las decisiones presentes, es decir,
la credibilidad de las posibles amenazas o promesas que se pueden plantear sobre el comportamiento
futuro para condicionar el comportamiento presente de los jugadores. Un Equilibrio de Nash Per-
fecto en Subjuegos representa, para el caso de los juegos dinámicos con información completa, una
adecuación y una mejora con respecto al equilibrio de Nash, precisamente porque tiene en cuenta ese
elemento de credibilidad antes mencionado. Un EPS sobrevive a amenazas no creı́bles.

Puesto que todo juego en forma extensiva puede representarse en forma estratégica una vez identifi-
cadas las estrategias de todos los jugadores, podemos hacer una propuesta de solución de un juego en
forma extensiva, que consistirı́a simplemente en el conjunto de los equilibrios de Nash de su represen-
tación en forma estratégica. Ahora bien, puesto que sabemos que se pierde información al traducir a
forma estratégica la forma extensiva de un juego, podrı́a suceder que algunos o todos los EN encontra-
dos fuesen razonables desde una perspectiva estática del juego, pero no lo fuesen desde la perspectiva
dinámica que tiene en cuenta detalles omitidos en la forma estratégica.

Por ejemplo, suponga una empresa incumbente que ejerce un monopolio en el mercado de softwares,
lo que genera un beneficio de $7 millones. Una segunda empresa quiere desafiar al monopolio y entrar
al mercado ya que sabe que, si entra, podrá aumentar sus beneficios de $3 a $5 millones. Si la empresa
desafiante ingresa al mercado, los beneficios del monopolio disminuirán a $5 millones. Sin embargo,
una competencia dura, por ejemplo una guerra de precios, harı́a que ambas empresas se quedaran sin
beneficios.

35
La representación en forma extensiva de este juego viene dada de la siguiente forma.

  


 

Guerra de precios Competir

   

El mismo juego, los podemos representar en su forma estratégica o normal. En este juego, las estra-
tegias de la firma desafiante son Entrar y No entrar, y las de la firma incumbente son Competir y
Guerra de Precios. Por tanto, su representación en forma estratégica es:

Incumbente
Guerra de precios Competir
Desafiante Entrar 0, 0 5, 5
No entrar 3, 7 3, 7

Los EN en estrategias puras son s∗ =(Entrar, Competir ) y s0∗ =(No entrar, Guerra de precios). Aun-
que ambos EN parecen razonables a la vista de la matriz de pagos aquı́ representada, veremos que
el primero de ellos es más razonable que el segundo si analizamos ambos en su desarrollo temporal.
Supongamos que un juez neutral propone que se ponga en práctica el perfil s∗ =(Entrar, Competir ).
En ese caso sabemos que a cualquiera de los jugadores le interesa atenerse a su estrategia particular
en dicho perfil, siempre que el otro haga lo mismo, ya que este perfil es un EN.

La realización práctica del perfil s∗ tendrı́a el siguiente desarrollo razonado: la firma desafiante hace
su jugada prevista Entrar y a continuación la firma incumbente (que acaba de observar que la firma
desafiante ha entrado) decide competir, que es respuesta óptima a Entrar (la que realmente le conviene
suponiendo que la firma entrante juegue Entrar ), mientras que Entrar también es respuesta óptima de
la firma desafiante a la jugada prevista por la firma incumbente. Todo se conforma al sentido común
en este caso y, a la vista de este razonamiento, los jugadores confirman su interés en no desviarse

36
unilateralmente de ese desarrollo previsto.

Sin embargo, si el juez propusiera poner en práctica el perfil s0∗ =(No entrar, Guerra de Precios),
el desarrollo propuesto serı́a el siguiente: la firma desafiante hace su jugada prevista No entrar la
firma incumebte no se ve obligado a hacer su jugada prevista Guerra de Precios, ya que el juego se
ha acabado. No todo aquı́ se aviene tan fácilmente al sentido común, pues la firma desafiante podrı́a
pensar lo siguiente: “Yo juego No entrar porque es mi respuesta óptima a la jugada prevista Guerra
de precios de la firma incumbente, pero la firma incumbente anuncia Guerra de precios porque si yo
juego No entrar no tendrá que ejecutarla con lo cual la Guerra de Precios sı́ es respuesta óptima a
No entrar. Sin embargo, si yo jugara Entrar no le convendrı́a ejecutar la jugada anunciada Guerra
de Precios, pues obtendrı́a un pago nulo en lugar de un pago $5. En conclusión, la jugada anunciada
Guerra de precios sólo le conviene si no tiene que ejecutarla, por lo que ese anuncio no tiene verdadera
credibilidad, o lo que es lo mismo, la estrategia Guerra de Precios es una amenaza no creı́ble”.

Otro modo de describir esa caracterı́stica intuitivamente insatisfactoria del EN s0 ∗=(No entrar, Guerra
de Precios) es decir que hay una cierta incoherencia entre el juicio que merece s0∗ al analizarlo desde
la perspectiva del juego global y el juicio que merece al analizarlo desde la perspectiva de un momento
particular del juego. En efecto, la Guerra de Precios es una respuesta óptima de la firma incumbente
a No entrar desde la perspectiva del juego global, pero no lo es si nos situamos en el nodo de decisión
en que la firma incumbente le toca jugar. Ası́ pues, hay dos EN en estrategias puras pero sólo uno de
ellos, s∗ , parece plenamente satisfactorio. Luego, s∗ =(Entrar, Competir ) es un Equilibrio de Nash
Perfecto en Subjuegos o EPS para abreviar.

Consideremos ahora la siguiente situación. La entrada de la firma desafiante obligarı́a a ambas firmas,
como única manera de subsistir, a diferenciar sus productos adaptándolo a la versión A y/o B. En
concreto, supongamos que ambas empresas han de decidir simultáneamente en qué especializarse,
sabiendo que los pagos serán los siguientes; si ambas empresas seleccionan la misma especialización se
ven abocadas a unas pérdidas de $2 millones si es A y de $1 millón si es B, mientras que si seleccionan
especializaciones diferentes, la empresa entrante obtiene beneficios de $4 con A o beneficios de $1
con B, y la firma incumbente obtiene unos beneficios de $4 y $2 millones respectivamente. Luego, la
representación en forma extensiva de este juego serı́a:
Hay 4 nodos de decisión, que forman tres conjuntos de información, dos de ellos unitarios, y hay 5
desarrollos posibles. La empresa entrante tiene 4 estrategias puras, que son Entrar − A; Entrar − B;
N o Entrar−A y N o Entrar−B, mientras que la firma incumbente tiene sólo 2 estrategias puras, A y B.

La representación de este juego en forma normal serı́a:


Luego, los EN en estrategias puras son [(Entrar, A), B], [(No entrar, A), A] y [(No entrar, B), A].

Subjuegos

Cuando en un punto del desarrollo de un juego en forma extensiva se da la circunstancia de que lo que
ha ocurrido hasta ese momento en el juego (qué jugadas han realizado los distintos jugadores y qué

37
Desafiante

No entrar Entrar

Incumbente

3, 7

A B

A B A B

-2, -2 1, 4 4, 2 -1, -1

Incumbente
A B
(Entrar, A) -2, -2 4, 2
(Entrar, B) 1, 4 4, 2
Entrante
(No entrar, A) 3, 7 3, 7
(No entrar, B) 3, 7 3, 7

resultados se han producido en las jugadas de azar) es de dominio público, ello hace que los jugadores
puedan ver la parte que falta por jugar como un juego en sı́ mismo. Parece natural pensar que los
criterios de actuación que les guı́en a partir de ese momento coincidirán con los que tenı́an antes de
iniciar el juego.

Dado un juego G con información completa en forma extensiva, y un nodo de decisión x de G, decimos
que G’ es un subjuego de G con inicio en x si G’ es una parte de G que cumple lo siguiente:

Contiene al nodo x y a todos los nodos que siguen a x, y sólo a ellos.

El nodo x es el conjunto de información unitaria.

Si el nodo y pertenece a G’, también pertenece a G’ todos los nodos del conjunto de información
al que pertence y, es decir, G’ no rompe ningún conjunto de información.

Algunos autores consideran el propio juego G como un subjuego. Esto es una conversión, pero algunos
autores pueden diferir. Si G es de información perfecta, cualquier parte que comience en un nodo de
decisión y contenga todos los nodos que le siguen es un subjuego (debido a que todos los conjuntos de
información son unitarios). Un subjuego puede empezar en un nodo de azar, porque consideramos que
dicho nodo es un conjunto de información unitario. También se consideran subjuegos aquellos en los

38
que ya sólo va a intervenir uno de los jugadores. Los juegos estáticos representados en forma extensiva
tienen sólo un subjuego, que es el propio propio, ya que el único conjunto de información unitario que
tienen es el nodo inicial.

El Premio Novel de Economı́a, Reinhard Selten, propuso en 1965 el concepto de Equilibrio de Nash
Perfecto en Subjuegos. Sea G un juego en forma extensiva y s un perfil de estrategias G que es un
EN, decimos que s es un Equilibrio de Nash Perfecto en Subjuego (EPS) de G si la restricción
de s a cualquier subjuego de G es un EN de dicho subjuego.

Un EPS es una mejor solución que un EN porque, basándose en el criterio de la credibilidad, des-
carta los equilibrios de Nash basados en amenazas no creı́bles o promesas no sostenibles (es decir,
proposiciones que no serán cumplidas) dado el desarrollo temporal del juego. Al exigir respuestas
óptimas en cada punto que sea inicio de un subjuego, el concepto de EPS es un paso en la puesta
en práctica del principio de racionalidad secuencial, según el cual la estrategia (en el equilibrio) de
cualquier jugador ha de ser una respuesta óptima, en cada punto del juego (sea o no sea el inicio de un
subjuego, y esté o no esté en la trayectoria de dicho equilibrio), a las estrategias del resto de jugadores.

Si G es un Juego dinámico finito (número finito de jugadores, cada uno de ellos con un conjunto finito
de estrategias), entonces existe un equilibrio de Nash perfecto en subjuegos de G. Puede ocurrir que
no exista ningún EPS en estrategias puras, lo que implicarı́a que alguna (o todas) las estrategias que
constituyen ese EPS que ha de existir, sean estrategias mixtas.

Inducción hacia atrás

En los juegos dinámicos con información completa y perfecta, existe un algoritmo llamado inducción
hacia atrás8 que permite identificar con claridad, y hallar de manera sistemática, los EPS del juego.
Éste consiste en racionar por etapas desde el final del juego hacia el principio. Esto es:

Dado un juego G finito en forma extensiva con información completa y perfecta, para resolver mediante
un algoritmo de inducción hacia atrás debemos:

1. Se identifican todos los subjuegos que se producen en último lugar (es decir, aquellos que co-
mienzan en los nodos de decisión que sólo preceden a nodos terminales. Estos subjuegos tienen
un único jugador, y su EN es por definición la acción óptima de dicho jugador).

2. A continuación se elimina cada uno de esos subjuegos, salvo su nodo de comienzo, y se considera
que dicho nodo pasa a ser nodo terminal del juego global, y se le atribuyen los pagos que se
habrı́an hecho efectivos de haberse jugado la acción óptima correspondiente a ese nodo. De esta
manera se han podado las últimas ramas del árbol del juego global inicial, y nos encontramos
con un árbol más corto.
8
También recibe los nombres de inducción retroactiva, algoritmo de Zermelo o algoritmo de Kuhn

39
3. Se repite con el árbol reducido lo dicho en la etapa anterior, y se continúa con este proceso hasta
que se llega al nodo inicial del juego de partida.

Si en algún nodo de decisión hay varias acciones óptimas, el proceso sólo cambia en el hecho de que
habrı́a que considerar todas las posibilidades. Es decir, habrı́a que formar tantos árboles reducidos
para la etapa siguiente del análisis (anterior en el tiempo) como combinaciones hubiera de acciones
óptimas en la etapa actual. Al final, obtendrı́amos varios resultados perfectos en subjuegos posibles y
varios equilibrios de Nash perfectos en subjuegos, uno por cada proceso de poda diferente.

Si existe la posibilidad de que en algún nodo de decisión haya un número infinito de acciones, pero
manteniendo finita la longitud de cualquier desarrollo posible del juego, el proceso sigue siendo válido
siempre que, en cada nodo de decisión, exista alguna acción factible óptima. Por ejemplo, si dos
personas deben decir cómo repartirse una torta, donde el jugador 1 ofrece n al jugador 2 y se queda
con 1-n. Otro ejemplo es el ajedrez. Éste es un juego de información completa y perfecta, pero dado
el gran número de combinaciones posibles, resulta prácticamente imposible utilizar el algoritmo de
inducción hacia atrás.
Teorema: Cada juego finito con información completa y perfecta G tiene un Equilibrio de Nash
Perfecto en Subjuegos (EPS) en estrategias puras que se obtiene por el método de inducción
hacia atrás. Además, si ningún jugador tiene más de una acción óptima en cada nodo de decisión,
tal EPS es único.

Revisemos el siguiente ejemplo. Considere un juego donde el paı́s A decide si invadir al paı́s B y el paı́s
B decide si pelar o rendirse. Si la historia es {no invadir}, entonces el juego acaba con un pago de $8
para cada jugador. SI la historia es {invadir, rendirse}, los pagos son de $9 para el jugador 1 y $6 para el
jugador 2. Si la historia es {invadir, pelear}, los pagos son de $7 para el jugador 1 y $2 para el jugador 2.

La Representación de este juego en forma extensiva serı́a de la siguiente forma:

Pelear 7, 2
Paise B
Invadir

Pais A
Rendirse 9, 6
No invadir
8, 8

Represente en forma estratégica o normal de este juego serı́a:


Nótese que un análisis estratégico del juego muestra que existen dos equilibrios de Nash: {(No invadir,
Pelear); (Invadir, Rendirse)}.

Luego, por inducción hacia atrás es posible observar el EPS:

40
Jugador 2
Pelear Rendirse
Invadir 7,2 9,6
Jugador 1
No invadir 8,8 8,8

Respuesta:

Pelear 7, 2
Paise B
Invadir

Pais A
Rendirse 9, 6
No invadir
8, 8

Por tanto, podemos concluir que (No invadir, Pelear) es una amenaza no creı́ble, y que (Invadir,
Rendirse) es un Equilibrio de Nash Perfecto en Subjuego, ya que es un equilibrio de Nash es
cada subjuego y sobrevive a amenazas no creı́bles.

3.2. El Modelo de Duopolio de Stackelberg


En 1934, el economista alemán Heinrich Freiherr von Stackelberg propuso un modelo dinámico de
duopolio en el cual una empresa dominante (o lı́der) decide primero y una empresa subordinada (o
seguidora) decide en segundo lugar.
El desarrollo temporal del juego es el siguiente:

Primero, la empresa lı́der escoge una cantidad qL > 0.

Luego, la empresa seguidora observa qL > 0, y escoge una cantidad qs > 0

La función de demanda de las empresas seguidoras es una función de reacción de la función de deman-
da de la empresa lı́der, mientras que el beneficio de la empresa lı́der depende de la cantidad óptima
de producción de las empresas seguidoras.

Suponga que la curva de demanda de un bien homogéneo está dada por P (Q) = a − Q. En el mercado
participan 2 firmas, una lı́der y una seguidora, y el costo marginal de cada empresa es Cmg = c.

Los beneficios es la firma i es

πi (qi , qj ) = qi [P (Q) − c]
Donde P (Q) es el precio de equilibrio de mercado cuando la cantidad agregada es Q = q1 + q2 , y c es
el costo marginal constante, siendo cero el costo fijo.

41
Por inducción hacia atrás, el problema de la firma seguidora (en t = 2) es:

M ax πs = M ax{(P − c)qs }

M ax πs = M ax{(a − Q − c)qs }

M ax πs = M ax{(a − qL − qs − c)qs }

M ax πs = M ax{aqs − ql qs − qs2 − cqs }


∂πs
= a − qL − 2qs − c = 0
∂qs
a − c − qL
F M Rs : qs (qL ) =
2

Luego, el problema de la firma lı́der (en t = 1) es:

M ax πL = M ax{(P − c)qL }

M ax πL = M ax{(a − qL − qs (qL ) − c)qL }


a − c − qL
M ax πL = M ax{(a − qL − − c)qL }
2
1
M ax πL = M ax{ (aqL − qL2 − cqL )}
2
∂πL
= a − 2qL − c = 0
∂qL
a−c
qL∗ =
2

Donde qL∗ es la cantidad óptima a producir por la firma lı́der. Luego, la firma seguidora produce:
qs (qL ) = a−c 1 a−c
2 − 2[ 2 ]

a−c a+c
qs = −
2 4

2a − 2c − a + c
qs =
4

a−c
qs∗ =
4

Donde qs∗ es la cantidad óptima que produce la firma seguidora, tal que qL > qs .

42
3.3. Juego Repetidos al Infinito
En un juego repetido con un horizonte finito las amenazas o las promesas creı́bles sobre el com-
portamiento futuro pueden influir en el comportamiento presente. Lo mismo no ocurre cuando un
juego es repetido con un horizonte infinito. En este caso, si un juego G tiene un único equilibrio
de Nash con un horizonte finito, en un horizonte infinito pueden existir muchos resultado perfectos
en subjuegos en los que ninguno de os resultados en cada etapa sea un equilibrio de Nache del juego G.

En un juego repetido con un horizonte finito no existen incentivos a desviarse del equilibrio de Nash.
Luego, el equilibrio de Nash en casa subjuego es el mismo. En un juego repetido al infinito, los ju-
gadores tienen incentivos a desviarse del equilibrio de Nash, y por tanto, el equilibrio perfecto en
subjuegos puede diferir del equilibrio de Nash. Por ejemplo, si dos empresas compiten en un mercado
y el equilibrio de Nash es producir la cantidad de Cournot, las empresas que interactúan de forma
infinita9 pueden desviarse de este equilibrio y coludirse o formar un cartel que les permita maximizar
sus beneficios actuando de forma conjunta como si fueran un monopolio.

Para desarrollar este tipo de modelo, es necesario calcular el valor presente de los beneficios futuros
que traerı́a la cooperación entre las empresas. Luego decimos que el valor presente de cooperar debe
ser mayor al valor presente de competir (o desviarse de la cooperación y volver hacia al equilibrio de
Nash). Para ello, debemos evaluar el factor de descuento con que las empresas valorizan sus ingresos
futuros.

Suponemos que existe un juego inicial, o stage game, que llamamos G el cual es simultáneo y se man-
tiene a lo largo de todo el periodo de interacción. Como el juego es simultáneo, cada jugador toma
una decisión sin saber la acción que están escogiendo los otros jugadores. Los beneficios que percibe
cada jugador es la suma de los beneficios de cada periodo producto del tipo de interacción que se
haya generado. Esto presenta un problema ya que la suma de los pagos de cada periodo al infinito
es desconocida. Sin embargo, introducimos el factor de descuento como una progresión geométrica
repetida al infinito, la cual nos permite conocer el beneficios presentes.

Cálculo de una progresión geométricas: sucesión infinita de pagos:

Sea a1 + a2 + a3 + ... + an una progresión geométrica donde,

a2 = a1 × δ

a3 = a2 × δ

a4 = a3 × δ
..
.
9
Un horizonte infinito supone que no es posible conocer el final de la interacción estratégica. Por ejemplo, la vida de
las empresas es supuestamente muy larga, trascendiendo generaciones en muchos casos, por lo tanto, como no es posible
determinar el fin de la interacción con otras empresas, se dice que es de horizonte infinito.

43
an = an−1 × δ

Al sumar todos los términos de la progresión geométrica, el lado derecho lo podemos factorizar por δ,
luego,
a2 + a3 + ... + an = δ(a1 + a2 + a3 + ... + an−1 )

El lado izquierdo es la suma de todos los términos menos el primero, por lo que podrı́amos escribirlo
como S − a1 . Al lado derecho aparece la suma de todos los términos menos el último, por lo que
podemos escribirlo como δ(S − an ). Luego,

S − a1 = δ(S − an )

S − a1 = δS − δan

δan − a1 = δS − S

δan − a1 = S(δ − 1)

Despejando S, obtenemos que


δan − a1
S=
δ−1
Sin embargo, an = a1 × δ n−1 , luego
δa1 δ n−1 − a1
S=
δ−1
a1 δ n − a1
S=
δ−1
a1 (δ n − 1)
S=
δ−1
Ahora bien, cuando n → ∞
a1 (0 − 1)
S=
δ−1
−a1
S=
δ−1
a1
S=
1−δ

Analicemos el siguiente ejemplo. Suponga que en un mercado existen dos firmas iguales, dichas firmas
compiten en cantidades, pero ellas creen que podrı́an estar mejor si se coluden, para lo cual, cada firma
establece la siguiente estrategia: una firma va a decidir cooperar en el periodo t siempre y cuando la
otra firma haya decidido cooperar en el periodo t - 1, en caso de que la otra firma no haya cooperado
(se desvı́e del acuerdo) en el periodo t - 1, la firma jugará para siempre la cantidad de competencia
en cantidades. Las firmas enfrentan una función de demanda de P = A − Q, donde Q = Σqi . El costo
marginal de cada firma es constante e iguala Cmg = c.
La estrategia planteada es una estrategia severa, pues cuando existe un desvı́o se acaba la posibilidad
de cooperación para siempre, por lo cual, aunque existen infinitos casos diferentes (pues la competencia
es por infinitos periodos), solo dos casos son relevantes de analizar.

44
Cuando se coopera en todos los periodos.

Cuando una firma se desvı́a en el primer periodo (todos los demás casos, i.e. cooperación por n
periodos y desvı́o en el periodo n+1 son análogos a este).

El beneficio que tendrı́a cada firma si ambas se mantienen en el acuerdo colusivo es,

Etapa t t+1 t+2 t+3 ∞


Acción de Fi qind qind qind qind
Perfil de la etapa (qind , qjnd ) (qind , qjnd ) (qind , qjnd ) (qind , qjnd )
Beneficios de la Fi πind δ πind δ 2 πind δ 3 πind

Luego, el valor presente del beneficio, dado un factor de descuento δ, viene dado por,

X
V P Πnd
i = δ t−1 πind
t=1


X 
VP Πnd
i = δ t−1 πind
t=1
1
V P Πnd
i = π nd
1−δ i

Cuando una firma se desvı́a en el primer periodo, obtiene el siguiente beneficio,

Etapa t t+1 t+2 t+3 ∞


Acción de Fi qid qic qic qic
Perfil de la etapa (qid , qjnd ) (qic , qjc ) (qic , qjc ) (qic , qjc )
Beneficios de la Fi πid δ πic δ 2 πind δ 3 πind

Luego, el valor presente del beneficio de la firma i, viene dado por,



X
V P Πdi = πid + δ t−1 πic
t=2


X 
VP Πdi = πid + πic δ t−1
t=2
δ
V P Πdi = πid + πic ×
1−δ

Por tanto, la colusión será un Equilibrio de Nash Perfecto en Subjuego si y sólo si,

V P Πnd d
i > Πi

45
1 δ
πind × > πid + πic ×
1−δ 1−δ

π nd > π d (1 − δ) + π c

π nd > π d − δπ d + δπ c

π nd − π d > δ(π c − π d
π nd − π d

πc − πd

Si el factor de descuento encontrado es menor al factor de las firmas, podemos asegurar que la colusión
será un Equilibrio de Nash Perfecto en Subjuego.

La diferencia entre un juego repetido con horizonte finito y uno con horizonte infinito es que el
comportamiento que ocurre en el juego repetido finito no puede darse (nos referimos al incentivo a
desviarse en el último periodo), pues a pesar de ser exactamente el mismo juego, al no tener un fin (o
lo que podrı́a ser análogo, las firmas no conocen cuando serı́a el fin del juego), no pueden desviarse en
el “último periodo”. Esto, permite la posibilidad (pero no la certeza), de lograr acuerdos cooperativos
cuando en un juego finito no podrı́an darse. Que exista la cooperación dependerı́a de varios factores,
entre ellos el factor de descuento δ, es decir, la ponderación que se le da a los pagos futuros. Mientras
más alta la ponderación, más probable serı́a que ocurra un acuerdo colusivo, pues el costo de desviarse
se ve en el futuro, por ende si el futuro tiene un “peso importante”para mi, es más probable lograr un
acuerdo, y viceversa.

46
4. Juegos Dinámicos con Información Completa pero Imperfecta
La información perfecta dice relación con el conocimiento que tienen los jugadores respecto de cómo se
ha desarrollado el juego hasta el momento en el que les toca jugar. En ciertas situaciones a un jugador
le puede corresponder jugar sin que sepa qué han hecho los otro jugadores previamente.
Una generalización del algoritmo de inducción hacia atrás permite resolver juegos con Información
Completa pero Imperfecta, es decir, un procedimiento para determinar los EPS cuando existen sub-
juegos propios con conjuntos de información no unitarios (con varios nodos de decisión) para al menos
un jugador.

Dado un juego G finito en forma extensiva con información completa, pero no necesariamente perfecta,
un algoritmo de inducción hacia atrás generalizado es:

1. Se identifican todos los subjuegos que se producen en último lugar (es decir, aquellos que co-
mienzan en los nodos de decisión lo más cercanos posible a los nodos terminales. Estos subjuegos
pueden tener uno o varios jugadores. Se calculan los EN de dichos subjuegos.

2. Si sólo existe un único EN en estrategias puras en cada subjuego, se elimina cada uno de esos
subjuegos, salvo su nodo de comienzo que es reemplazado por el nodo terminal del juego global
al que se habrı́a llegado de haberse jugado el perfil EN correspondiente a ese subjuego, y se le
atribuyen los pagos de dicho perfil. De esta manera se han podado las ramas del árbol corres-
pondientes a los subjuegos finales del juego global inicial, y nos encontramos con un árbol más
corto.

3. Se repite con el árbol reducido lo dicho en las etapas anteriores, y se continúa con este proceso
hasta que se llega al nodo inicial del juego de partida.

4. Acabado el proceso, tendremos unos pagos asociados al nodo inicial del juego, y unas ramas del
árbol señaladas como componentes de los EN de cada subjuego. Pues bien, el único desarrollo
del juego (camino desde el nodo inicial hasta un nodo terminal) consistente en que las ramas
señaladas son el único resultado perfecto en subjuegos, y los pagos asociados al nodo inicial son
los que corresponderı́an a ese desarrollo del juego. Por otra parte, el único perfil de estrategias,
en el que la estrategia de cada jugador consiste en jugar la acción indicada en cada uno de sus
conjuntos de información, es el único equilibrio de Nash perfecto en subjuegos.

Teorema: Si un juego admite la inducción hacia atrás generalizada, y todos y cada uno de sus
subjuegos finales (tanto en el juego global como en los reducidos) admiten un EN único, el resultado
mediante inducción del juego es el único resultado perfecto en subjuegos y las estrategias generadas a
partir de las acciones tomadas por cada jugador en cada uno de sus conjuntos de información consti-
tuyen el único equilibrio de Nash perfecto en subjuegos.

El hecho de que un jugador mueva primero no tiene implicancias estratégicas sobre la decisión del
otro. Cualquier juego estático puede ser entendido como un juego dinámico de información incompleta.
Cuando a un jugador le corresponde jugar y no sabe con precisión lo que ha ocurrido antes, el conjunto
de nodos en los cuales podrı́a estar ubicado lo se conoce como el conjunto de información.

47
Por ejemplo, suponga que dos prisioneros interactuan en el dilema del prisionero. Considerando la
matriz de pagos que se muestra a continuación, la representación en forma extensiva de este juego
serı́a de la siguiente forma:

Jugador 2
Confesar Callar
Confesar 1, 1 5, 0
Jugador 1
Callar 0, 5 4, 4


 
 

   

   
   

5. Juegos Estáticos con Información Incompleta y perfecta


Un juego tiene unformación incompleta cunado cierta información, como las preferencias, los pagos o
toda la información necesaria para describir un juego no es de conocimiento público. Por ejemplo, en
algunas situaciones el azar puede tener un rol en el juego; puede existir incertidumbre sobre alguna
situación o estado.

Por ejemplo, considere el dilema del prisionero donde los jugadores sólo interactúan una vez, pero con
una modificación que sólo afecta al caso en que ambos jugadores realizan su acción Callar. Supongamos
que a las consecuencias ya conocidas de dichas acciones, según las cuales a ambos presos se les va a
aplicar la pena correspondiente a un delito menor, y que se traduce en un vector de pagos (4, 4), se
añade la posibilidad, real aunque improbable, de que tampoco esté probado el delito menor, en cuyo
caso serı́an puestos en libertad por falta de pruebas. En caso de que ambos jugadores decidan Callar,
a continuación tiene lugar una jugada de azar de cuyo resultado dependerán los pagos. Concretando,
supongamos que el vector de pagos sea el habitual (4, 4) con probabilidad conocida p = 2/3, y que sea
(10, 10) con probabilidad 1 − p = 1/3. Si ambos jugadores se delatan, el vector de pagos es (1, 1). Si
el jugador 1 delata y el jugador 2 calla, el vector de pagos es (5, 0). Si el jugador 1 calla y el jugador
2 delata, el vector de pagos es (0, 5).

48
La represente este juego en su forma extensiva serı́a de la siguiente forma:

Luego, es necesario determinar la utilidad esperada de cada jugador en el resultado {Callar, Callar}

1 2
E[U1 (C, C)] = 10 + 4 = 6
3 3
1 2
E[U2 (C, C)] = 10 + 4 = 6
3 3
Ahora, podemos representar este juego en su forma extensiva incorporando el resultado de la utilidad
esperada en el nodo terminal.

49
También podemos represente este juego en su forma normal.

Jugador 2
Callar Confesar
Callar 6, 6 0, 5
Jugador 1
Confesar 5, 0 1, 1

Este juego tiene dos equilibrios de Nash en estrategias puras, (Confesar, Confesar) y (Callar, Callar ),
y uno en estrategias mixtas.

50
6. Ejercicios

6.1. Eliminación Iterativa de Estrategias Estrictamente Dominadas y Equili-


brio de Nash
1. Observe los siguientes juegos y determine si se pueden resolver mediante el proceso de elimina-
ción iterativa de estratégicas estrictamente dominadas.

a. Juego 1

Jugador 2
Izquierda Centro
Arriba 9, 9 4, 4
Jugador 1
Abajo 8, 8 5, 5

Respuesta:
El jugador 2 nunca escoge derecha, luego derecha es una estratégica estrictamente
dominada.
Dado que el jugador 2 siempre escogerá izquierda, el jugador 1 prefiere arriba. Luego
abajo es una estrategia estrictamente dominada.
Ergo, el equilibrio del juego es (arriba, izquierda).

b. Juego 2

Jugador 2 Jugador 2
A B A B
A 0,1,4 6,2,3 A 3,3,0 1,2,2
Jugador 1 Jugador 1
B 1,3,1 2,4,5 B 0,0,0 4,3,3
Jugador 3 = A Jugador 3 = B

Respuesta:
Para el jugador 3, B es una estrategia estrictamente dominada, luego se elimina la
segunda matriz. El jugador 3 siempre jugará A.
Para el jugador 2, A es una estrategia estrictamente dominada.
Si el jugador 3 juega A y el jugador 2 juega B, el Jugador 1 prefiere jugar A.
Ergo, (A, B, A) es un equilibrio.

c. Juego 3
Respuesta: El juego no se puede resolver mediante la eliminación iterativa de estratégicas
estrictamente dominadas.

51
Jugador 2
X Y Z
A 0, 4 4,0 5,3
Jugador 1 B 4, 0 0,4 5,3
C 3, 5 3,5 6,6

2. El sector pesquero de un paı́s-isla ha entrado recientemente en una grave crisis debido a que se
ha pescado en exceso, pese a que las compañı́as pesqueras habı́an firmado un acuerdo para no
hacerlo. Si todas hubiesen cumplido el acuerdo, las capturas podrı́an haber continuado siendo
abundantes.

Represente esta situaciòn con un dilema del prisionero en el que los jugadores son la Compañı́a
A y la compañı́a B y las estrategias son cumplir e incumplir. Inclya los resultados en la matriz.
Explique por qué es inevitable que se pesque excesivamente si no es posible hacer cumplir
eficazmente el acuerdo.
Respuesta:

Empresa 2
Cumplir No Cumplir
Cumplir y,y w,z
Empresa 1
No cumplir z,w x,x

Donde w < x < y < z

El equilibrio de Nash implica decisiones estratégicas que, una vez tomadas, no dan incentivos a
los jugadores para alterar su comportamiento. Es decir, es la mejor decisión de cada jugador y
donde no existen incentivos a desviarse. Los equilibrios de Nash surgen debido a la incertidumbre
de las estrategias inherentes a una situación. No hay nada que garantice que estos equilibrios
sean especialmente deseables desde el punto de vista de los jugadores.

La expresión ”tragedia de los comunes”se entiende como los problemas ambientales provocados
por la sobre explotación que ocurre cuando se considera que los recursos escasos son propiedad
común, como es el caso de los recursos marı́timos.

Un juego como la tragedia de los comunes sugiere que la cooperación entre jugadores puede
dar por resultado pagos que los dos jugadores prefieren, en lugar del resultado de Nash. En
este modelo es muy difı́cil presentar un modelo de cooperación, porque la lógica del concepto
del equilibrio de Nash sugiere que cualquier otra solución será inestable. Dado que la repetición
puede hacer que los jugadores se den cuenta directamente de las ineficiencia de un equilibrio

52
de Nash dentro de un solo periodo, es posible que la repetición del juego pueda fomentar la
cooperación.

3. Encuentre el equilibrio de Nash en los siguientes juegos

a. Considere la siguiente matriz de pagos

Jugador 2
L R
U 6,2 3,1
Jugador 1
D 1,3 7,7

Respuesta: (U,L) y (D,R) son equilibrios de Nash.


b. Dos individuos deben escoger una carta de un mazo. Las cartas pueden ser 1,2,3,4,J. Si am-
bos jugadores sacan la misma carta gana el jugador 1, si sacan cartas distintas gana el que
tiene el menor número. Si ambos jugadores escogen J, entonces es un empate. Los jugadores
prefieren ganar que empatar y empatar que perder. 1 < 2 < 3 < 4 < J. Modele el juego y
encuentre el equilibrio de Nash.

Respuesta: (J,J) es un equilibri de Nash

Jugador 2
1 2 3 4 J
1 1,0 1,0 1,0 1,0 1,0
2 0,1 1,0 1,0 1,0 1,0
Jugador 1 3 0,1 0,1 1,0 1,0 1,0
4 0,1 0,1 0,1 1,0 1,0
J 0,1 0,1 0,1 0,1 1,1

c. En la final del Mundial de fútbol dos equipos se encuentran en penales. Si el jugador con-
vierte su paı́s gana el campeonato, mientras que si el arquero ataja, el mejor pateador de
penales de su equipo, (el cuál convierte con probabilidad 1 un lanzamiento penal), patea
el siguiente tiro, (i.e., si el arquero ataja equivale a darle la victoria a su equipo). Ambos
jugadores deben escoger un lado, izquierda o derecha, el jugador donde patear y el arquero
donde lanzarse. El jugador siempre lanza el penal al arco, nunca afuera.
Cuál cree usted que será el resultado del juego? Suponga que a los jugadores sólo les im-
porta ganar; i.e. si ganan obtienen un pago positivo y si pierden un pago de cero. Modele
el juego en su forma normal y encuentre el equilibrio de Nash.

Respuesta: No existe un equilibrio de Nash en estrategias puras.

4. Florencia (J1) y Camilo (J2), eligen de manera simultánea entre ir al cine o salir a bailar. Si los
dos eligen lo mismo Camilo tiene que pagar a Florencia la entrada. Si los dos eligen cosas distintas

53
Jugador 2
Derecha Izquierda
Derecha 0,1 1,0
Jugador 1
Izquierda 1,0 0,1

es Florencia quien debe que pagar. Por tanto, cada uno ha de tomar una decisión sin conocer
la tomada por el otro, pero sabiendo que son ambas decisiones, consideradas conjuntamente, las
que afectan al bienestar de cada uno de ellos. En cualquier caso, prefieren salir juntos. Tanto el
cine como la disco cuestan $5.

a. Identifique el conjunto de jugadores que participan en el juego.


Respuesta:
J={Florencia, Camilo}
b. Identifique el conjunto de acciones de J1 y J2.
Respuesta:
A1 ={Cine, Baile}, A2 ={Cine, Baile}
c. Identifique el conjunto de estrategias de J1 y J2.
Respuesta:
S1 ={Cine, Baile}, S2 ={Cine, Baile}
d. Identifique los perfiles de estrategias.
Respuesta:
Hay cuatro perfiles de estrategias que son (P, P), (P, N), (N, P) y (N, N), cada uno de los
cuales lleva a uno de los resultados del juego.
e. Identifique los pagos que reciben cada jugador por cada perfil de estratégias.
Respuesta:
u1 (Cine, Cine)=5; u2 (Cine, Cine)=-5
u1 (Cine, Bailar)=-5; u2 (Cine, Bailar)=5
u1 (Bailar, Cine)=-5; u2 (Bailar, Cine)=5
u1 (Bailar, Bailar)=5; u2 (Bailar, Bailar)=-5

f Represente este juego en su forma normal o forma estratégica.


Respuesta:

Jugador 2
Cine Baile
Cine 5, -5 -5, 5
Jugador 1
Baile -5, 5 5, -5

5. Dos jugadores toman sus decisiones de un modo secuencial. En primer lugar el Jugador 1 elige
entre I, C y D. Si elige I se termina el juego y se alcanzan pagos de $2 y $0 (donde el primer

54
número indica la ganancia del Jugador 1 y el segundo la del Jugador 2). Si elige C, entonces
el Jugador 2 tiene la oportunidad de elegir entre i (alcanzándose ganancias de $4 y $7) o d
(con ganancias de $1 y $2). Finalmente, en caso de que el Jugador 1 elija D, le toca el turno al
Jugador 2 que puede elegir de entre i y d pero alcanzando ganancias de $5 y $4 con i, o de $1
y $3 con d.

a. Identifique el conjunto de jugadores que participan en el juego.


Respuesta:
El conjunto de los jugadores es J={1, 2}.
b. Identifique el conjunto de acciones de cada jugador.
Respuesta:
El conjunto de las acciones de J1 es A1 ={I, C, D}, y de J2 es A2 ={i, d}.
c. Identifique el conjunto de estrategias de cada jugador.
Respuesta:
El conjunto de las estrategias de J1 es S1 ={I, C, D}, y el de J2 es S2 =[{i,i}, {i,d}, {d,i},
{d,d}].
El significado de las estrategias de J2, por ejemplo {d,i}, es el siguiente: Jugar d si J1 juega
C y jugar i si J1 juega D.
d. Identifique los perfiles de estrategias y sus pagos asociados.
Hay 12 perfiles de estrategias, cada uno de los cuales conduce a un resultado del juego.
Los pagos de J1 son:
u1 (I; i,i) = u1 (I; i,d) = u1 (I; d,i) = u1 (I; d,d)=$2
u1 (C; i,i) =u1 (C; i,d)=$4
u1 (C; d,i) =u1 (C; d,d)=$1
u1 (D; i,i) =u1 (D; d,i)=$5
u1 (D; i,d) =u1 (D; d,d)=$1
Los pagos de J2 son:
u2 (I; i,i) =u2 (I; i,d)=u2 (I; d,i)=u2 (I; d,d)=$0
u2 (C; i,i) =u2 (C; i,d)=$7
u2 (C; d,i) =u2 (C; d,d)=$2
u2 (D; i,i) =u2 (D; d,i)=$4
u2 (D; i,d) =u2 (D; d,d)=$3

e. Represente este juego en su forma extensiva.


Respuesta:

6. Va a repartirse un pastel entre dos jugadores, de acuerdo con las siguientes reglas: ambos escriben
simultáneamente un número entre 0 y 1, cuyo significado es la parte del pastel que reclaman. Si
la suma de ambos números es igual o menor que 1, cada jugador recibe en pago la parte que ha
solicitado. En caso contrario, ninguno de ellos recibe nada.

55
a. Identifique el conjunto de jugadores que participan en el juego.
Respuesta:
El conjunto de los jugadores es J={1, 2}.
b. Identifique el conjunto de estrategias de cada jugador.
Respuesta:
El conjunto de las estrategias de J1 y J2 son S1 = S2 =[0, 1]

c. Identifique los pagos asociados a cada estrategia.


Respuesta:

(
s1 si s1 + s2 < 1
u1 (s1 , s2 ) =
0 si s1 + s2 ≥ 1

(
s2 si s1 + s2 < 1
u2 (s1 , s2 ) =
0 si s1 + s2 ≥ 1

d. ¿Es posible representar este juego en forma normal o extensiva? ¿Por qué?.
Respuesta:
Por tener cada jugador infinitas acciones posibles, este juego no puede representarse en
forma bimatricial.

7. Dos seres vivos pueden comportarse de un modo violento y agresivo (halcón) o pacı́fico y sumiso
(paloma) en un enfrentamiento por la posesión de un objeto de valor V . Ambos saben que si
los dos se comportan agresivamente se enzarzan en una pelea que les acarrea unos determinados
costes C; si ambos se comportan amistosamente se reparten el objeto, pero si cada uno se
comporta de un modo diferente, aquel que se comporta pacı́ficamente no obtiene nada y el
agresivo se lo queda todo.

a. Represente este juego en su forma normal.


Respuesta:

Jugador 2
Paloma Halcón
V V
Paloma 2, 2 0, V
Jugador 1 V V
Halcón V, 0 2 − C, 2 − C

b. Resuelva este juego mediante el proceso de eliminación de estrategias estrictamente domina-


das.

56
Respuesta:
Para el jugador 1:
u1 (Paloma, Paloma) = V/2 < V = u1 (Halcón, Paloma)
u1 (Paloma, Halcón) = 0 ≤ V/2 - C = u1 (Halcón, Halcón)

Para el jugador 1:
u2 (Paloma, Paloma) = V/2 < V = u2 (Paloma, Halcón)
u2 (Halcón, Paloma) = 0 ≤ V/2 - C u2 (Halcón, Halcón)

Por tanto, para cualquier jugador la estrategia Paloma está dominada, aunque no estricta-
mente, por la estrategia Halcón, lo que hace Halcón la estrategia dominante.

8. Tres amigos, la Isi, Gastón y Pedro, deben escoger qué van a tomar en el carrete de hoy. Para
decidirlo hacen una votación donde cada uno escribe de manera simultánea en un papel el copete
que prefiere. Sólo se puede votar por un copete y no se puede votar en blanco. Se comprará el
copete que tenga más votos, y en caso de empate o que no exista acuerdo, los amigos caballero-
samente dejan que su amiga escoja. Suponga que las preferencias de cada uno son las siguientes:
Isi: champaña > pisco > cerveza
Gastón: pisco > cerveza > champaña
Pedro: cerveza > champaña > pisco
La primera preferencia de cada jugador le aporta una utilidad de 2, la segunda preferencia una
utilidad de 1 y la tercera preferencia una utilidad de 0.

a. Represente este juego en su forma normal.


Respuesta:

Jugador 2
Champaña Pisco Cerveza
Champaña 2, 0, 1 2, 0, 1 2, 0, 1
Jugador 1 Pisco 2, 0, 1 1, 2, 0 1, 2, 0
Cerveza 2, 0, 1 0, 1, 2 0, 1, 2
Jugador 3 = Champaña

Jugador 2
Champaña Pisco Cerveza
Champaña 2, 0, 1 1, 2, 0 2, 0, 1
Jugador 1 Pisco 1, 2, 0 1, 2, 0 1, 2, 0
Cerveza 0, 1, 2 1, 2, 0 0, 1, 2
Jugador 3 = Pisco

57
Jugador 2
Champaña Pisco Cerveza
Champaña 2, 0, 1 2, 0, 1 0, 1, 2
Jugador 1 Pisco 1, 2, 0 1, 2, 0 0, 1, 2
Cerveza 0, 1, 2 0, 1, 2 0, 1, 2
Jugador 3 = Cerveza

b. Resuelva este juego mediante el proceso de eliminación de estrategias estrictamente domina-


das.
Respuesta:
El jugador 1 tiene champaña como estrategia dominante, pues
u1 (pisco, x, y) ≤ u1 (champana, x, y), y u1 (cerveza, x, y) ≤ u1 (champana, x, y)
donde x e y representan cualquier otra estrategia del jugador 2 y el jugador 3.

El jugador 2 no tiene estrategia estrictamente dominante, pero para él la estrategias pisco
domina a champaña, ya que u2 (z, champana, y) ≤ u2 (x, pisco, y). Donde x e y representan
cualquier otra estrategia del jugador 1 y el jugador 3.

El jugador 3 no tiene estrategia dominante, pero para él la estrategia cerveza domina a
champaña, ya que u3 (x, y, champana) ≤ u3 (x, y, cerveza), Donde x e y representan cual-
quier otra estrategia del jugador 1 y el jugador 2.

9. Suponga que Falabella y Paris están pensando lanzar una oferta de mochilas Kaken. Actualmente
las ganancias de vender mochilas son de $4 millones para cada tienda. Si Falabella lanza la oferta
y Parı́s mantiene el precio, Falabella tendrı́a ganancias de $5 millones y Parı́s de $0. Lo mismo
ocurrirı́a para Parı́s si sólo ellos lanzaran la oferta. La oferta sólo resultarı́a si una empresa la
lanza. Sin embargo, que ambas lanzan la oferta, las ganancias para cada empresa serı́an de $1
millón para cada una.

a Represente este juego en su forma normal.


Respuesta:

Parı́s
Sin oferta Con oferta
Sin oferta 4, 4 0, 5
Falabella
Con oferta 5, 0 1, 1

b Encuentre el equilibrio de Nash.


Respuesta:
El Equilibrio de Nash es (Con oferta, Con oferta). Nótese es éste es un juego donde el
equilibrio de Nash no es Pareto-optimo. Lo mismo sucede en el Dilema del Prisionero.

58
10. Considere el siguiente juego.

Jugador 2
Izquierda Centro Derecha
Arriba 3, 3 4, 2 1, 1
Jugador 1 Medio 2, 4 3, 5 4,0
Bajo 1, 0 2, 1 0, 3

a Enumere el perfil de estrategias para cada jugador.


Respuesta:
S1 = {(A, I); (A, C); (A, D); (M, I); (M, C); (M, D); (B, I); (B, C); (B, D)}
b Encuentre el equilibrio de Nash.
Respuesta:
EN = {(A, I)}

11. Considere las siguientes matrices de pagos.

Jugador 2 Jugador 2
I M D I M D
A 1, 3, 0 -1, 2, 3 -1, 0, -2 A 0, 2, -1 4, 3, 2 1, 2, 0
Jugador 1 Jugador 1
B 2, 1, 1 4, 1, 3 0, 0, 1 B 2, -2, 5 5, 5, 2 4, 6, 4
Jugador 3 juega X Jugador 3 juega Y

a Encuentre el equilibrio de Nash.


Respuesta:
EN = {(B, M, X); (B, D, Y )}

59
12. Dos jugadores escriben, simultáneamente, un número entre 0 y 1. Los pagos dependen de la
diferencia entre ambos números, ası́:

u1 (s1 , s2 ) = u2 (s1 , s2 ) = (s1 − s2 )2

En este juego, a cada jugador le conviene, en respuesta a un hipotético número s que pudiera
haber escrito el otro, escribir un número a la mayor distancia posible de s. Por ejemplo, la res-
puesta óptima a s2 = 3/4 serı́a s1 = 0. Formalmente, el jugador 1 determinarı́a su respuesta
óptima a cualquier estrategia s2 del jugador 2 resolviendo:

max (s1 − s2 )2

sujeto a 0 ≤ s1 ≤ 1

a Encuentre el conjunto de soluciones para cada jugador.


Respuesta:

Para J1 : 
 0
 si s2 > 1/2
R1 (s2 ) = 1 si s2 < 1/2

(0, 1) si s2 = 1/2

Para J2 : 
 0
 si s1 > 1/2
R2 (s1 ) = 1 si s1 < 1/2

(0, 1) si s1 = 1/2

b Encuentre el equilibrio de Nash.


Respuesta:
EN = {(0, 1); (1, 0)} ya que estos dos son los únicos perfiles de estrategias en que se
interceptan R1 (s2 ) y R2 (s1 ), es decir, en que cada estrategia es la mejor respuesta.

60
13. Considere un juego entre dos jugadores donde A y B son las acciones para cada jugador. Deter-
mine la matriz de pago para que se cumpla:

a El equilibrio de Nash sea Pareto-óptimo.


b El equilibrio de Nash no sea Pareto-óptimo.

Respuesta:
Sea la matriz,

Jugador 2
I D
A y, y w, z
Jugador 1
B z, w x, x

Si x > w > z > y, entonces el equilibrio de Nash es Pareto-óptimo.


Si w < x < y < z, entonces el equilibrio de Nash no es Pareto-óptimo.

6.2. Equilibrio de Nash Aplicado a los Mercados

14. Trek y Merida son 2 empresas que venden bicicletas. Las bicicletas son bienes homogéneos. La
demanda de mercado de bicicletas es Q = 37, 5 − P4 . El costo marginal de producir una bicicleta
es constante e igual a 4.

a. Determine la cantidad y precio de equilibrio de Cournot.

Respuesta:
Función de mejor respuesta:
146 4qj
qi = −
8 8
Luego,
73
q1 = q2 =
6
73
Q∗ =
3
158
P∗ =
3

15. LAN y SKY son dos empresas aéreas que ofrecen viajes a Arica. La demanda de mercado es de
Q = 10 − p2 . La función de costo de cada aerolı́nea es de C = 10 + q(q + 1)

61
a. a) Encuentre los valores de equilibrio de Cournot.
Respuesta:

19 2qj
La función de mejor respuesta es qi = 6 − 6
Luego,
19
qi = qj =
8
19 21
Q= →P =
4 2
π=

16. Considere una industria compuesta por tres firmas que enfrentan la demanda P (Q) = 1 − Q,
donde Q = q1 + q2 + q3 . Inicialmente, las firmas son idénticas, y cada una posee una planta con
2
costos C(Qi ) = q2 , donde i = 1, 2, 3.

a. a) Encuentre el equilibrio de Cournot y las utilidades de la firma


Respuesta:
qi = 51 ; Q = 3
5 ;P = 2
5 yπ= 3
50

b. Suponga que ahora dos de ellas se fusionan, quienes, al combinar sus costos, obtienen una
q2
nueva función de costos CT (qi ) = 4i . Calcule el nuevo equilibrio de Cournot y compare
ambas utilidades e indique si la fusión benefició a las firmas que realizaron la operación y
a la que no participó.
Respuesta:
q12
Firma fusionada: π = (1 − q1 − q2 )q1 − 4
q22
La otra firma: π = (1 − q1 − q2 )q2 − 2

4 3
q1 = 13 ; q2 = 13

7
Q= 13 ; P = 613
20 27
π1 = 169 ; π2 = 338
6
La suma de utilidades con anterioridad a la fusión para ambas firmas es de 50 , que es
20
mayor que 169 por lo que la fusión no es beneficiosa. La empresa no-fuisionada aumentó
sus utilidades.

17. Suponga un mercado donde hay 6 firmas que compiten a la Cournot. La demanda del mercado
es Q(P ) = 40 − P . No hay costos variables pero sı́ hay costos fijos F para cada firma.

Encuentre las funciones de mejor respuesta o funciones de reacción de cada empresa.


Encuentre la cantidad de equilibrio de Cournot de cada empresa.
Encuentre la cantidad de equilibrio de Cournot del mercado.
Encuentre los beneficios de equilibrio de Cournot de cada empresa.

62
Respuesta:

M ax πi = M ax{(40 − Q)qi − F }

M ax πi = M ax{qi − qi2 − qi qj − F }, donde qj representa a las 5 empresas restantes en el


mercado.

La condición de primer orden viene dada por,


∂πi
= 40 − 2qi − qj = 0
∂qi
Luego, la función de reacción de la firma i es
qj − 4
qi (qj ) =
2
Pero qj representa las 5 empresas restantes en el mercado. Luego
∂πi
= 40 − 2qi − 5qj = 0
∂qi
Por simetrı́a, podemos afirmar que qi = qj = q. Luego,

40 − 7q = 0

Entonces, encontramos la cantidad de equilibrio de Cournot de cada firma.


40
q∗ =
7
La cantidad de equilibrio de mercado es
240
Q∗ =
7
El precio de equilibrio del mercado es
40
P∗ =
7
Los beneficios de equilibrio de cada firma son
1600
πi∗ = −F
49
18. La demanda inversa del mercado del papel Confort está dada por P = 400 − 2Q. Hay 2 empresas
que fabrican papel. Cada empresa tiene un costo por unidad de producción igual a 40, y compiten
en el mercado por sus volúmenes, y toman esas decisiones al mismo tiempo.

a. Muestre cómo derivar el equilibrio de Cournot en este juego. Cuáles son las utilidades de
cada empresa en equilibrio?

Respuesta:
360−2qj
La función de mejor respuesta de la firma i es qi (qj ) = 4
qi∗ = qj∗ = 60
Q∗ = 120
P ∗ = 160

63
b. Cuál es la producción de monopolio, es decir, aquella que maximiza la utilidad total de la
industria? Por qué lo que produce cada firma, si existiera un cartel, es superior a Cournot.
Respuesta:
El problema del monopolista es:

max π = {P Q − CmgQ}

Como el monopolista es la única empresa en el mercado, la cantidad total producida por el


monopolio es la cantidad de mercado; qi = Q
La condición de primer orden del monopolista viene dada por:
∂π
∂Q = 400 − 4Q − 40 = 0

Luego,
Q∗ = 90
P ∗ 220
Note que π M > π C

c. Suponga ahora que la empresa 1 tiene ventaja en costos. Su costo unitario es constante e
igual a 25, mientras que la empresa 2 tiene un costo unitario de 40. Cuál es la producción
de Cournot? Cuáles son las utilidades de las empresas?.

19. Sean dos oligopolistas que compiten en un mercado cuya función inversa de demanda es P =
10 − 3X, donde X es la cantidad total producida. Los costos totales de producción de ambas
empresas son iguales C(X) = X. Calcule las cantidades de equilibrio, precio de mercado, y
beneficios de las firmas si:

a. Las firmas compiten como un oligopolio de Cournot.


b. Las firmas deciden maximizar beneficios mediante una colusión.

20. En el mercado de telefonı́a celular existen tres empresas que compiten entre sı́ en cantidades:
T-Mobile, Vodafone y Orange. La demanda viene dada por P = 500 − Q, donde Q es la cantidad
total ofrecida en el mercado. Los costos marginales son CmgT −M obile = 100, CmgV odaf one = 200
y el CmgOrange = 200.

a. Encuentre el equilibrio de Cournot. Calcule los beneficios de cada empresa

21. Suponga que existen dos firmas en el mercado. La demanda del mercado es Q = 10 − p. Ambas
firmas tienen los mismos costos marginales e iguales a Cmg = 2.

a. Determine cuánto producen las firmas cuando compiten en cantidades y cuando forman un
cartel tipo Cournot.

64
Respuesta:
i) Cuando compiten a la Cournot.

8
q1 = q2 =
3
16
Q∗ =
3
14
P∗ =
5
64
π=
9
ii) Si forman un cartel
Si forman un cartel el problema se resuelve como si las empresas actuaran como un mono-
polio. Luego,
M ax π M = M ax{(10 − Q)Q − 2Q}

∂π M
∂Q = 8 − 2Q = 0
QM = 4 P ∗ = 6 π M = 16
πi∗ = 8 qi∗ = 2
b. Suponga que una de las firmas hace trampa y no coopera en el cartel. Cuál serı́a el nivel de
producción que maximiza sus utilidades.

Respuesta:
Si F1 no coopera y F2 sigue cooperando, F1 asume q2 como constanta tal que q2 = 2.

M ax π1 = M ax{(10 − Q)q1 − 2q}


M ax π1 = M ax{(10 − q1 − q2 )q1 − 2q}
M ax π1 = M ax{(10 − q1 − 2)q1 − 2q}

∂π1
∂q1 = 6 − 2q1 = 0

q1 = 3
Q = q1 + q2 = 3 + 2 = 5
P ∗ = 10 − 5 = 5
π1 = P ∗ q1∗ − cq1∗ = 5 × 3 − 2 × 3 = 9
π2 = P ∗ q2∗ − cq2∗ = 5 × 2 − 2 × 2 = 6

Por tanto, la empresa que no copera F1 , aumenta su beneficios y perjudica a la empresas


F2 . Donde π1c = 7, 11 < π1M = 8 < π1no cooperar = 9.

22. Considere un mercado donde participan 3 firmas con iguales costos marginales Cmg = 2. La
demanda de mercado es P = 18 − 2Q. Las firma compiten en cantidad.

65
a. Encuentre el equilibrio de mercado.

Respuesta:
R: qi∗ = 2 ; Q∗ = 6 ; P ∗ = 6 ; πi = 8
b. Suponga que 2 firmas se fusionan.
Respuesta:
Dado que las firmas son simétricas en costos. q1 + q2 = q̂, Luego Q = q3 + q̂

16 − 2q3
q̂ =
4
Dado que todas las firmas son simétricas.

q = q̂ + q3
8
q∗ =
3
22
P∗ =
3
128
πf usion =
9
La fusión no aumentó la utilidad de la empresas fusionadas, aumentó el precio, y el a firma
3 aumentó su cantidad vendida, y como el precio aumentó, también aumentó sus beneficios.

23. Suponga un mercado donde interactúan 2 firmas. La demanda de mercado es P (Q) = 250 − 12 Q.
El costo marginal de la firma 1 es Cmg1 = 50 y el costo marginal de la firma 2 es Cmg2 = 100.

a. Encuentre el equilibrio del mercado y los beneficios de las firmas.

Respuesta:

500 200 700 400


q1 = 3 ; q2 = 3 ;Q= 3 ;P = 3 ; π1 = 13,888, 88 ; π2 = 2,222, 22

24. Suponga que en un mercado dos firmas compiten en precios. La demanda en este mercado es
D(P ) = 2 − P . Suponga que sólo existen costos marginales y que Cmg1 = 1 y Comg2 = 1, 5.
Un innovador ha descubierto una tecnologı́a que podrá reducir los costos a Cmg ∗ = 0, 75

a. Calcule el equilibrio inicial (sin la innovación) para precio, cantidades individuales, cantidad
de mercado y utilidades individuales.

Respuesta:
La mejor respuesta de la firma 1 es fijar un precio P1 = Cmg2 −ε y obtiene todo el mercado.
Con P = 1, 5 ; Q = 2 − 1, 5 = 0, 5, que es la cantidad producida por la firma 1.

66
Las utilidades de la firma serán π = P1 · q1 − Cmg1 · q1 π1 = 0, 25
La firma 2 produce cero; q2 = 0, por tanto sus utilidades son ceros π2 = 0.
Por tanto, la cantidad de mercado es Q = 0, 5.

b. Cómo cambia el equilibrio si la innovación es adquirida por la firma 1? Cómo cambia si es


adquirida por la firma 2? En cada caso, calcule también el cambio en el excedente social
desde el equilibrio en a) al nuevo equilibrio.

Respuesta:
Si la firma 1 adquiere la tecnologı́a, seguirá cobrando p = 1, 5 y obteniendo todo el mercado,
su cantidad individual vendida será de 0, 5, y esa será la cantidad de mercado. Ahora sus
utilidades suben a (1, 5 − 0, 75)0, 5 = 0, 375. La firma 2 vende y obtiene utilidades de cero.
El excedente social corresponde al bienestar social. El EC = 0, 125 y el EP = 0, 375. Luego,
el ES = 0, 5. El excedente social aumenta respecto al equilibrio en ”a)”
Si la firma 2 adquiere la tecnologı́a, bajará sus costos marginales a Cmg = 0, 75, y podrı́a
cobrar un P = 1 − ε. La firma 1 no producirı́a nada y obtendrı́a cero utilidades. La firma
2 producirı́a D(p) = 2 − 1 = 1, y obtiene utilidades por π = 0, 25.

c. La empresa que gane la tecnologı́a será aquella que esté dispuesta a pagar un mayor monto
que su rival. En este caso, quién obtendrá la tecnologı́a finalmente? Es eficiente este resul-
tado (en el sentido que el equilibrio resultando se quien adquiera la tecnologı́a está más o
menos cercano a competencia perfecta)?

Respuesta:
La firma 2 obtiene ningún beneficio en la situación inicial y con la nueva tecnologı́a obtiene
utilidades de π = 0, 25, por lo que lo máximo que estará dispuesta a pagar serı́a 0, 25 − ε.
La firma 1 obtiene $0, 25 de utilidades en la situación inicial, y con la nueva tecnologı́a
obtiene utilidades de $0, 375. Sin embargo, si la rival gana la tecnologı́a, la firma 1 terminará
con cero utilidades, por lo que su mejor respuesta es ofrecer 0, 25 + ε y ganar la nueva
tecnologı́a.
Que la firma 1 gane es el resultado menos eficiente, ya que si hubiese ganado la forma 2,
el precio de mercado serı́a más bajo y la cantidad de mercado mayor, o sea, estarı́a más
cercano al equilibrio de competencia perfecta que hubiera ganado la firma 2 y no la firma
1.

25. Si dos empresas compiten a la Bertrand con productos diferenciados, una reducción de los costos
marginales de la firma 1 reduce el precio de la firma 2 y aumenta el precio de la firma 1.

Respuesta:
En una competencia a la Bertrand con diferenciación de productos Q(p) = A − P1 − αP2 .

67
Luego,
max π F1 = P1 Q − C1 Q

= P1 (A − P1 − αP2 ) − C1 (A − P1 − αP2 )
∂π
= 0 = A − 2P1 − αP2 + C1
∂p1
Luego, Función de mejor respuesta de ambas empresas son (por simetrı́a de costos)

A + Ci − αPi
F M Ri → Pi =
2
Luego,
Si baja C1 , entonces P1 baja.
Si baja P1 , entonces P2 baja.
Por tanto el comente el falso, ya que una disminución en C1 disminuye P2 , pero no aumenta P1 .
? En el caso de productos homgéneos, P = Cmg (Paradoja de Bertrand) y Q = a − bP .

26. Suponga que la demanda de mercado de un bien homogéneo está dada por Q = 90 − 3P . En el
mercado existen 2 empresas y éstas compiten en precios. El costo marginal de la empresa 1 y 2
es Cmg1 = 15 y el Cmg2 = 10.

a) Determine el beneficio de cada firma en el mercado.

Respuesta:
Paradoja de Bertrand. La empresa con menores costos se lleva todo el mercado y cobre un
P2 = Cmg1 = 15. Luego π2 = 225 y π1 = 0.

27. Suponga n firmas con costos marginales idénticos y constantes. Esto es Cmg = c. Las firmas
maximizan sus beneficios escogiendo precios de forma simultánea. La firma con el menor precio
se lleva todo el mercado. Si pi = pj , entonces el mercado se reparte entre las formas en formas
iguales.

a. Describa la demanda de la firma i.

Respuesta:


 Q(p) si pi < pj

Q(p)
qi (pi ) = n si pi = pj

0 si pi > pj

? Paradoja de Bertrand: El equilibrio de Nash resultante de una competencia a la Bertrand


simple es el mismo que en competencia perfecta, esto es, p = cmg, lo que implica π = 0

68
28. Suponga que existen n firmas las cuales tiene acceso a diferentes tipos de tecnologı́as de produc-
ción, y por tanto, tienen costos marginales distintos, de forma que es posible ordenar las firmas
de un mercado desde la más eficiente a la menos eficiente; i.e. ci < ci+1 < ci+2 < ...ci+n−1 .
Suponga que las firmas escogen precios de forma simultánea.

a. Encuentre el equilibrio de Nash de este juego.

Respuesta:
Cualquier precio p ∈ [ci , ci+1 ] es un equilibrio de Nash, tal que Pi∗ = Cmg2 − 

29. Suponga que existen 2 firmas que venden dos productos diferenciados. Las firmas se posicionan
en los extremos de una recta de intervalo [0, 1]. El costo marginal de cada firma es constante
e igual a Cmg = c. Los consumidores se distribuyen uniformemente en el intervalo [0, 1]. Los
consumidores obtienen desutilidades de viajar a lo largo del intervalo [0, 1] para obtener el
producto. Asuma que esta distancia es lineal.

a. Plantee el problema de maximización de beneficios de la firma i.


Respuesta:
M ax πi = M ax{pi Q(pi , pj ) − ci Q(pi , pj )}
b. Derive la función de utilidad del consumidor.
Respuesta:
U (x) = v − τ (`i − x) − pi

30. La tragedia de los recursos comunes.


En una pradera existen dos campesinos. El campesino i posee gi ovejas y mantenerlas le significa
un costo Cmg = 2 por oveja. El beneficio que se obtiene depende del número total de ovejas que
hay en la pradera ya que el pastizal que hay en la pradera y que es de acceso común, constituye
la principal fuente de alimentación y, por lo tanto, determina la cantidad final del producto.
La función de beneficio por cada oveja está dada por V (G)10 − G, donde G = g1 + g2 es el
número agregado de ovejas en la pradera. Los granjeros deciden simultáneamente, y de modo no
cooperativo, cuantas ovejas mantener. Asuma que las ovejas son perfectamente divisibles.

a. Escriba la forma normal de este juego.

Respuesta:
Para que un juego pueda ser descrito en su forma norma es necesario identificar los jugado-
res, las estrategias y los pagos. Esto es, J = {1, 2}, Si = R+ , Ui (gi , gj ) = (10−gi −gj )gi −2qi .
b. Encuentre el óptimo social en que un planificador decide la cantidad de ovejas total para ma-
ximizar el excedente. Puede pensar en el planificador como un dueño exclusivo del terreno
y de las ovejas.

Respuesta:
En este caso, el óptimo social puede calcularse como si sólo existiese un solo dueño de todas

69
las ovejas quien busca maximizar el beneficios de sus ovejas disminuyendo los costos (Este
problema es similar al de maximización de beneficios de un monopolio simple.)
La función de utilidad de este único dueño, o bien de la sociedad agregada, serı́a
Us (Gs ) = (10 − Gs )Gs − 2Gs

∂Us (Gs )
∂Gs = 10 − 2Gs − 2 = 0

Luego, Gs = 4 es el número óptimo social de ovejas que puede ir a pastar a la pradera.


c. Encuentre el equilibrio de Nash del juego y compárelo con el óptimo social. Dé una intuición
económica breve para explicar a qué se deben las diferencias.

Respuesta:

U1 (g1 ) = (10 − G)q1 − 2g1


U1 (g1 ) = (10 − g1 − g2 )q1 − 2g1

∂u1 (g1 )
∂g1 = 10 − 2g1 − g2 − 2 = 0

Luego, g1 (g2 ) = 8−g


2
2
es la función de reacción del campesino uno al campesino dos.
Para el caso del campesino dos, la función de reacción es análoga. El equilibrio se obtiene
al interceptar las funciones de reacción de los dos campesinos.

Luego, g1 = g2 ≈ 2, 7 ovejas por campesino. Esto se debe a que el pasto es un recurso


común, y por lo tanto, los agentes lo utilizan en una medida mayor a la que lo deberı́an
usar si internalizaran los costos.
d. Qué sucede con los beneficios individuales y los beneficios sociales cuando el número de cam-
pesinos aumenta?

Respuesta:

A medida que el número de jugadores de involucrados en un juego de recursos comunes


aumenta, mayor es la explotación del recurso común y, por tanto, los beneficios privados
disminuyen a tal punto que, cuando el numero de jugadores tiende a infinito, los beneficios
privados son cero. Esto se debe a la condición de rivalidad de los recursos comunes. Lo
mismo ocurre con el beneficio social. Es decir, mientras más ovejas vayan a pastar, menos
pasto quedará para las demás, incluso, para las propias, por lo que el beneficio tiende a cero.

31. Suponga que una empresa contrata dos trabajadores con idénticas preferencias por consumo y
ocio dadas por la función:

70
U (C, O) = C · O

Donde C representa una canasta de bienes la cual tiene un precio de p y O representa el números
de horas dedicadas al ocio. Los trabajadores enfrentan la restricción pC + wO = wT, donde T
representa el total de horas disponibles en un dı́a.

a. Encuentre el nivel de consumo óptimo (C ∗ ) y Ocio optimo (O∗ ) para los trabajadores.
Respuesta:

El problema es

max U (C, O) = C · O

Sujeto a,

pC + wO = wT

La ecuación de Fisher viene dada por,

U mgO w
=
U mgC p
Calculando las utilidades marginales de la función entregada y usando la restricción pode-
mos encontrar entonces los niveles óptimos.

C w
=
O p

w
C= O
p
Reemplazando en la restricción se obtiene que,

w 
p O + wO = wT
p
2wO = wT
wT T
O∗ = =
2w 2
wT
C∗ =
2p
b. En adelante asuma que p = 1 y T = 20. Suponga que a ambos trabajadores se les ofrece
unirse al sindicato de la empresa a cambio de pagar una cuota D = 2. El éxito del sindica-
to para presionar por aumentos salariales depende del número de miembros. El sindicato
representa a todos trabajadores, por lo tanto, los beneficios salariales que se consigan serán
percibidos tanto por los trabajadores sindicalizados como por los que no. Ambos trabaja-
dores deben decidir si unirse (U ) o no unirse (NU ) al sindicato.

71
• Si ambos trabajadores deciden NU, el sindicato no puede presionar por nuevas alzas
salariales y el salario termina siendo w = 5 para todos los trabajadores.
• Si uno de los trabajadores decide unirse y el otro no, el sindicato aumenta la presión
sobre el salario consiguiendo w = 12 para todos los trabajadores. Sin embargo, los
miembros del sindicato deben pagar la cuota de membresı́a por lo que su salario serı́a
w = 12 − 2 = 10.
• Finalmente, si ambos trabajadores deciden unirse al sindicato, la presión salarial au-
menta aun más hasta conseguir w = 13. Nuevamente, todos los miembros del sindicato
deben pagar la cuota, por lo tanto su salario serı́a w = 13 − 2 = 11.
Calcule el nivel de utilidad de cada trabajador en cada uno de los tres casos y construya
una matriz donde se reflejen los niveles de utilidad de cada trabajador asociado a la opción
U y NU.
Respuesta:
Calcularemos, la utilidad para ambos trabajadores en cada uno de los tres casos:
• Ambos trabajadores deciden NU. Si los dos trabajadores no deciden unirse al sindicato
el salario percibido será 5, esto sumado a los valores de T y p nos darı́a:
20
O∗ = = 10
2
5 · 20
C∗ = = 50
2
Por lo tanto la utilidad para ambos trabajadores en este caso será:

U (C, O) = C ∗ O · O∗ = 10 · 50 = 500

• Uno de los trabajadores se une al sindicato y el otro no. Lo interesante es que en este
caso uno de los trabajadores decide unirse al sindicato por lo que se logran nuevas
alzas salariales, en particular en este caso, el salario sube a 12. Por otra parte esta alza
salarial es percibida por todos los miembros de la empresa (estén o no en el sindicato),
finalmente debemos recordar que ser miembro del sindicato tiene un costo de 2, por lo
que el salario neto percibido por los individuos sindicalizados será de 12 − 2 = 10. El
nivel de consumo y ocio óptimo para el individuo que NO es parte del sindicato será:
20
O∗ = = 10
2
12 · 20
C∗ = = 120
2
Por lo tanto la utilidad del trabajador que no participa del sindicato es,

U (C, O) = 10 · 120 = 1200

Por otra parta, el nivel de consumo y ocio óptimo para el individuo que SI participa
del sindicato será,
20
O∗ = = 10
2

72
10 · 20
C∗ = = 100
2
Por lo tanto la utilidad del trabajador que sı́ participa del sindicato es,

U (C, O) = 10 · 100 = 1000

• Ambos trabajadores se unen al sindicato. En este último caso, ambos se deciden unir
por lo que el sindicato es aún más fuerte para presionar por presiones salariales por lo
que el salario alcanza a ser 13. Recuerden que ambos ahora deben pagar la cuota, por
lo tanto el salario final serı́a w = 13 − 2 = 11. Los niveles de consumo y ocio óptimo
para ambos trabajadores en este caso serı́an:
20
O∗ = = 10
2
11 · 20
C∗ = = 110
2
Por lo tanto la utilidad de cada trabajador si ambos participan del sindicato es,

U (C, O) = 10 · 110 = 1100

Con toda la información anterior podemos construir la matriz de pago del juego:

J2
U NU
U 1100, 1100 1000, 1200
J1
NU 1200, 1000 500, 500

c. Encuentre el equilibrio de Nash de la matriz de juego construida en la pregunta anterior.


Comente sobre el(los) equilibrio(s) encontrado(s). ¿Cuál es el sentido económico de su re-
sultado?.
Respuesta:
El juego anterior tiene dos equilibrios de Nash (U,NU ) y (NU,U ). El equilibrio del juego
está en que un trabajador siempre decidirá unirse al sindicato, mientras que el otro no.
La idea es clara, ser miembro del sindicato tiene costos (el costo de pagar la cuota) y al
mismo tiempo los logros que se consigan de la negociación serán percibidos por todos los
trabajadores de la empresa. De ahı́ que el incentivo sea que solo uno de los trabajadores
entre al sindicato ası́ el otro se verı́a beneficiado del alza salarial y al mismo tiempo evita
pagar el costo de ser parte del sindicato. Lo interesante es que los equilibrios siempre son
de este tipo, no es sostenible que ambos entren debido a que el incentivo a moverse es
demasiado alto. Si uno de los trabajadores decide entrar entonces el otro no tendrá ninguna
motivación a hacerlo. En este tipo de ejemplos, la conducta del jugador que no entra se
conoce como Free-Rider, ya que, sin hacer nada, se ve beneficiado con la negociación y no
enfrenta costo alguno.
d. Finalmente, comente sobre el resultado del juego si es que la negociación sindical beneficiara
únicamente a los trabajadores que son miembros del sindicato.

73
Respuesta:

Si los beneficios de la negociación sólo son percibidos por los miembros del sindicato entonces
los incentivos a no entrar serán nulos, siempre los trabajadores preferirı́an entrar dado que
a pesar de tener que pagar el costo, el beneficio salarial compensa el costo. De hecho, esta
medida podrı́a ser tomada por los propios miembros del sindicato de manera de evitar
equilibrios como el encontrado en la pregunta anterior.

32. Coca-cola ha anunciado que está desarrollando una máquina de venta inteligente. Esta maquina
es capaz de cambiar el precio según la temperatura ambiente, la cual puede ser lata o baja.
Cuando la temperatura es alta, la demanda es Q = 280 − 2p, y cuando la temperatura es baja
la demanda es Q = 160 − 2p. En el mes, la cantidad de dı́as de temperatura alta es igual a la
cantidad de dı́as de temperatura baja. El costo marginal es c = 20.

a. Suponga que Coca-Cola instala una máquina inteligente. ¿Qué precio deberı́a cobraren un
dı́a de temperatura alta y qué precio cuando la temperatura es baja?
Respuesta:
En un dı́a de calor la demanda inversa es p = 140 − q/2, por lo tanto Img = 140 − q.
Haciendo Img = Cmg, tenemos que q = 120, con lo que p = 80. En un dı́a frı́o, la demanda
inversa es p = 80 − q/2 e Img = 80 − q, luego q = 60 y p = 50.

b. Alternativamente, suponga que Coca-Cola usa una máquina normal con un precio fijo. ¿Qué
precio deberı́a cobrar Coca-Cola por una lata de bebida?
Respuesta:
La demanda esperada es,
1  1 
280 − 2p + 160 − 2p = 220 − 2p
2 2
Por lo tanto p = 110−q/2 y Img = 110−q. Haciendo Img = Cmg tenemos que 20 = 110−q,
o bien q = 90. Por tanto, p = 65.
c. ¿Qué tipo de máquina le conviene más a Coca Cola?
Respuesta:
Con discriminación de precios los beneficios esperados son
1  1 
E[π] = (p − c)q1 + (p − c)q2
2 2
1   1 
E[π] = (80 − 20)120 + (50 − 20)60
2 2
E[π] = 4500

Sin discriminación de precios (65 − 20)90 = 4050, por tanto le conviene más discriminar.

74
6.3. Subastas

33. Suponga que la casa de sus sueños está siendo rematada ya que si antiguo dueño no pagó la
hipoteca. Sea vi la valoración que usted, el jugador i, le atribuye a esta casa, de forma tal que
vi  0 y vi 6= vj . Sea p el precio final que usted paga por la casa. Entonces vi − p es el beneficios
que obtiene de comprar la casa. Y bi es la oferta que usted hace para quedarse con la casa.
Suponga que hay n participantes en el remate y que ninguno de los jugadores tiene la misma
valoración sobre la casa. La casa de adjudica a quien tenga la mayor oferta y se paga es segundo
precio más alto.
Encuentre un posible equilibrio para este juego.

Respuesta:
Un posible equilibrio es que casa jugador ofrezca su disposición a pagar, de forma tal que bi = vi .
Si v1  v2  ...  vn , entonces el jugador 1 gana la subasta al precio b2 . Luego, su beneficio es
v1 − b2 y el de todos los otros jugadores es cero.
Si el jugador 1 cambia su oferta a otro precio, al menos, igual a b2 , entonces el resultado del
juego es el mismo.
Si el jugador 1 cambia su oferta a b1 < b2 , su pago es de cero.
Si el jugador 1 cambia su oferta a b1 > v1 , entonces gana la subasta, pero su beneficio es negativo.

34. Una linea aérea pierde dos maletas pertenecientes a diferentes viajeros. Ambas maletas son idénti-
cas y tiene el mismo contenido de difı́cil valoración (por ejemplo antiguedades). El encargado
de la compañı́a argumenta que la empresa es responsable por un máximo de $100 por maleta
(él no está capacitado para valorar el contenido de cada maleta), y en función de obtener un
valoración honesta de los viajeros les pide que escriban en un papel cada uno por separado una
valoración que este contenida en [2, 100]. Además explica que si ambos escriben el mismo número
el tomará éste como la verdadera valoración y les reembolsara esa cantidad a cada uno. Por otra
parte si uno escribe un número menor al otro, ese número será considerado como la verdadera
valoración y se hará el reembolso de acuerdo a este número en conjunto con un bono c > 0 al que
declare el menor número y un castigo de ?c al que declare la mayor valoración. Usted el viajero 1.

a. Cuál es su pago cuando el otro viajero escribió una valoración de $55 y c = 50?
Respuesta:
Sea si ∈ [2, 100] el número que escribe el viajero i, la función de pago del viajero 1, cuando
el viajero 2 ha escrito $55 y c = 2 es:

 s1 + 2 si s1 < 55

U1 (s1 , s2 = 55) = 55 si s1 = 55

55 − 2 si s1 > 55

b. Cuál es tu pago cuando el otro viajero escribió una valoración de $55 y c = 50


Respuesta:
En este caso, la función de pago del viajero 1 es,

75

 s1 + 50 si s1 < 55

U1 (s1 , s2 = 55) = 55 si s1 = 55

55 − 50 si , s1 > 55

c. Cuál es el equilibrio de Nash cuando c = 2 y cuando c = 50.


Respuesta:
El equilibrio de Nash es un par de números donde ninguno de los dos viajeros tiene incentivos
a desviarse. Suponga que (s∗1 , s∗2 ) es un equilibrio de Nash. El único resultado posibles es
s∗1 = s∗2 = 2 ∀c

35. Imagine que se está subastando el último disco de Justin Bieber y sólo asiste usted y otra per-
sona más. Ustedes sólo pueden ofrecer $0 o $30 (suponga que si la oferta ganadora es 0, el bien
se vende de todos modos). En caso de que ambos hagan la misma oferta, se sortea el ganador
lanzando una moneda. La valoración que tiene cada postor por el bien vi es información privada,
es decir, es una subasta a sobre cerrado. Sin embargo, cada uno sabe que ésta sólo puede tomar
los valores 20 o 50, con probabilidad (1 − α) y α respectivamente.

Sea yi una variable que toma el valor yi = 1 si el postor i gana la subasta y el valor yi = 0 en
caso contrario. Además, denotamos pi el precio que paga el individuo cuando gana la subasta.

a. Describa la función de utilidad del agente i


Respuesta:
Ui (yi , pi , vi ) = (vi − pi )yi
Esto es, el pago es igual al excedente de la compra en caso de ganar, y 0 en caso contrario.

b. Una estrategia para el jugador i es una acción para cada posible valoración que pueda ocu-
rrir, y la podemos denotar como bi (vi ). Por ejemplo, una posible estrategia es ofertar 50
cuando tengo una valoración alta; bi (50) = 30, y ofertar 0 cuando es baja; bi (20) = 0. Como
e individuo 1 desconoce la valoración que tiene el jugador 2, no puede saber con certeza
la oferta que hará este último, aun cuando conozca su plan de acción (b2 (v2 )). Dada esta
incertidumbre, calcule la utilidad esperada del jugador 1.

Respuesta:
(v1 − b1 )P r(b1 > b2 ) + 12 (v1 − b1 )P r(b= b2 )
Donde se observa claramente el trade-off entre hacer una oferta menor, con lo que aumenta
el excendete (v1 − b1 ), y hacer una oferta mayor aumentando la probablididad P r(b1 > b2 ).
c. Encuentre un posible equilibrio para este juego.
Respuesta:
Un perfil de equilibrio es un par de estrategias (b1 (v1 ), b2 (v2 )) tal que nadie puede mejorar
cambiando su estrategia. Ası́, lo primero que podemos decir respecto de la estrategia de
equilibrio es que necesariamente bi (20) = 0 deja un excedente negativo, ya que cuando la
valoración es baja comprar el bien a pi = 30 no tiene sentido y se ofrece pi = 0. Con esto,

76
sólo falta determinar cuál es la estratégica óptima cuando vi = 50. Para ello, fijemos la es-
trategia del jugador 2 en b2 (50) = 0 y analicemos cuál es la respuesta óptima del individuo 1.

b1 (50) Excedente si gana Pr(ganar) Utilidad esperada


b1 = 0 50 0.5 25
b1 = 30 20 1 20

Si b1 = 0, entonces los jugadores empatan (asumiendo que el jugador 2 juega 0 independiente


de su tipo) y en ese caso gana con probabilidad 0,5, lo que le deja un pago de 25. En
cambio, si juega b1 = 30 gana con certeza, lo que le deja un pago de 20. Ası́, cuando el
jugador 2 sigue la estrategia (b2 (20) = 0, b2 (50) = 0), la mejor respuesta del individuo 1
es (b1 (20) = 0, b1 (50) = 0). Como el problema es simétrico, también es cierto que la mejor
respuesta del jugador 2 (b2 (20) = 0, b2 (50) = 0). Luego, hemos encontrado un equilibrio
donde cada individuo oferta 0 independientemente de la valoración vi que le corresponda.

6.4. Estrategias Mixtas

36. Suponga el siguiente juego.

Jugador 2
I D
A 3, 2 1, 4
Jugador 1 C 1, 3 2, 1
B 2, 2 2, 0

a. Identifique el conjunto de estrategias puras y mixtas para cada jugador.

Respuesta:

Los conjuntos de estrategias puras son S1 = {A, C, B} y S2 = {I, D}. Una estrategia
mixta para el jugador 1 no es más que una distribución de probabilidad (p, q, 1-p-q)
donde p representa la probabilidad de elegir A, q la probabilidad de elegir C, y (1-p-q)
la probabilidad de elegir B. Y del mismo modo, una estrategia mixta para el jugador 2
consistirá en una loterı́a (r, 1-r) en la que r representa la probabilidad de elegir I y (1-r)
la probabilidad de elegir D.
b. Encuentre las ganancias esperadas para cada jugador.
Respuesta:

Como puede observarse, dada la estrategia I del jugador 2, el jugador 1 no puede esperar
ganar menos de 1 (ganancia cuando juega C), ni más de 3 (ganancia cuando juega A) con
ninguna de sus estrategias, ya sean puras o mixtas:

77
U1 [(p, q, 1 − p − q), I] = pu1 (A, I) + qu1 (C, I) + (1 − p − q)u1 (B, I)
U1 [(p, q, 1 − p − q), I] = 3p + 1q + 2(1 − p − q)

U1 [(p, q, 1 − p − q), I] toma un valor máximo de 3 cuando p = 1, q = 0 y 1 − p − q = 0, y


un valor mı́nimo de 1 cuando p = 0, q = 1 y 1 − p − q = 0.

37. Cara o sello. Considere la siguiente matriz de pagos.

Jugador 2
Cara Sello
Cara 1, -1 -1, 1
Jugador 1
Sello -1, 1 1, -1

a. Identifique el conjunto de estrategias puras y mixtas para cada jugador.

Respuesta:
En el juego de las monedas los conjuntos de estrategias puras son S1 = S2 = {Cara, Sello}.
Por tanto, una estrategia mixta para el jugador 1 no es más que una distribución de pro-
babilidad sobre el conjunto S1 , es decir, (p, 1 − p) donde p representa la probabilidad de
elegir Cara y (1 − p) la probabilidad de elegir Sello. Y del mismo modo, una estrategia para
el jugador 2 consistirá en una loterı́a (q, 1 − q) sobre el conjunto S2 en la que q representa
la probabilidad de elegir Cara y (1 − q) la probabilidad de elegir Sello.

b. Encuentre los pagos esperados para cada jugador.


Respuesta:

Cuando el jugador 2 juega cara, la utilidad esperada para el jugador 1 es:


U1 ((p, 1 − p), Cara) = p × u1 (Cara, Cara) + (1 − p) × u1 (Sello, Cara)
U1 ((p, 1 − p), Cara) = p × (1) + (1 − p) × (−1)
U1 ((p, 1 − p), Cara) = 2p − 1

Cuando el jugador 2 juega sello, la utilidad esperada para el jugador 1 es:


U1 ((p, 1 − p), Sello) = p × u1 (Cara, Sello) + (1 − p) × u1 (Sello, Sello)
U1 ((p, 1 − p), Sello) = p × (−1) + (1 − p) × (1)
U1 ((p, 1 − p), Sello) = 1 − 2p

Cuando el jugador 1 juega cara, la utilidad esperada para el jugador 2 es:


U2 ((p, 1 − p), Cara) = p × u2 (Cara, Cara) + (1 − p) × u2 (Sello, Cara)
U2 ((p, 1 − p), Cara) = p(−1) + (1 − p)(1)
U2 ((p, 1 − p), Cara) = 1 − 2p

78
Cuando el jugador 1 juega sello, la utilidad esperada para el jugador 2 es:
U2 ((p, 1 − p), Sello) = p × u2 (Cara, Sello) + (1 − p) × u2 (Sello, Sello)
U2 ((p, 1 − p), Sello) = p(1) + (1 − p)(−1)
U2 ((p, 1 − p), Sello) = 2p − 1

c. Identifique los pagos esperados de las estrategias ((p, 1 − p), (q, 1 − q)). Resuelva incorpo-
rando el comportamiento de ambos jugadores en la misma función de pagos esperado.

Respuesta:

Para el jugador 1:
U1 ((p, 1 − p), (q, 1 − q)) = qU1 ((p, 1 − p), Cara) + (1 − q)U1 ((p, 1 − p), Sello)
U1 ((p, 1 − p), (q, 1 − q)) = q[2p − 1] + (1 − q)[1 − 2p]
U1 ((p, 1 − p), (q, 1 − q)) = 1 − 2p − 2q + 4pq

Para el jugador 2:
U2 ((p, 1 − p), (q, 1 − q)) = pq(−1) + (1 − p)q(1) + p(1 − q)(1) + (1 − p)(1 − q)(−1)
U2 ((p, 1 − p), (q, 1 − q)) = −1 + 2p + 2q − 4pq

d. Encuentre las funciones de reacción de cada jugador.

Respuesta:

Dadas las estrategias mixtas (p, 1 − p) y (q, 1 − q) para los jugadores 1 y 2, fijamos la
estrategia mixta del jugador 2 y luego analizamos las conjeturas del jugador 1:

U1 (Cara, (q, 1 − q)) = q(1) + (1 − q)(−1) = 2q − 1


U1 (Sello, (q, 1 − q)) = q(−1) + (1 − q)(1) = 1 − 2q

Al interceptar las conjeturas del jugador 1 sobre los que el jugador 2 jugará, es posible
hallar un punto crı́tico. En este caso,

2q − 1 = 1 − 2q
1
q=
2
Luego, hacemos un análisis de los punto crı́ticos:

1
U1 (Cara, (q, 1 − q)) > U1 (Sello, (q, 1 − q)) ⇔ 2q − 1 > 1 − 2q ⇔ q > 2
1
U1 (Cara, (q, 1 − q)) < U1 (Sello, (q, 1 − q)) ⇔ 2q − 1 < 1 − 2q ⇔ q < 2
1
U1 (Cara, (q, 1 − q)) = U1 (Sello, (q, 1 − q)) ⇔ 2q − 1 = 1 − 2q ⇔ q = 2

79
Por tanto, la respuesta óptima es Cara si q > 1/2, Sello si q < 1/2, y cualquiera si q = 1/2.
Luego,

1
 p = 0(Sello)
 si q < 2
R1 (q) = 1
p = 1(Cara) si q > 2
 1
p ∈ [0, 1] (culaquier estrategia) si q =

2

El mismo análisis es válido para el jugador 2. Luego, su función de reacción es:



1
 q = 0(Sello)
 si p > 2
R2 (p) = 1
q = 1(Cara) si p < 2
 1
q ∈ [0, 1] (culaquier estrategia) si p =

2

Teniendo en cuenta que el jugador 2 es indiferente entre sus estrategias puras y mixtas
(le generan la misma utilidad esperada) cuando el jugador 1 juega su estrategia mixta
(p, 1 − p) = (1/2, 1/2), y que el jugador 1 es indiferente entre sus estrategias puras y mixtas
cuando el jugador 2 juega su estrategia mixta (q, 1 − q) = (1/2, 1/2), podemos decir que el
EN en estrategias mixtas es aquel en el que cada jugador juega dicha estrategia mixta, que
corresponde al punto en que se cortan las correspondencias de respuesta óptima. Luego,
{( 21 , 12 ), ( 12 , 12 )} es un equilibrio de Nash.

38. Considere el siguiente juego.

Jugador 2
Paloma Halcón
Paloma 1, 1 0, 2
Jugador 1
Halcón 2, 0 -3, -3

a. Encuentre los pagos esperados para cada jugador.

Respuesta:

Si el jugador 1 juega la estrategia pura Paloma con probabilidad p y Halcón con probabilidad
(1-p), y del mismo modo el jugador 2 juega Paloma con probabilidad q y Halcón con
probabilidad (1-q), la utilidad esperada de ambos jugadores es:
U1 [(p, 1 − p), (q, 1 − q)] = pU1 (paloma, (q, 1 − q)) + (1 − p)U1 (Halcon, (q, 1 − q))
U1 [(p, 1 − p), (q, 1 − q)] = p[q(1) + (1 − q)(0)] + (1 − p)[2q + (−3)(1 − q)]
U1 [(p, 1 − p), (q, 1 − q)] = 3p + 5q − 4pq − 3

U2 [(p, 1 − p), (q, 1 − q)] = pU2 (paloma, (q, 1 − q)) + (1 − p)U2 (Halcon, (q, 1 − q))
U2 [(p, 1 − p), (q, 1 − q)] = p[q(1) + (1 − q)(2)] + (1 − p)[q(0) + (−3)(1 − q)]

80
U2 [(p, 1 − p), (q, 1 − q)] = 5p + 3q − 4pq − 3

b. Encuentre las funciones de reacción de cada jugador


Respuesta:

El jugador 1 decidirá el valor de p de tal modo que maximice sus ganancias esperadas dada
la estrategia mixta del jugador 2:

max U1 [(p, 1 − p), (q, 1 − q)] = 3p + 5q − 4pq − 3

Si existieran soluciones interiores, se identificarı́an derivando la utilidad esperada de J1 con


respecto a p e igualando a 0. De ese modo obtendrı́amos:
∂U1
= 0 = 3 − 4q
∂p
3
q=
4
Luego, analizamos los puntos crı́ticos,

3 ∂U1
Si q > , entonces < 0, lo que significa que p∗ = 0 y el jugador 1 selecciona Halcón.
4 ∂p
3 ∂U1
Si q < , entonces > 0, lo que significa que p∗ = 1 y el jugador 1 selecciona Paloma.
4 ∂p
3 ∂U1
Si q = , entonces = 0, lo que significa el jugador 1 está indiferente entre sus
4 ∂p
estrategias puras Paloma y Halcón, ası́ como cualquier distribución de probabilidades
sobre dichas estrategias puras.

c. Encuentre todos los equilibrios de Nash existentes.

Respuesta:

Es fácil observar que existen dos EN en estrategias puras; {(Paloma, Halcón), (Halcón,
Paloma)}. Al interceptar las funciones de mejor respuesta de ambos jugadores es posible
encontrar un tercer equilibrio tal que (p = 3/4, q = 3/4) es un equilibrio de Nash en
estrategias mixtas.

39. Dicen que la principal causa de peleas en una relación es por el lugar donde salir a comer.
Suponga que usted prefiere la comida vegana y su pareja quiere ir al McDonals. Sin embargo,
ambos están mejor saliendo a comer junto que no haciéndolo. Considere la siguiente matriz de
pagos para este problema.

81
J2
Vegana McDonals
Vegana 2, 1 0, 0
J1
McDonals 0, 0 1, 2

a. Encuentre las utilidades esperadas de ambos jugadores.


Respuesta:

UJ1 = 2pq + 1(1 − p)(1 − q) = p(3q − 1) − q

UJ2 = 1pq + 2(1 − p)(1 − q) = q(3p − 2) − 2p

b. Encuentre las funciones de mejor respuesta de ambos jugadores.


Respuesta:

J1 conjetura lo que J2 va a jugar:

E[UJ1 (F )] = 2q + 0(1 − q) = 2q

E[UJ1 (M )] = 0q + 1(1 − q) = 1 − q

Luego,
2q = 1 − q
1
q=
3
Entonces q = 13 es un punto crı́tico. Esto quiere decir que, cuando q = 13 , el jugador 1 es
indiferente entre jugar V egana o M cDonals. Luego,

1
 1
 si q > 3
p(q) = 1
0 si q < 3
 1
[0, 1] si q =

3

c. Encuentre todos los posibles equilibrios de Nash.


Respuesta:
En este caso, existen dos equilibrio en estrategias puras (p, q) = (1, 1) y (p, q) = (0, 0), y
existe un equilibrio en estrategias mixtas (p, q) = ( 23 , 31 ).
d. Grafique las funciones de mejor respuesta
Respuesta:

82
40. Considere un juego entre dos firmas, una establecida en el mercado, la firma A, y una entrante,
la firma B. La firma A debe decidir si construir una nueva planta. La utilidad que obtendrı́a la
firma depende de los costos de inversión y también de la entrada o no del posible competidor B.
Por su parte, la firma B sólo se beneficiará de entrar en el mercado si la firma A no construye la
planta. Al momento de decidir, ninguna de las dos firmas conoce la decisión de la otra.

La firma A debe elegir entre No Construir (N-C) o construir (C) una planta . La firma B debe
optar si entrar (E) o no entrar (N-E) al mercado. Las utilidades respectivas en función de las
estrategias, están resumidas en la siguiente matriz de pagos.

Firma B
Entrar No-Entrar
No-Construir 2, 1 2, 0
Firma A
Construir 0, -1 3, 2

a. Determine para cada jugador si hay estrategias dominadas o dominantes.


Respuesta:
No existen estrategias es dominadas ni dominantes ya que; si el jugador 1 juega N-C, la
mejor respuesta del jugador 2 es jugar E. Si el jugador 1 juega C, la mejor respuesta del
jugador 2 es jugar N-E. Es decir, la mejor respuesta del jugador 2 cambia dependiendo de
lo que juega el jugador 1. Lo mismo aplica para el jugador 1. Si el jugador 2 juega E, la
mejor respuesta del jugador 1 es N-C. Si el jugador 2 juega N-E, la mejor respuesta del
jugador 1 es C.
b. Encuentre las funciones de utilidad de las empresas
Respuesta:
UJ1 (p, q) = 2pq + 2p(1 − q) + 0(1 − q)p + 3(1 − p)(1 − q)

83
UJ1 (p, q) = p(3q − 1) − 3q + 3

UJ2 (p, q) = 1pq + 0(1 − q)p + (−1)(1 − p)q + 2(1 − q)(1 − p)


UJ2 (p, q) = q(2p − 1)
c. Calcule las funciones de reacción para ambos jugadores
Respuesta:
De las funciones de utilidad se puede realizar el siguiente análisis:

Si (3q − 1) > 0, es decir, q > 13 , entonces el jugador 1 N-C con probabilidad P = 1.


Si (3q − 1) < 0, es decir, q < 13 , entonces el jugador 1 juega C con probabilidad P = 0
Si (3q − 1) = 0, es decir, q = 13 , entonces el jugador 1 está indiferente.
Luego,

1
 1
 si q > 3
p(q) = 1
0 si q < 3
 1
[0, 1] si q =

3

El mismo análisis se puede hacer para el jugador 2:

Si (2p − 1) > 0, es decir, p > 12 , entonces el jugador 2 conjetura que el jugador 1 jugará
N-C con probabilidad p > 12 , luego, el jugador 2 juega E con probabilidad q = 1
Si (2p − 1) < 0, es decir, p < 21 , entonces el jugador 2 conjetura que el jugador 1 jugará C
con probabilidad (1 − p) > 12 , luego, el jugador 2 juega N-E con probabilidad q = 0. q = 0
equivale a (1 − q) = 1

Luego, 
1
 1
 si p > 2
q(p) = 1
0 si p < 2
 1
[0, 1] si p =

2

d. Encuentre todos los equilibrios de Nash del juego.


Respuesta:
Existen dos equilibrios en estrategias puras, tal que (p, q) = (0, 0) y (p, q) = (1, 1), y un
equilibrio en estrategias mixtas, (p, q) = ( 12 , 13 ).
e. Grafique las funciones de reacción.

84
41. Considere la siguiente matriz de pagos.

Jugador 2
Bajo Medio Alto
Bajo 2, 2 6,1 3, 3
Jugador 1 Medio 1, 6 5, 5 2, 1
Alto 3, 3 1, 2 0, 0

a. Encuentre todos los equilibrios de Nash de este juego.

Respuesta:
Podemos notar que la estrategia M edio es una estrategia estrictamente dominada para el
jugador 1 y para el jugador 2. Luego, es posible plantear el problema de la siguiente forma.

Jugador 2
Baja Alto
Baja 2, 2 3, 3
Jugador 1
Alta 3, 3 0, 0

Luego, es fácil ver que en estrategias puras existen los equilibrios EN : {(B, A); (A, B)}

En estrategias mixtas
J1 conjetura lo que J2 va a jugar;

E[B] = 2q + 3(1 − q) = 3 − q
E[A] = 3q + 0(1 − q) = 3q
Luego,
3 − q = 3q
q = 34 es un punto crı́tico.
J2 conjetura lo que J1 va a jugar,
E[B] = 2p + 3(1 − p) = 3 − p
E[A] = 3p + 0(1 − p) = 3p
Luego,
3 − p = 3p
p = 34 es un punto crı́tico.
Por tanto, J1 conjetura que J2 jugará B con probabilidad 34 y jugará con probabilidad 14 . J2
conjetura que J1 jugará B con probabilidad 43 y A con probabilidad 41 . Ergo, el equilibrio
de Nash en estrategias mixtas es (q ∗ , p∗ ) = (B, B).

42. Suponga que en un laboratorio se hace un experimento con dos perros para medir su inteligencia.
Ambos perros son de la misma raza pero uno de ellos es claramente más veloz que el otro. La

85
idea del experimento es ver como reaccionan ante una situación de cooperación. El experimento
consiste en encerrar a ambos perros en una misma jaula, en donde en un extremo de la jaula hay
un botón que al ser presionado libera alimento arrojado en el otro extremo de la jaula. Ambos
perros deciden apretar el botón (A) o no (NA). Si cualquiera de los perros aprieta el botón, el
otro simplemente esperará a que llegue la comida mientras que el otro deberá correr antes que
el otro la coma. Si el perro veloz aprieta el botón alcanza a comer algo del alimento, mientras
que si el perro lento aprieta, no alcanza a llegar a la comida antes que el otro perro la devore.
La matriz de pagos es:

NA A
NA 0, 0 4, 1
A 0, 5 2, 3

a. Identifique qué jugador corresponde al perro rápido y qué jugador corresponde al perro
lento.
Respuesta:

El jugador 1, el de la fila, es el perro lento mientras que en el jugador 2, de la columna es


el perro rápido.

b. ¿Existe un equilibrio de estrategias estrictamente dominadas en este juego?


Respuesta:
No. Basta con mirar al perro rápido, si el otro perro juega NA entonces a él le convendrá
A mientras que si el otro perro juega A al perro rápido le convendrá NA. No se pueden
eliminar estrategias por dominancia estricta para este jugador.
c. Determine el o los equilibrios de Nash en estrategias puras del juego (de existir).
Respuesta:
De la matriz de juegos anterior, se pueden determinar dos equilibrios de Nash en estrategias
puras: (A,NA) y (NA,A). El equilibrio propone que siempre uno de los perros apretarı́a
el botón. De la misma forma, se aprecia que el conjunto de estrategias (A,A) y (NA,NA)
nunca serán equilibrios de Nash debido a los incentivos a desviar.
d. Encuentre las funciones de reacción de cada uno de los perros.
Respuesta:
Para determinar las funciones de reacción debemos calcular la utilidad esperada para ambos
perros. Para esto, diremos que π1 es la probabilidad que el perro lento (PL) no apriete el
botón mientras π2 será la probabilidad de que el perro rápido (PR) no apriete el botón.
Comencemos con el perro lento (PL) su utilidad esperada será:

E(UP L ) = π1 [0 × π2 + 4 × (1 − π2 )] + (1 − π)[0 × π2 + 2 × (1 − π2 )]

E(UP L ) = 2π1 − 2π1 π2 − 2π2 + 2

86
Con esto, buscamos la probabilidad π1 que maximice la utilidad:

∂E(UP L)
= 2 − 2π2 = 0
∂π1
π2 = 1

Con lo anterior, determinamos que la función de reacción del perro lento será:
(
π1 = 1 si π2 < 1
F RP L =
π1 ∈ (0, 1) si π2 = 1

Ahora, para el perro rápido, su utilidad esperada será:

E(UP R ) = π2 [0 × π1 + 5(1 − π1 )] + (1 − π2 )[1 × π1 + 3(1 − π1 )]

E(UP R ) = 2π2 − 3π1 π2 − 2π1 + 3

Con esto, buscamos la probabilidad π2 que maximice la utilidad:

∂E(UP R )
= 2 − 3π1 = 0
∂π2
2
π1 =
3
Con lo anterior, determinamos que la función de reacción del perro rápido será:

2
 π2 = 1
 si π1 < 3
2
F RP R = π2 ∈ (0, 1) si π1 = 3
 2
π2 = 0 si π1 >

3

e. Determine el o los equilibrios en estrategias mixtas del juego (si prefiere puede ayudarse
con un gráfico).
Respuesta:

Podemos graficar ambas funciones de reacción en respuesta a los potenciales valores de π1


y pi2 , dicho gráfico serı́a:
Se observa que existen entonces infinitos equilibrios de Nash en estrategias mixtas. En
particular los infinitos equilibrios serán {π1 ∈ (0, 2/3); π2 = 1}.

87
6.5. Juegos Dinámicos con Información Completa y Perfecta

43. Existe una posibilidad de negocios que sólo puede ser explotada por Marı́a y por Gastón de forma
conjunta. Esta oportunidad de negocios genera ganancias por $12 millones. Tanto Gastón como
Marı́a están preocupados por su propio bienestar y deben decidir cómo repartir las ganancias del
negocio. La forma de negociación consiste en hacer ofertas sobre cómo dividir las ganancias de
forma alternada. Primero, Marı́a hace una oferta sobre cómo dividir los $12 millones. Si Gastón
acepta, entonces los $12 millones se dividen de acuerdo a la propuesta de Marı́a. Si Gastón
rechaza, entonces él debe hacer una propuesta a Marı́a el dı́a siguiente. Si Marı́a acepta, ambos
reparten las ganancias según la propuesta de Gastón. Si Marı́a rechaza, entonces ella debe hacer
una nueva propuesta a Gastón el dı́a siguiente, y ası́ hasta que ambos lleguen a un acuerdo.

a. Suponga que la oportunidad de negocio desaparece si Marı́a y Gastón demoran más de un


dı́a en lograr un acuerdo sobre cómo dividir las ganancias. Qué predicción realizarı́a usted
respecto al resultado del juego.

Respuesta:
Marı́a ofrece $12 − s, tal que s > 0. Si ambos son egoı́stas, Marı́a ofrece s → 0.
Gastón puede rechazar o aceptar. Si rechaza, debe hacer una oferta al dı́a siguiente cuando
la oferta ya expiró, por tanto, su pago es cero. Si Gastón acepta, su pago es cero.
Luego, Gastón acepta $12 − s, tal que s > 0.
b. Suponga ahora que las ganancias son $12 millones si el acuerdo se logra el primer dı́a, $11
millones sin el acuerdo se logra el dı́a 2, y $6 millones si el acuerdo se alcanza el dı́a 3. Marı́a
y Gastón acuerdan la siguiente forma de negociar. El dı́a 1 Marı́a hace una oferta sobre
cómo dividir los $12 millones. Si Gastón acepta, entonces los $12 millones se dividen de
acuerdo a la propuesta de Marı́a. Si Gastón rechaza, entonces él debe hacer una propuesta
a Marı́a al dı́a siguiente. Si Marı́a acepta la propuesta, ambos se reparten las ganancias de
$11 millones. Si Marı́a rechaza, ambos deben volver a jugar el dı́a siguiente. En el dı́a 3,

88
ambos deben escribir de forma simultanea cuanto desean recibir de los $6 millones. Si la
sima de sus peticiones es exactamente igual a $6 millones, entonces Marı́a y Gastón reciben
lo solicitado. Si las cantidades suman cualquier cantidad diferentes a $6 millones, entonces
cada uno recibe $0.
Qué predicción realizarı́a usted para este juego?

Respuesta:
Resolviendo por inducción hacia atrás.
En t = 3, Gastón escogerá $3 y Marı́a escogerá $3. De esta forma ambos se quedan con 3
millones, ya que 3 & 0.
En t = 2, se reparten $11 millones. Gastón ofrecerá $8 millones para él y $3 millones para
Marı́a. Si Marı́a rechaza, ambos se quedan con $3 millones.
En t = 1, se reparten $12 millones. Marı́a ofrece $4 para ella y $8 para Gastón. Luego, el
juego se acaba en t = 1.

44. Considere el siguiente juego de 2 jugadores. El jugador 1 elige un número x1 entre 1 y 10. El
jugador 2 suma un número y1 que esté entre 1 y 10 que este entre x1 + 1 y x1 + 10. El jugador
1 observa este número y elige un número x2 entre y1 + 1 y y1 + 10 y ası́ sucesivamente. En
cada turno uno de los dos jugadores adiciona un número entre 1 y 10. El ganador del juego es
el jugador que primero declare el número 100. El ganador recibe un pago de 100 y el perdedor
nada.
Encuentre el equilibrio perfecto en subjuegos de este juego.

Respuesta:
El jugador 1 escoge x y el jugador 2 escoge y, tal que x, y ∈ [1, 10]
En t = n, J1 escoge un número entre (1, 10), tal que, Σ = 100
En t = n, J2 escoge un número entre (1, 10), tal que, Σ = 90 − 99
En t = n, J1 escoge un número entre (1, 10), tal que, Σ = 89
En t = n, J2 escoge un número entre (1, 10), tal que, Σ = 79 − 88
..
.
En t = n, J2 escoge un número entre (1, 10), tal que, Σ = 2 − 11
En t = n, J1 escoge un número entre (1, 10), tal que, Σ = 1

Por tanto, el Equilibrio de este juego es que el jugador 2 tenga que escoger un número cualquiera
entre 1 y 10, independientemente del periodo en el que se toque jugar.

45. Considere un juego donde hay dos montones de monedas sobre la mesa. Inicialmente, cada
jugador tienen una moneda. Hay dos jugadores, uno frente a cada montón. Los jugadores toman,
de manera alternada, decisiones consistentes en seguir (S ) o en terminar (T ). Comienza J1 , y
si elige T se acaba el juego, mientras que si elige S el juego prosigue hasta de modo que los
montones pasan a tener 0 monedas el primer jugador y 3 monedas el segundo jugador. Luego
es el turno del J2 . Si J2 elige T se acaba el juego, mientras que si juega S los montones pasan

89
a tener 2 monedas el primero y 2 el segundo (es decir, disminuye en una moneda el montón
del jugador que acaba de tomar la decisión S, y aumenta en dos monedas el montón del otro
jugador), y el juego prosigue hasta una última jugada a cargo de J1 . Si en su última jugada J1
elige T se acaba el juego y si elige S los montones varı́an de igual modo (pasando a tener una
moneda el primero y 4 el segundo), y se acaba el juego. Cuando el juego termina, cada jugador
recibe como pago su propio montón de monedas.

a. Represente este juego en su forma extensiva.

Respuesta:

1, 4
S

J1

T
J2 2,2
S
T

0, 3
J1

T
1, 1

b. Identifique los nodos de este juego, los desarrollos posibles y el conjunto de información
para cada jugador.

Respuesta:

Hay 3 nodos de decisión (2 para J1 , uno de ellos el inicial, y uno para J2 ), todos los cuales
tienen el mismo conjunto {S, T } de acciones factibles, y 4 nodos terminales.
Hay 4 desarrollos posibles del juego, y son los siguientes: T, S → T , S → S → T y
S → S → S. Cada nodo terminal culmina y representa un desarrollo posible del juego, de
modo que el primer nodo terminal (el situado más a la izquierda) culmina el desarrollo T,
el segundo nodo terminal culmina el desarrollo S → T , y ası́ sucesivamente.
Todos los conjuntos de información de este juego son unitarios, y las estrategias puras de
cada jugador son todas las funciones que van desde el conjunto de sus nodos de decisión
hasta el conjunto {S, T }. Ası́ pues, J1 tiene 4 estrategias puras (que son S − S, S − T , T − S
y T − T ) mientras que J2 tiene 2 (que son S y T ). En consecuencia, el número de perfiles
estratégicos es 8.

90
c. Represente este juego en su forma normal.

Respuesta:

El conjunto de estrategias de J1 es S1 =T,T; T, S; S, T; S,S y el de J2 es S2 = T, S. Por


tanto, su representación en forma normal es:

Jugador 2
T S
(T, T) 1, 1 1, 1
(T, S) 1, 1 1, 1
Jugador 1
(S, T) 0, 3 2, 2
(S, S) 0, 3 1, 4

d. Encuentre el equilibrio de Nash de este juego.

Respuesta:

Los EN en estrategias puras son (T,T; T) y (T,S; T).

46. Dos hermanos han encontrado el frasco de galletas de la abuela y ahora deben decidir cómo
repartirlas. Hay n galletas (con n > 1), tal que n es conocido por ambos jugadores. El jugador
J1 ofrece a J2 un número m de galletas del frasco (0 como mı́nimo y n como máximo). A
continuación, J2 ve las galletas ofrecidas por J1 y dice Sı́, o bien dice Resto. J2 recibe como pago
del juego las galletas ofrecidas por J1 si su acción es Sı́, y las que han quedado en el frasco si su
acción es Resto. J1 recibe las galletas que no se han dado a J2 .

a. Represente este juego en su forma extensiva para n = 4.

Respuesta:

91


    

    

         

         
         

b. Suponga que el juego sólo se juega dos veces pero ahora las decisiones son tajantes. El
jugador J1 ofrece a J2 , un número m de galletas (0 como mı́nimo y n como máximo). A
continuación, J2 ve las galletas ofrecidas por J1 y dice Sı́ o No, que significan Acepto y No
Acepto, respectivamente. Si J2 dice Sı́, recibe en pago las m galletas sacadas y J1 recibe
n − m (las restantes). Pero si J2 dice No, ambos reciben 0 galletas. Represente este juego
en su forma extensiva para n = 4.

Respuesta:



    

    

         

         
         

6.6. Juegos Dinámicos con Información Imperfecta

47. Suponga una empresa incumbente que ejerce un monopolio en el mercado de softwares, lo que
genera un beneficio de $7 millones. Una segunda empresa quiere desafiar al monopolio y entrar
al mercado ya que sabe que, si entra, podrá aumentar sus beneficios de $3 a $5 millones. Si la

92
empresa desafiante ingresa al mercado, los beneficios del monopolio disminuirán a $5 millones. Sin
embargo, una competencia dura, por ejemplo una guerra de precios, harı́a que ambas empresas
se quedaran sin beneficios.

a. Represente este juego en su forma extensiva.

Respuesta:

  


 

Guerra de precios Competir

   

b. Represente este juego en su forma estratégica y encuentre los equilibrios de Nash.

Respuesta:

En este juego, las estrategias de la firma desafiante son Entrar y No entrar, y las de la
firma incumbente son Competir y Guerra de Precios. Por tanto, su representación en forma
estratégica es:

Incumbente
Guerra de precios Competir
Desafiante Entrar 0, 0 5, 5
No entrar 3, 7 3, 7

Los EN en estrategias puras son s∗ =(Entrar, Competir ) y s0∗ =(No entrar, Guerra de
precios). Aunque ambos EN parecen razonables a la vista de la matriz de pagos aquı́ re-
presentada, veremos que el primero de ellos es más razonable que el segundo si analizamos
ambos en su desarrollo temporal. Supongamos que un juez neutral propone que se ponga
en práctica el perfil s∗ =(Entrar, Competir ). En ese caso sabemos que a cualquiera de los

93
jugadores le interesa atenerse a su estrategia particular en dicho perfil, siempre que el otro
haga lo mismo, ya que este perfil es un EN.

La realización práctica del perfil s∗ tendrı́a el siguiente desarrollo razonado: la firma desafian-
te hace su jugada prevista Entrar y a continuación la firma incumbente (que acaba de ob-
servar que la firma desafiante ha entrado) decide competir, que es respuesta óptima a Entrar
(la que realmente le conviene suponiendo que la firma entrante juegue Entrar ), mientras
que Entrar también es respuesta óptima de la firma desafiante a la jugada prevista por la
firma incumbente. Todo se conforma al sentido común en este caso y, a la vista de este
razonamiento, los jugadores confirman su interés en no desviarse unilateralmente de ese
desarrollo previsto.

Sin embargo, si el juez propusiera poner en práctica el perfil s0∗ =(No entrar, Guerra de
Precios), el desarrollo propuesto serı́a el siguiente: la firma desafiante hace su jugada pre-
vista No entrar la firma incumebte no se ve obligado a hacer su jugada prevista Guerra de
Precios, ya que el juego se ha acabado. No todo aquı́ se aviene tan fácilmente al sentido
común, pues la firma desafiante podrı́a pensar lo siguiente: “Yo juego No entrar porque es
mi respuesta óptima a la jugada prevista Guerra de precios de la firma incumbente, pero
la firma incumbente anuncia Guerra de precios porque si yo juego No entrar no tendrá que
ejecutarla con lo cual la Guerra de Precios sı́ es respuesta óptima a No entrar. Sin embar-
go, si yo jugara Entrar no le convendrı́a ejecutar la jugada anunciada Guerra de Precios,
pues obtendrı́a un pago nulo en lugar de un pago $5. En conclusión, la jugada anunciada
Guerra de precios sólo le conviene si no tiene que ejecutarla, por lo que ese anuncio no
tiene verdadera credibilidad, o lo que es lo mismo, la estrategia Guerra de Precios es una
amenaza no creı́ble”.

Otro modo de describir esa caracterı́stica intuitivamente insatisfactoria del EN s0 ∗=(No en-
trar, Guerra de Precios) es decir que hay una cierta incoherencia entre el juicio que merece
s0∗ al analizarlo desde la perspectiva del juego global y el juicio que merece al analizarlo
desde la perspectiva de un momento particular del juego. En efecto, Competir duro es una
respuesta óptima de la firma incumbente a No entrar desde la perspectiva del juego global,
pero no lo es si nos situamos en el nodo de decisión en que la firma incumbente le toca
jugar. Ası́ pues, hay dos EN en estrategias puras pero sólo uno de ellos, s∗ , parece plena-
mente satisfactorio. Luego, s∗ =(Entrar, Competir ) es un Equilibrio de Nash Perfecto
en Subjuegos o EPS para abreviar.

c. Considere la siguiente situación: la entrada de la firma desafiante obligarı́a a ambas firmas,


como única manera de subsistir, a diferenciar sus productos adaptándolo a la versión A y/o
B. En concreto, supongamos que ambas empresas han de decidir simultáneamente en qué
especializarse, sabiendo que los pagos serán los siguientes: si ambas empresas seleccionan
la mismo especialización se ven abocadas a unas pérdidas de $2 millones si es A y de $1

94
millón si es B, mientras que si seleccionan especializaciones diferentes, la empresa entrante
obtiene beneficios de $4 con A o beneficios de $1 con B, y la firma incumbente obtiene unos
beneficios de $4 y $2 millones respectivamente. Represente este juego en su forma extensiva.

Respuesta:

Desafiante

No entrar Entrar

Incumbente

3, 7

A B

A B A B

-2, -2 1, 4 4, 2 -1, -1

d. Identifique los nodos, los conjunto de información y las estrategias de este juego.

Respuesta:

Hay 4 nodos de decisión, que forman tres conjuntos de información, dos de ellos unita-
rios, y hay 5 desarrollos posibles. La empresa entrante tiene 4 estrategias puras, que son
Entrar − A; Entrar − B; N o Entrar − A y N o Entrar − B, mientras que la firma incum-
bente tiene sólo 2 estrategias puras, A y B.

e. Represente este juego en forma normal.

Respuesta:

f. Encuentre el o los equilibrios de Nash

Respuesta:

Los EN en estrategias puras son [(Entrar, A), B], [(No entrar, A), A] y [(No entrar, B), A].

95
Incumbente
A B
(Entrar, A) -2, -2 4, 2
(Entrar, B) 1, 4 4, 2
Entrante
(No entrar, A) 3, 7 3, 7
(No entrar, B) 3, 7 3, 7

48. Dos prisioneros interactuan 2 veces consecutivas en el dilema del prisionero. Se supone que al
comenzar cada una de ellas es de dominio público cómo han jugado ambos jugadores en las
etapas anteriores, pero los jugadores no conocen la decisión del otro prisionero en el tiempo
contemporáneo. Los pagos finales del juego se calculan sumando los pagos correspondientes a
las distintas etapas. Para ello, considere la siguiente matriz de pagos.

Jugador 2
Confesar Callar
Confesar 1, 1 5, 0
Jugador 1
Callar 0, 5 4, 4

a. Represente este juego en su forma extensiva.

Respuesta:


 
 
   
   

       

       
               

             
             

b. Identifique los nodos de este juego, los desarrollos posibles y el conjunto de información
para cada jugador.

Respuesta:

En el dilema del prisionero repetido 2 veces, J1 tiene 5 conjuntos de información, todos


unitarios, y J2 tiene otros 5, todos binarios. En cualquiera de los anteriores conjuntos de in-

96
formación, las opciones factibles son Confesar y Callar, y por tanto ambos jugadores tienen
25 estrategias puras y el número de perfiles es 210 . Hay 24 = 16 nodos terminales, y por tanto
16 trayectorias o desarrollos posibles del juego, pero sólo hay 9 resultados finales en cuanto a
pagos se refiere, pues algunos de los 16 desarrollos conducen a los mismos vectores de pagos.
Por ejemplo, los desarrollos Conf esar → Conf esar → Conf esar → Callar y Conf esar →
Callar → Conf esar → Conf esar conducen al vector de pagos (6, 1). Merece la pena resal-
tar que el número total de perfiles estratégicos (210 ) es mayor que el número total de desa-
rrollos posibles del juego (24 ). Efectivamente, puesto que este juego no tiene jugadas de azar,
cada perfil estratégico determina uno y sólo un desarrollo del juego, pero puede ocurrir, y ası́
ocurre en este caso, que varios perfiles distintos determinen el mismo desarrollo. Por ejemplo,
los perfiles (Confesar-Confesar-Confesar-Confesar-Confesar, Confesar-Confesar-Confesar-
Confesar-Confesar ) y (Confesar-Confesar-Confesar-Confesar-Callar, Confesar-Confesar-
Confesar-Confesar-Callar ) determinan ambos el desarrollo Conf esar → Conf esar →
Conf esar → Conf esar.

49. Considere las siguientes matrices de pagos.

Jugador 2 Jugador 2
I M D I M D
A 1, 3, 0 -1, 2, 3 -1, 0, -2 A 0, 2, -1 4, 3, 2 1, 2, 0
Jugador 1 Jugador 1
B 2, 1, 1 4, 1, 3 0, 0, 1 B 2, -2, 5 5, 5, 2 4, 6, 4
Jugador 3 juega X Jugador 3 juega Y

a. Represente este juego en su forma extensiva.

Respuesta:


 
 

     
     
           

           
           
           

97
6.7. Juegos Repetidos al Infinito

50. Suponga que en un mercado existen dos firmas iguales, dichas firmas compiten en cantidades,
pero ellas creen que podrı́an estar mejor si se coluden, para lo cual, cada firma establece la
siguiente estrategia: una firma va a decidir cooperar en el periodo t siempre y cuando la otra
firma haya decidido cooperar en el periodo t - 1, en caso de que la otra firma no haya cooperado
(se desvı́e del acuerdo) en el periodo t - 1, la firma jugará para siempre la cantidad de competencia
en cantidades. Las firmas enfrentan una función de demanda de P = A − Q, donde Q = Σqi . El
costo marginal de cada firma es constante e iguala Cmg = c.

a. Encuentre las cantidades de producción individual de cada firma y sus beneficios cuando
compiten.
Respuesta:

La maximización de beneficios de la firma i viene dada por,

πi = P × qi − Cmg × qi

πi = (A − qi − qj )qi − cqi
∂π
= A − 2qi − qj − c = 0
∂qi
La función de reacción, o función de mejor respuesta es,
A − C − qj
qi (qj ) =
2
Al interceptar las funciones de reacción de las empresas se encuentra la cantidad óptima de
competencia,
A−c
qi =
3
Luego, el beneficio de la firma i viene dado por
 A − c 2
πic =
3

b. Encuentre las cantidades de producción individual de cada firma y sus beneficios cuando
se coluden.
Respuesta:

Al maximizar los beneficios de forma conjunta, en una colusión, las firmas actúan como si
fueran un monopolio y luego se reparten el mercado en dos. Esto es,

πi = P × Q − Cmg × Q

πi = (A − Q)Q − cQ

98
∂π
= A − 2Q − c = 0
∂Q
A−c
Q=
2
Luego, cada empresa produce la mitad de lo que producirı́a un monopolio.
Q A−c
qi = =
2 4
El beneficio de cada firma viene dado por,
1  A − c 2
πim =
2 2

c. Encuentre las cantidades de producción individual de cada firma y sus beneficios cuando
una firma coopera y la otra se desvı́a del acuerdo.
Respuesta:

• La firma que coopera, es decir, que se mantiene en el acuerdo y no se desvı́a sigue


produciendo la cantidad de monopolio divida en dos qjnd = A−c
4 y obtiene beneficios
 2
por πind = 32 A−c
4 .

• La firma que se desvı́a elige un qid que maximiza su beneficio de forma que πid (qid , qjnd .

A − c 1 nd
qid = − qj
2 2
A − c 1 A − c
qid = −
2 2 4
Luego,
3
qid = (A − c)
8
y su beneficio es,
h3 i2
πid = (A − c)
8
d. Plantee la matriz de pagos para un solo periodo, indique qué tipo de juego es éste y en-
cuentre el equilibrio de Nash del mismo (si es que existe).
Respuesta:

Firma 2
Cooperar Desviarse
Firma 1 Cooperar πm , πm π nd , π d
Desviarse π d , π nd πc , πc

De forma tal que π nd < π c < π m < π d . Cómo este juego sólo se repite una vez, el equilibrio
de Nash de este juego es {Desviarse, Desviarse}, es decir, las empresas compiten a la
Cournot.

99
e. Explique conceptualmente qué pasa en este mercado si las firmas compiten por 100 perio-
dos.
Respuesta:

Dado que el juego es un dilema del prisionero y el EN es {Desviarse, Desviarse}, cuando


un juego es repetido un número infinito de veces, este resultado se va repitiendo en cada
periodo. Esto se debe a que (y a pesar de que el resultado conjunto más beneficioso es que
ambos cooperen), existirı́a un incentivo a cooperar en 99 periodos y desviarse en el periodo
100, la otra firma trata de anticipar esto y buscarı́a desviarse en el periodo 99 (un periodo
antes de su rival), y ası́ suvesivamente, al tratar de anticipar el desvı́o del otro termina
repitiéndose el equilibrio del Stage Game en cada periodo.

f. Determine si, dadas las estrategias de las firmas, existe un equilibrio de Nash perfecto en
subjuegos cuando compiten por infinitos periodos y la tasa de descuento temporal de las
1
firmas es δ = 0, 6. Donde δ = 1+r .
Respuesta:

La estrategia planteada es una estrategia severa, pues cuando existe un desvı́o se acaba
la posibilidad de cooperación para siempre, por lo cual, aunque existen infinitos casos
diferentes (pues la competencia es por infinitos periodos), solo dos casos son relevantes de
analizar.
• Cuando se coopera en todos los periodos.
• Cuando una firma se desvı́a en el primer periodo (todos los demás casos, i.e. coopera-
ción por n periodos y desvı́o en el periodo n+1 son análogos a este).

El beneficio que tendrı́a cada firma si ambas se mantienen en el acuerdo colusivo es,

Etapa t t+1 t+2 t+3 ∞


Acción de Fi qind qind qind qind
Perfil de la etapa (qind , qjnd ) (qind , qjnd ) (qind , qjnd ) (qind , qjnd )
Beneficios de la Fi πind δ πind δ 2 πind δ 3 πind

Luego, el valor presente del beneficio, dado un factor de descuento δ, viene dado por,

X
V P Πnd
i = δ t−1 πind
t=1


X 
V P Πnd
i = δ t−1 πind
t=1
1
V P Πnd
i = π nd
1−δ i

100
1 3  A − c 2
V P Πnd
i = ×
1−δ 2 4
Cuando una firma se desvı́a en el primer periodo, obtiene el siguiente beneficio,

Etapa t t+1 t+2 t+3 ∞


Acción de Fi qid qic qic qic
Perfil de la etapa (qid , qjnd ) (qic , qjc ) (qic , qjc ) (qic , qjc )
Beneficios de la Fi πid δ πic δ 2 πind δ 3 πind

Luego, el valor presente del beneficio de la firma i, viene dado por,



X
V P Πdi = πid + δ t−1 πic
t=2


X 
V P Πdi = πid + πic δ t−1
t=2
h3 i2 δ  A − c 2
V P Πdi = (A − c) + ×
8 1−δ 3
Por tanto, la colusión será un Equilibrio de Nash Perfecto en Subjuego si y sólo si,

V P Πnd d
i > Πi
1 δ
πind × > πid + πic ×
1−δ 1−δ
1  A − c 2 h 3 i2 1  A − c 2
> (A − c) (1 − δ) + δ
2 2 8 9 3
1 9 1
(A − c)2 > (A − c)2 (1 − δ) + δ (A − c)2
8 64 9
1 9 1
> (1 − δ) + δ
8 64 9
Mı́nimo común multiplo: 576
71 > 81 − 81δ + 64δ

Luego,
9
δ>
17
Como el factor de descuento encontrado
9
δ>
17
es menor al factor de descuento dado

δ = 0, 6

podemos asegurar que la colusión será un Equilibrio de Nash Perfecto en Subjuego.

101
g. Explique conceptualmente lo obtenido en (f.) y compare con lo obtenido en (e.).
Respuesta:

Ambos casos, son casos de juegos repetidos, sin embargo la gran diferencia es que el caso
(e.) es un juego repetido finito y el caso (f.) es repetido de forma infinita. Esto hace que el
comportamiento que ocurre en (e) no pueda darse (nos referimos al incentivo a desviarse
en el último periodo), pues a pesar de ser exactamente el mismo juego, al no tener un
fin (o lo que podrı́a ser análogo, las firmas no conocen cuando serı́a el fin del juego), no
pueden desviarse en el “último periodo”. Esto, permite la posibilidad (pero no la certeza),
de lograr acuerdos cooperativos cuando en un juego finito no podrı́an darse. Que exista
la cooperación dependerı́a de varios factores, entre ellos el factor de descuento δ, es decir,
la ponderación que se le da a los pagos futuros. Mientras más alta la ponderación, más
probable serı́a que ocurra un acuerdo colusivo, pues el costo de desviarse se ve en el futuro,
por ende si el futuro tiene un “peso importante”para mi, es más probable lograr un acuerdo,
y viceversa.

51. Comúnmente personas que ocupan cargos de cierta responsabilidad dentro de las empresas re-
ciben un salario superior al salario promedio del mercado. Una posible razón para pagar estos
salarios es otorgar mayores incentivos que eviten que los trabajadores pongan menos esfuerzo del
esperado. Para ver como operan estos incentivos, suponga que una empresa ofrece un salario $w
por periodo. El beneficio (utilidad) del trabajador (por periodo) es U = salario - esfuerzo. En
cada periodo el trabajador debe escoger si se esfuerza o no. Esforzarse tiene un costo de $1 (por
periodo) para el trabajador, mientras que no esforzarse cuesta $0. Si durante algún periodo el
trabajador decide no esforzarse, la empresa lo despide con probabilidad 1 al final de ese periodo.
Si el trabajador es despedido su salario (en alguna otra empresa) es $1 (el trabajador no debe
esforzarse en este trabajo alternativo por lo que su beneficio es U = 1 si es despedido). Suponga
que la relación contractual puede durar indefinidamente. El factor de descuento usado por el
trabajador para descontar flujos futuros es δ ∈ (0, 1).

a. Qué condiciones sobre δ deben ser ciertas para que el trabajador decida esforzarse en cada
periodo?
Respuesta:

Si el trabajador se esfuerza en cada periodo:

Etapa t t+1 t+2 t+3 ∞


Beneficios del trabajador (w - 1) δ(w - 1) δ 2 (w
- 1) δ 3 (w
- 1) ...

Luego, su pago será:


w−1
Ui =
1−δ
Si el trabajador decide no esforzarse en el periodo t:
Luego, para que el trabajador se esfuerce en cada periodo se debe cumplir que el Valor
Presente de esforzarse debe ser mayor o igual que el Valor presente de no esforzarse

102
Etapa t t+1 t+2 t+3 ∞
Beneficios del trabajador w δ (1) δ 2 (1) δ 3 (1) ...

w−1 δ
≥w+
1−δ 1−δ
b. Suponga que δ = 12 . Cuál es el menor valor de w (salario de eficiencia) que la empresa debe
pagar para incentivar al trabajador a esforzarse?
Respuesta:

Si δ = 12 , entonces w∗ que hace que la anterior desigualdad se cumpla con igualdad es:

1
w∗ − 1 ∗ 2
= w +
1 − 21 1− 1
2

2w∗ − 2 = w∗ + 1

w∗ = 3

c. Suponga que un trabajador que actualmente gana el “salario de mercado”(esto es $1) se


acerca a la empresa que paga el salario de eficiencia calculado en (b) y ofrece trabajar por
menos. ¿Contratarı́a la empresa a este trabajador? ¿por qué?
Respuesta:

No. Si la empresa accede a contratar al trabajador por menos de w = $3 el trabajador


tendrı́a incentivos a no esforzarse.

52. Considere una firma que produce un bien cuya calidad puede ser calidad alta o baja, q ∈ (qb ; qa ).
Los consumidores no pueden observar la calidad antes de comprar el bien. La utilidad de los
consumidores depende de la calidad del bien consumido. Si el bien consumido es de calidad alta,
entonces el consumidor obtiene una utilidad de U = s̄ − p, donde s̄ es una constante y p es el
precio pagado por el bien. Si el bien resulta ser de calidad baja entonces la utilidad obtenida
por el consumidor es U = −p. El costo para la firma de producir bienes de alta calidad es c,
mientras que producir bienes de baja calidad tiene un costo igual a 0, por lo que el pago de la
firma es π = p − c si produce un bien de alta calidad, y π = p si produce uno de baja calidad.
Además es de conocimiento común que s̄, c y δ satisfacen δs̄ > c.

a. Suponga que la firma y los consumidores interactúan por una única vez. Muestre que el
único equilibrio de Nash es aquel en el cual la firma produce bienes de baja calidad y los
consumidores no compran nada.
Respuesta:

103
Cómo los jugadores interactúan sólo una vez, y el conjunto de estrategias es acotado, el
juego se puede representar en forma normal. Los jugadores son la Firma y el Consumidor;
las acciones de la firma son {producir alta calidad; producir baja calidad} y las acciones
del consumidor son {comprar; no comprar}.

Consumidor
Comprar No Comprar
Alta p − c , s̄ − p −c, 0
Firma
Baja p, −p 0, 0

Claramente, producir Baja Calidad es una estrategia dominante para la firma. Como p > 0,
lo mejor que puede hacer el consumidor es este caso no comprar, por lo que el único equi-
librio de Nash es aquel en que la firma produce Baja Calidad y el consumidor No Compra.

b. Suponga ahora que la firma y los consumidores interactúan de forma infinita. Considere la
siguiente estrategia para los consumidores: (i) comenzar comprando el bien en el periodo
t=1. En t ≥ 2, comprar si en el pasado la firma siempre ha producido bienes de alta calidad
y no comprar si en algún periodo pasado la firma ha producido bienes de baja calidad. Su-
ponga además que los consumidores utilizan un factor δ para descontar sus pagos futuros y
que el precio cobrado por el bien es el mismo en todos los periodos. Determine el precio p
que permite que producir bienes de alta calidad por parte de la firma y seguir la estrategia
antes descrita por parte de los consumidores es un equilibrio perfecto en subjuegos.
Respuesta:

De la respuesta en la parte (a) se deduce inmediatamente que no comprar y producir bienes


de baja calidad es el único equilibrio de Nash en cualquier subjuego que siga a una historia
en la que la firma, en algún periodo pasado, ha producido baja calidad. Por lo tanto,
considere un subjuego que sigue a una historia en la que la firma siempre ha producido alta
calidad en el pasado. Si la firma produce alta calidad y el consumidor sigue su estrategia,
el pago para el consumidor es:

V P U ∗ = (s̄ − p) + δ(s̄ − p) + δ 2 (s̄ − p) + ...


(s̄ − p)
V P U∗ =
1−δ

Donde V P U es el Valor Presente de la Utilidad del consumidor.

Si el consumidor se desvı́a, su pago será:

V P U d = 0 + δ(s̄ − p) + δ 2 (s̄ − p) + ...


 s̄ − p 
V P Ud = δ
1−δ

104
Si V P U ∗ > V P U d , entonce el consumidor no tiene incentivos unilaterales a desviarse.

Analicemos ahora el comportamiento de la firma:

V P π ∗ = (p − c) + δ(p − c) + δ 2 (p − c) + ...

(p − c)
V P π∗ =
1−δ
Donde V P π es el Valor Presente de los beneficios de la firma (π).

Si la firma se desvı́a:

V P π d = p + δ0 + δ 2 0 + ...

V P πd = p

Los consumidores dejan de comprar una vez que han descubierto que el bien es de baja
calidad. Luego, la firma no tendrá incentivos unilaterales a desviarse si π ∗ ≥ π d , esto es, si:

(p − c)
≥p
1−δ
Por lo que el precio debe satisfacer que δp ≥ c, o bien, p ≥ δc .

53. Considere un duopolio de Bertrand puro. El costo marginal y medio de cada firma es de $1, y
la demanda de mercado es Q = 210 − 3P .

a. Las empresas se coluden para cooperar y fijan un precio de monopolio. Cuál es el factor de
descuento que al menos deberı́an tener las firmas para que la cooperación sea un equilibrio
perfecto en subjuegos.
Respuesta:

1 δ
πicooperar > πidesviarse
1−δ 1−δ
213 207
PM = 6 ; QM = 2 ; π M = 3,570, 75

πM
π cooperar = 2 = 1,785, 375

π desviarse = π cooperar × 2 = π M = 3,570, 75

1 δ
1,785, 375 × > 3,750, 75 + 0 ×
1−δ 1−δ
1
δ cooperar >
2

105
b. Suponga ahora que por algún motivo, la firma 1 tiene una participación de mercado, s,
mayor que la participación de mercado de la firma 2 (1-s). Qué pasa con los incentivos a
cooperar en la medida que las firmas son diferentes.
Respuesta:

A mayor tasa de descuento (δ) es más difı́cil sostener la colusión.


1 δ1
Para F1 : s × π M × 1−δ1 > piM + 0 × 1−δ1

δ1 > 1 − s

1 δ2
Para F2 : (1 − s) × π M × 1−δ2 > piM + 0 × 1−δ2

δ2 > s

6.8. Juegos con Información Incompleta

54. Considere el dilema del prisionero donde los jugadores sólo interactúan una vez, pero con una
modificación que sólo afecta al caso en que ambos jugadores realizan su acción Callar. Supon-
gamos que a las consecuencias ya conocidas de dichas acciones, según las cuales a ambos presos
se les va a aplicar la pena correspondiente a un delito menor, y que se traduce en un vector
de pagos (4, 4), se añade la posibilidad, real aunque improbable, de que tampoco esté probado
el delito menor, en cuyo caso serı́an puestos en libertad por falta de pruebas. En caso de que
ambos jugadores decidan Callar, a continuación tiene lugar una jugada de azar de cuyo resultado
dependerán los pagos. Concretando, supongamos que el vector de pagos sea el habitual (4, 4)
con probabilidad conocida p = 2/3, y que sea (10, 10) con probabilidad 1 − p = 1/3. Si ambos
jugadores se delatan, el vector de pagos es (1, 1). Si el jugador 1 delata y el jugador 2 calla, el
vector de pagos es (5, 0). Si el jugador 1 calla y el jugador 2 delata, el vector de pagos es (0, 5).

a. Represente este juego en su forma extensiva.


Respuesta:
b. Determine la utilidad esperada de cada jugador en el resultado {Callar, Callar}
Respuesta:

1 2
E[U1 (C, C)] = 10 + 4 = 6
3 3
1 2
E[U2 (C, C)] = 10 + 4 = 6
3 3
c. Represente este juego en su forma extensiva incorporando el resultado de la utilidad espe-
rada en el nodo terminal.
Respuesta:

106
d. Represente este juego en su forma normal y encuentre todos los equilibrios de Nash.
Respuesta:
Este juego tiene dos equilibrios de Nash en estrategias puras, (Confesar, Confesar) y (Ca-
llar, Callar ), y uno en estrategias mixtas.

55. Considere el siguiente juego donde las condiciones económicas son desconocidas para los juga-
dores y pueden ser fuerte (F) con probabilidad 1/2 o débil (D) con probabilidad 1/2. Comienza
ENTRON. Si juega No entrar se acaba el juego con el vector de pagos (3, 7) o (1, 3), y si juega
Entrar le tocará el turno a INCUMBRON, que podrá Competir duro, lo que resulta en el vector
de pagos (0, 0) o (-4, -2), o Competir suave con los vectores de pagos (5, 5) y (3, 3).

a. Represente este juego en su forma extensiva.


Respuesta:

107
Jugador 2
Callar Confesar
Callar 6, 6 0, 5
Jugador 1
Confesar 5, 0 1, 1

b. Determine la utilidad esperada de cada jugador y represente el juego en su forma extensiva.


Respuesta:

Si ENTRON juega No Entrar :


1 1
E[UE ] = 3 + 1 = 2
2 2
1 1
E[UI ] = 7 + 3 = 5
2 2
Si ENTRON juega Entrar e INCUMBRON juega Competir duro
1 1
E[UE ] = 0 + (−4) = −2
2 2
1 1
E[UI ] = 0 + (−2) = −1
2 2
Si ENTRON juega Entrar e INCUMBRON juega Competir suave
1 1
E[UE ] = 5 + 3 = 4
2 2
1 1
E[UI ] = 5 + 3 = 4
2 2
Luego,

108
c. Encuentre el Equilibrio de Nash Perfecto en Subjuegos.
Respuesta:
ENPS = {(Entrar, Competir suave)}

56. Volvamos al ejercicio 1 del Dilema del Prisionero, pero esta vez se produce una jugada al azar
que tiene lugar al inicio del juego y sólo el jugador 1 observa su resultado, mientras que el
jugador 2 sólo conoce las probabilidades que gobiernan dicha jugada (tras Callar-Callar, pagos
de 4 con probabilidad 2/3 y pagos de 10 con probabilidad 1/3, en este caso). Ambos comparten
el conocimiento de que el jugador 1 observará dicho resultado.

a. Represente este juego en su forma extensiva.


Respuesta:

b. Represente este juego en su forma normal.


Respuesta:
Este juego es estático en cuanto a que las acciones de los jugadores pueden considerarse
simultáneas, pero la jugada inicial del azar, hace que exista asimetrı́a en la información.

109
Otro modo de describir la situación serı́a decir que se va a jugar un juego estático de dos
jugadores, donde ambos tienen las acciones factibles Confesar y Callar, que ese juego va a
ser o bien el dilema del prisionero, cuya forma normal es:

Jugador 2
Callar Confesar
Callar 4, 4 0, 5
Jugador 1
Confesar 5, 0 1, 1

o bien,

Jugador 2
Callar Confesar
Callar 10, 10 0, 5
Jugador 1
Confesar 5, 0 1, 1

57. Suponga dos firmas que compiten en cantidades donde i = {1, 2}. La demanda inversa del mer-
cado es P (Q) = A − Q. Suponga que la firma 1 tiene un costo marginal conocido por ambas
firmas de Cmg1 = c. En cambio, la firma 2 tiene información privada sobre su costo, el cual
puede ser alto (ca ) o bajo (cb ). Concretamente, supondremos que la firma 1 sólo sabe que con
probabilidad α se trata de una firma con costo alto y con probabilidad (1 − α), de costo bajo.
La firma 2 conoce su costo, y además sabe que la firma 1 va a producir q1∗ . Encuentre los valores
de equilibrio para este mercado.

La función objetivo de la firma 2 es:


Si Cmg2 = ca ;
M ax πa = (A − q1 − q2 )q2 − ca q2

Si Cmg2 = cb ;
M ax πb = (A − q1 − q2 )q2 − cb q2

Luego,
∂πa
= A − q1 − 2q2 − ca = 0
∂q2
A − q1 − ca
q2 (ca ) =
2
O bien,
∂πb
= A − q1 − 2q2 − cba = 0
∂q2
A − q1 − cb
q2 (cb ) =
2
La firma 1 no conoce la estructura de costos de la firma 2, pero sabe que puede ser Ca o Cb ,
y asigna una probabilidad de ocurrencia a cada uno. Luego, la estrategias óptima de la firma
1, dada ciertas cantidades q2 (ca ) y q2 (cb ) fijas, es maximizar su ganancia esperada. Esto es, la

110
función objetivo debe tomar en cuenta la incertidumbre que tienen los jugadores respecto a las
caracterı́sticas de los otros jugadores.

M ax π1 = α{[A − q1 − q2 (ca )]q1 − cq1 } + (1 − α){[A − q1 − q2 (cb )]q1 − cq1 }

La condición de primer orden viene dada por,


∂π1
= α[A − 2q1 − q2 (ca ) − c] + (1 − α)[A − 2q1 − q2 (cb ) − c] = 0
∂q1
Luego, la función de reacción de la firma 1 a la firma 2 considerando cada caso en que se puede
encontrar la firma 1 frente a la firma 2.
α[A − q2 (ca ) − c] + (1 − α)[A − q2 (cb ) − c]
q1 =
2
La función objetivo toma en cuenta la incertidumbre que tiene la firma 1 respecto a la firma 2.

Luego, encontrar el equilibrio del juego se reduce a calcular el perfil de estratégicas en el cual
las funciones de reacción se interceptan. Esto es, hallar q1∗ , q2∗ (ca ) y q2∗ (cb ).

1n h  A − q − c i h  A − q − c io
1 a 1 b
q1∗ = α A−c− + (1 − α) A − c −
2 2 2
Luego,
A − 2c + αca + (1 − α)cb
q1∗ =
3

Luego, debemos reemplazar q1 en q2 (ca ) y q2 (cb )

A − ca − q1
q2∗ (ca ) =
2
A − ca 1  A − 2c − αca − cb (1 − α) 
q2∗ (ca ) = −
2 2 3
Luego, q2∗ (ca ) es,
A − 2ca + c (1 − α)(ca − cb )
q2∗ (ca ) = +
3 6

Finalmente, para hallar q2∗ (cb ), debemos reemplazar q1∗ en q2 (cb )

A − cb − q1
q2cb =
2
A − cb 1 A − 2c + αca − cb (1 − α) i
h
q2∗ (cb ) = −
2 2 3
Por tanto,
A − 2cb + c (ca − cb )
q2∗ (cb ) = −α
3 6

111

S-ar putea să vă placă și