Sunteți pe pagina 1din 20

An Introduction to Applicable Game Theory

Robert Gibbons
La teoría de juegos es rampante en economía. Habiendo invadido hace mucho tiempo la
organización industrial, el modelado teórico de juegos es ahora común en las finanzas
internacionales, laborales, macro y públicas, y está cobrando fuerza en el desarrollo y la historia
económica. Tampoco la economía por sí sola: contabilidad, finanzas, derecho, mercadotecnia,
ciencias políticas y sociología están comenzando experiencias similares. Muchos modeladores usan
la teoría de juegos porque les permite pensar como un economista cuando la teoría de los precios
no se aplica. Es decir, los modelos de teoría de juegos permiten a los economistas estudiar las
implicaciones de la racionalidad, el interés propio y el equilibrio, tanto en las interacciones de
mercado que se modelan como juegos (como donde están presentes números pequeños,
información oculta, acciones ocultas o contratos incompletos) y en interacciones no comerciales
(como entre un regulador y una empresa, un jefe y un trabajador, etc.).

Muchos economistas aplicados parecen apreciar que la teoría de juegos puede complementar la
teoría de precios de esta manera, pero no obstante encuentran que la teoría de juegos es más una
barrera de entrada que una herramienta útil. Este documento está dirigido a dichos lectores. Trato
de dar definiciones claras y ejemplos intuitivos de los tipos básicos de juegos y los conceptos básicos
de solución. Quizás lo más importante es que trato de destilar el conjunto de conceptos de solución
y otras jergas en algunos principios básicos que impregnan la literatura. Por lo tanto, imagino este
artículo como un tutorial para economistas que se han enfrentado a la teoría de juegos pero que
(todavía) no han leído un libro sobre el tema.

La teoría se presenta en cuatro secciones, correspondientes a si el juego en cuestión es estático o


dinámico y si tiene información completa o incompleta. ("Información completa" significa que no
hay información privada: el tiempo, los movimientos factibles y los pagos del juego son de
conocimiento común). Comenzamos con juegos estáticos con información completa; Para estos
juegos, nos centramos en el equilibrio de Nash como el concepto de solución. Pasamos a los juegos
dinámicos con información completa, para lo cual utilizamos la inducción hacia atrás como concepto
de solución. Discutimos juegos dinámicos con información completa que tienen múltiples equilibrios
de Nash, y mostramos cómo la inducción hacia atrás selecciona un equilibrio de Nash que no se basa
en amenazas no creíbles. Luego volvemos al contexto de los juegos estáticos e introducimos
información privada; para estos juegos, ampliamos el concepto de equilibrio de Nash para permitir
la información privada y llamamos al concepto de solución resultante equilibrio de Nash Bayesiano.
Finalmente, consideramos los juegos de señalización (los juegos dinámicos más simples con
información privada) y combinamos las ideas de inducción hacia atrás y el equilibrio bayesiano de
Nash para definir el equilibrio bayesiano perfecto.

Puede parecer que este esquema sugiere que la teoría de juegos invoca un nuevo concepto de
equilibrio para cada nueva clase de juegos, pero un tema de este artículo es que estos conceptos de
equilibrio están muy estrechamente vinculados. A medida que consideramos juegos
progresivamente más ricos, fortalecemos progresivamente el concepto de equilibrio para descartar
equilibrios inverosímiles en los juegos más ricos que sobrevivirían si aplicamos conceptos de
equilibrio adecuados para juegos más simples. En cada caso, el concepto de equilibrio más fuerte
difiere del concepto más débil solo para los juegos más ricos, no para los juegos más simples.
Las limitaciones de espacio me impiden presentar otra cosa que no sea la teoría básica. Omito varias
extensiones naturales de la teoría; Solo insinuo la gran variedad de aplicaciones en economía; No
digo nada sobre el creciente cuerpo de campo y la evidencia experimental; y no discuto aplicaciones
recientes fuera de la economía, incluidos los fascinantes esfuerzos para integrar la teoría de juegos
con elementos conductuales y socio-estructurales de otras ciencias sociales. Para concluir el
documento, por lo tanto, ofrezco una breve guía para lecturas adicionales.

Juegos estáticos con información completa

Comenzamos con juegos de movimiento simultáneo para dos jugadores (todo lo que hacemos para
juegos de dos jugadores se extiende fácilmente a tres o más jugadores; consideramos los juegos de
movimiento secuencial a continuación). El momento de tal juego es el siguiente:

1) El jugador 1 elige una acción a, de un conjunto de acciones factibles A1. Simultáneamente, el


jugador 2 elige una acción a2 de un conjunto de acciones factibles A2.

2) Después de que los jugadores eligen sus acciones, reciben pagos: u1 (a1, a2) para el jugador 1 y u2
(a1, a2) para el jugador 2.

Figura 1
Un ejemplo de eliminación iterada de estrategias dominadas

Un ejemplo clásico de un juego estático con información completa es el modelo de duopolio de


Cournot (1838). Otros ejemplos incluyen el modelo de opciones de plataforma de candidatos de
Hotelling (1929) en una elección, el modelo de arbitraje de oferta final de Farber (1980) y el modelo
de ofertas de adquisición de Grossman y Hart (1980).

Juego racional

En lugar de preguntar cómo se debe jugar un juego determinado, primero preguntamos cómo no
se debe jugar el juego. Considere el juego en la Figura 1. El jugador 1 tiene dos acciones, {Up, DownJ;
el jugador 2 tiene tres, {Izquierda, Medio, DerechaJ. Para el jugador 2, jugar a la derecha está
dominado por jugar al medio: si el jugador 1 elige Arriba, entonces la derecha rinde 1 para el jugador
2, mientras que el medio rinde 2; si 1 elige Down, entonces Right produce 0 para 2, mientras que
Middle produce 1. Por lo tanto, un jugador racional 2 no jugará Right.

Ahora lleva el argumento un paso más allá. Si el jugador 1 sabe que el jugador 2 es racional, entonces
el jugador 1 puede eliminar Derecha del espacio de acción del jugador 2. Es decir, si el jugador 1
sabe que el jugador 2 es racional, entonces el jugador 1 puede jugar el juego como si los únicos
movimientos del jugador 2 fueran Izquierda y Medio. Pero en este caso, Down está dominado por
Up para el jugador 1: si 2 juega a la izquierda, entonces Up es mejor para 1, y del mismo modo si 2
juega al medio. Por lo tanto, si el jugador 1 es racional (y el jugador 1 sabe que el jugador 2 es
racional, de modo que los únicos movimientos del jugador 2 son Izquierda y Medio), entonces el
jugador 1 no jugará Abajo.

Finalmente, tome el argumento un último paso. Si el jugador 2 sabe que el jugador 1 es racional, y
el jugador 2 sabe que el jugador 1 sabe que el jugador 2 es racional, entonces el jugador 2 puede
eliminar Abajo del espacio de acción del jugador 1, dejando Arriba como único movimiento del
jugador 1. Pero en este caso, Left está dominado por Middle para el jugador 2, dejando (Up, Middle)
como la solución del juego.

Este argumento muestra que algunos juegos se pueden resolver preguntando (repetidamente)
cómo no se debe jugar el juego. Este proceso se llama eliminación iterativa de estrategias
dominadas. Aunque se basa en la atractiva idea de que los jugadores racionales no juegan
estrategias dominadas, el proceso tiene dos inconvenientes. Primero, cada paso requiere una
suposición adicional sobre lo que los jugadores saben sobre la racionalidad de los demás. Segundo,
el proceso a menudo produce una predicción muy imprecisa sobre el juego. Considere el juego en
la Figura 2, por ejemplo. En este juego no hay estrategias dominantes para eliminar. Como todas las
estrategias en el juego sobreviven a la eliminación iterativa de las estrategias dominadas, el proceso
no produce predicción alguna sobre el juego. Por lo tanto, preguntar cómo no se debe jugar un
juego a veces no ayuda a determinar cómo se debe jugar.

Pasamos al equilibrio de Nash, un concepto de solución que produce predicciones mucho más
estrictas en una clase muy amplia de juegos. Veremos que cada uno de los dos juegos anteriores
tiene un equilibrio de Nash único. En cualquier juego, las estrategias de los jugadores en un
equilibrio de Nash siempre sobreviven a la eliminación iterativa de las estrategias dominadas; en
particular, veremos que (Arriba, Medio) es el único equilibrio de Nash del juego en la Figura 1.

Equilibrio de Nash

Acabamos de ver que preguntar cómo no se debe jugar un juego determinado puede arrojar algo
de luz sobre cómo se debe jugar. Para introducir el equilibrio de Nash, adoptamos un enfoque
indirecto similar: en lugar de preguntar cuál es la solución de un juego determinado (es decir, qué
deberían hacer todos los jugadores), preguntamos qué resultados no pueden ser la solución.
Después de eliminar algunos resultados, nos quedan una o más soluciones posibles. Luego
discutimos cuál de estas posibles soluciones, si hay alguna, merece más atención. También
consideramos la posibilidad de que el juego no tenga una solución convincente.

Supongamos que la teoría de juegos ofrece una predicción única sobre el juego de un juego en
particular. Para que esta solución prevista sea correcta, es necesario que cada jugador esté
dispuesto a elegir la estrategia que la teoría predice que jugará el individuo. Por lo tanto, la
estrategia prevista de cada jugador debe ser la mejor respuesta de ese jugador a las estrategias
predichas de los otros jugadores. Tal conjunto de estrategias predichas podría llamarse
"estratégicamente estable" o "autoejecutable", porque ningún jugador quiere desviarse de su
estrategia predicha. Llamaremos a tal conjunto de estrategias un equilibrio de Nash.

Para relacionar esta definición con la motivación anterior, suponga que la teoría de juegos ofrece
las acciones (a1*, a2*) como una solución. Decir que (a1*, a2*) no es un equilibrio de Nash equivale
a decir que a1* no es la mejor respuesta para el jugador 1 a a2*, o a2* no es la mejor respuesta para
el jugador 2 a a1*, o ambos. Por lo tanto, si la teoría ofrece las estrategias (a1*, a2*) como la solución,
pero estas estrategias no son un equilibrio de Nash, entonces tienen un incentivo para desviarse de
la predicción de la teoría, por lo que la predicción parece poco probable que sea cierta.

Para ver la definición del equilibrio de Nash en el trabajo, considere los juegos en las Figuras 1 y 2.
Para cinco de los seis pares de estrategias en la Figura 1, al menos un jugador desearía desviarse si
ese par de estrategias se propusiera como la solución al juego. Solo (Arriba, Medio) satisface el
criterio de mejor respuesta mutua del equilibrio de Nash. Del mismo modo, de los nueve pares de
estrategias en la Figura 2, solo (B, R) es "estratégicamente estable" o "autoejecutable". En la Figura
2, sucede que el equilibrio único de Nash es eficiente: produce los pagos más altos en el juego para
ambos jugadores. Sin embargo, en muchos juegos, el equilibrio único de Nash no es eficiente;
considere el dilema de los prisioneros en la figura 3.

Algunos juegos tienen múltiples equilibrios de Nash, como el Juego de citas (o Batalla de los sexos,
en terminología anticuada) que se muestra a continuación en la Figura 4. La historia detrás de este
juego es que Chris y Pat cenarán juntos, pero actualmente están separados. caminos a casa desde
el trabajo. Se supone que Pat debe comprar el vino y Chris el plato principal, pero Pat podría comprar
vino tinto o blanco y Chris bistec o pollo. Tanto Chris como Pat prefieren vino tinto con bistec y
blanco con pollo, pero Chris prefiere la primera combinación a la segunda y Pat al revés; es decir,
los jugadores prefieren coordinarse pero no están de acuerdo sobre cómo hacerlo.5 En este juego,
Red Wine and Steak es un equilibrio de Nash, al igual que White Wine and Chicken, pero no hay una
forma obvia de decidir entre estos equilibrios. Cuando varios equilibrios de Nash son igualmente
convincentes, como en el juego de citas, el equilibrio de Nash pierde gran parte de su atractivo como
predicción del juego. En tales entornos, el equilibrio de Nash (si lo hay) emerge como una
convención puede depender de accidentes de la historia (Young, 1996).
Otros juegos, como Matching Pennies en la Figura 5, no tienen un par de estrategias que satisfagan
la definición mutua de mejor respuesta del equilibrio de Nash dada anteriormente. La característica
distintiva de Matching Pennies es que a cada jugador le gustaría superar al otro. Las versiones de
este juego también surgen en póker, auditoría y otras configuraciones. En el póker, por ejemplo, la
pregunta análoga es con qué frecuencia farolear: si se sabe que el jugador i nunca farolea, entonces
los oponentes de i se doblarán cada vez que haga una oferta agresiva, haciendo que valga la pena
hacerlo en ocasiones; Por otro lado, farolear con demasiada frecuencia también es una estrategia
perdedora. De manera similar, en la auditoría, si un subordinado trabajó diligentemente, el jefe
prefiere no incurrir en el costo de auditar al subordinado, pero si el jefe no va a auditar, el
subordinado prefiere eludir, y así sucesivamente.

En cualquier juego en el que a cada jugador le gustaría superar al otro, no hay un par de estrategias
que satisfagan la definición de equilibrio de Nash dada anteriormente. En cambio, la solución a tal
juego necesariamente implica incertidumbre sobre lo que harán los jugadores. Para modelar esta
incertidumbre, nos referiremos a las acciones en el espacio de acción de un jugador (Ai) como
estrategias puras, y definiremos una estrategia mixta para que sea una distribución de probabilidad
sobre algunas o todas las estrategias puras del jugador. Una estrategia mixta para el jugador i a
veces se describe como el jugador i tirando dados para elegir una estrategia pura, pero más adelante
en el documento ofreceremos una interpretación mucho más plausible basada en la incertidumbre
del jugador j sobre el jugador de estrategia que elegiré. Independientemente de cómo se
interpreten las estrategias mixtas, una vez que se amplíe la definición de equilibrio mutuo de Nash
para permitir estrategias mixtas y puras, cualquier juego con un número finito de jugadores, cada
uno de los cuales tiene un número finito de estrategias puras , tiene un equilibrio de Nash
(posiblemente con estrategias mixtas). Vea el artículo clásico de Nash (1950) para la prueba, basada
en un teorema de punto fijo.
Juegos dinámicos con información completa
Pasamos a los juegos dinámicos, comenzando con los juegos de movimiento secuencial para dos
jugadores. El momento de tal juego es el siguiente:

1) El jugador 1 elige una acción a1, de un conjunto de acciones factibles A1.

2) El jugador 2 observa la elección de 1 y luego elige una acción a2 de un conjunto de acciones


factibles A2.

3) Después de que los jugadores eligen sus acciones, reciben pagos: u1 (a1, a2) para el jugador 1 y u2
(a1, a2) para el jugador 2.

Un ejemplo clásico de un juego dinámico con información completa es la versión de Stackelberg


(1934) del movimiento secuencial del duopolio de Cournot. Otros ejemplos incluyen el modelo de
monopolio-unión de Leontief (1946) y el modelo de negociación de Rubinstein (1982) (aunque este
último puede no terminar después de solo dos movimientos).

El nuevo concepto de solución en esta sección es la inducción hacia atrás. Veremos que en muchos
juegos dinámicos hay muchos equilibrios de Nash, algunos de los cuales dependen de amenazas no
creíbles definidas como amenazas que el amenazador no querría llevar a cabo, pero que no tendrá
que llevar a cabo si se cree la amenaza. La inducción hacia atrás identifica un equilibrio de Nash que
no depende de tales amenazas.

Inducción hacia atrás

Considere el Juego de Confianza en la Figura 6, en el cual el jugador 1 primero elige Confiar o no en


el jugador 2. Por simplicidad, suponga que si el jugador 1 elige No Confiar, entonces el juego termina:
yo termina la relación. Sin embargo, si el jugador 1 elige Confiar en 2, entonces el juego continúa y
2 elige Honrar o Traicionar la confianza de l. Si el jugador 1 decide terminar la relación, los pagos de
ambos jugadores son 0. Si 1 elige Confiar en 2, los pagos de ambos jugadores son 1 si 2 Honra la
confianza de 1, pero el jugador 1 recibe -1 y el jugador 2 recibe 2 si el jugador 2 traiciona la confianza
de 1. Todo esto es capturado por el árbol del juego en el lado izquierdo de la Figura 6. El juego
comienza con un nodo de decisión para el jugador 1 y llega a un nodo de decisión para el jugador 2
si 1 elige Confianza. Al final de cada rama del árbol, la recompensa del jugador l aparece por encima
del jugador 2. Las ramas en negrita en el árbol se explicarán momentáneamente.
Resolvemos el juego de confianza trabajando hacia atrás a través del árbol del juego. Si el jugador 2
se mueve (es decir, si el jugador 1 elige Confianza), entonces 2 puede recibir una recompensa de 1
eligiendo Honrar la confianza de l o una recompensa de 2 eligiendo Traicionar la confianza de l.
Como 2 excede a 1, el jugador 2 traicionará la confianza de l. Sabiendo esto, la elección inicial del
jugador l equivale a terminar la relación (y así recibir un pago de 0) o Confiar en el jugador 2 (y así
recibir un pago de -1, después de que el jugador 2 traicione la confianza de l). Como 0 excede de -1,
el jugador 1 no debe confiar. Estos argumentos se resumen por las líneas en negrita en el árbol del
juego.

Hasta ahora, puede parecer que los juegos de movimientos simultáneos deben representarse en
forma matricial (o "normal"), como en la sección anterior, mientras que los juegos de movimientos
secuenciales deben representarse utilizando árboles de juego. De manera similar, puede parecer
que usamos dos métodos diferentes para resolver estos dos tipos de juegos: equilibrio de Nash en
juegos de movimientos simultáneos e inducción hacia atrás en juegos de movimientos secuenciales.
Estas percepciones no son correctas. Cualquier tipo de juego puede representarse en forma normal
o en un árbol de juegos, pero para algunos juegos es más conveniente usar uno que el otro. El Juego
de Confianza, por ejemplo, se representa en forma normal en el lado derecho de la Figura 6, y
usando esta representación se puede verificar que el equilibrio de Nash es (No Confianza, Traición),
tal como lo encontramos al trabajar hacia atrás Árbol de juego.

Las garantías ofrecieron un oscuro punto sutil: en algunos juegos, hay varios equilibrios de Nash,
algunos de los cuales dependen de amenazas o promesas no creíbles. Afortunadamente, la solución
de inducción hacia atrás para un juego es siempre un equilibrio de Nash que no se basa en amenazas
o promesas no creíbles. Como ilustración de un equilibrio de Nash que se basa en una amenaza no
creíble (pero no satisface la inducción hacia atrás), considere el árbol del juego y la forma normal
asociada en la Figura 7. Trabajar hacia atrás a través de este árbol del juego muestra que la solución
de inducción hacia atrás es para el jugador 2 para jugar R 'si se le da el movimiento y para que el
jugador 1 juegue R Pero la forma normal revela que hay dos equilibrios de Nash: (R, R') y (L, L '). El
segundo equilibrio de Nash existe porque la mejor respuesta del jugador l a L 'por 2 es terminar el
juego eligiendo L. Pero (L, L') se basa en la amenaza no creíble del jugador 2 de jugar L 'en lugar de
R' si se le da el moverse. Si el jugador 1 cree en la amenaza de 2, entonces 2 está descolgado porque
1 jugará L, pero 2 nunca querría llevar a cabo esta amenaza si se le da la oportunidad.

La inducción hacia atrás se puede aplicar en cualquier juego de horizonte finito de información
completa en el que los jugadores se mueven uno a la vez y todos los movimientos anteriores son de
conocimiento común antes de elegir el siguiente movimiento. El método es simple: ve al final del
juego y trabaja hacia atrás, un movimiento a la vez. Sin embargo, en juegos dinámicos con
movimientos simultáneos o un horizonte infinito, no podemos aplicar este método directamente.
Pasamos luego al equilibrio de Nash perfecto para subjuegos, que extiende el espíritu de inducción
hacia atrás a tales juegos.

Equilibrio de Nash perfecto para subjuegos

El equilibrio de Nash perfecto para subjuegos es un refinamiento del equilibrio de Nash; es decir,
para ser perfecto en el subjuego, las estrategias de los jugadores deben primero ser un equilibrio de
Nash y luego cumplir un requisito adicional. El objetivo de este requisito adicional es, como con la
inducción hacia atrás, descartar equilibrios de Nash que se basan en amenazas no creíbles.

Para proporcionar una definición informal del equilibrio perfecto de Nash en subjuegos, volvemos
a la motivación para el equilibrio de Nash, es decir, que una solución única a un problema de teoría
de juegos debe satisfacer el requisito de la mejor respuesta mutua de Nash. En muchos juegos
dinámicos, el mismo argumento también se puede aplicar a ciertas piezas del juego, llamadas
subjuegos. Un subjuego es la pieza de un juego original que queda por jugar comenzando en
cualquier punto en el que la historia completa del juego hasta el momento sea de conocimiento
común. En el juego de confianza de un disparo, por ejemplo, la historia del juego es de conocimiento
común después de que el jugador 1 se mueve. La parte del juego que queda es muy simple: solo un
movimiento del jugador 2.

Como segundo ejemplo de un subjuego (y, eventualmente, del equilibrio de Nash perfecto para
subjuegos), considere el modelo de torneo de Lazear y Rosen (1981). Primero, el director elige dos
salarios: H para el ganador, WL para el perdedor. Segundo, los dos trabajadores observan estos
salarios y luego eligen simultáneamente los niveles de esfuerzo. Finalmente, se observa la
producción de cada trabajador (que equivale al esfuerzo del trabajador más el ruido), y el trabajador
con la producción más alta gana WH. En este juego, la historia del juego es de conocimiento común
después de que el director elige los salarios. La pieza del juego que queda es el juego de elección de
esfuerzo entre los trabajadores.

Debido a que el juego de elección de esfuerzo de los trabajadores tiene movimientos simultáneos,
no podemos ir al final del juego y trabajar hacia atrás un movimiento a la vez, como con la inducción
hacia atrás. (Si vamos al final del juego, ¿qué movimiento de los trabajadores deberíamos analizar
primero?) En cambio, analizamos los movimientos de ambos trabajadores juntos. Es decir,
analizamos todo el subjuego que queda después de que el director establece los salarios resolviendo
el equilibrio de Nash en el juego de elección de esfuerzo de los trabajadores dados los salarios
arbitrarios elegidos por el director. Dada la respuesta de equilibrio de los trabajadores a estos
salarios arbitrarios, podemos trabajar hacia atrás, resolviendo el problema del principal: elegir
salarios que maximicen las ganancias esperadas dada la respuesta de equilibrio de los trabajadores.
Este proceso produce el equilibrio de Nash perfecto para el subjuego del juego de torneo.

Normalmente hay otros equilibrios de Nash del juego de torneo que no son perfectos para
subjuegos. Por ejemplo, la directora podría pagar salarios muy altos porque los trabajadores
amenazan con eludir si ella paga algo menos. Resolver la respuesta de equilibrio de los trabajadores
a un par arbitrario de salarios revela que esta amenaza no es creíble. Este proceso de solución ilustra
la definición de Selten (1965) de un equilibrio de Nash perfecto en subjuegos: un equilibrio de Nash
(del juego en su conjunto) es perfecto en subjuegos si las estrategias de los jugadores constituyen
un equilibrio de Nash en cada subjuego.

Juegos repetidos

Cuando las personas interactúan con el tiempo, las amenazas y las promesas relacionadas con el
comportamiento futuro pueden influir en el comportamiento actual. Los juegos repetidos capturan
este hecho de la vida y, por lo tanto, se han aplicado de manera más amplia que cualquier otro
modelo teórico de juegos (según mi cuenta del sillón), no solo en prácticamente todos los campos
de la economía sino también en finanzas, derecho, marketing, ciencias políticas y sociología. En esta
sección, analizamos el juego de confianza infinitamente repetido, tomado del análisis de Kreps
(1990a) de la cultura corporativa. Todos los resultados anteriores se conocen antes de que se juegue
el Trust Game del próximo período. Ambos jugadores comparten la tasa de interés r por período.7
Considere las siguientes estrategias de "activación":

Jugador 1: En el primer período, juega Confianza. A partir de entonces, si todos los movimientos en
todos los períodos anteriores han sido Confianza y Honor, juegue Confianza; de lo contrario, juega
a No confiar.

Jugador 2: Si se le dio el movimiento en este período, juegue Honor si todos los movimientos en
todos los períodos anteriores han sido Confianza y Honor; de lo contrario, juega Betray.

Recuerde que en la versión de una sola vez del juego Trust, la inducción hacia atrás produce (No
Trust, Betray), con pagos de (0, 0). Dadas las estrategias de activación indicadas anteriormente para
el juego repetido, este resultado de inducción hacia atrás del juego en el escenario será el resultado
del "castigo" si la cooperación colapsa en el juego repetido. Bajo estas estrategias de activación, los
beneficios de la "cooperación" son (1, 1), pero la cooperación crea un incentivo para la "deserción",
al menos para el jugador 2: si el jugador 1 elige Confianza, la rentabilidad de un período del jugador
2 se maximizaría al eligiendo Traicionar, produciendo pagos de (-1, 2). Por lo tanto, el jugador2
cooperará si el valor presente de los pagos de la cooperación (1 en cada período) excede el valor
presente de los pagos de la detección seguido de un castigo (2 inmediatamente, pero 0 a partir de
entonces). El valor presente anterior excede al último si la tasa de interés es suficientemente
pequeña (aquí, r ≤ 1).

¿Qué pasa con el jugador 1? Supongamos que el jugador 2 está jugando su estrategia dada
anteriormente. Como el jugador 1 se mueve primero, no tiene ninguna posibilidad de desertar, en
el sentido de hacer trampa mientras el jugador 2 intenta cooperar. La única desviación posible para
el jugador 1 es jugar Not Trust, en cuyo caso el jugador 2 no obtiene el movimiento ese período.
Pero la estrategia de 2 especifica que cualquier Fideicomiso futuro se encontrará con Traición. Por
lo tanto, al jugar a Not Trust, el jugador 1 obtiene 0 en este período y 0 a partir de entonces (porque
jugar a Not Trust para siempre es la mejor respuesta para la Traición de confianza anticipada de 2).
Entonces, si el jugador 2 está jugando su estrategia dada anteriormente, entonces es óptimo que el
jugador 1 juegue la suya. Por lo tanto, si la tasa de interés es suficientemente pequeña, las
estrategias de activación indicadas anteriormente son un equilibrio de Nash del juego repetido.

El punto general es que la cooperación es propensa a la deserción; de lo contrario, deberíamos


llamarlo de otra manera, como una alineación feliz de los intereses propios de los jugadores. Pero
en algunas circunstancias, la deserción se puede enfrentar con un castigo, en cuyo caso un desertor
potencial debe sopesar el valor actual de la cooperación continua contra la ganancia a corto plazo
de la deserción seguida de la pérdida a largo plazo del castigo. Si los jugadores son lo
suficientemente pacientes (es decir, la tasa de interés es lo suficientemente pequeña), entonces la
cooperación puede ocurrir en un equilibrio del juego repetido cuando no puede hacerlo en el juego
de un tiro.

Juegos estáticos con información incompleta


Pasamos a los juegos con información incompleta, también llamados juegos bayesianos. En un juego
de información completa, las funciones de pago de los jugadores son de conocimiento común,
mientras que en un juego de información incompleta, al menos un jugador no está seguro acerca
de la función de pago de otro jugador. Un ejemplo común de un juego estático de información
incompleta es una subasta de oferta sellada: cada postor conoce su propia valoración del bien que
se vende, pero no conoce la valoración de ningún otro postor; Las ofertas se envían en sobres
cerrados, por lo que los movimientos de los jugadores son efectivamente simultáneos. Sin embargo,
los juegos bayesianos más interesantes económicamente son dinámicos, porque la existencia de
información privada conduce naturalmente a intentos de las partes informadas para comunicarse
(o engañar) y a intentos de partes no informadas para aprender y responder.

Primero usamos la idea de información incompleta para proporcionar una nueva interpretación
para equilibrios de Nash de estrategia mixta en juegos con información completa: una
interpretación de la estrategia mixta del jugador i en términos de la incertidumbre del jugador j
sobre la acción de i, en lugar de en términos de aleatorización real en es parte. Usando este modelo
simple como plantilla, definimos un juego bayesiano estático y un equilibrio bayesiano de Nash. De
manera tranquilizadora, veremos que un equilibrio bayesiano de Nash es simplemente un equilibrio
de Nash en un juego bayesiano: las estrategias de los jugadores deben ser las mejores respuestas
entre sí.

Estrategias mixtas reinterpretadas

Recuerde que en el Juego de citas discutido anteriormente, hay dos equilibrios de Nash de estrategia
pura: (Filete, Vino tinto) y (Pollo, Vino blanco). También hay un equilibrio de Nash de estrategia
mixta, en el que Chris elige Filete con probabilidad 3 y Pollo con probabilidad 3, y Pat elige Vino
blanco con probabilidad 2 y Vino tinto con probabilidad 3. Para verificar que estas estrategias mixtas
constituyen un equilibrio de Nash, compruebe que dada la estrategia de Pat, Chris es indiferente
entre las estrategias puras de Steak y Chicken y, por lo tanto, también es indiferente entre todas las
distribuciones de probabilidad sobre estas estrategias puras. Por lo tanto, la estrategia mixta
especificada para Chris es una de las mejores respuestas a la estrategia de Pat. Lo mismo es cierto
para Pat, por lo que las dos estrategias mixtas son un equilibrio de Nash.

Ahora suponga que, aunque se conocen desde hace bastante tiempo, Chris y Pat no están muy
seguros de los beneficios del otro, como se muestra en la Figura 8. El beneficio de Chris de Steak
with Red Wine ahora es 2 + t, donde t, es privado conocido por Chris; La recompensa de Pat de pollo
con vino blanco es ahora 2 + tp, donde tp es conocido en privado por Pat; yt, y tp son sorteos
independientes de una distribución uniforme en [0, x]. La elección de una distribución uniforme es
solo por conveniencia, pero tenemos en cuenta que los valores de t y tp solo perturban un poco los
pagos en el juego original, así que piense en x como pequeño. Todos los otros pagos son los mismos
que en el juego original de información completa.

Construiremos un equilibrio Bayesiano de Nash de estrategia pura de esta versión de información


incompleta del juego de citas en el que Chris elige Steak si tc excede un valor crítico, c, y elige Chicken
de lo contrario, y Pat elige White Wine si tp excede un valor crítico, p, y elige vino tinto de lo
contrario. En tal equilibrio, Chris elige Filete con probabilidad (x - c) / x, y Pat elige Vino Blanco con
probabilidad (x - p) / x. (Por ejemplo, si el valor crítico c es casi x, entonces la probabilidad de que tc
exceda c es casi cero). Mostraremos que a medida que desaparece la información incompleta, es
decir, cuando x se acerca a cero, el comportamiento de los jugadores en este equilibrio bayesiano
de Nash de estrategia pura del juego de información incompleta se aproxima a su comportamiento
en el equilibrio de Nash de estrategia mixta en el juego original de información completa. Es decir,
tanto (x - c) / x como (x - p) / x se acercan a 2/3 cuando x se acerca a cero.

Supongamos que Pat jugará la estrategia descrita anteriormente para el juego de información
incompleta. Luego, Chris puede calcular que Pat elige el vino blanco con probabilidad (x - p)/x y el
rojo con probabilidad p/x, por lo que los beneficios esperados de Chris al elegir Steak y al elegir
Chicken son p(2 + tc)/x y (x - p)/x, respectivamente. Por lo tanto, la mejor respuesta de Chris a la
estrategia de Pat tiene la forma descrita anteriormente: elegir Steak tiene el mayor beneficio
esperado si y solo si tc ≥ (X-3p)/p = c. De manera similar, dada la estrategia de Chris, Pat puede
calcular que Chris elige Filete con probabilidad (x - c)/x y Pollo con probabilidad c/x, por lo que los
beneficios esperados de Pat al elegir Vino Blanco y al elegir Vino Tinto son c(2 + tp)/x y (x - c)/x,
respectivamente. Por lo tanto, elegir el vino blanco tiene el mayor beneficio esperado si y solo si tp
≥ (x-3c)/c-p.

Ahora hemos demostrado que la estrategia de Chris (es decir, Filete si y solo si tC ≥ c) y la estrategia
de Pat (es decir, Vino blanco si y solo si tp ≥ p) son las mejores respuestas entre sí si y solo si (x - 3p)/p
= c y (x - 3c)/c = p. Resolver estas dos ecuaciones para p y c muestra que la probabilidad de que Chris
elija Steak, es decir, (x - c)/x, y la probabilidad de que Pat elija White Wine, es decir, (x - p)/x, son
iguales. Esta probabilidad se aproxima a 2/3 cuando x se aproxima a cero (mediante la aplicación de
la regla de l'Hopital). Por lo tanto, a medida que desaparece la información incompleta, el
comportamiento de los jugadores en este equilibrio Bayesiano Nash de estrategia pura del juego de
información incompleta se aproxima a su comportamiento en el equilibrio de Nash de la estrategia
mixta en el juego original de información completa.
Harsanyi (1973) demostró que este resultado es bastante general: un equilibrio de Nash de
estrategia mixta en un juego de información completa puede (casi siempre) interpretarse como un
equilibrio de Nash bayesiano de estrategia pura en un juego estrechamente relacionado con un
poco de incompleto información. Dicho de manera más sugerente, la característica crucial de una
estrategia mixta El equilibrio de Nash no es que el jugador j elija una estrategia al azar, sino que el
jugador i no está seguro acerca de la elección del jugador j; Esta incertidumbre puede surgir debido
a la aleatorización o (más plausiblemente) debido a un poco de información incompleta.

Juegos bayesianos estáticos y equilibrio bayesiano de Nash

Recuerde de la primera sección que en un juego de dos jugadores, con movimientos simultáneos de
información completa, primero los jugadores eligen simultáneamente acciones (el jugador i elige ai
del conjunto factible Ai) y luego se reciben los pagos ui(ai, aj). Para describir un juego de dos
jugadores de movimientos simultáneos con información incompleta, el primer paso es representar
la idea de que cada jugador conoce su propia función de pago, pero puede no estar seguro acerca
de la función de pago del otro jugador. Deje que las posibles funciones de pago del jugador i estén
representadas por ui(ai, aj; ti), donde ti se llama tipo del jugador i y pertenece a un conjunto de tipos
posibles (o espacio de tipos) Ti. Cada tipo ti corresponde a una función de pago diferente que ese
jugador podría tener. En una subasta, por ejemplo, la recompensa de un jugador depende no solo
de todas las ofertas de los jugadores (es decir, las acciones ai y aj de los jugadores) sino también de
la propia valoración del jugador por el bien que se subasta (es decir, el tipo de jugador ti).

Dada esta definición del tipo de jugador, decir que el jugador i conoce su propia función de pago es
equivalente a decir que el jugador i conoce su tipo. Del mismo modo, decir que el jugador i puede
tener dudas sobre la función de pago del jugador j es equivalente a decir que el jugador i puede
tener dudas sobre el tipo tj del jugador j. (En una subasta, el jugador i puede estar inseguro sobre la
valoración del jugador j para el bien). Utilizamos la distribución de probabilidad p (tj|ti) para denotar
la creencia del jugador i sobre el tipo de jugador j, tj, dado que el jugador i conoce su propio tipo ti.
Para simplificar la notación, suponemos (como en la mayoría de la literatura) que los tipos de
jugadores son independientes, en cuyo caso p (tj|ti) no depende de ti, por lo que podemos escribir
la creencia del jugador i como p(tj).

Unir estos nuevos conceptos de tipos y creencias con los elementos familiares de un juego estático
de información completa produce un juego bayesiano estático, como lo definió Harsanyi (1967,
1968a, b). El momento de un juego bayesiano estático para dos jugadores es el siguiente:

1) La naturaleza dibuja un vector tipo t = (t1, t2), donde ti se extrae independientemente de la


distribución de probabilidad p (ti) sobre el conjunto de posibles tipos Ti del jugador i.

2) La naturaleza revela ti al jugador i pero no al jugador j.

3) Los jugadores eligen simultáneamente acciones, el jugador i elige ai del conjunto factible A.

4) Los pagos ui(ai, aj; ti) son recibidos por cada jugador.

Puede ser útil comprobar que el juego de citas con información incompleta descrita anteriormente
es un ejemplo simple de esta definición abstracta de un juego bayesiano estático.
Ahora necesitamos definir un concepto de equilibrio para juegos bayesianos estáticos. Para hacerlo,
primero debemos definir los espacios de estrategia de los jugadores en dicho juego, después de lo
cual definiremos un equilibrio bayesiano de Nash como un par de estrategias para que la estrategia
de cada jugador sea la mejor respuesta a la estrategia del otro jugador. Es decir, dada la definición
apropiada de una estrategia en un juego bayesiano estático, la definición apropiada de equilibrio
(ahora llamado equilibrio bayesiano de Nash) es solo la definición familiar de Nash.

Una estrategia en un juego bayesiano estático es una regla de acción, no solo una acción. Más
formalmente, una estrategia (pura) para el jugador i especifica una acción factible (ai) para cada tipo
posible de jugador i (ti). En el juego de citas con información incompleta, por ejemplo, la estrategia
de Chris era una regla que especificaba la acción de Chris para cada valor posible de tc: Filete si tc
excede un valor crítico, c, y Chicken en caso contrario. De manera similar, en una subasta, la
estrategia de un postor es una regla que especifica la oferta del jugador para cada posible valoración
que el postor pueda tener por el bien.

En un juego bayesiano estático, la estrategia del jugador l es una mejor respuesta a la del jugador 2
si, para cada uno de los tipos de jugador 1, la acción especificada por la regla de acción de l para ese
tipo maximiza el pago esperado de 1, dada la creencia de 1 sobre el tipo de 2 y la acción de 2 dada.
regla. En el equilibrio bayesiano de Nash que construimos en el juego de citas, por ejemplo, no había
ningún incentivo para que Chris cambiara ni siquiera una acción por un tipo, dada la creencia de
Chris sobre el tipo de Pat y la regla de acción de Pat (es decir, elegir Vino blanco si tp excede un valor
crítico, p, y elija vino tinto de lo contrario). Del mismo modo, en un equilibrio bayesiano de Nash de
una subasta de dos postores, el postor 1 no tiene ningún incentivo para cambiar ni siquiera una
oferta por un tipo de valoración, dada la creencia del licitante 1 sobre el tipo del licitador 2 y la regla
de licitación del licitador 2.

Juegos dinámicos con información incompleta


Como se señaló anteriormente, la existencia de información privada conduce naturalmente a
intentos de las partes informadas para comunicarse (o engañar) y a intentos de partes no
informadas para aprender y responder. El modelo más simple de tales intentos es un juego de
señalización: hay dos jugadores, uno con información privada y el otro sin él; y hay dos etapas en el
juego: una señal enviada por la parte informada, seguida de una respuesta tomada por la parte no
informada. En el modelo clásico de Spence (1973), por ejemplo, la parte informada es un trabajador
con información privada sobre su capacidad productiva, la parte no informada es un empleador
potencial (o un mercado de la misma), la señal es la educación y la respuesta Es una oferta salarial.

Los juegos bayesianos dinámicos más ricos permiten desarrollar, mantener u ordeñar reputaciones.
En el primer análisis de este tipo, Kreps, Milgrom, Roberts y Wilson (1982) mostraron que un dilema
de prisioneros repetido que comienza con un poco de (el tipo correcto de) información privada
puede tener una cooperación de equilibrio en todos los períodos, excepto en los últimos. . Por el
contrario, un argumento de inducción hacia atrás muestra que la cooperación de equilibrio no
puede ocurrir en ninguna ronda de un dilema de prisioneros finitamente repetidos bajo información
completa, porque saber que la cooperación se romperá en la última ronda hace que se rompa en la
próxima. última ronda, y así sucesivamente a la primera ronda. Los juegos de señalización, los juegos
de reputación y otros juegos bayesianos dinámicos (como los juegos de negociación) se han aplicado
ampliamente en muchos campos de la economía y en contabilidad, finanzas, derecho, marketing y
ciencias políticas. Por ejemplo, ver Benabou y Laroque (1992) sobre información privilegiada y gurús
en los mercados financieros, Cramton y Tracy (1992) sobre huelgas y Rogoff (1989) sobre política
monetaria.

Equilibrio bayesiano perfecto

Para analizar los juegos bayesianos dinámicos, introducimos un cuarto concepto de equilibrio:
equilibrio bayesiano perfecto. La nueva característica crucial del equilibrio bayesiano perfecto se
debe a Kreps y Wilson (1982): las creencias se elevan al nivel de importancia de las estrategias en la
definición del equilibrio. Es decir, la definición de equilibrio ya no consiste solo en una estrategia
para cada jugador, sino que ahora también incluye una creencia para cada jugador cada vez que el
jugador tiene el movimiento, pero no está seguro de la historia del juego anterior ". 4 La ventaja de
hacer que los jugadores Las creencias, una parte explícita del equilibrio, es que, tal como insistimos
previamente en que los jugadores eligen estrategias creíbles (es decir, perfectas para subjuegos),
ahora también podemos insistir en que tengan creencias razonables.

Para ilustrar por qué las creencias de los jugadores son tan importantes como sus estrategias,
considere el ejemplo de la Figura 9. (Este ejemplo muestra que el equilibrio bayesiano perfecto
refina el equilibrio de Nash perfecto en el subjuego; volvemos a los juegos bayesianos dinámicos en
la siguiente subsección). Primero, el jugador 1 elige entre tres acciones: L, M y R. Si el jugador 1 elige
R, el juego termina sin un movimiento del jugador 2. Si el jugador 1 elige L o M, entonces el jugador
2 descubre que R no fue elegido (pero no cuál de los dos) L o M fue elegido) y luego elige entre dos
acciones, L 'y R', después de lo cual el juego termina. (La línea punteada que conecta los dos nodos
de decisión del jugador 2 en el árbol del juego a la izquierda de la Figura 9 indica que si el jugador 2
consigue el movimiento, el jugador 2 no sabe a qué nodo se ha llegado, es decir, si el jugador 1 ha
elegido L o M. Las probabilidades p y 1 - p asociadas a los nodos de decisión del jugador 2 se
explicarán a continuación.) Los pagos se dan en el árbol del juego.

La representación en forma normal de este juego en el lado derecho de la Figura 9 revela que hay
dos equilibrios de Nash de estrategia pura: (L, L') y (R, R'). Primero preguntamos si estos equilibrios
de Nash son perfectos en subjuegos. Debido a que un subjuego se define para comenzar cuando la
historia del juego anterior es de conocimiento común, no hay subjuegos en el árbol de juego
anterior. (Después del nodo de decisión del jugador l al comienzo del juego, no hay ningún punto
en el que el historial completo de juego sea de conocimiento común: los únicos otros nodos son del
jugador 2, y si se alcanzan estos nodos, entonces el jugador 2 no sabe si la jugada anterior fue L o
M.) Si un juego no tiene subjuegos, entonces el requisito de la perfección del subjuego, es decir, que
las estrategias de los jugadores constituyan un equilibrio de Nash en cada subjuego, se cumple
trivialmente. Por lo tanto, en cualquier juego que no tenga subjuegos, la definición de equilibrio de
Nash perfecto para subjuegos es equivalente a la definición de equilibrio de Nash, por lo tanto, en
este ejemplo, ambos (L, L') y (R, R') son equilibrios de Nash perfectos para subjuegos. Sin embargo,
(R, R ') depende claramente de una amenaza no creíble: si el jugador 2 consigue el movimiento,
entonces jugar L' domina jugar R ', por lo que el jugador 1 no debe ser inducido a jugar R por la
amenaza de 2 para jugar R' si se le da el movimiento.

Una forma de fortalecer el concepto de equilibrio para descartar el equilibrio de Nash perfecto para
subjuegos (R, R') es imponer dos requisitos.

Requisito 1: Siempre que un jugador tenga el movimiento y no esté seguro acerca del historial de
juego anterior, el jugador debe tener un creyente en el conjunto de historias de juego factibles.

Requisito 2: Dadas sus creencias, las estrategias de los jugadores deben ser secuencialmente
racionales. Es decir, cada vez que un jugador tiene el movimiento, la acción del jugador (y la
estrategia del jugador a partir de ese momento) debe ser óptima dada la creencia del jugador en
ese punto (y las estrategias de los otros jugadores a partir de ese momento).

En el ejemplo anterior, el Requisito 1 implica que si el jugador 2 obtiene el movimiento, entonces el


jugador 2 debe creer si el jugador 1 ha jugado L o M. Esta creencia está representada por las
probabilidades p y 1 - p asociadas a los nodos relevantes. en el árbol del juego Dada la creencia del
jugador 2, el beneficio esperado de jugar R 'es p 0 + (1 - p) 1 = 1 - p, mientras que el beneficio
esperado de jugar L' es p I + (1 - p) * 2 = 2-p. Como 2-p> 1 -p para cualquier valor de p, Requisito 2
evita que el jugador 2 elija R '. Por lo tanto, simplemente requerir que cada jugador tenga una
creencia y actúe de manera óptima dado que esta creencia es suficiente para eliminar el equilibrio
implantable (R, R ') en este ejemplo.

¿Qué pasa con el otro equilibrio de Nash perfecto para subjuegos, (L, L ')? El requisito 1 dicta que el
jugador 2 tiene una creencia, pero no especifica lo que debería ser. Sin embargo, en el espíritu de
las expectativas racionales, la creencia del jugador 2 en este equilibrio debería ser p = 1.
Establecemos esta idea un poco más formalmente como

Requisito 3: siempre que sea posible, las creencias deben determinarse por la regla de Bayes a partir
de las estrategias de equilibrio de los jugadores.

A continuación, damos otros ejemplos del Requisito 3.

En aplicaciones económicas simples, incluyendo los juegos de señalización discutidos antes, los
requisitos 1 a 3 constituyen la definición de equilibrio perfecto de Bayes. En aplicaciones más ricas,
se deben imponer más requisitos para eliminar los equilibrios inverosímiles ''.
Juegos de señalización

Ahora volvemos a los dinámicos juegos bayesianos, donde aplicaremos el equilibrio bayesiano
perfecto. Para simplificar, restringimos la atención a los juegos de señalización (finitos), que tienen
el siguiente tiempo:

1) La naturaleza dibuja un tipo t, para el remitente de un conjunto de tipos factibles T = {t1, t1}
de acuerdo con una distribución de probabilidad p (ti).

2) El remitente observa ti y luego elige un mensaje mj de un conjunto de mensajes factibles M


= {m1, . . ., mj}.

3) El receptor observa mj (pero no ti) y luego elige una acción ak de un conjunto de acciones
factibles A = {a1, . . ., aKj.

4) Los pagos son dados por Nosotros (ti, m>, ak) y UR (t1, mj, ak).

En el juego de señalización "Beer and Quiche" de Cho y Kreps (1987), que se muestra en la Figura
10, los espacios de tipo, mensaje y acción (T, M y A, respectivamente) tienen solo dos
elementos. Mientras que la mayoría de los árboles de juego comienzan en la parte superior, un
juego de señalización comienza en el medio, con un movimiento de la Naturaleza que determina
el tipo de remitente: aquí t4 = "debilucho" (con probabilidad 1) o t = "hosco" (con probabilidad
9). Ambos tipos de remitentes tienen la misma opción de mensajes: Quiche o Cerveza (como
interruptores alternativos). El Receptor observa el mensaje, pero no el tipo. (Como se indicó
anteriormente, la línea discontinua que conecta dos de los dos nodos de decisión del Receptor
indica que el Receptor sabe que se alcanzó uno de los nodos en este "conjunto de información",
pero no sabe qué nodo, es decir, el Receptor observa el desayuno del Remitente, pero no su
tipo.) Finalmente, después de cada mensaje, el Receptor elige entre dos acciones: duelo o no
duelo con el remitente.

Las características cualitativas de las recompensas son que el tipo debilucho preferiría tomar
quiche para el desayuno, el tipo malhumorado preferiría tomar cerveza, ambos tipos preferirían
no pelear con el Receptor, y el Receptor preferiría duelo con el tipo debilucho, pero no duelo
con el tipo hosco. Específicamente, el desayuno preferido vale B> 0 para ambos tipos de
remitentes, evitar un duelo vale D> 0 para ambos tipos de remitentes, y la recompensa de un
duelo con el tipo debilucho (respectivamente, maleducado) es 1 (respectivamente, -1) para el
receptor; todos los otros pagos fueron cero.

El objetivo de un juego de señalización es que el mensaje del remitente puede transmitir


información al receptor. Llamamos a la estrategia del remitente separándose si cada tipo envía
un mensaje diferente. En Beer and Quiche, por ejemplo, la estrategia [Quiche si es débil, Beer
si es hosca] es una estrategia de separación para el remitente. En el otro extremo, la estrategia
del remitente se llama agrupación si cada tipo envía el mismo mensaje. En un modelo con más
de dos tipos, también hay estrategias de agrupación parcial (o semiseparación) en las que todos
los tipos de un conjunto dado de tipos envían el mismo mensaje, pero diferentes conjuntos de
tipos envían mensajes diferentes. Los equilibrios bayesianos perfectos que involucran tales
estrategias para el remitente también se denominan separación, agrupación, etc.

Si B> D, entonces la estrategia del Remitente [Quiche si es débil, Beer si es hosca] y la estrategia
del Receptor [duelo después de Quiche, no duelo después de Beer], junto con las creencias p =
1 y q = 0 satisfacen los Requisitos 1 a 3 y también lo es un equilibrio bayesiano perfecto del juego
de señalización de cerveza y quiche. Dicho de manera más sugerente, cuando B> D, tener el
desayuno preferido es más importante que evitar un duelo, por lo que cada tipo de Remitente
elige su desayuno preferido, señalando su tipo; señalar esta información funciona en contra del
tipo débil (porque induce al receptor a pelear), pero esta consideración se ve compensada por
la importancia de obtener el desayuno preferido.

También podemos preguntarnos si Beer and Quiche tiene otros equilibrios bayesianos
perfectos. Las otras tres estrategias puras que el Remitente podría jugar son [Quiche si es débil,
Quiche si es hosco], [Cerveza si es débil, Quiche si es hosco] y [Cerveza si es débil, Cerveza si es
hosco]. Cuando B> D, la recompensa más baja que el tipo Remitente débil podría recibir al jugar
Quiche

(B) excede el más alto disponible al jugar Beer (D), por lo que el tipo debilucho no jugará Beer,
dejando [Quiche si debilucho, Quiche si hosco] como la única otra estrategia que el Remitente
podría jugar. De manera análoga, la recompensa más baja que el tipo Sender podría recibir al
jugar Beer (B) excede la más alta disponible al jugar Quiche (D), por lo que el tipo hosco no
jugará Quiche. Por lo tanto, el equilibrio bayesiano perfecto de separación derivado
anteriormente es el equilibrio bayesiano perfecto único del juego de señalización de cerveza y
quiche cuando B> D.

¿Qué pasa cuando B <D? Ahora no hay separación del equilibrio bayesiano perfecto.17 Pero hay
dos equilibrios bayesianos perfectos agrupados. Es sencillo demostrar que cuando B <D, la
estrategia del Remitente [Beer si es débil, Beer si es hosca] y la estrategia del Receptor [duelo
después de Quiche, no duelo después de Beer], junto con las creencias p = 1 y q = .1 satisfar los
requisitos 1 a 3. (De hecho, cualquier p ≥ .5 funcionaría igual de bien). Este equilibrio de
agrupación tiene sentido (así como el equilibrio de separación anterior tenía sentido cuando B>
D): el tipo hosco obtiene su desayuno preferido y evita un duelo; porque B <D, el tipo debilucho
ahora prefiere esconderse detrás de la alta probabilidad previa del tipo hosco (.9, que disuade
al Receptor de duelo sin más información) en lugar de tener su desayuno preferido.
También hay otro equilibrio de agrupamiento: cuando B <D, la estrategia del Remitente [Quiche
si es débil, Quiche si es hosca] y la estrategia del Receptor [sin duelo después de Quiche, duelo
después de Beer], junto con las creencias p = .1 y q = 1 satisface los Requisitos 1 a 3. (De hecho,
cualquier q> = 5 funcionaría igual de bien). Cho y Kreps argumentan que la creencia del Receptor
en este equilibrio es contraintuitiva. Su "Criterio Intuitivo" refina el equilibrio bayesiano
perfecto al imponer restricciones adicionales a las creencias (más allá del Requisito 3) que
descartan este equilibrio de agrupación (pero no el equilibrio de agrupación anterior, en el que
ambos tipos eligen Beer).

Otras lecturas
Espero que este documento haya definido claramente las cuatro clases principales de juegos y
sus conceptos de solución, así como también esbozó la motivación y las conexiones entre estos
conceptos. Esto puede ser suficiente para permitir que algunos economistas aplicados lidien
con el trabajo de teoría de juegos en sus propias áreas de investigación, pero espero haber
interesado al menos a algunos lectores en más de esta introducción.

Un economista que busca leer más sobre la teoría de los juegos tiene el lujo de una gran
variedad de opciones: al menos ocho libros nuevos, así como al menos dos textos anteriores,
uno ahora en su segunda edición. (Pido disculpas por excluir varios otros libros escritos para
economistas o no, así como cualquier libro escrito por economistas que hayan escapado a mi
atención). Estos diez libros son Binmore (1992), Dixit y Nalebuff (1991), Friedman (1990),
Fudenberg y Tirole (1991b), Gibbons (1992), Kreps (1990b), McMillan (1992), Myerson (1991),
Osborne y Rubinstein (1994) y Rasmussen (1989). Todos estos libros son excelentes, pero creo
que es justo decir que diferentes lectores encontrarán diferentes libros apropiados,
dependiendo de los antecedentes y objetivos del lector. A riesgo de ofender a mis colegas
autores, permítanme poner en peligro algunas caracterizaciones y sugerencias. En términos
generales, algunos libros enfatizan la teoría, otras aplicaciones económicas y otros "el mundo
real". Dado el énfasis de un libro, hay una pregunta con respecto a su nivel. Veo a Binmore,
Friedman, Fudenberg -Tirole, Kreps, Myerson y Osborne-Rubinstein como libros que enfatizan
la teoría. Si intentara transformar a un estudiante universitario brillante en un teórico del juego
(a diferencia de un modelador aplicado), comenzaría con Binmore y Kreps, o ambos, y luego
procedería con Friedman, Fudenberg-Tirole, Myerson y Osborne- Rubinstein. En contraste, veo
a Gibbons y Rasmussen (y, hasta cierto punto, a McMillan) como libros que enfatizan las
aplicaciones económicas. Cada uno es accesible para un estudiante universitario brillante, pero
también podría proporcionar la capacitación doctoral inicial para un modelador aplicado y
quizás la capacitación doctoral completa para un economista aplicado que desee consumir (en
lugar de construir) modelos aplicados. El siguiente paso para aquellos que desean construir tales
modelos podría ser tomar muestras de Fudenberg-Tirole, como la mayoría de las aplicaciones
orientadas a los libros de teoría avanzada. Finalmente, veo libros de Dixit-Nalebuff y McMillanas
que enfatizan el mundo real (McMillan está más estrechamente vinculado a las aplicaciones de
la literatura económica). Estos son los textos que se usarán para enseñar a un estudiante
universitario (o un MBA) a pensar estratégicamente, aunque para este propósito también se
deben leer los trabajos recopilados de Thomas Schelling. Estos libros también serían adiciones
útiles al entrenamiento de un modelador aplicado, con la esperanza de que el estudiante
aprenda a mantener su ojo en la pelota empírica.
Toda esta lectura adicional es para economistas que buscan un tratamiento más profundo de la
teoría. Desearía poder ofrecer recomendaciones análogas para aquellos que buscan leer más
sobre las muchas formas en que la teoría de juegos se ha utilizado para construir nuevos
modelos teóricos, tanto dentro como fuera de la economía; esto tendrá que esperar una
encuesta futura. Más importante aún, espero ansiosamente la primera evaluación exhaustiva
de cómo les ha ido a los modelos de teoría de juegos en economía cuando se enfrentan con
datos de campo del tipo comúnmente utilizado para evaluar modelos de teoría de precios. Para
un paso importante en una dirección relacionada, vea el excelente Manual de economía
experimental de Roth y Kagel (1995), que describe la evidencia de laboratorio correspondiente
a muchos modelos de teoría de juegos.

* Agradezco a Carl Shapiro por dar forma a este proyecto y a Brad De Long, Alan Krueger y
Timothy Taylor por sus útiles comentarios.

Referencias

Benabou, Roland y Guy Laroque, "Uso de información privilegiada para manipular mercados:
Insiders, Gurus y credibilidad", Quarterly Journal of Economics, agosto de 1992, 107, 921-58.

Binmore, Ken, Diversión y juegos: un texto sobre teoría de juegos. Lexington, Massachusetts: D.
C. Heath & Co, 1992.

Cho, In-Koo y David Kreps, "Juegos de señalización y equilibrios estables", Quarterly journal of
Economics, mayo de 1987, 102, 179-222.

Cournot, A., Recherche sur les Principes Mathematiques de la Theorie des Richesses, 1838.
Edición en inglés, Bacon, N., ed., Investigaciones sobre los principios matemáticos de la teoría
de la riqueza. Nueva York: Macmillan, 1897.

Cramton, Peter y Joseph Tracy, "Huelgas y retenciones en la negociación salarial: teoría y datos",
American Economic Review, marzo de 1992, 82, 100-21.

Dixit, Avinash y Barry Nalebuff, Pensando estratégicamente en la ventaja competitiva en los


negocios, la política y la vida cotidiana. Nueva York: Norton, 1991.

Farber, Henry, "An Analysis of Final-Offer Arbitration", Journal of Conflict Resolution, diciembre
de 1980, 35, 683-705.

Friedman, James, Game Theory with Applications to Economics 2nd ed., Oxford: Oxford
University Press, 1990.

Fudenberg, Drew y Jean Tirole, "Equilibrio bayesiano perfecto y equilirio secuencial", Journal of
Economic Theory, abril de 1991a, 53, 236-60. Economic Journal, marzo de 1929, 39, 41-57.

Gibbons, Robert, Teoría de juegos para economistas aplicados. Princeton, N.J .: Princeton
University Press, 1992.
Grossman, Sanford y Oliver Hart, "Take over Bids, the Free-Rider Problem and the Theory of the
Corporation", Bell Journal of Economics, Spring 1980, 11, 42-64.

Harsanyi, John, "Juegos con información incompleta que juegan los 'jugadores bayesianos': I. El
modelo básico", Management Science, noviembre de 1967, 14, 159-82.

Harsanyi, John, "Juegos con información incompleta que juegan los 'jugadores bayesianos': II.
Puntos de equilibrio bayesianos", Management Science, enero de 1968 a, 14, 320-34.

Hotelling, Harold, "Estabilidad en la competencia", Economic Journal, marzo de 1929, 39, 41-57.

Harsanyi, John, "Juegos con información incompleta que juegan los 'jugadores bayesianos': III.
La distribución básica de la probabilidad del juego", Management Science, marzo de 1968b, 14,
486-502.

Harsanyi, John, "Juegos con pagos aleatorios alterados: una nueva justificación para los puntos
de equilibrio de estrategia mixta", International Journal of Game Theory, 1973, 2: 1, 1-23.

Kreps, David, "Cultura corporativa y teoría económica". En Alt, J. y K Shepsle, eds., Perspectivas
sobre una economía política positiva Cambridge: Cambridge University Press

S-ar putea să vă placă și