Sunteți pe pagina 1din 20

Juegos No Cooperativos

John Nash

(Mayo, 1950)

Resumen

Este documento introduce el concepto de juegos no cooperativos y desarrolla mtodos para el anlisis
matemtico de dichos juegos. Los juegos considerados son juegos de n-personas representados por medio
de estrategias puras y funciones de pago definidas por la combinacin de estrategias puras.

La distincin entre juegos cooperativos y no cooperativos no est relacionada con la descripcin


matemtica por medio de estrategias puras y funciones de pago del juego. En cambio, depende de la
posibilidad o imposibilidad de coaliciones, comunicacin y pagos laterales.

Los conceptos de punto de equilibrio, solucin, solucin fuerte, sub-solucin, y valores son introduci-
dos mediante definiciones matemticas. Y en secciones posteriores la interpretacin de estos conceptos
en juegos no cooperativos es discutida.

El resultado matemtico principal es la prueba de la existencia en cualquier juego de por lo menos


un punto de equilibrio. Otros resultados conciernen la estructura geomtrica de un conjunto de puntos
de equilibrio de un juego con una solucin, la geometra de sub-soluciones, y la existencia de un punto
de equilibrio simtrico en un juego simtrico.

Como una ilustracin de las posibilidades para aplicacin un tratamiento de un modelo simple de un
juego de pquer de tres personas es incluido.
ndice

ndice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

Definiciones Formales y Terminologa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

Existencia de Puntos de Equilibrio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

Simetras de Juegos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

Soluciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

Forma Geomtrica de las Soluciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

Dominancia y Mtodos de Contradiccin . . . . . . . . . . . . . . . . . . . . . . . . . . 13

Un Juego de Pquer de Tres Personas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

Motivacin e Interpretacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

Agradecimientos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
Introduccin

Von Neumann y Morgenstern han desarrollado una teora muy fructfera de un juego de suma
cero para dos personas en su libro Teora de Juegos y Comportamiento Econmico. Este libro tam-
bin contiene una teora de juegos de n-personas que se puede llegar a tomar como cooperativa. Esta
teora se basa en un anlisis de las interrelaciones de las distintas coaliciones que pueden formarse
por los jugadores del juego.

Nuestra teora, en contraposicin, se basa en la ausencia de coaliciones en que se supone que


cada participante acta de forma independiente, sin la colaboracin o comunicacin con cualquiera
de los otros.

La nocin de un punto de equilibrio es el ingrediente bsico en nuestra teora. Esta nocin provee
una generalizacin del concepto de la solucin de un juego de suma cero para dos personas. Resulta
que el conjunto de puntos de equilibrio para el juego de suma cero con dos personas es simplemente
el conjunto de todos los pares de buenas estrategias opuestas.

En las siguientes secciones inmediatas vamos a definir puntos de equilibrio y probar que un
juego no cooperativo finito siempre tiene al menos un punto de equilibrio. Tambin vamos a in-
troducir las nociones de solubilidad y solubilidad fuerte de un juego no cooperativo y demostrar
un teorema sobre la estructura geomtrica del conjunto de puntos de equilibrio de un juego resoluble.

Como un ejemplo de la aplicacin de nuestra teora incluimos una solucin del juego de pquer
simplificado de tres personas.

La motivacin e interpretacin de los conceptos matemticos empleados en la teora estn re-


servados para discusin en una seccin especial de este documento.
John Nash 4

Definiciones Formales y Terminologa

En esta seccin definimos los conceptos bsicos de este trabajo y tambin establecemos la ter-
minologa y la notacin estndar. Definiciones importantes sern precedidas por un subtitulo que
indica el concepto definido. La idea no cooperativa ser implcita, en lugar de explcita, a continua-
cin.

Juego finito:

Para nosotros un juego de n-personas sera un conjunto de n jugadores, o posiciones, cada uno
asociado con un conjunto finito de estrategias puras; y correspondiente a cada jugador, i, una fun-
cin de pagos, pi , que mapea el conjunto de todas las n-tuplas de estrategias puras dentro de los
nmeros reales. Cuando usamos el trmino n-tupla siempre queremos dar a entender un conjunto
ordenado de n elementos, con cada elemento est asociado con un jugador diferente.

Estrategia mixta, si :

Una estrategia mixta del jugador i ser una coleccin de nmeros no negativos que tiene como
suma la unidad y estn en correspondencia uno a uno con sus estrategias puras.

Escribimos si = ci i con ci = 0 y ci = 1 para representar dicha estrategia mixta,


P P
donde las i son las estrategias puras del jugador i. Consideramos las si como puntos en un smplex
cuyos vrtices son las i . Este smplex puede considerarse como un subconjunto convexo de un es-
pacio vectorial real, que nos da un proceso natural de combinacin lineal para las estrategias mixtas.

Utilizaremos los sufijos i, j, k para los jugadores y , y para indicar diversas estrategias
puras de un jugador. Los smbolos si , ti y ri , etc. indicarn estrategias mixtas; i indicar la
-sima estrategia pura del i-simo jugador, etc.

Funcin de pagos, pi :

La funcin de pagos, pi , utilizada en la definicin de un juego finito anteriormente, tiene una


nica extension para las n-tuplas de estrategias mixtas que es lineal en la estrategia mixta de cada
jugador [n-lineal]. Esta extensin tambin la denotaremos por pi escribiendo pi (s1 , s2 , , sn ).

Escribiremos s o t para denotar una n-tupla de estrategias mixtas y si s= (s1 , s2 , , sn ) enton-


ces pi (s) se entender pi (s1 , s2 , , sn ). Tal n-tupla, s, tambin ser considerada como un punto en
un espacio vectorial, el espacio del producto de los espacios vectoriales que contienen las estrategias
mixtas. Y el conjunto de todas las formas de n-tuplas, por supuesto, como un poltopo convexo, el
producto de los smplexes que representan las estrategias mixtas.

Por conveniencia introducimos la notacin de sustitucin (s; ti ) para representar


(s1 , s2 , , si1 , ti , si+1 , , sn ) dnde s= (s1 , s2 , , sn ). El efecto de las sustituciones sucesi-
vas ((s; ti ); rj ) lo indicamos por (s; ti ; rj ), etc.
5 Juegos No Cooperativos

Punto de equilibrio:

Una n-tupla s es un punto de equilibrio si y slo si para cada i

pi s = mx [pi (s; ri )] (1)


todas las ri

Por lo tanto un punto de equilibrio es una n-tupla s tal que la estrategia mixta de cada jugador
maximiza su pago si las estrategias de los otros se mantienen fijas. Por lo tanto la estrategia de
cada jugador es ptima frente a las de los dems. Ocasionalmente abreviaremos punto de equilibrio
por pt. eq.

Decimos que una estrategia mixta si utiliza una estrategia pura i si si = y ci > 0.
P
ci i
Si s = (s1 , s2 , , sn ) y si utiliza i tambin decimos que s utiliza i .

De la linealidad de pi (s1 , s2 , , sn ) en si ,

mx [pi (s; ri )] = mx[pi (s; i )] (2)


todas las ri

Definimos pi (s) = pi (s; i ). Luego obtenemos la siguiente condicin trivial necesaria y sufi-
ciente para que s sea un punto de equilibrio:

pi (s) = mx pi (s) (3)


Si s = (s1 , s2 , , sn ) y si = ci pi luego pi (s) = ci pi (s) en consecuencia, para que


P P
(3) se cumpla debemos tener ci = 0 cuandoquiera que pi (s) < mx pi (s), lo que quiere decir que
s no utiliza i a menos que sea una estrategia pura ptima para el jugador i. As que escribimos

Si i es usado en s luego pi (s) = mx pi (s) (4)


como otra condicin necesaria y suficiente para un punto de equilibrio.

Ya que el criterio (3) para un pt. eq. puede ser expresado por la comparacin de n pares de fun-
ciones continuas en el espacio de n-tuplas s los pts. eq. obviamente forman un subconjunto cerrado
de este espacio. En realidad, este subconjunto est formado por un nmero de piezas de variedades
algebraicas, separado por otras variedades algebraicas.
John Nash 6

Existencia de Puntos de Equilibrio

Una prueba de este teorema de existencia basado en el teorema de punto fijo generalizado
de Kakutani fue publicado en Proceeding of the National Academy of Sciences U.S.A., 36, pgs.
48-49. La prueba dada aqu es una mejora considerable sobre la version anterior y est basada
directamente en el teorema de Brouwer. Procedemos construyendo una transformacin continua T
del espacio de n-tuplas de tal manera que los puntos fijos de T son los puntos de equilibrio del juego.

Teorema 1. Cada juego finito tiene un punto de equilibrio.

Prueba. Sea s una n-tupla de estrategias mixtas, pi (s) el pago correspondiente del jugador i,
y pi (s) el pago del jugador i si cambia hacia su -sima estrategia pura i y los otros continan
usando sus respectivas estrategias mixtas de s.

Ahora definimos un conjunto de funciones continuas de s por

i (s) = max(0, pi (s) pi (s))

y para cada componente si de s definimos una modificacin s0i dada por


P
si + i (s)i
s0i =
P ,
1 + i (s)

llamando s' a la n-tupla (s01 , s02 , s03 , , s0n ).

Ahora debemos mostrar que los puntos fijos del mapa T : s s' son los puntos de equilibrio.

Primero considerar cualquier n-tupla s. En s la estrategia mixta si del i-simo jugador utiliza-
r algunas de sus estrategias puras. Alguna de estas estrategias, digamos i , debe ser la menos
rentable para que pi (s) 5 pi (s). Esto har que (s) = 0.

Ahora si sucede que esta n-tupla s es fija bajo T la proporcin de i usada en si no debe de-
crecer por T . Por lo tanto, para todos los , i (s) deber ser cero para evitar que el denominador
de la expresin que define s0i se exceda de 1.

As, si s es fijo bajo T , para cualquier i y i (s) = 0.. Esto significa que ningn jugador puede
mejorar su pago movindose a una estrategia pura i . Pero esto es solo un criterio para un pt. eq.
[ver (2)].

Por el contrario, si s es un pt. eq. es inmediato que todos los desaparecen, haciendo s un punto
fijo bajo T .

Ya que el espacio de n-tuplas es una celda el teorema del punto fijo de Brouwer requiere que T
deba tener al menos un punto fijo s, el cual debe ser un punto de equilibrio.
7 Juegos No Cooperativos

Simetras de Juegos

Un automorfismo, o simetra, de un juego ser una permutacin de sus estrategias puras que
satisface ciertas condiciones, dadas abajo.

Si dos estrategias pertenecen a un nico jugador deben ir hacia dos estrategias pertenecientes a
un nico jugador. As, s es la permutacin de las estrategias puras sta induce una permutacin
de los jugadores.

Cada n-tupla de estrategias puras es por lo tanto permutada en otra n-tupla de estrategias puras.
Podemos llamar a la permutacin inducida de estas n-tuplas. Sea que denote una n-tupla de
estrategias puras y pi () el pago del jugador i cuando la n-tupla es empleada. Requerimos que si

j = i entonces pj ( ) = pi ()

lo que completa la definicin de simetra.

La permutacin tiene una nica extension lineal a las estrategias mixtas. Si

definimos
X X
si = ci i (si ) = ci (i ) ,

La extensin de a las estrategias mixtas claramente genera una extensin de a las n-tuplas
de estrategias mixtas. Tambin debemos designar esto mediante .

Definimos una n-tupla simtrica s de un juego por medio de s = s para todas las .

Teorema 2. Cualquier juego finito tiene un punto de equilibrio simtrico.

Prueba. Primero, notamos que si0 = i/ 1 tiene la propiedad (si0 ) = sj0 donde j = i ,
P P

de modo que la n-tupla s0 = (s10 .s20 , , sn0 ) es fija bajo cualquier ; por lo tanto cualquier juego
tiene al menos una n-tupla simtrica.

Si s = (s1 , , sn ) y t = (t1 , , tn ) son simtricos, entonces


 
s+t s1 + t1 s2 + t2 sn + tn
= , , ,
2 2 2 2

es tambin simtrico porque s = s sj = (si ) , donde j = i , por ello



(si ) + (ti )

sj + tj si + ti
= =
2 2 2

por consiguiente  
s+t s+t
= .
2 2
John Nash 8

Esto muestra que el conjunto de n-tuplas simtricas es un subconjunto convexo del espacio de
n-tuplas ya que es obviamente cerrado.

Ahora observar que el mapa T : s s' usado en la prueba del teorema de existencia fue intrnse-
camente definido. Por lo tanto, si s2 = T s1 y es derivado de un automorfismo del juego tendremos
s2 = T s1 . Si s1 es simtrico s1 = s1 y por eso s2 = T s1 = s2 . Consecuentemente el mapa traza el
conjunto de n-tuplas simtricas dentro de s mismo.

Ya que este conjunto es una celda debe haber un punto simtrico fijo s que debera ser un punto
de equilibrio simtrico.
9 Juegos No Cooperativos

Soluciones

Definimos aqu soluciones, soluciones fuertes, y sub-soluciones. Un juego no cooperativo no siem-


pre tiene una solucin, pero cuando la tiene la solucin es nica. Soluciones fuertes son soluciones
con propiedades especiales. Sub-soluciones siempre existen y tienen muchas de las propiedades de
las soluciones, pero carecen de unicidad.

S1 denotar un conjunto de estrategias mixtas del jugador i y S un conjunto de n-tuplas de


estrategias mixtas.

Solubilidad:

Un juego es resoluble si su conjunto de puntos de equilibrio, S, satisface para todas las i la


condicin

(t; ri ) S y s S (s; ri ) S (5)


Esto es llamado la condicin de intercambiabilidad. La solucin de un juego resoluble es su
conjunto de puntos de equlibrio S.

Solubilidad Fuerte:

Un juego es fuertemente resoluble si tiene una solucin, S , tal que para todas los i.

s S y pi (s; ri ) = pi (s) (s; ri ) S

y luego S es llamado una solucin fuerte.

Estrategias de equilibrio:

En un juego resoluble sea Si el conjunto de todas las estrategias mixtas si tal que para cada t la
n-tupla (t; si ) sea un punto de equilibrio. [si es el i-simo componente de algn punto de equilibrio.]
Llamamos a Si el conjunto de estrategias de equilibrio del jugador i.

Sub-soluciones:

Si S es un subconjunto de un conjunto de puntos de equilibrio de un juego y satisface la con-


dicin (1); y si S es el mximo relativo a esta propiedad entonces llamamos a S una sub-solucion.

Para cada sub-solucion S nosotros definimos el conjunto de factores i-simo, Si , como el con-
junto de todos los si tal que S contiene (t; si ) para algn t.

Notar que la sub-solucion, cuando es nica, es una solucin; y que sus conjunto de factores son
los conjuntos de estrategias de equilibrio.
John Nash 10

Teorema 3. Una sub-solucin, S, es un conjunto de todos las n-tuplas (s1 , s2 , , sn ) tal que
cada si Si cuando Si es el conjunto de factores i-simo de S. Geomtricamente, S es el producto
de sus conjuntos de factores.

Prueba Considerar dicha n-tupla (s1 , s2 , , sn ). Por definicin t1 , t2 , , tn tal que para
cada i (t; s1 ) S. Usando la condicin (5) n 1 veces obtenemos sucesivamente (t; s1 ) S, (t;
s1 ; s2 ) S, (t; s1 ; s2 ; ; sn ) S y el ltimo es simplemente (s1 , s2 ; , sn ) S que es lo que
necesitbamos mostrar.

Teorema 4. Los conjuntos de factores S1 , S2 , , Sn de una sub-solucin son cerrados y con-


vexos como subconjuntos de espacios de estrategias mixtas.

Prueba Es suficiente mostrar dos cosas:

(a) Si si y s0i Si entonces si = (si + s0i )/2 Si ; (b) si si es un punto lmite de S1 entonces
si Si .

Sea t S. Entonces tenemos pj (t; si ) = pj (t; si ; rj ) y pj (t; s0i ) = pj (t; s0i ; rj ) para cada rj , usando
el criterio de (1) para un pt. eq. Sumando estas desigualdades, usando la linealidad de pj (s1 , , sn )
en si , y dividiendo por 2, obtenemos pj (t; si ) = pj (t; si ; rj ) ya que si = (si + s0i )/2. De esto sa-
bemos que (t; si ) es un pt. eq. para cada t S. Si el conjunto de todos dichos pts. eq. (t; si ) es
adicionado a S el conjunto aumentado claramente satisface la condicin (5), y como S iba a ser
mximo concuerda con si Si .

Para atacar (b) notar que la n-tupla (t; si ), donde t S, ser un punto lmite de un conjunto
de n-tuplas de la forma (t; si ) donde si Si , ya que si es un punto lmite de Si . Pero este conjunto
es un conjunto de pts. eq. y por lo tanto cualquier punto en su clausura es un pt. eq., ya que el
conjunto de todos los pts. eq. es cerrado. Entonces (t; si ) es un pt. eq. y por lo tanto si Si por el
mismo argumento que para si .

Valores:

Sea S el conjunto de puntos de equilibrio de un juego. Definimos:

vi+ = mx[pi (S)] vi = mn[pi (S)]


sS sS

Si vi+ = vi escribimos vi = vi+ = vi . vi+ es el valor superior para el jugador i del juego; vi es
el valor inferior; y vi el valor, si ste existe.

Los valores tendrn obviamente que existir si hay solo un punto de equilibrio.

Uno puede definir valores asociados para una sub-solucin restringiendo S a los pts. eq. en la
sub-solucin y luego usando las mismas ecuaciones definitorias como arriba.

Un juego de suma cero de dos personas es siempre resoluble en el sentido definido anteriormen-
te. Los conjuntos de estrategias de equilibrio S1 y S2 son simplemente un conjunto de buenas
11 Juegos No Cooperativos

estrategias. Dicho juego no es generalmente fuertemente resoluble; soluciones fuertes existen solo
cuando hay un punto de ensilladura en estrategias puras.

Ejemplos Simples

Estos intentan ilustrar los conceptos definidos en el documento y mostrar fenmenos especiales
que ocurren en estos juegos.

El primer jugador tiene las estrategias en letra romana y el pago a la izquierda, etc.

Ejm. 1 5 a -3
Solucin ( 16
9
a+ 7 7
16 b, 17 + 10
17 )
-4 a 4
-5 b 5 5
(v1 = 17 , v2 = + 12 )
3 b -4
Ejm. 2 1 a 1 Solucin Fuerte (b, )
-10 a 10
10 b -10 v1 = v2 = 1
-1 b -1
Ejm. 3 1 a 1
Irresoluble; pts. eq. (a, ), (b, ), y ( a2 + 2b , 2 + 2 ).
-10 a -10
Las estrategias en el ltimo caso tienen propiedades
-10 b -10
maxi-min y mini-max.
1 b 1
Ejm. 4 1 a 1 Solucin Fuerte: todos los pares de estrategias mixtas.
0 a 1
1 b 0 v1+ = v2+ = 1, v1 = v2 = 0
0 b 0
Ejm. 5 1 a 2
Irresoluble; pts. eq. (a, ), (b, ), y
-1 a -4
( 14 a + 34 b, 32 + 52 ). Sin embargo, las pruebas
-4 b -1
empricas muestran una tendencia hacia (a, ).
2 b 1
Ejm. 6 1 a 1 Pts. eq. (a, ) y (b, ), con (b, ) como ejemplo de
0 a 0 inestabilidad.
0 b 0
0 b 0
John Nash 12

Forma Geomtrica de las Soluciones

En el caso del juego de suma cero para dos personas, ha sido mostrado que el conjunto de
buenas estrategias de un jugador es un subconjunto polidrico convexo de su espacio de estrate-
gias. Obtendremos el mismo resultado para un conjunto de estrategias de equilibrio del jugador en
cualquier juego resoluble.

Teorema 5. Los conjuntos S1 ,S2 , ,Sn de estrategias de equilibrio en un juego resoluble son
subconjuntos polidricos convexos de los espacios de estrategias mixtas respectivos.

Prueba. Una n-tupla s ser un punto de equilibrio si y solo si para todo i:

pi (s) = mx pi (s) (6)


que es la condicin (3). Una condicin equivalente es que para todo i y

pi (s) pi (s) = 0. (7)

Ahora consideremos la forma del conjunto Sj de estrategias de equilibrio, sj , del jugador j. Sea
t cualquier punto de equilibrio, entonces (t; sj ) ser un punto de equilibrio si y slo si sj Sj , segn
el Teorema 2. Ahora aplicamos las condiciones (2) a (t; sj ), obteniendo

sj Sj para todo i, pi (t, sj ) pi (t, sj ) = 0. (8)

Ya que pi es n-lineal y t es constante stos son un conjunto de inecuaciones lineales de la forma


Fi, (sj ) = 0. Cada una de tales inecuaciones es satisfecha ya sea para todo sj o para los que se
encuentran en y a un lado de algn hiperplano que pasa a travs de la estrategia simplex. Por lo
tanto, el conjunto completo [el cual es finito] de condiciones ser satisfecho simultneamente en
algn subconjunto polidrico convexo de estrategia simplex del jugador j. [interseccin de espacios-
medios.]

Como un corolario podramos concluir que Sj es el cierre convexo de un conjunto finito de


estrategias mixtas [vrtices].
13 Juegos No Cooperativos

Dominancia y Mtodos de Contradiccin

Decimos que s0i domina a si si pi (t; s0j ) > pi (t; sj ) para todo t.

Esto equivale a decir que s0i da al jugador i un mayor pago que si sin importar cuales sean las
estrategias de los otros jugadores. Para ver si una estrategia s0i domina a si es suficiente considerar
slo las estrategias puras para los otros jugadores, debido a la n-linealidad de pi .

Es obvio de las definiciones que ningn punto de equilibrio puede involucrar una estrategia do-
minada si .

La dominacin de una estrategia mixta por otra siempre implicar otras dominaciones. Supon-
gamos que s0i domina a si y ti utiliza todas las estrategias puras que tienen un mayor coeficiente en
si que en s0i . Entonces para un suficientemente pequeo > 0

t0i = ti + (s0i si )

es una estrategia mixta; y t0i domina ti por linealidad.

Uno puede probar unas cuantas propiedades del conjunto de estrategias no dominadas. Est
conectado simplemente y est formado por la unin de alguna coleccin de caras de la estrategia
smplex.

La informacin obtenida al descubrir dominancias para un jugador puede ser relevante para los
dems, en lo que la eliminacin de clases de estrategias mixtas como posibles componentes de un
punto de equilibrio concierne. Para las t cuyos componentes son todos no dominados es todo lo que
necesita ser considerado y por lo tanto eliminando algunas de las estrategias de un jugador puede
hacer posible la eliminacin de una nueva clase de estrategias para el otro jugador.

Otro procedimiento que puede ser utilizado en la localizacin de los puntos de equilibrio es el
anlisis tipo contradiccin. Aqu uno asume que existe un punto de equilibrio teniendo estrategias
que lo componen yaciendo dentro de ciertas regiones de los espacios de estrategia y procede a
deducir condiciones adicionales que deben ser satisfechas si la hiptesis es verdadera. Este tipo
de razonamiento se puede llevar a cabo a travs de varias etapas para obtener eventualmente una
contradiccin que indica que no hay punto de equilibrio que satisface la hiptesis inicial.
John Nash 14

Un Juego de Pquer de Tres Personas

Como un ejemplo de la aplicacin de nuestra teora a un caso ms o menos realista, incluimos


el juego de pquer simplificado dado a continuacin:

(a) El mazo es grande, con muchas cartas altas y bajas por igual, y una mano consiste de una
carta.
(b) Dos fichas son usadas para apostar inicialmente, abrir o igualar.
(c) Los jugadores juegan en rotacin y el juego finaliza despus que todos han pasado o despus
que un jugador ha abierto y los otros han tenido una oportunidad para llamar.
(d) Si nadie apuesta, las apuestas iniciales se recuperan.
(e) De otra manera el pozo se divide en partes iguales entre las manos ms altas que han apostado
apuesta.

Encontramos ms satisfactorio tratar el juego en trminos de cantidades que llamamos pa-


rmetros de comportamiento que en la forma normal de la Teora de Juegos y Comportamiento
Econmico. En la representacin en forma normal dos estrategias mixtas de un jugador pueden ser
equivalentes en el sentido que cada uno hace que el individuo elija cada curso de accin disponible
en cada situacin particular que requiere una accin por su parte con la misma frecuencia. Es decir,
representan el mismo patrn de comportamiento por parte del individuo.

Parmetros de comportamiento dan las probabilidades de tomar cada una de las diversas ac-
ciones posibles en cada una de las diferentes situaciones posibles que puedan surgir. Por lo tanto
describen los patrones de comportamiento.

En trminos de parmetros de comportamiento las estrategias de los jugadores pueden ser re-
presentadas de la siguiente manera, asumiendo que ya que no hay punto en pasar con una carta
alta en la ltima oportunidad para apostar ello no se har. Las letras griegas son las probabilidades
de diferentes acciones.

Primer Movimiento Segundo Movimiento


Abrir con carta alta Igualar a III con carta baja
I Abrir con carta baja Igualar a II con carta baja
Igualar a II y a III con carta baja
Igualar a I con carta baja Igualar a III con carta baja
II Abrir con carta alta Igualar a III y a I con carta baja
Abrir con carta baja
Igualar a I y a II con carta baja El jugador III nunca tiene un segundo movimiento
Abrir con carta baja
III
Igualar a I con carta baja
Igualar a II con carta baja

Localizamos todos los posibles puntos de equilibrio mostrando primero que la mayora de los
parmetros en letras griegas deben desaparecer. Por dominancia principalmente con un pequeo
anlisis de tipo contradiccin es eliminada y con ella se van , y por dominancia. Luego las
15 Juegos No Cooperativos

contradicciones eliminan , , , , y en ese orden. Eso nos deja con , , y . El anlisis


de contradiccin muestra que ninguna de ellas puede ser cero o uno y por lo tanto obtenemos un
sistema de ecuaciones algebraicas simultaneas. Las ecuaciones justamente tienen solo una solucin
con las variables en el rango (0, 1). Obtenemos:

21 321 5 + 1 5 2 4 1
= , = , = , = .
10 4 5+ +5
Esto da como resultado: =.308, =.635, =.826, =.044. Ya que solo hay un punto de
equilibrio, el juego tiene valores; estos son:

(1 + 17) 1 2
1 = .147 = , 2 = .096 = ,
8(5 + ) 4
y  
79 1
3 = .243 = .
40 5+
Una investigacin de los poderes de la coalicin da las siguientes buenas estrategias y valores
para varias coaliciones. Los parmetros no mencionados son cero.

I y II versus III
= 3/4 = 1/4, 0 2/3
==1 valor para III: .03125 =1/32

II y III versus I
=1,=0 = 2/3
= 2/3 valor para I: .1667 = 1/6

I y III versus II
alta baja
apostar pasar =0 3/11 = 7/11 , = = 3/11
pasar pasar = 13/16 8/11 valor para II: .1136 = -5/44

Los miembros de la coalicin tienen el poder de acordar un patrn de juego antes de que el
juego sea jugado. Esta ventaja se vuelve significativa solo en los casos de coalicin I y III donde III
puede abrir luego de dos pases cuando I ha planeado pasar tanto en cartas altas como en cartas
bajas pero no abrir si I ha planeado apostar si obtiene una carta alta. Los valores dados son, por
supuesto, los que el jugador individual se asegura con su estrategia segura.

Un tratamiento ms detallado de este juego est siendo preparado para su publicacin en otra
parte. ste considerar diferentes tamaos relativos de apuesta inicial y otras apuestas.
John Nash 16

Motivacin e Interpretacin
En esta seccin trataremos de explicar el significado de los conceptos introducidos en este docu-
mento. Es decir, trataremos de mostrar como puntos de equilibrio y soluciones se pueden conectar
con fenmenos observables.

Los requisitos bsicos para un juego no comparativo es que no debe haber comunicacin previa
al juego entre los jugadores [a menos que no tenga que ver en el juego]. As, por consecuencia, no
hay coaliciones ni pagos laterales. Debido a que no hay transferencia de utilidad [pagos] adicional
al juego, los pagos de diferentes jugadores son efectivamente incomparables; si transformamos las
funciones de pago linealmente: p0i = ai pi + bi donde ai > 0 el juego ser esencialmente el mismo.
Note que los puntos de equilibrio son preservados bajo tal transformacin.

Ahora tomaremos la interpretacin accin de masas de puntos de equilibrio. En esta inter-


pretacin las soluciones no tienen gran significado. No es necesario garantizar que los participantes
tengan pleno conocimiento de la estructura total del juego, o la habilidad e inclinacin de ir a tra-
vs de algunos procesos de razonamiento complejo. Pero se supone que los participantes acumulan
informacin emprica sobre las ventajas relativas de las distintas estrategias puras a su disposicin.

Para ser ms detallados, asumimos que hay una poblacin [en el sentido de la estadstica] de
participantes por cada posicin del juego. Asumimos tambin que el juego promedio de un juego
consiste en n participantes seleccionados al azar de las n poblaciones, y que hay una frecuencia me-
dia estable con la que cada estrategia pura es empleada por el miembro promedio de la poblacin
apropiada.

Ya que no hay colaboracin entre los individuos que juegan en diferentes posiciones del juego, la
probabilidad que una particular n-tupla de estrategias puras se empleara en una jugada del juego
ser el producto de las probabilidades que indican la probabilidad de cada una de las n estrategias
puras para ser empleadas en una jugada aleatoria.

P Sea la probabilidad que i sea empleado en una jugada aleatoria del juego cia , y sea Si =
ci i , s = (s1 , s2 , , sn ). Luego el pago esperado a un individuo que juega en la i-sima
posicin del juego y emplea la estrategia pura i es pi (s; i ) = pi (s).

Ahora consideremos que efectos la experiencia de los participantes producirn. Asumir, como
hicimos, que acumularon evidencia emprica de las estrategias puras a su disposicin es asumir que
aquellos que juegan en la posicin i aprenden los nmeros pi (s). Pero si saben stos, emplearn
solamente estrategias puras ptimas, en otras palabras, aquellas estrategias puras i tal que :

pi (s) = mx pi (s).

En consecuencia dado que Si expresa su comportamiento Si adjunta coeficientes positivos solamente


a estrategias puras ptimas, tal que

i es usanda en Si pi (s) = mx pi (s).



17 Juegos No Cooperativos

Pero esto es simplemente una condicin para que s sea un punto de equilibrio. [ver (4)]

As, las suposiciones que hicimos en esta interpretacin de accin de masas lleva a la conclu-
sin que las estrategias mixtas que representan el comportamiento promedio en cada una de las
poblaciones forman un punto de equilibrio.

Hay situaciones en economa o poltica internacional en que, efectivamente, un grupo de intereses


estn involucrados en un juego no cooperativo sin ser conscientes de ello, esta inconsciencia ayuda
a hacer la situacin verdaderamente no cooperativa.

En realidad, por supuesto, podemos solamente esperar algn tipo de equilibrio aproximado, ya
que la informacin, su utilizacin y la estabilidad de la frecuencia promedio ser imperfecta.

Ahora esquematizamos otra interpretacin, una en la cual las soluciones jueguen un rol principal
y que sea aplicable a un juego jugado solo una vez.

Procedemos investigando la pregunta: cul sera una prediccin racional del comportamiento
a ser esperado de una jugada racional del juego en cuestin? Usando los principios que una predic-
cin racional debe ser nica, que los jugadores deben ser capaces de deducir y hacer uso de ella,
y que tal conocimiento por parte de cada jugador de lo que puede esperar que los otros jugadores
hagan no le debera conducir a actuar de conformidad con la prediccin, se es llevado al concepto
de una solucin definida antes.

Si S1 , S2 , , Sn fueron los conjuntos de estrategias de equilibro de un juego resoluble, la pre-


diccin racional debe ser: El comportamiento promedio de personas racionales jugando en la
posicin i definira una estrategia mixta si en Si si un experimento fue llevado a cabo.

En esta interpretacin necesitamos asumir que los jugadores conocen la estructura completa
del juego con el fin de ser capaces de deducir la prediccin por s mismos. Es una interpretacin
racionalista e idealizadora bastante fuerte.

En un juego irresoluble a veces sucede que buenas razones heursticas pueden ser encontradas
por reduccin del conjunto de puntos de equilibrio a aquellos en una sub-solucin simple, que luego
juega el rol de una solucin.

En general una sub-solucin puede ser vista como un conjunto de puntos de equilibrio mutua-
mente compatibles, formando un todo coherente. Las sub-soluciones parecen dar una subdivisin
natural del conjunto de puntos de equilibrio de un juego.
John Nash 18

Aplicaciones

El estudio de juegos de n-personas para las cuales la tica aceptada de juego limpio implica el
juego no cooperativo es, desde luego, una direccin obvia en la cual aplicar esta teora. Y el pquer
es el objetivo ms obvio. El anlisis de un juego de pquer ms realista que nuestro muy simple
modelo debe ser un asunto bastante interesante.

La complejidad del trabajo matemtico necesario para una completa investigacin aumenta con
bastante rapidez, sin embargo, al aumentar la complejidad del juego; por lo que el anlisis de un
juego mucho ms complejo que el ejemplo dado aqu solo podra ser factible usando mtodos de
aproximacin computacionales.

Un tipo menos obvio de aplicacin es el estudio de juegos cooperativos. Por un juego cooperativo
nos referimos a una situacin que involucra a un conjunto de jugadores, estrategias puras, y pagos
como de costumbre; pero con el supuesto que los jugadores pueden y van a colaborar como lo hacen
en la teora de Von Neumann y Morgenstern. Esto significa que los jugadores pueden comunicarse
y formar coaliciones que sern hechas cumplir por un rbitro. Es innecesariamente restrictivo, sin
embargo, asumir cualquier transferibilidad o incluso comparabilidad de los pagos [que deben estar
en unidades de utilidad] para diferentes jugadores. Cualquier transferibilidad deseada puede ponerse
en el juego mismo en lugar de asumir que es posible en la colaboracin extra-juego.

El autor ha desarrollado un enfoque dinmico para el estudio de los juegos cooperativos ba-
sados en la reduccin a la forma no cooperativa. Se procede mediante la construccin de un modelo
de la negociacin pre-juego tal que los pasos de la negociacin se vuelvan movimientos en un juego
no cooperativo mayor [que tendr una infinidad de estrategias puras] que describe la situacin total.

Este juego mayor es entonces tratado en trminos de la teora de este documento [extendida a
juegos infinitos] y si se obtienen valores, stos se toman como los valores de los juegos cooperativos.
Por lo tanto el problema de analizar un juego cooperativo se convierte en el problema de obtener
un modelo no cooperativo, adecuado y convincente, para la negociacin.

El autor obtiene, por dicho tratamiento, valores para todo juego finito cooperativo de dos per-
sonas, y algunos juegos especiales de n-personas.
Referencias

[1] von Newman, Morgenstern, Theory of Games and Economic Behavior, Princeton University
Press, 1944.
[2] J. F. Nash, Jr., Equibilibrium Points in N-Person Games, Proc. Nat. Acad. Sci. U.S.A. 36
(1950) 48-49.

[3] J. F. Nash, L.S. Sharpley, Simple Three-Person Poker Game, Annals of Mathematics Study
No 24, Princeton Univesity Press, 1950.
[4] John Nash Two Person Cooperative Games to appear in Econometrica.
[5] H. W. Kuhn Extensive Games Proc. Nat. Acad. Sci. U.S.A. 36 (1950) 570-576.

Agradecimientos

Los Doctores Tucker, Gale y Kuhn dieron valiosas crticas y sugerencias para mejorar la expo-
sicin del material en este documento. David Gale sugiri la investigacin de los juegos simtricos.
La solucin del modelo de Pquer fue un proyecto conjunto llevado a cabo por Lloyd S. Shapley y
el autor. Finalmente, el autor fue sostenido financieramente por la Comisin de Energa Atmica
en el periodo 1949-1950 durante el cual se llev a cabo este trabajo.

S-ar putea să vă placă și