Documente Academic
Documente Profesional
Documente Cultură
Teora de juegos
Conceptos
Juego suma cero
Estrategias Puras
Estrategias mixtas
Mtodo grafico
Programacin lineal
Juegos suma constante
Juegos de suma no constante
Conceptos
Conceptos
Conceptos
-1
-1
Estrategias puras
Estrategias puras
Estrategias puras
Estrategias puras
Jugador A
18
-4
10
mx.
18
min
2
5
-4
Estrategias puras
Estrategias puras
Estrategias puras
Punto Silla: si Vminimax = Vmaxmin.
Si el juego tiene punto silla => las
estrategia puras son ptimas y el valor
del juego (V) es:
V=Vminimax = Vmaxmin.
Estrategias puras
Estrategias mixtas
Estrategias mixtas
Ejemplo:
jugador B
Jugador A
1
2
3
4
mx.
1
5
6
8
3
8
2
-10
7
7
4
7
3
9
8
15
-1
15
4
0
1
2
4
4
min.
-10
1
2
-1
Estrategias mixtas
En este caso, cada jugador puede jugar
todas sus estrategias de acuerdo con un
conjunto predeterminado de
probabilidades, esto es, se asocia a
cada estrategia del jugador las
probabilidades:
Estrategias mixtas
Sean x1, x 2,....xm las probabilidades asociadas a las
estrategias del jugador A (jugador de la filas) y
y1, y 2 ,.... yn las probabilidades asociadas a las estrategias
del jugador B (jugador de las columnas)
m
n
=>
x =
y =1
x ,y 0
i, j
i =1
j=
entonces se tiene
x1
y1
a11
y2
a12
...
...
yn
a1n
x2
...
xm
a 21
..
a m1
a 22 ... a 2 n
.. ... ..
a m 2 ... a mn
Estrategias mixtas
Se usa tambin el criterio MinMax
Esto es:
A : Elige xi la cual maximiza el pago
esperado mas pequeo en una columna
( xi 0,
Donde:
m
m
max min
ai1 xi , ai 2 xi ,.....,
xi
i =1
i =1
ain xi
i =1
= 1)
Estrategias mixtas
B : Elige y j la cual minimiza el mayor
pago esperado en una fila
Donde:
min max
yj
( y j 0,
= 1)
a1 j y j , a 2 j y j ,.....,
a mj y j
j =1
j =1
j =1
Se verifica que:
pago esperado minimax>= pago esperado maximin
IO2- Rosa Delgadillo
Estrategias mixtas
y *j
xi*
Teorema: si
y
son soluciones
ptimas para ambos jugadores Cada
elemento de pago estar asociado a la
probabilidad por consiguiente el valor
esperado ptimo del juego es:
m
V =
*
i =1 j =1
aij xi* y *j
Mtodo grfico
Juegos 2 x n : en este caso es posible
calcular los pagos esperados del
jugador A con respecto a las estrategias
puras del jugador B y luego trazar las
rectas para determinar el valor del
juego.
Mtodo grfico
Juegos 2 x n :
sea
A
y1
y2
...
yn
x1
a11
a12
... a1n
x2
a 21
a 22 ...
a 2n
como x2 = 1 x2 se tiene
Pagos esperados de A
1
Estrategias
puras de B
2 (a12 a 22 ) x1 + a22
..
...
n (a1n a 2 n ) x1 + a 2 n
Es lineal
Mtodo grfico
Trazar las rectas como funciones de xi para
determinar determinar el valor de xi que maximiza los
mnimos pagos esperados (Jugador A: maximin)
Ejemplo:
B
1 2 3
A
1 2 2 3 1
2 4 3 2
Mtodo grfico
Dado que el juego no tiene punto silla, se calcula
Pagos esperados de A
4
1
Estrategias
puras de B
2 x1 + 4
2 x1 + 3
3
x1 + 2
4 7 x1 + 6
2
3
Maxmin
Mtodo grfico
xi las rectas
el maxmin ocurre en la interseccin de
2,3 y 4 , de donde x 1 = 1 / 2 , sustituyendo en
cualquier recta que pasa por maxmin se tiene el valor
del juego
La estrategia ptima de A es
x1* = 0.5, x2* = 0.5 y
V * = 5/ 2
Mtodo grfico
Para obtener la estrategia ptima para B, se observa
las 3 rectas que pasan por maximin (2, 3 y 4), esto
es B puede combinar cualquiera de las tres.
por tanto las rectas (2,3) (2,4) (3,4), son las
posibles estrategias a combinar, se excluye (2,4)
pues tienen pendientes del mismo signo y esto no
garante que sea una solucin optima alternativa.
Si tomamos las rectas (2,3), implica que
y3 = 1 y 2
y1* = y 4* = 0 y
Mtodo grfico
Calculando los pagos de B
Pagos esperados de B
Estrategias
puras de A
Se obtiene
1 y2 + 3
2
y2 + 2
V * = 5/ 2
V * = 5/ 2
Mtodo grfico
trazamos las 4 rectas
4
Minmax
1
2
3
de donde
y1* = 2 / 3, y 2* = 1 / 3 y
V * = 8/3
Mtodo grfico
Para el jugador A, se observa que el punto minmax
corresponde a las estrategias puras 1 y 3 de A
x2* = x4* = 0
y x3 = 1 x1
Pagos esperados de A
Estrategias
puras de B
1 x1 + 3
2 2 x1 + 2
V * = 8/3
Programacin Lineal
El problema del jugador A, se puede escribir de la siguiente forma:
m
m
max min
a i1 xi ,
a i 2 x i ,.....,
xi
i =1
i =1
s.a
x1 + x 2 + .... + x m = 1
x i 0,
Si hacemos
i =1
a in xi
i = 1, 2,..., m
m
m
v = min
ai1 xi , ai 2 xi ,.....,
i =1
i =1
ain xi
i =1
Programacin Lineal
Entonces el problema del jugador A, se puede escribir como un
PPL.
max Z = V
s .a
m
a ij x i ,
j = 1 , 2 ,..., n
i =1
xi = 1
i =1
xi 0,
Programacin Lineal
El problema del jugador B, se puede escribir de la siguiente forma:
min max
xi
s.a
a1 j y j ,
a 2 j y j ,.....,
a mj y j
j =1
j =1
j =1
n
y1 + y 2 + .... + y n = 1
y j 0,
Si hacemos
y = 1, 2,..., n
w = max
a1 j y j , a2 j y j ,.....,
a mj y j
j =1
j =1
j =1
Programacin Lineal
Entonces el problema del jugador B, se puede escribir como un
PPL.
min Z = W
s .a
n
a ij y
W ,
i = 1 , 2 ,.... m
j =1
n
0,
= 1
j =1
j
Programacin Lineal
Observe: que el Problema del jugador B es el dual del problema del
jugador A.
La solucin del problema de A proporciona la solucin del
problema de B
el problema de B se resuelve con simplex regular
el problema de A se resuelve con Simplex dual
La eleccin de un mtodo u otro depende de que el problema
tenga Un nmero ms pequeo de restricciones ( nmero de
estrategias puras para un jugador)
Programacin Lineal
Ejercicio: Dos jugadores dicen simultneamente 3 palabras piedra,
papel tijeras, y hacen seales correspondientes con las manos,
si ambos jugadores dicen lo mismo, entonces el juego se
empata, si no sucede as, un jugador gana 1 dlar al otro
jugador.
Solucin: la matriz de recompensa es
B
piedra
piedra
0
papel
tijera
1
1
0
1
1
0
max
1
1
Programacin Lineal
El PPL para jugador A:
max
s .a .
V
, x
, x
V
nrs
Programacin Lineal
El PPL para jugador B:
min
s .a
W
, y
, y
Al resolver obtiene
y
+
+
3
y
3
y
y
nrs
y1* = y 2* = y3* = 1 / 3 y W = 0
Dominancia
Definicin: Sea dos vectores A = (a1 , a2 ,...., an ) y B = (b1 , b2 ,...., bn ) se dice
que A domina B, si cada componente de A es estrictamente
mayor o igual a su correspondiente componente en B, esto es
a j bj
Dominancia
A = (a1 , a2 ,...., iande
) un
B =jugador
(b1 , b2 ,...., bdado
Dominancia en juegos: Una estrategia
es
n)
dominada por una estrategia i , si para cada una de las otras
estrategias posibles del jugador; el jugador si domina por lo
menos tambin con la estrategia i como lo hace con la
estrategia i y si para al menos una de las otras estrategias del
jugador, i es superior a la estrategia i
Un jugador puede dejar de considerar todas sus
estrategias dominadas
Dominancia
Ejemplo: Sea la siguiente matriz de recompensas de dos jugadores
AyB
A1
A2
A3
B1
40
38
28
B2
34
35
33
B3
30
36
35
B4
33
37
38
B1
40
38
28
B2
34
35
33
B3
30
36
35
B4
33
37
38
Dominancia
En la matriz reducida observe las estrategias del jugador A
Como A, busca maximizar su
B1 B2 B3 B4
minima ganancia, entonces la
A1 40 34 30 33
estrategia A2 domina a la
A2 38 35 36 37
estrategia A3
A3
28 33
35
38
A1
A2
A3
B1
40
38
28
B2
34
35
33
B3
30
36
35
B4
33
37
38
35
45
38
15
58
14
60
50
70
58
14
58
50
70
70
45
14
confiesa noconfiesa
(5,5)
(0,20)
(20,0)
(1. 1)
Observe: las recompensas varan desde -2 hasta -20 => no es juego suma
constante
Si cada prisionero decide eliminar su estrategia dominada => confesar
domina a no confesar => c/prisionero pasa 5 aos en prisin.
en tanto que si c/ prisionero escoge su estrategia dominada no confesar
=> c/ prisionero pasar solo 1 ao en prisin
confiesa noconfiesa
(5,5)
(0,20)
(20,0)
(1. 1)
NC ( P, P) (T , S )
C
NC= no cooperar
C = cooperar
( S , T ) ( R, R )
NC ( P, P) (T , S )
C
( S , T ) ( R, R )