Teoria de Juegos

Teora de Juegos:
IO2 Rosa Delgadillo
Teora de juegos

Conceptos
Juego suma cero
Estrategias Puras
Estrategias mixtas
Mtodo grafico
Programacin lineal
Juegos suma constante
Juegos de suma no constante
IO2- Rosa Delgadillo
Conceptos
En la teora de decisin con incertidumbre, se

supone que los estados de la naturaleza, son
los oponentes
En la teora de juegos, trata de decisiones
con incertidumbre, comprendiendo dos o ms
oponentes inteligentes.
Cada oponente aspira a optimizar su propia
decisin a costa de los otros.
Conceptos

Ejemplo donde se aplican

En campaas publicitarias para
productos competitivos
Plan de tcticas destinadas a dos
bandos contrincantes
Conceptos
En la teora de juegos, cada oponente

se conoce como un jugador
Cada jugador tiene un nmero finito o
infinito de estrategias
Los resultados o pagos de un juego se
resume como funciones de las
diferentes estrategias para cada
jugador
Juego suma cero

Un juego con 2 jugadores en donde la

ganancia de uno implica la prdida del
otro se conoce como juego de dos
personas suma cero. Entonces los
resultados se pueden expresar en
trminos del pago de un jugador.
Juego suma cero

Ejemplo: El juego consiste en igualar 2

monedas, cada jugador puede elegir C cara
o S sello.
El jugador A elije C y el jugador B elije S.
Si los resultados de lanzar las dos monedas
son:
(C, C) (S, S) => A gana $1, que paga B
(C, S) (S, C) => A pierde $1 que paga a B
Juego suma cero

Cada jugador tiene 2 estrategias C

S
La matriz de juegos 2 x 2 es:
Jugador B
Juga
dor
A
-1
-1
Estrategias puras
La solucin para el juego puede

necesitar que cada jugador emplee una
estrategia pura estrategias mixtas.
Los problemas de juegos o los juegos
representan problemas de decisin
donde existe falta informacin, pues los
oponentes inteligentes trabajan en un
medio conflictivo.
Estrategias puras
Supuesto: Cada jugador elige una

estrategia que lo posibilita a hacer lo
mejor que puede dado que su oponente
conoce la estrategia que est siguiendo.

(teora de juego . Jhon Von Neumann y Oskar
Morgenstern )
la estrategia que se sigue es

conservadora => el criterio es minimaxmaximin
Estrategias puras
Criterio minimaxmaximin: Elegir la

estrategia que proporciona el mejor de
los peores resultados.
El jugador de las filas (jugador A) utiliza
el criterio minimax, esto es maximiza sus
ganancias mnimas
El jugador de las columnas (jugador B)
utiliza el criterio maximin, esto es
minimiza sus mximas perdidas.
Estrategias puras
ejemplo: sea la siguiente matriz de

pagos
Jugador B
Jugador A
18
-4
10
mx.
18
min
2
5
-4
Estrategias puras
Solucin ptima: se alcanza cuando

ninguno encuentra beneficio en alterar
su estrategia, esto es el juego es
estable o esta en estado de equilibrio.
Estrategias puras
La ganancia correspondiente al jugador

A, Vmaxmin, se conoce como valor
maximin (o inferior) del juego.
La ganancia correspondiente al jugador
B, Vminimax, se conoce como valor
minimax (o superior) del juego.
Esto es, Vminimax >= V >= Vmaxmin
Estrategias puras
Punto Silla: si Vminimax = Vmaxmin.
Si el juego tiene punto silla => las
estrategia puras son ptimas y el valor
del juego (V) es:
V=Vminimax = Vmaxmin.
Estrategias puras
La Optimalidad significa que ningn

jugador debe cambiar su estrategia
pues su oponente puede contrarrestar
eligiendo otra estrategia que
proporcione pagos menos atractivos.
Estrategias mixtas
Cuando no es posible conseguir la

estabilidad del juego utilizando
estrategias puras, entonces es
necesario utilizar el concepto de
estrategias mixtas.
Estrategias mixtas
Ejemplo:
jugador B
Jugador A
1
2
3
4
mx.
1
5
6
8
3
8
2
-10
7
7
4
7
3
9
8
15
-1
15
4
0
1
2
4
4
min.
-10
1
2
-1
Se observa que cada jugador mejora su pago eligiendo una

estrategia diferente => el juego es inestable
Estrategias mixtas
En este caso, cada jugador puede jugar
todas sus estrategias de acuerdo con un
conjunto predeterminado de
probabilidades, esto es, se asocia a
cada estrategia del jugador las
probabilidades:
Estrategias mixtas
Sean x1, x 2,....xm las probabilidades asociadas a las
estrategias del jugador A (jugador de la filas) y
y1, y 2 ,.... yn las probabilidades asociadas a las estrategias
del jugador B (jugador de las columnas)
m
n
=>
x =
y =1
x ,y 0
i, j
i =1
j=
entonces se tiene
x1
y1
a11
y2
a12
...
...
yn
a1n
x2
...
xm
a 21
..
a m1
a 22 ... a 2 n
.. ... ..
a m 2 ... a mn
Estrategias mixtas
Se usa tambin el criterio MinMax
Esto es:
A : Elige xi la cual maximiza el pago
esperado mas pequeo en una columna
( xi 0,
Donde:
m
m
max min
ai1 xi , ai 2 xi ,.....,
xi
i =1
i =1
ain xi
i =1
= 1)
Estrategias mixtas
B : Elige y j la cual minimiza el mayor
pago esperado en una fila
Donde:
min max
yj
( y j 0,
= 1)
a1 j y j , a 2 j y j ,.....,
a mj y j
j =1
j =1
j =1
Se verifica que:
pago esperado minimax>= pago esperado maximin
Estrategias mixtas
y *j
xi*
Teorema: si
y
son soluciones
ptimas para ambos jugadores Cada
elemento de pago estar asociado a la
probabilidad por consiguiente el valor
esperado ptimo del juego es:
m
V =
*
i =1 j =1
aij xi* y *j
Mtodo grfico
Juegos 2 x n : en este caso es posible
calcular los pagos esperados del
jugador A con respecto a las estrategias
puras del jugador B y luego trazar las
rectas para determinar el valor del
juego.
Mtodo grfico
Juegos 2 x n :
sea
A
y1
y2
...
yn
x1
a11
a12
... a1n
x2
a 21
a 22 ...
a 2n
como x2 = 1 x2 se tiene
Pagos esperados de A
1
Estrategias
puras de B
(a11 a21 ) x1 + a21
2 (a12 a 22 ) x1 + a22
..
...
n (a1n a 2 n ) x1 + a 2 n
Es lineal
Mtodo grfico
Trazar las rectas como funciones de xi para
determinar determinar el valor de xi que maximiza los
mnimos pagos esperados (Jugador A: maximin)
Ejemplo:
B
1 2 3
A
1 2 2 3 1
2 4 3 2
Mtodo grfico
Dado que el juego no tiene punto silla, se calcula
4
1
Estrategias
puras de B
2 x1 + 4
2 x1 + 3
3
x1 + 2
4 7 x1 + 6
2
3
Maxmin
Mtodo grfico
xi las rectas
el maxmin ocurre en la interseccin de
2,3 y 4 , de donde x 1 = 1 / 2 , sustituyendo en
cualquier recta que pasa por maxmin se tiene el valor
del juego
La estrategia ptima de A es
x1* = 0.5, x2* = 0.5 y
V * = 5/ 2
Mtodo grfico
Para obtener la estrategia ptima para B, se observa
las 3 rectas que pasan por maximin (2, 3 y 4), esto
es B puede combinar cualquiera de las tres.
por tanto las rectas (2,3) (2,4) (3,4), son las
posibles estrategias a combinar, se excluye (2,4)
pues tienen pendientes del mismo signo y esto no
garante que sea una solucin optima alternativa.
Si tomamos las rectas (2,3), implica que
y3 = 1 y 2
y1* = y 4* = 0 y
Mtodo grfico
Calculando los pagos de B
Pagos esperados de B
Estrategias
puras de A
Se obtiene
1 y2 + 3
2
y2 + 2
y 2* = 0.5, y3* = 0.5 y
V * = 5/ 2
La combinacin (3,4) producir
y3* = 0.875, y 4* = 0.125 y
V * = 5/ 2
Un promedio ponderado de (2,3) y (3,4), tambin proporciona una

nueva solucin ptima que mezcla las estrategias 2,3 y 4
Mtodo grfico
trazamos las 4 rectas
4
Minmax
1
2
3
de donde
y1* = 2 / 3, y 2* = 1 / 3 y
V * = 8/3
Mtodo grfico
Para el jugador A, se observa que el punto minmax
corresponde a las estrategias puras 1 y 3 de A
x2* = x4* = 0
y x3 = 1 x1
Estrategias
puras de B
1 x1 + 3
2 2 x1 + 2
De donde la estrategia ptima e A es:
x1* = 1 / 3, x2* = 0, x3* = 2 / 3, x4* = 0 y
V * = 8/3
Programacin Lineal
El problema del jugador A, se puede escribir de la siguiente forma:
m
m
max min
a i1 xi ,
a i 2 x i ,.....,
xi
i =1
i =1
s.a
x1 + x 2 + .... + x m = 1
x i 0,
Si hacemos
i =1

a in xi
i = 1, 2,..., m
m
m
v = min
ai1 xi , ai 2 xi ,.....,
i =1
i =1
ain xi
i =1
Programacin Lineal
Entonces el problema del jugador A, se puede escribir como un
PPL.
max Z = V
s .a
m
a ij x i ,
j = 1 , 2 ,..., n
i =1
xi = 1
i =1
xi 0,
Donde V representa el valor del juego
Programacin Lineal
El problema del jugador B, se puede escribir de la siguiente forma:
min max
xi
s.a

a1 j y j ,
a 2 j y j ,.....,
a mj y j
j =1
j =1
j =1

n
y1 + y 2 + .... + y n = 1
y j 0,
Si hacemos
y = 1, 2,..., n
w = max
a1 j y j , a2 j y j ,.....,
a mj y j
j =1
j =1
j =1
Programacin Lineal
Entonces el problema del jugador B, se puede escribir como un
PPL.
min Z = W
s .a
n
a ij y
W ,
i = 1 , 2 ,.... m
j =1
n
0,
= 1
j =1
j
Donde W representa el valor del juego
Programacin Lineal
Observe: que el Problema del jugador B es el dual del problema del
jugador A.
La solucin del problema de A proporciona la solucin del
problema de B
el problema de B se resuelve con simplex regular
el problema de A se resuelve con Simplex dual
La eleccin de un mtodo u otro depende de que el problema
tenga Un nmero ms pequeo de restricciones ( nmero de
estrategias puras para un jugador)
Programacin Lineal
Ejercicio: Dos jugadores dicen simultneamente 3 palabras piedra,
papel tijeras, y hacen seales correspondientes con las manos,
si ambos jugadores dicen lo mismo, entonces el juego se
empata, si no sucede as, un jugador gana 1 dlar al otro
jugador.
Solucin: la matriz de recompensa es
B
No hay punto silla

piedra
piedra
0
papel tijera min

1
1
1
papel
tijera
1
1
0
1
1
0
max
1
1
Programacin Lineal
El PPL para jugador A:
max
s .a .
V
, x
, x
V
Resuelva y confiera que
nrs
x1* = x2* = x3* = 1 / 3 y V = 0
Programacin Lineal
El PPL para jugador B:
min
s .a
W
, y
, y
Al resolver obtiene
y
+
+
3
y
3
y
y
nrs
y1* = y 2* = y3* = 1 / 3 y W = 0
Dominancia
Definicin: Sea dos vectores A = (a1 , a2 ,...., an ) y B = (b1 , b2 ,...., bn ) se dice
que A domina B, si cada componente de A es estrictamente
mayor o igual a su correspondiente componente en B, esto es
a j bj
Ejemplo: sean los siguientes vectores

B domina A
A = (1,1,1)
C domina A
B = (1 / 2, 0, 0)
B y C son no dominados
C = (0, 1, 0)
Dominancia
A = (a1 , a2 ,...., iande
) un
B =jugador
(b1 , b2 ,...., bdado
Dominancia en juegos: Una estrategia
es
n)
dominada por una estrategia i , si para cada una de las otras
estrategias posibles del jugador; el jugador si domina por lo
menos tambin con la estrategia i como lo hace con la
estrategia i y si para al menos una de las otras estrategias del
jugador, i es superior a la estrategia i
Un jugador puede dejar de considerar todas sus
estrategias dominadas
Dominancia
Ejemplo: Sea la siguiente matriz de recompensas de dos jugadores
AyB
A1
A2
A3
B1
40
38
28
B2
34
35
33
B3
30
36
35
B4
33
37
38
El jugador A no tiene ninguna

estrategia dominada, observemos
para el jugador B
Dado que, B busca minimizar la mxima perdida, entonces B3 domina

B4 luego se elimina columna 4
A1
A2
A3
B1
40
38
28
B2
34
35
33
B3
30
36
35
B4
33
37
38
Dominancia
En la matriz reducida observe las estrategias del jugador A
Como A, busca maximizar su
B1 B2 B3 B4
minima ganancia, entonces la
A1 40 34 30 33
estrategia A2 domina a la
A2 38 35 36 37
estrategia A3
A3
28 33
35
38
Por lo que la matriz queda
A1
A2
A3
B1
40
38
28
B2
34
35
33
B3
30
36
35
B4
33
37
38
Repetir sucesivamente, hasta que no sea posible reducir mas la matriz.

Juego suma constante para dos personas

Es un juego en donde participan dos personas en el cual para
cualquier eleccin de las estrategias de ambos jugadores, la
recompensa del jugador A y la recompensa del jugador B suman
un valor constante
es un juego suma cero donde la constante es=0
Los jugadores estn en conflicto pues el incremento en una
unidad de la recompensa del jugador A ocasiona que disminuya
en esa unidad la recompensa del jugador B
Se aplica los mtodos de suma cero para dos personas

Ejemplo: dos canales de TV. Compiten por la audiencia de 100
millones de televidentes durante la hora punta de 8:00 a 9:00
pm. Los canales anuncian en forma simultanea el tipo de
programa que mandarn al aire en esa hora. Las elecciones
posibles para cada TV y el nmero de televidentes (millones) se
da en la siguiente tabla
pelicula telenovela comedia
pelicula
telenovela
comedia
35
45
38
15
58
14
60
50
70

Solucin:
pelicula
telenovela
comedia
max
pelicula telenovela comedia min

15
35
15
60
45
38
45
58
14
58
50
70
70
45
14
Como c= 100 millones de televidentes

La solucin es canal 1, transmite telenovelas y canal 2 pasa pelculas, el
valor del juego es que canal 1 consigue una audiencia de 45 millones y
canal 2 una audiencia de 55 millones de televidentes

Resumen de cmo resolver un juego de suma constante:
Paso 1: Verificar si hay puno silla, si el juego no tiene punto silla
pase al paso2
Paso 2: Elimine cualquier estrategia dominada del jugador A.
inspeccione la matriz reducida y elimine cualquier estrategia
dominada del jugador B, as sucesivamente.
Paso 3: Si la matriz reducida de juegos es de 2 x n m x 2,
resuelva por el mtodo grafico, en caso contrario utilice
programacin lineal
Juego suma no constante para 2 personas

La mayor parte de los modelos de juegos para situaciones
financieras no son juegos de suma constante, porque es inusual
que los competidores comerciales estn en conflicto total. Esto
es, pueden cooperar.
Problema del dilema del prisionero:
Dos prisioneros escaparon y participaron en un robo, han sido recapturados y esperan el juicio
sobre el nuevo delito. Ambos son culpables pero no hay suficiente evidencia para
condenarlos. El fiscal para hacer que cada uno testifique en contra del otro, le dice a cada
prisionero. si solo uno de Uds. Confiesa y testifica contra su compaero, el que confiesa
quedara libre, en tanto que el que no confiese quedar condenado a 20 aos de crcel. Si
ambos confiesan, entonces ambos sern condenados y enviados a prisin por 5 aos. Por
ltimo si ninguno confiesa, yo puedo condenar a ambos por un delito menor y pasar cada
uno un ao de prisin
qu debe hacer el prisionero?

Solucin: se supone que los prisioneros no se pueden comunicar
entre si. Entonces las estrategias y recompensas son:
confiesa
noconfiesa
confiesa noconfiesa
(5,5)
(0,20)
(20,0)
(1. 1)
Observe: las recompensas varan desde -2 hasta -20 => no es juego suma
constante
Si cada prisionero decide eliminar su estrategia dominada => confesar
domina a no confesar => c/prisionero pasa 5 aos en prisin.
en tanto que si c/ prisionero escoge su estrategia dominada no confesar
=> c/ prisionero pasar solo 1 ao en prisin
Por lo que estn mejor si ambos eligen su estrategia dominada.


Punto de equilibrio: Una eleccin de estrategia por parte de cada
jugador es un punto de equilibrio si ninguno de los jugadores
puede beneficiarse al hacer un cambio unilateral en estrategia
confiesa
noconfiesa
confiesa noconfiesa
(5,5)
(0,20)
(20,0)
(1. 1)
=> en el ejemplo (-5,-5) es punto de equilibrio

y (-1, -1) no es punto de equilibrio
Obs: si ambos jugadores cooperan( no confiesan) => c/ uno puede
ganar al traicionar a su cmplice, si ambos se traicionan, estn
ambos en peor situacin

Formalmente: el juego puede representarse como
NC
NC ( P, P) (T , S )
C
NC= no cooperar
C = cooperar
( S , T ) ( R, R )
P= Castigo por no cooperar

S= pago al jugador que es traicionado
T = Tentacin de traicionar a su cmplice
R = recompensa por cooperar

Observe: que
NC
NC ( P, P) (T , S )
C
( S , T ) ( R, R )
como el punto de equilibrio es (P,P) , se requiere que P >S

Para que (R,R) no sea punto de equilibrio se requiere que T>R
El juego es razonable si R>P
=> T>R>P>S
El dilema del prisionero, explica la razn de que dos adversarios no
cooperen con frecuencia entre si.

Teoria de Juegos

Încărcat de

Informații document

Descriere originală:

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Teoria de Juegos

Încărcat de

Drepturi de autor:

Formate disponibile

Teora de Juegos:

IO2 Rosa Delgadillo

IO2- Rosa Delgadillo

En la teora de decisin con incertidumbre, se

IO2- Rosa Delgadillo

Ejemplo donde se aplican

IO2- Rosa Delgadillo

En la teora de juegos, cada oponente

IO2- Rosa Delgadillo

Juego suma cero

Un juego con 2 jugadores en donde la

IO2- Rosa Delgadillo

Juego suma cero

Ejemplo: El juego consiste en igualar 2

IO2- Rosa Delgadillo

Juego suma cero

Cada jugador tiene 2 estrategias C

IO2- Rosa Delgadillo

La solucin para el juego puede

IO2- Rosa Delgadillo

Supuesto: Cada jugador elige una

conoce la estrategia que est siguiendo.

la estrategia que se sigue es

IO2- Rosa Delgadillo

Criterio minimax- maximin: Elegir la

IO2- Rosa Delgadillo

ejemplo: sea la siguiente matriz de

IO2- Rosa Delgadillo

Solucin ptima: se alcanza cuando

IO2- Rosa Delgadillo

La ganancia correspondiente al jugador

IO2- Rosa Delgadillo

IO2- Rosa Delgadillo

La Optimalidad significa que ningn

IO2- Rosa Delgadillo

Cuando no es posible conseguir la

IO2- Rosa Delgadillo

Se observa que cada jugador mejora su pago eligiendo una

IO2- Rosa Delgadillo

IO2- Rosa Delgadillo

IO2- Rosa Delgadillo

IO2- Rosa Delgadillo

IO2- Rosa Delgadillo

IO2- Rosa Delgadillo

(a11 a21 ) x1 + a21

IO2- Rosa Delgadillo

IO2- Rosa Delgadillo

IO2- Rosa Delgadillo

IO2- Rosa Delgadillo

y 2* = 0.5, y3* = 0.5 y

La combinacin (3,4) producir

y3* = 0.875, y 4* = 0.125 y

Un promedio ponderado de (2,3) y (3,4), tambin proporciona una

IO2- Rosa Delgadillo

De donde la estrategia ptima e A es:

x1* = 1 / 3, x2* = 0, x3* = 2 / 3, x4* = 0 y

IO2- Rosa Delgadillo

IO2- Rosa Delgadillo

Donde V representa el valor del juego

IO2- Rosa Delgadillo

IO2- Rosa Delgadillo

Donde W representa el valor del juego

IO2- Rosa Delgadillo