Explorați Cărți electronice
Categorii
Explorați Cărți audio
Categorii
Explorați Reviste
Categorii
Explorați Documente
Categorii
Teoria jocurilor
Problema 1. Sursa: http://www.class.coursera.org/gametheory-2012-002
Problema penalty-urilor in fotbal
Un fotbalist trebuie sa execute o lovitura de la 11 metri. Se stie ca atunci cand portarul
alege directia in care a sutat fotbalistul, acesta sigur va apara, iar atunci cand directiile sunt
diferite, fotbalistul va inscrie.
Se cere:
a). Scrieti forma normal a jocului si descrieti-l;
b). Gasiti echilibrele Nash in strategii pure, daca exista;
c). Gasiti echilibrul Nash in strategii mixte;
d). Daca se stie ca fotbalistul are 25% sanse sa rateze cand suteaza spre dreapta portii, cum se
modifica echilibrul in strategii mixte? Ce observati?
a).
Portar
Fotbalist
S
D
S
0,1
1,0
D
1,0
0,1
S
D
S
0,1
1,0
D
1,0
0,1
q
1-q
p
S
0,1
1,0
S
D
1-p
D
1,0
0,1
u 1 ( S , )=0p+1(1 p)
u 1 ( D , )=1p+ 0(1 p) ; utilitatile sunt egale pentru ca portarului sa ii fie indiferent =>
1 p=p= p=1p=
1
2
Prin simetrie:
q=1q=
1
2
1 1 1 1
, ; ,
.
2 2 2 2
(( ) ( ))
q
1-q
S
D
p
S
0,1
0,75;0,25
u1 ( S , )=0p+1(1 p)
u 1 ( D , )=0,75p +0(1 p) ; utilitati egale =>
1 p=0,75 p= 1=1,75 p= p=
1
4
3
= = 1 p=
1,75 7
7
1-p
D
1,0
0,1
3
4
q= = 1q=
7
7
(( 47 , 37 ) ;( 37 , 47 )) .
4 3
1q >q ( > )
Din relatia
ne dam seama ca portarul crede ca fotbalistul va suta
7 7
spre dreapta cu o probabilitate mai mare, chiar daca exista sanse mai mari sa rateze decat in
cazul sutului spre stanga ( 0,25>0 ) .
S
D
S
0;1
0,647;0,353
Jucatori: 1,2
Strategii: S 1= { S , D } ; S 2={S , D}
Castiguri: u1 ( S , )=( 0 ; 0,647 ) ; u1 ( D , )=( 0,647,0 )
u2 ( , S )=( 1 ; 0,353 ) ; u2 ( , D )=(0,353 ; 1)
D
0,647;0,353
0;1
b). Prin compararea castigurilor strategiilor, am constatat ca nu exista strategii dominate, deci
nu putem elimina nicio strategie.
Dupa aplicarea algoritmului maximizarii castigurilor relative a rezultat:
2
1
S
0;1
0,647;0,353
S
D
D
0,647;0,353
0;1
q
1-q
S
D
p
S
0;1
0,647;0,353
1-p
D
0,647;0,353
0;1
u 1 ( S , )=0p+0,647(1p)
u 1 ( D , )=0,647p+0(1p) => utilitatile trebuie sa fie egale la echilibru =>
0,6470,647p=0,647p= p=1 p=
1
2
u 2 ( , S )=1q+0,353(1q)
u 2 ( , D )=0,353q+1(1q) => utilitati egale la echilibru =>
q+ 0,3530,353q=0,353q+1q= q=1q=
1
2
(( ) ( ))
1 1 1 1
, ; ,
.
2 2 2 2
p
Agresiv
I
NI
C
-1,2
0,3
NC
2,-1
0,3
1-p
Normal
I
NI
C
-1,0
0,3
NC
1,2
0,3
a). G={A,T,P,U}
A (actiunile):
T (tipuri):
I ,
A 1=
T 2 ={ Agresiv , Normal }
P (probabilitati):
U (utilitati):
P2={ p , 1 p }
U={ 1 , 2 }
c).
12 p =0= 1=2 p = p =
1
2
Cand t=2 si w=2:- inginerului ii este indiferent daca este angajat sau nu, castig sau ramane 2;
-compania este indierenta la angajarea inginerului (0);
Cand t=1 si w=2: -inginerul prefera sa fie angajat (2>1);
-compania pierde daca il angajeaza pe inginer (1-w=-1), deci nu angajeaza.
Echilibrele: t=2 Startup,t=1 (Work, Not); t=2 Work, t=1(Work, Not).
Problema 5. Sursa: http://www.econ.ucdavis.edu/faculty/bonanno/teaching/200C/
Se considera urmatoarul graf cu rute. Yvette se afla in punctul Y, iar Zoe in punctul Z.
Zoe trebuie sa ajunga din punctul Z in punctul Y, mergand mereu spre Vest. Yvette, pe cealalta
parte, trebuie sa mearga din punctul Y in punctul Z, de-a lungu; sistemului de drumuri, fara sa
se intoarca in punctul Y si fara sa traverseze prin acelasi loc de doua ori (nu trebuie sa mearga
mereu spre Est).
Se cere:
a). Scrieti toate rutele posibile pe care Yvette poate sa le parcurga. Considerati-le strategiile ei
b). Scrieti toate rutele posibile pe care Zoe poate sa le parcurga. Considerati-le strategiile ei
c). Scrieti jocul sub forma normala, presupunand urmatoarele: daca Yvette si Zoe merg prin
aceeasi intersectie, atunci Zoe castiga. Altfel, castiga Yvette.
d). Ce strategii ale lui Yvette sunt slab dominate? Care strategii ale lui Zoe ssunt slab
dominate? (se presupune ca fiecare dintre cele doua preferea sa castige in loc sa piarda)
a). Yvette are 9 strategii posibile. Ea poate sa viziteze fiecare dintre urmatoarele seturi de
noduri rutiere: b, bac, bacd, ab, ac, acd, dcab, dc, d. Urmatorul arbore arata cum se pot
construi strategiile posibile:
b). Zoe are doar 5 strategii: b,ba,ca, cd, d. Urmatorul arbore arata cum se pot construi
strategiile posibile:
c). Atribuind randurile lui Yvette si coloanele lui Zoe, obtinem o matrice de 9x5:
d). Pentru Yvette, jucatorul de pe rand, o ruta scurta domina o ruta mai lunga care trece prin
aceleasi segmente:
Pentru Zoe, jucatorul de pe coloane, o ruta mai lunga o domina pe una mai scurta care
trece prin acelasi segment, asadar
ba domina b
cd domina d
Problema 6. Se considera un joc cu doi jucatori, fiecare dintre acesti avand un set de carti,
fiecare carte avand trecut un numar. Cei 2 jucatori se numesc Antonia si Bob. Cartile Antoniei
au trecute numerele 0,1,2,3 si 4, pe cand ale lui Bob au 0,1 si 2. Fiecare jucator alege o carte,
fara a sti alegerea celuilalt. Castigul depinde de suma punctelor de pe cartile alese.
Se cere:
a). reprezentati jocul in forma matriceala pentru fiecare dintre urmatoarele variante:
1). Daca suma e mai mare de 3, atunci Antonia primeste 10 $, iar Bob nu primeste nimic.
Daca suma e mai mica sau egala cu 3, atunci Bob primeste 10$, iar Antonia nimic.
2). Daca suma e mai mare de 2 si este un numar par, Antonia primeste 10 $, iar Bob nu
primeste nimic. Daca suma e mai mare de 2 si este un numar impar, Antonia plateste 5$, iar
Bob nu primeste nimic. Daca suma e mai mica sau egala cu 2, si e un numar par, Bob
primeste 5 $, iar Antonia 0 $; daca este un numar impar Bob primeste 10$, iar Antonia nimic.
3). Sa presupunem urmatorul lucru: cartile Antoniei sunt schimbate in 2,4 sau 6 (ale lui Bob
raman 0,1 si 2). Daca suma punctelor e mai mare sau egala cu 5, Antonia primeste 10$, din
care se scade suma punctelor, altfel ea nu primeste nimic. Castigul lui Bob e urmatorul: daca
suma punctelor este un numar impar, Bob primeste atatia dolari cat totalul punctelor; daca
suma punctelor se dovedeste a fi un numar par si e mai mica sau egala cu 6, Bob primeste 2$,
altfel nu primeste nimic.
b). Pentru fiecare dintre cele 3 jocuri dintre Antonia si Bob, pentru fiecare jucator si fiecare
pereche de strategii, sa se precizeze daca o strategie o domina pe cealalta. Are Antonia o
strategie dominanta? Dar Bob? Este vreo strategie cu echilibru dominant?
c). Gasiti toate echilibrele Nash in jocul B.
a).1).
Anton
ia
0
1
0
0 , 10
0 , 10
Bob
1
0 , 10
0 , 10
2
0 , 10
0 , 10
2
3
4
0 , 10
0 , 10
10 , 0
0 , 10
10 , 0
10 , 0
10 , 0
10 , 0
10 , 0
a).2).
Anton
ia
0
1
0
0,5
0 , 10
Bob
1
0 , 10
0,5
2
0,5
-5 , 0
2
3
4
0,5
-5 , 0
10 , 0
-5 , 0
10 , 0
-5 , 0
10 , 0
-5 , 0
10 , 0
0
0,2
Bob
1
0,3
2
0,2
4
6
0,2
4,2
5,5
3,7
4,2
2,0
a).3).
Anton
ia
b). Jocul A. Pentru Antonia: 4 domina strict pe 0 si 1 si domina slab 2 si 3. Asadar, 4 este o
strategie slab dominanta. 0 si 1 sunt echivalente. 2 domina slab pe 0 si 1, iar 3 pe 2.
Pentru Bob: 1 domina slab 2, 0 domina slab 1 si 2. Asadar 0 este o strategie slab dominanta.
Echilibrul dominant este (4,0).
Jocul B. Pentru Antonia: 0 domina slab 1, 4 domina slab 2 si atat. Asadar, Antonia nu are o
strategie dominanta.
Pentru Bob: 0 domina slab pe 2, 1 domina slab pe 2 si atat. Deci nici Bob nu are o strategie
dominanta.
Nu exista nici un echilibru dominant.
Jocul C. Pentru Antonia: 6 domina strict pe 2, 4 domina slab pe 2 si atat. Deci Antonia nu are
nici acum o strategie dominanta.
Pentru Bob: 1 domina strict pe 0 si 2, 4 domina slab pe 2. 1 este strategia dominanta a lui Bob,
dar nu exista nici un echilibru dominant.
c). echilibrele Nash sunt cele subliniate:
Anton
ia
0
1
0
0,5
0 , 10
Bob
1
0 , 10
0,5
2
3
0,5
-5 , 0
-5 , 0
10 , 0
2
0,5
-5 , 0
10 , 0
-5 , 0
10 , 0
-5 , 0
10 , 0
q2
2
q1
2
=0
q1
q1 = q2 = 240
Q = 480
P = 1040
1 = 2 = 115,200 80,000 = 35,200.
c). Un monopolist ar seta Q=360 si P=1280. Profitul firmei ar fii :
= 259,20080,000 = 179,200.
Curba cererii este urmatoarea:
Dovada : In primul rand aratam ca orice pereche (P1,P2) cu 4 lei <= P1 = P2 <= 6 lei
este un echilibru Nash. A doua firma face 0 profit. Daca va reduce pretul sau va avea o
pierdere, iar daca il va creste va face in continuare profit 0. Profitul primei firme este de 2 (p1
- 4) >=0. Daca va reduce pretul, profitul va scadea, iar daca il va creste profitul va fi 0.
Acum aratam ca p1=p2 > 6 nu este un echilibru Nash. Firma 2 face profit 0 si il poate
mari prin perceperea unui pret P2* astfel incat 6<P2*<P1.
(P1,P2) cu P1<4 si P1<=2 nu este un echilibru Nash deoarece prima firma are o pierdere si isi
poate creste profiturile de la zero prin cresterea lui P1.
In cele din urma:
a). 4 <= P1 < 10 si P1<P2 nu este un echilibru Nash, deoarece prima firma isi poate creste
profiturile sale prin marirea lui P1.
b). P1=P2 < P2 nu este un echilibru Nash deoarece firma 2 poate obtine profituri pozitive
prin reducerea lui P2 astfel incat P2<P1.
c). 10 < P1 < P2 nu este un echilibru Nash deoarece firma 1 isi poate creste profiturile sale
prin reducerea lui P1.
d). P2<6 si P2 < P1 nu este un echilibru Nash deoarece firma 2 este in pierdere.
e). P2 >= 6 i P2 < P1 nu este un echilibru Nash deoarece firma 1 isi poate mari profitul prin
reducerea pretului sau (P1) in asa fel incat P1=P2.
Problema 9. Se considera un joc cu doi jucatori. Exista 3 plicuri nemarcate. Unul
contine 100$, unul 200$, iar al treilea contine 300$. Ele sunt amestecate foarte bine si unul e
dat jucatorului 1, iar altul jucatorului 2 ( al treilea ramane pe masa si nu va mai fi utilizat
deloc). Jucatorul 1 isi dechide plicul si ii verifica in secret continutul. El poate spune pass,
caz in care fiecare jucator isi pastreaza plicul, sau il poate ruga pe jucatorul 2 sa schimbe
plicurile intre ele. Jucatorul 2 nu are voie sa vada continutul plicului si trebuie sa zica Da
sau Nu. Daca spune Nu, atunci cei doi jucatori trebuie sa-si pastreze plicurile originale. In
schimb, daca jucatorul 2 spune Da, atunci ei fac schimb de plicuri si le pastreaza pe cele
primite. Se presupune ca cei doi jucatori sunt neutri la risc, se cere:
a). Reprezentati situatia intr-un joc cu informatie imperfecta
b). Desenati jocul in forma normala corespunzatoare si gasiti toate echilibrele Nash
c). Ce se obtine atunci cand se aplica algoritmul de eliminare a strategiilor dominate?
a). In jocul descris mai jos, 12 inseamna jucatorul 1 alege plicul cu 100$ si jucatorul 2 cel cu
200$, 13 inseamna jucatorul 1 alege plicul cu 100$ si jucatorul 2 cel cu 300$, etc. P
provine de la pass, T de la propune un schimb, Y este Da, iar N Nu.
b). Jucatorul 1 are 8 strategii. O prima strategie este: daca ia plicul cu 100$ spune pass, daca
il ia pe cel cu 200$ propune un targ, iar daca il ia pe cel cu 300$ spune pass. Vom folosi
urmatoare prescurtare pentru strategia de mai sus PTP. Jucatorul 2 are in schimb doar 2
strategii. Cum primim recompensele? Sa consideram prima celula, spre exemplu.
Presupunand strategiile PPP si Y, castigul este (100,200) cu o probabilitate de 1/6, (100,300)
cu o probabilitate de 1/6, (200,100) cu probabilitatea de 1/6, (200,300) cu probabilitatea 1/6,
(300,100) cu probabilitatea 1/6, (300,200) cu probabilitatea 1/6. Asadar, castigul asteptat al
jucatorului 1 este (100 + 100 + 200 + 200 + 300 + 300)*(1/6)=200$. Similar este si pentru
celalalt jucator si celelalte celule. Echilibrele Nash sunt subliniate:
c). Pentru jucatorul 1 toate strategiile sunt slab dominate, exceptand TPP si TTP. Eliminand
strategiile slab dominate obtinem un joc unde Y este strict dominat de 2. Asadar, ramanem cu
strategiile (TPP, N) si (TTP, N).
Problema 10. Se considera urmatorul joc:
Se cere:
a), Gasiti toate echilibrele Nash in strategie pura.
b). Demonstrati, fara a face prea multe calcule, ca nu exista un echilibru in strategii mixte in
care jucatorul 1 joaca M cu probabilitatea p cu 0 < p < 1.
a). Forma normal este:
Jucatorul1
Jucatorul1
R
M
L
R
M
L
Jucatorul
Jucatorul2 2
l
r
1,0,0 1,0,0
0,1,1 2,2,1
1,1,0 0,0,0
l
1,0,0
0,1,0
1,1,0
r
1,0,0
0,0,0
0,0,0
Jucatorul 3 alege a
Jucatorul. 3 alege b
Echilibrele Nash in strategii pure sunt: (R,l,a) , (M,r,a) , (L,l,a) , (R,l,b) , (R,r,b) si
(L,l,b)
b). Deoarece pentru jucatorul 3, a domina strict pe b , el trebuie sa joace a daca setul de
informatii este atins cu probabilitate pozitiva. Pentru jucatorul 3 informatia este atinsa, daca si
doar daca jucatorul 1 joaca strategia M cu probabilitate pozitiva. Asadar, cand Pr(M) > 0, jocul
se reduce la :
Infectie
bacterian
Infecti
Cance
Inflamati
e
virala
e
a vezicii
a
140
110
90
260
c). Un test de sange pozitiv este reprezentat de evenimentul {B, V}. O boala tratabila este
evenimentul {B, I}. Asadar:
e). Informatia este {B, V} {B, V, C} = {B, V}. Asadar, noi dorim:
Problema 12. Albert si Bill joaca un joc cu informatie incompleta. Fiecare jucator
trebuie sa aleaga daca sa se abata sau nu de la joc. Alegerile sunt facute simultan. Daca un
jucator se abate atunci el este un las. Altfel, el este un erou daca celalalt jucator renunta, dar
este mort daca celalalt jucator nu se abate. Un jucator poate fi de tipul normal sau daunator.
Tipul normal primeste un castig de 100 daca devine erou, 85 daca este las si 0 daca este ucis.
Tipul daunator crede ca a fi erou merita 100, a fi mort merita 50, dar fiind un las merita 0!
Albert stie cu siguranta ca Bill este tipul normal, dar Bill crede ca exista 20% sanse ca Albert
sa fie daunator. Fiecare jucator isi stie cu siguranta tipul si totul, exceptand tipul lui Albert
este cunoscut de ambii.
a). Conform teoriei lui Harsanyi despre informatia incompleta, cine sun t jucatorii si care sunt
strategiile lor?
b). Reprezentati jocul si obtineti forma normala a acestuia
c). Gasiti echilibrul Nash Bayesian in strategii pure.
a). In teoria lui Harsanyi strategia unui jucator specifica o actiune pentru fiecare dintre tipurile
acestuia. Albert are 2 tipuri posibile si fiecare trebuie sa utilizeze o actiune. Asadar, Albert are
4 strategii pure:
Deoarece Bill are un singur tip posibil, cel normal, o strategie pura pentru el e
reprezentata de o singura actiune : sa se abata (s) sau sa nu se abata (ds). Asadar el are 2
strategii pure.
b). Jocul incepe cu Natura care alege tipul lui Albert (tipul nechibzuit e ales cu o probabilitate
de 0,2). Doar Albert este informat in privinta tipului sau.
Castigurile pentru fiecare tip sunt prezenate. Este de asemenea posibil sa fie
completate castigurile asteptate folosind cerintele anterioare (in fiecare celula primul castig e
a lui Bill)