Sunteți pe pagina 1din 12

Jocuri statice în informație completă

1. Dilema prizonierului
Considerăm 2 indivizi A și B care jefuiesc o bancă. Fugind de la locul faptei sunt prinși de
poliție și arestați pentru deținere ilegală de arme, dar asupra lor nu este găsită nicio dovadă
referitoare la jaf. Polițiștii îi separă pe cei doi suspecți și: (1) dacă ambii suspecți neagă, atunci
vor fi ținuți la închisoare un an pentru deținere ilegală de arme; (2) dacă jucătorul A își
recunoaște fapta, iar jucătorul B neagă, atunci A scapă de închisoare și B va ispăși o pedeapsă de
10 ani; (3) dacă B recunoaște și A nu, atunci B scapă de închisoare și A va primi o pedeapsă de
10 ani; (4) dacă ambii mărturisesc, atunci vor primi o pedeapsă de 5 ani fiecare.
Se cere:
a). Să se descrie jocul sub formă normală prin intermediul matricei câștigurilor.
b). Determinați echilibrul jocului prin eliminarea strategiilor dominate.
c). Determinați echilibrul Nash prin algoritmul maximizării câștigurilor relative.
Rezolvare:
a). Desfășurarea jocului este următoarea: dacă jucătorul A mărturisește, atunci el poate sta 5 ani
în închisoare dacă partenerul său mărturisește, sau poate scăpa dacă B neagă. Dacă A neagă,
atunci fie stă 10 ani la închisoare dacă partenerul său mărturisește, fie va sta 1 an dacă neagă
amândoi.
Matricea câștigurilor este:
Jucătorul B
M NM
Jucătorul A M -5,-5 0,-10
NM -10,0 -1,-1
b). Verificăm dacă există strategii dominate, testând dacă jucătorul A obține întotdeauna
câștiguri mai mari folosind una dintre strategii. Observăm că dacă mărturisește, câștigurile sale
sunt mai mari decât dacă neagă: -5>-10 și 0>-1. Prima strategie o domină pe cea de-a doua (deci
primului jucător îi este optim să mărturisească întotdeauna), putând reduce dimensionalitatea
matricei câștigurilor:
Jucătorul B
M NM
Jucătorul A M (-5,-5 0,-10)
Știind acest lucru, jucătorul B dacă mărturisește, va petrece în închisoare 5 ani, iar dacă nu
mărturisește va sta 10 ani, preferând să își mărturisească fapta. Reducând din nou dimensiunea
matricei (prima strategie fiind dominantă) obținem echilibrul jocului:
Jucătorul B
M
Jucătorul A M (-5,-5)
Pentru cei 2 jucători este optim să își mărturisească fapta, petrecându-și astfel amândoi câte 5 ani
la închisoare.
c). Algoritmul maximizării câștigurilor relative este:
Jucătorul B
M NM
Jucătorul A M -5,-5 0,-10
NM -10,0 -1,-1
- Dacă jucătorul A crede că jucătorul B mărturisește, atunci el are de ales între a mărturisi, fiind
privat de libertate 5 ani și a nu mărturisi, petrecându-și 10 ani la închisoare, alegând max{-5,-
10}=-5. Cel mai bun răspuns al jucătorului A la strategia aleasă de jucătorul B îi va aduce o
pierdere egală cu -5. Acest element din matricea câștigurilor relative este subliniat.
- Dacă jucătorul A crede că jucătorul B nu mărturisește, atunci are de ales între a mărturisi,
scăpând de închisoare, și a nu mărturisi, petrecându-și un an la închisoare. Formal are de ales
max{0,-1}=0. Cel mai bun răspuns al jucătorului A la strategia aleasă de jucătorul B este să
mărturisească. Acest element din matricea câștigurilor relative este subliniat.
Analog aplicăm algoritmul și pentru jucătorul B.
Echilibrul Nash al jocului se află în căsuța în care ambele elemente sunt subliniate, fiind optimal
pentru ambii jucători să își mărturisească fapta.
2. Bătălia sexelor
Într-un cuplu o fată și un băiat vor să se decidă cum își petrec timpul liber. Băiatul
dorește să își susțină echipa favorită de fotbal, iar fata doerște să meargă la cinematograf. Dacă
vor alege să meargă la meciul de fotbal, atunci băiatul câștigă o utilitate egală cu 2 unități, iar
fata o utilitate egală cu 1. Dacă vor merge la film împreună, atunci băiatul câștigă o utilitate
egală cu 1, iar fata o utilitate egală cu 2, Dacă fata merge la film, iar băiatul la meci, atunci
utilitatea fiecăruia este 0. Neputându-se hotărî se decid să stabilească un loc de întâlnire în fața
cinematografului și unul în fața stadionului, urmând ca fiecare să decidă singur unde va merge.
Se cere:
a). Descrieți jocul sub formă normală;
b). Determinați echilibrul jocului în strategii pure;
c). Determinați echilibrul jocului în strategii mixte;
d). Presupunem că peste o perioadă de 2 ani se căsătoresc și au și un copil, care dorește să
meargă la cinematograf la ultimul film de desene animate, soțul dorește să meargă la meci, iar
soția la cinematograf. Deoarece copilul nu este jucător rațional, doar soțul și soția vor trebui să se
decidă cum își vor petrece seara, independent de jocul inițial. Determinați echilibrul jocului dacă
matricea câștigurilor este :
Soție J2
M F DA
M 3, 1 1, 2 2, 2
Soț J1
F 2, 1 1, 1 1, 3
DA 3, 2 2, 3 3, 3

Rezolvare :
a). Descrierea jocului în formă normală presupune menționarea celor trei elemente :
(i) Jucătorii – fata și băiatul
(ii) Strategiile – fiecare dintre cei doi jucători poate alege să meargă la film sau la meci : SB={M,
F}, SF={M, F}
(iii) Matricea câștigurilor:
Fata
M F
Băiatul M 2, 1 0, 0
F 0, 0 1, 2
b). Determinăm echilibrul prin algoritmul celui mai bun răspuns. Dacă băiatul crede că fata va
alege să îl aștepte în fața stadionului, atunci își maximizează câștigul așteptat: max{2,0} = 2,
alegând să se ducă la meci. Subliniem acest element în matricea câștigurilor. Dacă băiatul crede
că fata îl așteaptă în fața cinematografului, atunci va alege max{0,1} = 1, subliniind elementul.
Dacă fata crede că băiatul o așteaptă în fața stadionului, atunci alege max{1,0} = 1 (subliniem
elementul), iar dacă crede că băiatul o așteptă în fața cinematografului alege max{2,0} = 2
(subliniem elementul).
Echilibrul jocului se află în căsuțele în care sunt subliniate ambele elemente:
Fata
M F
Băiatul M 2, 1 0, 0
F 0, 0 1, 2
Observăm că jocul admite două puncte de echilibru Nash în strategii pure (M,M), (F,F), cu
câștigurile (2,1) și, respectiv, (1,2).
c). Pentru a determina echlibrul în strategii mixte considerăm că fata crede că băiatul o așteptă în
fața stadionului cu probabilitatea x și în fața cinematografului cu probabilitatea (1-x). Iar băiatul
crede că fata îl așteaptă în fața stadionului cu probabilitatea y și în fața cinematografului cu
probabilitatea (1-y).
Câștigul așteptat al băiatului când alege să aștepte în fața stadionului este media următoarei
loterii:

L1: 2 0
y 1-y
unde: E(L1)=2y
Câștigul așteptat al băiatului când alege să aștepte în fața cinematografului este media următoarei
loterii:
L2: 0 1
y 1-y
unde: E(L2)=1-y
În punctul de echilibru băiatul trebuie să fie indiferent între cele două strategii, respectiv:
1
E(L1)= E(L2), de unde 𝑦 = 3. Deci băiatul crede că fata va fi în fața stadionului cu probabilitatea
1 2
𝑦 = 3 și în fața cinematografului cu probabilitatea 1 − 𝑦 = 3.

Analog pentru fată loteria câștigurilor când alege să aștepte în fața stadionului este:
A1: 1 0
x 1-x
cu: E(A1) = x
Loteria câștigurilor când alege să aștepte în fața cinematografului este:
A2: 0 2
x 1-x
cu: E(A2) = 2 - 2x
La optim: E(A1) = E(A2), de unde obținem probabilitatea cu care fata crede că băiatul se
2
află în fața stadionului este 𝑥 = 3, și probabilitatea cu care fata crede că băiatul se află în fața
1
cinematografului 1 − 𝑥 = 3.
2 1 1 2
Echilibrul Nash în strategii mixte este ((3 , 3) , (3 , 3)).

Semnificația echilibrului în strategii mixte este următoarea: Fata crede despre Băiat că
dorește să meargă la Meci cu probabilitatea 2/3 și la Film cu probabilitatea 1/3, în timp ce
Băiatul crede că Fata dorește să meargă la Meci cu probabilitatea 1/3 și la Film cu probabilitatea
2/3.
d). Determinăm echilibrul jocului cu ajutorul celui mai bun răspuns:
Soție J2
M F DA
M 3, 1 1, 2 2, 2
Soț J1
F 2, 1 1, 1 1, 3
DA 3, 2 2, 3 3, 3
Observăm că jocul are două puncte de echilibru (deoarece în două căsuțe sunt subliniate
ambele elemente): fie ambii soți se duc la desene animate însoțiți de copil, caz în care câștigul
fiecărui jucător este de 3 unități, fie soția se va duce la film și soțul la desene animate, caz în care
soția câștigă 3 unități, iar soțul 2.

3. Jocul vânătorii
Jocul vânătorii presupune existenţa a doi jucători (vânători) care planifică să plece a doua
zi la vânătoare. Vânătorii pot decide să vâneze cerbi (C) - care sunt mai greu de prins în cazul în
care fiecare acţionează individual - sau iepuri (I) - care se presupune că sunt mai uşor de prins.
În plus, vom presupune că mai au şi varianta de a nu pleca (N) la vânătoare în ziua următoare.
Câştigurile jocului sunt reprezentate în tabelul de mai jos. Astfel, în cazul în care vor vâna
împreună cerbi satisfacţia va fi maxima pentru fiecare, în cazul în care vor vâna iepuri vor avea o
satisfacţie medie, iar în cazul în care nu vor merge, vor economisi energia de a participa la
vânătoare. În cazul în care vor merge la vânătoare dar nu vor prinde nimic, atunci satisfacţia
fiecăruia va fi nulă. Totuşi, fiecare din cei doi jucători ar prefera să meargă singur la vânătoare
de iepuri, fără a fi însoţit de celălalt jucător.
Vânător 2
C I N
C 9, 9 0, 7 0, 3
Vânător 1
I 7, 0 5, 5 7, 6
N 3, 0 6 ,7 3, 3
Matricea câştigurilor
Se cere:
a) Să se descrie jocul sub formă normală.
b) Să se determine echilibrele Nash ale în strategii pure.
c) Există echilibru în strategii mixte? Dacă da, care va fi acesta?

Soluţie
a) Pentru a descrie jocul sub formă normală trebuie să se precizeze: jucătorii, strategiile
posibile şi câştigurile obţinute în urma derulării jocului.
Jucătorii sunt vânătorul 1şi vânătorul 2.
Strategiile fiecărui vânător sunt: vânează cerbi, C, vânează iepuri, I, sau nu merge deloc la
vânătoare, N. S i = C , I , N , i = 1,2 .

Câştigurile ui sunt indicate în matricea câștigurilor. De exemplu, dacă deciziile jucătorilor sunt
coordonate, atunci fiecare va avea un câştig de 9 unităţi dacă vor vâna cerbii, de 5 unităţi dacă
vor vâna iepuri sau de 3 unităţi dacă vor sta acasă.
b) Determinarea echilibrului în strategii pure.
Verificăm dacă există strategii dominate, comparând câştigurile aduse de cele trei
strategii: U1(C,*) = (9, 0, 0 ); U1(I,*) = (7, 5, 7); U1(N,*) = (3, 6, 3). În acest caz observăm că
nu există strategii dominate, deci nu poate fi aplicat algoritmul eliminării strategiilor dominate.
Pentru jucătorul 2 se aplică acelaşi raţionament datorită faptului că jocul este simetric.

Aplicăm algoritmul determinării celui mai bun răspuns:


Pentru Vânătorul 1: Dacă Vânătorul 2 alege C, atunci pentru vânătorul 1 cel mai bine este să
vâneze tot cerbi, C (9 > 7 > 3 ). Dacă Vânătorul 2 alege să vâneze iepuri, I, atunci pentru
vânătorul 1 cel mai convenabil este să nu meargă la vânătoare , N, (dacă merge să vâneze cerbi
atunci nu va reuşi să prindă nici unul, iar daca va vâna iepuri, atunci va fi mai puţin satisfăcut
deoarece vânătoarea este comună cu cel de-al doilea vânător). Dacă Vânătorul al doilea alege să
nu meargă la vânătoare, atunci Vânătorul 1 va decide să vâneze iepuri, deoarece aceasta este
varianta care îi aduce satisfacţia maximă.
Pentru vânătorul 2: Jocul fiind simetric, şi pentru jucătorul 2 se va efectua un raţionament
similar.
Astfel, vom avea trei echilibre în strategii pure, respectiv (C,C), (I,N) şi (N,I), respectiv fie vor
vâna împreună cerbi, fie unul va stat acasă iar celălalt va vâna iepuri.
Vânător 2
C I N
C 9, 9 0, 7 0, 3
Vânător 1
I 7, 0 5, 5 7, 6
N 3, 0 6 ,7 3, 3

c) Verificăm existenţa unui echilibru în strategii mixte. Vom ataşa câte o distribuţie de
probabilitate mulţimii strategiilor pure ataşate fiecărui jucător, respectiv p1, p2, 1-p1 –p2, pentru
strategiile jucate de jucătorul 1 şi q1, q2, 1-q1 –q2, pentru strategiile jucate de jucătorul 2 (cu
pi , qi 0,1).

Vânător 2
q1 q2 1 - q1 – q2
C I N
Vânător 1 p1 C 9, 9 0, 7 0, 3
p2 I 7, 0 5, 5 7, 6
1 - p1 – p2 N 3, 0 6 ,7 3, 3

Pentru a determina echilibrul jocului în strategii mixte vom calcula câştigurile aşteptate
aduse de fiecare din strategiile disponibile pentru jucătorul 1, respectiv pentru jucătorul 2.
Echilibrul va fi dat de punctul în care jucătorii sunt indiferenţi între a juca o strategie sau alta,
ceea ce conduce la faptul că vom avea câştiguri aşteptate egale aduse de fiecare strategie.
Câştigurile aşteptate de Vânătorul 1 sunt:
E( U1( C ,*)) = q1  9 + q2  0 + ( 1 − q1 − q2 )  0
E( U1( I ,*)) = q1  7 + q2  5 + ( 1 − q1 − q2 )  7
E( U1( N ,*)) = q1  3 + q2  6 + ( 1 − q1 − q2 )  3

La echilibru, avem E( U1( C ,*)) = E( U1( I ,*)) = E( U1( N ,*))

Rezolvând sistemul de două ecuaţii cu două necunoscute obţinem soluţia: q1 = 3/5 şi q2 = 4/5
care nu convine, deoarece q1 + q2 > 1.
În acest caz jocul considerat nu admite un echilibru în strategii mixte.

4. Jocul Pradă-Pradător (Howk Dove Game).


Doi jucători concurează pentru a câștiga o resursă v. Fiecare dintre cei doi jucători poate
alege să fie agresiv, caz în care îl vom numi prădător (H) sau să nu fie agresiv, caz în care vom
spune că este pradă (D). Dacă ambii jucători aleg să fie prădători, atunci vor împărți resursa și
vor mai pierde o sumă k, ca urmare a altercației dintre ei, cu k>v/2. Dacă ambii jucători aleg să
fie de tipul pradă, atunci ei împart resursa și vor mai pierde o sumă d, unde d<v/2. Dacă un
jucător este de tipul pradă, atunci acesta nu câștigă nimic, pe când adversarul său, prădătorul,
câștigă întreaga resursă.
Se cere:
a). Descrieți jocul sub formă normală.
b). Dacă v=10, k=6 și d=4, determinați echilibrul jocului.

Rezolvare:
a). (1) jucători = cei doi adversari
(2) strategiile = fiecare jucător poate alege să fie de tipul pradă sau de tipul prădător:
s1={H,D}; s2={H,D}.
(3) câștigurile = se scriu sub formă matriceală:
Jucătorul 2
H D
Jucătorul 1 H v/2-k,v/2-k v,0
D 0,v v/2-d,v/2-d
b). Dacă v=10, k=6 și d=4, atunci matricea câștigurilor devine:
Jucătorul 2
H D
Jucătorul 1 H -1,-1 10,0
D 0,10 1,1
Determinăm echilibrul cu ajutorul algoritmului celui mai bun răspuns: Dacă jucătorul 1 crede că
adversarul său este prădător (H), atunci are de ales între a fi tipul prădător și a pierde o unitate
sau a fi pradă și a câștiga 0. Evident va alege câștigul nul, care se subliniază în matricea
câștigurilor. Dacă jucătorul 1 crede că adversarul său este de tip pradă, atunci are de ales între a
câștiga 10 dacă este prădător și a câștiga o unitate dacă este pradă. Va alege acea strategie care îi
oferă cel mai bun răspuns la strategia adversarului, adică cea care îi maximizează câștigul: va
alege să fie de tipul H (prădător).
Analog pentru jucătorul 2: dacă crede că adversarul este de tip H, atunci alege max{-1,0}=0 și
subliniem elementul. Altfel va alege max{10,1}=10 și subliniem elementul.
Matricea câștigurilor este:
Jucătorul 2
H D
Jucătorul 1 H -1,-1 10,0
D 0,10 1,1
Deoarece avem 2 casuțe în care sunt subliniate ambele elemente, înseamnă că jocul are două
puncte de echilibru în strategii pure: (H,D) și (D,H), cu câștigurile (10,0) și (0,10).

5. Duopolul Bertrand
In anul 1883 Bertrand a propus un alt model pentru comportamentul a 2 firme care se află
pe o aceeaşi piaţă (cazul duopolului Bertrand). În acest caz vom presupune că cei doi jucători
sunt două firme care produc pentru o piaţă 2 produse diferite, dar care pot fi substituibile.
Funcţiile de cerere ale consumatorilor sunt date prin relaţia :
qi ( pi , p j ) = a − pi + b p j

( b  0 arată că cele 2 produse sunt substituibile iar b<0 arată că cele două produse sunt
complementare).
Spaţiul strategiilor celor doi jucători este dat de sensul dat de alegerea preţurilor la care vor
vinde cele 2 produse şi nu a cantităţilor – ca în cazul duopolului Cournot . Aducând jocul sub
formă normală avem :
- 2 jucători – reprezintă cele două firme;
- spaţiul strategiilor – dat de alegerea preţurilor p i , p j cu S i = [ 0, ) ;

- funcţiile de câştig - care vor fi profitul realizat de cele 2 firme, în cazul în care costul
total este dat prin C i ( q i ) = c q i ( presupunem de această dată că nu avem cost fix , iar

costul marginal este acelaşi pentru ambele firme ).


( )
Atunci perechea p1* , p 2* este un echilibru Nash al jocului considerat ( în care firmele aleg

simultan preţul de desfacere ) dacă fiecare firmă rezolvă următoarea problemă de maximizare:

( ) 
max ui pi , p j = max a − pi + b p j ( pi − c )
p i 0
*

p i 0
*

Din condiţiile de ordin întâi rezultă:
( *
ui pi , p j ) * 1
( *
= 0  pi = a + b q j + c )
 pi 2

(
* *
)
Deci perechea de preţuri p i , p j va satisface sistemul de ecuaţii:

 * 1
(
 p1 = 2 a + b p 2 + c
*
)

 p 2* =

1
2
(
a + b p1 + c
*
)
şi de aici , soluţia problemei: p1* = p 2* = (a + c ) .
2−b
(Observăm că această problemă are soluţie doar dacă b  2 , altfel vom obţine preţuri negative) .
Grafic, echilibrul Nash al jocului se determină la intersecția celor 2 funcții de reacție:
Aplicații propuse
Aplicația 1. Dilema Samariteanului (Tullock 1983). Considerăm o autoritate guvernamentală
ce dorește să ajute un cerșetor care își caută un loc de muncă, doar în cazul în care nu poate conta
pe ajutorul guvernamental. Câștigurile se regăsesc în tabelul de mai jos:
Cerșetor
Lucrează Nu lucrează
Acordă
3,2 -1,3
ajutorul
Agenție
guvernamentală Nu acordă -1,1 0,0
ajutorul
Să se determine echilibrul jocului atât în strategii pure, cât și în strategii mixte.

Aplicația 2. Zeităţile Marte şi Venus se luptă pentru a crea condiţiile meteorologice de pe


Pământ. Venus preferă temperaturile extreme (de regulă cele foarte ridicate), iar Marte le preferă
pe cele temperate. Câştigurile lor (exprimate în puncte de mânie) sunt date în tabelul de mai jos:
Venus
Cald Rece
Cald 20,0 0,10
Marte
Rece 0,90 20,0
Să se determine echilibrul jocului atât în strategii pure, cât și în strategii mixte.

S-ar putea să vă placă și