Sunteți pe pagina 1din 21

Jocul operaţional ca metodă de simulare

Noţiuni introductive

În toate domeniile de activitate este necesară analiza situațiilor conflictuale, acele


situații practice în care sunt prezente doi sau mai multi competitori ce urmăresc aspecte
opuse și rezultatul final al “întrecerii” depinde de măsurile pe care și le-au luat pe
parcurs „competitorii”.
Orice conflict, luat nemijlocit din activitatea practică, este foarte complex și
analiza lui matematică presupune construirea unui model simplificat (prin omiterea
factorilor mai puțin importanți) și formalizat al conflictului, model care se numește
“joc” și care se deosebește de conflictele reale prin faptul că are “reguli” bine
definite.
Teoria jocurilor este diferită de teoria jocurilor de noroc, chiar dacă
terminologia este uneori analogă, în acestea din urmă elemental dominant fiind
întâmplarea, iar acțiunile partenerilor nu pot forța această întâmplare în scopul
câștigului.
Jocurile care fac obiectul acestei teorii sunt acelea în care partenerii au
libertatea de a-și alege strategia, adică un plan care conduce la obținerea unui câștig
optim. Din acest motiv, aceste jocuri se numesc jocuri strategice și în acest context
jocul apare ca un proces în care factorii activi sunt oamenii (jucatorii).
John von Neumann şi Oskar Morgenstern în 1943: jocul este: “orice
interacţiune între diverşi agenţi, guvernată de un set de reguli specifice care stabilesc
mutările posibile ale fiecărui participant şi câstigurile pentru fiecare combinaţie de
mutări”.
Teoria jocurilor utilizează trei ipoteze fundamentale: jucătorii se comportă
raţional; fiecare stie că ceilalţi sunt raţionali; toţi jucătorii cunosc regulile jocului.
Pentru a înţelege un joc oarecare este necesară mai întâi cunoaşterea
regulilor acestuia, deoarece astfel se poate afla care acţiuni sunt permise (posibile)
la un anumit moment şi care nu. Apoi este necesar să se cunoască cum aleg jucătorii
una dintre acţiunile posibile.
Problema alegerii acţiunilor (strategiilor) de către jucători este legată de
primele două ipoteze amintite anterior. Jucătorul raţional are o anumită ierarhie a
preferinţelor, astfel încât este posibilă exprimarea acestora cu ajutorul unor funcţii
de utilitate.
Se poate observa că ipotezele cu care operează teoria jocurilor sunt similare
celor cu care se lucrează în economie şi în alte domenii.

Definiţia1. Numim joc cu n jucători o succesiune de decizii şi evenimente


aleatoare distribuite probabilistic, simultane sau nu, care respectă o anumită
structură a câştigului, impusă de anumite reguli (regulile jocului).
Regulile jocului vor indica modul în care se iau deciziile de către jucatori şi
ordinea acestora.
Un jucător este raţional dacă va căuta să-şi maximizeze satisfacţia (câștigul) în
raport cu ceilalţi jucatori.

1
Definiţia 2. Se numeşte strategie a unui jucător, o acţiune posibilă, pe care
jucătorul o poate alege în cadrul jocului. Mulţimea strategiilor jocului este dată de
mulţimea strategiilor tuturor jucătorilor.
Vom nota mulţimea strategiilor jocului astfel:
S = S1 x S2 x ... x Sn,
unde n este numărul de jucători.
În unele situaţii, natura (hazardul) este al (n + 1) -lea jucător.

Definiţia 3. Se numeşte funcţie câştig (de utilitate) a jocului, funcţia u = (u1, u2,
...un), formată din funcţiile câştig ale fiecărui jucător. Notând funcţia câştig a fiecărui
jucător ui şi funcţiile câştig ale celorlalţi jucatori u-i, funcţia câştig a jocului va fi: u : S
→ R, u = (ui, u-i). Strategiile se mai notează uzual cu ai şi bj, reprezentând acelaşi
lucru.

Definiţia 4. Se numeşte strategie optimală acea strategie care maximizează


câştigul jucătorului i, indiferent de strategiile alese de ceilalţi jucători.

Clasificarea jocurilor

Jocurile pot fi clasificate în raport cu diverse criterii:


a) în raport cu modul în care comunică jucatorii între ei:
- jocuri cooperative;
- jocuri necooperative.
În jocurile cooperative jucătorii comunică liber între ei înainte de luarea
deciziilor şi pot face promisiuni (care vor fi respectate) înainte de alegerea
strategiilor, pe când în cele necooperative aceştia nu comunică între ei înainte de
luarea deciziilor.
b) în raport cu desfăşurarea în timp a jocurilor:
- jocuri statice;
- jocuri dinamice.
În jocurile statice deciziile jucătorilor se iau simultan, după care jocul ia sfârsit.
În jocurile dinamice deciziile jucătorilor sunt secvenţiale, adică evoluează în
timp.
c) în raport cu natura informaţiei:
- jocuri în informaţie completă;
- jocuri în informaţie incompletă.
În primul caz, toţi jucătorii cunosc numărul celorlalţi jucători, strategiile fiecăruia,
funcţiile câştig ale fiecăruia, precum şi regulile jocului.
În cel de-al doilea caz, cel puţin unul dintre jucători nu cunoaşte una sau mai multe
funcţii câştig ale celorlalţi jucători, restul elementelor (numărul celorlalţi jucători,
strategiile fiecăruia şi regulile jocului) fiind cunoscute.
d) în cazul jocurilor dinamice, în raport cu tipul informaţiei:
- jocuri în informaţie perfectă
- jocuri în informaţie imperfectă

2
Jocul dinamic în informaţie perfectă este jocul dinamic în care fiecare dintre jucători
cunoaşte regulile, numărul jucătorilor, strategiile acestora, precum şi evoluţia în
timp a jocului (istoria jocului). Jocul dinamic în informaţie imperfectă este jocul
dinamic în care măcar unul dintre jucători nu cunoaşte istoria jocului, cunoscând
celelalte elemente.
e) în raport cu structura câştigurilor:
- jocuri de sumă nulă;
- jocuri de sumă nenulă
Jocul de suma nulă este acel joc în care suma câştigurilor este zero .
Jocul de suma nenulă este jocul în care suma câştigurilor este diferită de zero.
f) în raport cu numărul de jucatori:
- jocuri cu doi jucători;
- jocuri cu mai mulţi jucători;
- jocuri contra naturii (cu un singur jucator rational).
g) În raport cu cantitatea de informație pe care o au jucătorii despre pașii anteriori:
- jocuri finite, când numărul de pași este finit
- jocuri infinite, când numărul de pași este infinit.

În cele ce urmează vom considera jocuri cu doi jucători (parteneri). În locul


acestora pot fi considerate două echipe în competiţie, jucătorii fiecăreia dintre acestea
fiind perfect corelaţi în acţiuni şi strategii. Fiecare dintre ei dispune de un număr finit de
acţiuni posibile (mutări) incompatibile, strategii şi cunoaşte consecinţele adoptării lor.
Fiecare jucător alege o strategie fără a şti care sunt strategiile adoptate de jucătorul cu
care este în competiţie.
Conform cu strategia aleasă de fiecare jucător se asociază o plată pentru fiecare cuplu
de mutări generându-se matricea plăţilor sau matricea jocului. De menţionat că plăţile
sunt, după caz, câştiguri. Funcţiile corespunzătoare se numesc funcţii câştig, sau de
utilitate (vezi definiţia 3).
Presupunem că numărul de strategii (mutări) al fiecărui jucător este finit.
Jucătorul J1 are m strategii notate a1, a2 ,...am iar J2 are n strategii b1, b2 ,...bn . Dacă J1
adoptă strategia ai şi J2 adoptă strategia bj, apare o plată egală cu aij (sau câştig) pe care
în mod convenţional o câştigă jucătorul J1 şi o pierde jucătorul J2. (dacă aij  0, în
realitate J1 pierde şi J2 câştigă). Toate cele m.n plăţi ale jocului, precum şi strategiile
celor doi jucători sunt prezentate în tabela de mai jos, numită tabela/ matricea plăţilor:

J2
b1 b2 ... bn
a1 a11 a12 ... a1n
a2 a21 a22 ... a2n
J1 . . . .
. . . .
. . . .
am am1 am2 ... amn

3
Matricea plăţilor este matricea A = ( aij ) care are m linii şi n coloane. După cum se
vede din matricea jocului am considerat strategiile jucătorului J1 liniile matricei plăţilor,
iar strategiile jucătorului J2 coloanele matricei plăţilor. Alegerea de către J1 a strategiei ai
înseamnă alegerea liniei i a matricei A iar alegerea de către J2 a strategiei bj înseamnă
alegerea coloanei j a matricii A.
În consecinţă, un joc matricial este caracterizat de tripletul (X, Y, A) unde :
X = a1, a2, ...an  este muţimea strategiilor jucătorilor J1 ;
Y = b1, b2 ,... bn  este mulţimea strategiilor jucătorului J2 ;
A = (aij ), i = 1, m j = 1, n este matricea plăţilor.
Vom nota jocul prin (X, Y, A) şi vom spune că un joc este rezolvat dacă ambii jucători
au ales câte o strategie optimă. Perechea de strategii optime se numeşte soluţia jocului.

Exemple de jocuri.

Exemplul 1.
Doi jucători j1 și j2 aleg fiecare câte un număr din mulțimea {1,2,3} și convin ca plata
jocului să fie suma celor două numere, anume:
- Câștigă j1 dacă suma este un număr par;
- Câștigă j2 dacă suma este număr impar.

Matricea de plăți a acestui joc de tip 3x3, întocmită cu câștigurile lui j1 este:

1 2 3
1 2 −3 4
2 −3 4 −5
3 4 −5 6

Pierderea lui j1, este câștig al lui j2 și am notat-o cu semnul minus pentru a păstra ideea de
câștig și pierdere.

Exemplul 2.
Jucătorii j1 și j2 aleg câte un număr din mulțimea {1,2,3} și respectiv mulțimea {1,2,3,4},
j2 neavând nici o informație despre numărul ales de j1.
După ce alegerile au fost făcute, j2 plătește lui j1 o sumă definită în tabloul următor:
1 2 3 4
1 2 1 10 11
2 0 −1 1 2
3 − 3 − 5 −1 1

4
Prin urmare, dacă j1 alege 1, iar j2 alege 3, atunci j2 plătește lui j1 suma de 10 um, iar dacă
j1 alege 3, iar j2 alege 2, atunci j1 plătește lui j2 suma de 5 um. Etc.

Principiul dominării

Pe baza regulilor ce guvernează jocul, se poate stabili o corespondență între fiecare


pereche ordonată de strategii pure ale celor doi jucători și câștigul atribuit la sfârșitul
jocului unuia dintre ei (egal de obicei cu pierderea celuilalt jucător).
În multe cazuri, matricea jocului cuprinde unele strategii care sunt dezavantajoase pentru
jucători, deci trebuie eliminate. Convenția stabilită este că pentru jucătorul j1 sunt
avantajoase strategiile cu plăți mari, iar pentru j2, cele cu plăți mici. De exemplu în jocul
cu matricea:
b1 b2 b3 b4 b5
a1 3 −5 4 2 1
a2 2 3 1 0 −1
a3 4 −1 0 −1 3
a4 5 0 3 2 4
se observă cu convenția anterioară că strategiile b1 şi b3 sunt dominate de strategia b4, cu
plăți mai mici, iar strategia a3 este dominată de strategia a4 cu plati mai mari. Prin
eliminarea acestor strategii se obţine jocul având matricea:
b2 b4 b5
a1 −5 2 1
a2 3 0 −1
a4 0 2 4
Rezultă din exemplul de mai sus necesitatea găsirii strategiilor neavantajoase, pentru
reducerea prealabilă a matricei iniţiale a jocului la o matrice mai simplă. Operaţia prin
care se îndepărtează strategiile dezavantajoase poartă numele de cercetarea dominării.
Dominarea este strictă dacă toate elementele unei linii sau coloane sunt respectiv mai
mari sau mai mici decât acelea corespunzătoare altor linii sau coloane. O strategie ai
corespunzătoare liniei i ale cărei elemente sunt mai mici decât elementele liniei k
( aij  aki pentru orice j ) se spune că este dominată de strategia ak sau că strategia ak
domină strategia ai . Acest lucru se scrie ak  ai unde semnul  exprimă un raport de
preferinţă. Dacă dominaţia nu este strictă semnul  este dublat şi de semnul = în care caz
unele elemente ale liniei k pot fi egale cu elementele corespunzătoare ale liniei i. De
exemplu în jocul având matricea:
 2 3 4
 
 4 6 4
 5 2 1
 

strategia a1 nu este dominată strict de strategia a2.


Asemănător şi în matricea:

5
2 5 6 
 
2 5 − 6
1 −1 4 

unde strategiile a1 şi a2 se repetă.
Dacă air  ais pentru orice i se spune că strategia br este dominată de strategia
bs (br  bs ) sau, prescurtat coloana r este dominată de coloana s. Deci este indicat ca
jucătorul B să renunţe la strategia br.

Principiul minimax

Întocmirea matricei jocurilor este precedată de stabilirea strategiilor de care dispune


fiecare jucător fară a se analiza în prealabil calitatea acestora.
Numai într-o matrice în care fiecare element aij al matricei plăţilor reprezintă plata ce i
se cuvine jucătorului J1 dacă acesta a ales strategia pură ai iar adversarul său J2 a ales
strategia pură bj, urmează a se stabili comportarea celor doi jucători.
În comportarea sa un jucător porneşte de la premiza că adversarul său este cel puţin tot
atât de priceput ca şi el şi face totul pentru a-l împiedica să-şi atingă scopul.
În teoria jocurilor nu se mizează pe incapacitatea adversarului, ci din contră pe
calităţile raţionale ale jucătorilor care trebuie să dovedească ingeniozitate.
Principiul jucătorilor este al aversiunii faţă de risc; un jucător trebuie să-şi aleagă
comportarea ţinând seama de acţiunea cea mai defavorabilă pe care i-o rezervă
adversarul.
Jucătorul J1 doreşte să acţioneze în aşa fel încât cel mai mic câştig asigurat pe
care îl poate obţine de la jucătorul J2 să fie cât mai mare posibil, fără ca jucătorul J2
să-l poată împiedica să-l obţină.
Jucătorul J2 urmăreşte să facă pe cât posibil mai mică cea mai mare valoare ce o
va da lui J1 fără ca acest jucător să poată obţine mai mult indiferent ce ar face.
Acest principiu născut din prudenţă poartă numele de principiul minimax şi reprezintă
ideea care stă la baza teoriei jocurilor.

Jocuri cu sumă constantă

Dacă jucătorul J1 alege strategia pură ai corespunzătoare liniei i, trebuie să se aştepte


că jucătorul J2 va răspunde cu aceea din strategiile sale pentru care câştigul lui J1 va fi cel
mai mic.
Această strategie a lui J2 corespunde numărului aij având în linia i a matricei m x n
valoarea cea mai mică. Notăm acest număr  i = min aij , unde j reprezintă coloana în
j

care figurează cel mai mic element al liniei i. Deci dacă J1 a ales strategia pură ai , el nu
se aşteapta să câştige mai mult decât  i (bineînţeles în ipoteza că J2 alege acţiunile sale
cele mai logice). Dar J1 are la dispoziţie m strategii pure, aşadar el va căuta să aleagă pe
aceea dintre ele în care ai este cel mai mare. Dacă  = max  i = max min aij , atunci
i i
această valoare reprezintă valoarea inferioară a jocului sau câştigul maxim al jucătorului
J1, notată cu v.

6
Analog putem raţiona şi pentru jucătorul J2 care urmăreşte să reducă pe cât posibil
câştigul maxim pe care l-ar putea realiza jucătorul J1 . Astfel alegându-şi strategia pură bj,
el este sigur că J1 nu va putea câştiga mai mult decât max aij . Notăm cu  j = max aij
i
elementul cu cea mai mare valoare situat în coloana j. Jucătorul J2 are la dispoziţie n
strategii pure, aşa că va alege coloana în care elementul  j este cel mai mic, adică va
căuta  = min  j = min max aij numită valoarea superioară a jocului, notată v .
j j i

Să considerăm elementul a al matricii plăţilor situat la intersecţia liniei ce conţine pe 


cu coloana care îl conţine pe .
  
  
 
  a    
  
  
Deoarece elementul a face parte din coloana lui  avem evident a   şi deoarece
face parte din linia lui  avem corespunzător a   deci   a      .
Cele două valori  şi  ale jocului există întotdeauna pentru orice matrice de plăţi. Ele
permit jucătorilor să cunoască sumele pe care le au asigurate şi anume jucătorul J1 nu
poate să câştige mai puţin decât  iar jucătorul J2 nu poate pierde mai mult decât .
Strategia ce garantează jucătorului J1 câştigul egal cu valoarea inferioară a
jocului se numeşte strategie maximin, iar cea corespunzătoare lui J2 ce îi asigură o
pierdere egală cu valoarea superioară a jocului se numeşte strategie minimax.
Există jocuri pentru care  =  adică cele două valori, inferioară şi superioară ale
jocului sunt egale, avem deci:
max min aij = min max aij (1)
i j j i
Valoarea comună se numeşte valoarea jocului notată cu v, elementul matricii în care se
realizează această egalitate se numeşte punct şa iar jocurile pentru care are loc (1) se
numesc jocuri cu punct şa . Punctului şa îi corespunde o pereche de strategii minimax.
Aceste strategii se numesc optime iar perechea lor determină valoarea jocului care este
egală cu elementul corespunzător punctului şa, aij din matrice.

Rezolvarea jocurilor prin metoda grafică.

Vom ilustra pe un exemplu această metodă.


Fie jocul matricial având matricea:
J2
b1 b2 b3 b4
J1
a1 1 2 −1 1
a2 3 2 0 2
a3 1 −1 2 4

7
unde a1, a2 , a3 sunt strategiile pure ale jucătorului maximizant J1 şi b1, b2 , b3 , b4 sunt
strategiile pure ale jucătorului minimizant J2. Se observă că strategia a1 este dominată de
a2 pentru că:
a2 j  a1 j () j (3  1, 2 = 2, 0  −1, 2  1)
şi deci J1 renunţă la strategia dominantă a1 fără ca valoarea jocului şi strategiile optime să
se modifice. Matricea jocului devine:
3 2 0 2
 
 1 − 1 2 4 
Pentru jucătorul minimizant J2 strategia b1 este dominată de b2 pentru că
bi 2  bi 1 ()i (2  3, − 1  1) şi strategia b4 este dominată de b3
(bi 3  bi 4 (0  2, 2  4) ) deci jucătorul J2 renunţă la strategiile dominate b1 şi b4 fără să
modifice soluţia optimă a jocului. Matricea jocului a devenit:
2 0
A =  
 − 1 2
Valorile inferioară şi superioară ale jocului sunt:
b1 b2 i
a1 2 0 0
a2 −1 2 −1
0
j 2 2
2
Avem  = v = 0 si  = v = 2 . Jocul nu are punct şa deoarece v  v . În acest caz
v  v  v şi strategiile optime sunt strategii mixte X = x1, x2  [i Y = y1, y2  unde x1 şi
x2 reprezintă frecvenţele relative de folosire a strategiilor pure a1 respectiv a2 iar y1 ,y2
frecvenţele relative de folosire a strategiilor pure b1 respectiv b2 .
Modelul matematic al jocului este:
 x1 + x2 = 1  y1 + y2 = 1
x , x  0 y , y  0
 1 2  1 2
I 2x − x  v II 2 y v
 1 2  1
 2x2  v − y1 + 2 y2  v
Pentru sistemul I, x2 = 1− x1
2x1 − (1− x1) − v  0 3x1 − v  1 (1)
 
2(1− x1) − v  0 − 2x1 − v  −2 (2)
Rezolvăm grafic sistemul având în vedere că J1 este jucător maximizant,
v

1
B

A C
0 1/3 x1
(2) 8
(1)

-1
x1  0 si 0  v  2 . Poligonul soluţiilor posibile este triunghiul ABC. Soluţia optimă
corespunde valorii maxime a lui v, deci este dată de punctul B.

3x1 − v = 1 3 2 4
  x1 = , x2 = , v =
− 2x1 − v = −2 5 5 5
Pentru sistemul II avem: y2 = 1 − y1,
2 y1 − v  0 2 y − v  0 (1)
   1
− y1 + 2(1− y1) − v  0 − 3y1 − v  −2 (2)
În rezolvare se ţine seama de faptul că y1  0 si 0  v  2 şi J2 este jucător
minimizant. Poligonul soluţiilor posibile este triunghiul ABC.

v
A
2
C

1 B

0 2/3 y
(2) 1
(1)

Soluţia optimă corespunde valorii minime a lui v, deci punctul:


 2 y1 − v = 0 2 4 3
 y1 = , v = , y2 =
− 3y1 − v = −2 3 5 5
Strategiile optime ale jocului iniţial cu matricea asociată vor fi:
 3 2  2 3 
X * = 0, ,  si Y * = 0, , ,0
 5 5  5 5 
unde am ţinut cont de faptul că strategiile dominante a1, b1, b4 sunt folosite de strategiile
4
optime cu frecvenţe egale cu zero. Valoarea optimă a jocului este v * = .
5

Jocul poate fi rezolvat prin metoda programarii liniare astfel:


Se imparte fiecare inecuatie a sistemului II la V, se noteaza fiecare raport rezultat y1/V si
y2/v cu Y1, respective Y2, se observa din asta ca rezulta functia obiectiv [max]g=Y1+Y2
si gata problema pusa in ecuatie.

Jocuri cu suma variabilă

Majoritatea jocurilor ce apar în afaceri nu au o sumă constantă. Jocurile cu sumă


variabilă sunt mai complexe decât cele cu suma fixă, şi au o soluţie mai complicată.

9
Un exemplu este aşa-numitul “Let’s Make a Deal” (“Să facem o înţelegere”). Jucătorul 1,
o vedeta de cinema, şi jucătorul 2, un regizor, încearcă să se pună de acord cu privire la
un film. Ei estimează că filmul va aduce un profit de 30 milioane $. Profitul ar urma să se
împartă în mod egal. Regizorul şi vedeta de cinema trebuie să fie amândoi de acord cu
afacerea. Dacă unul din ei o respinge, jocul se sfârşeste şi filmul nu se va mai realiza.
Jocul are două echilibre. Unul dintre ele (da;da) înseamnă că afacerea de 30
milioane $ este încheiată şi fiecare parte obţine 15 milioane $. Al doilea echilibru (nu;nu)
înseamnă că afacerea nu s-a incheiat, şi ambele părţi obţin 0 $. Dacă vedeta de cinema
ştie ca studioul va respinge filmul, nu pierde nimic dacă şi ea îl respinge. Cele două
echilibre sunt foarte diferite din punct de vedere al câştigurilor, fapt ce demonstrează că
jocul este unul cu suma variabilă. Acest lucru ne obligă să facem diferenţa între echilibru
şi soluţie. Un echilibru este reprezentat de orice pereche de strategii spre care se indică
prin sageţi din ambele direcţii (valoarea jocului). În acest caz, ambii jucători au utilitate
maximă şi nici unul nu are motiv să schimbe strategia. Dacă jocul este unul cu suma
variabilă, nu toate echilibrele au acelaşi câştig.
Un rezultat trebuie să fie un punct de echilibru pentru a putea fi considerat o
posibilă soluţie. Dacă un rezultat nu este un punct de echilibru, atunci unul din jucători va
câştiga printr-o schimbare de strategie. Însă faptul că un rezultat este un punct de
echilibru nu înseamnă neapărat că acel rezultat este soluţia.
Prezentăm o condiţie suficientă pentru a alege dintre echilibrul de valoare
superioară şi cel de valoare inferioară din jocul “Let’s Make a Deal”. Observăm că în
ceea ce priveşte vedeta de cinema opţiunea da îi va aduce cel puţin acelaşi căştig ca în
cazul opţiunii nu, pentru orice opţiune a regizorului. De exemplu, dacă regizorul spune
da, atunci vedeta de cinema primeşte 15 milioane $ dacă răspunde da, şi 0 $ dacă
răspunde nu. Răspunsul da poate aduce un câştig mai mare decât răspunsul nu. Dacă
regizorul spune nu, atunci vedeta de cinema câştigă 0$ pentru opţiunea da şi 0$ pentru
opţiunea nu. În acest caz problema devine o dilemă. Nici unul dintre jucători nu are vreun
motiv să spună nu, pentru că opţiunea da, domină opţiunea nu. Acest lucru ne face să
devenim neîncrezători în alegerea echilibrului (nu, nu) ca soluţie. Această neîncredere se
naşte ca urmare a următoarelor condiţii suficiente:
Aplicând condiţia suficientă a strategiilor (opţiunilor) nedominate în cazul jocului
“Let’s Make a Deal), observăm că (nu,nu) nu poate fi o soluţie, din moment ce opţiunea
da domină în cazul ambilor jucători. La fel ca şi condiţiile suficiente în calcule, condiţiile
suficiente în teoria jocurilor arată că un anume rezultat nu poate fi o soluţie, chiar dacă
este un echilibru. Ele sunt menite să demonstreze că anumite echilibre nu sunt posibile
soluţii. Jocul are şi un alt echilibru, (da,da) şi acest echilibru nu este infirmat de condiţia
suficientă a strategiilor nedominate. De aceea soluţia jocului este ca regizorul şi vedeta de
cinema să spună da afacerii. Astfel am rezolvat un prim joc cu suma variabilă.

10
Jocuri contra naturii, decizii în condiţii de risc

Dacă unul dintre jucătorii este imprevizibil şi pasiv, jocul se numeşte contra naturii.
“Natura”, în cele ce urmează, este un termen generic care desemnează: diverse conditii
naturale, sau factori ca raspunsul concurenței, comportamentul consumatorilor, piața,
condiții economice în viitor, condiții politice, stare de sănătate etc.
Natura își alege strategiile întâmplător și nu este interesată de rezultat.
Un joc contra naturii este caracterizat prin următoarele:
a) O listă de alternative sau de decizii ale jucătorului 1,
b) O listă a stărilor posibile ale naturii (al doilea jucator),
c) Plățile asociate fiecărei alternative când apare una din stările naturii,
d) Gradul de certitudine a apariției evenimentelor viitoare (certitudine, risc,
incertitudine),
e) Un criteriu de decizie.
Vom trata in continuare, deciziile in conditii de risc.
Matricea jocului (a plăţilor) este următoarea:

A S1 S2 … Sn
D1 a11 a12 … a1n
D2 a21 a22 … a2n
. .
. .
Dm am1 am2 … amn
Probabilităţile P1 P2 … Pn
stărilor naturii
- aij este profitul în starea Sj când decizia este Di, i = 1, m, j = 1, n
- Pj este probabilitatea estimată pentru apariţia stării Sj
n
i = 1, n, Pj = 1
j =1

Dacă alege decizia Di, câștigul mediu al decidentului, notat MPi, este:
n
MPi =  aij Pj
j =1

Aplicând criteriul a) decidentul va alege strategia Di care-i maximizează profitul


mediu:

Pentru a aplica criteriul b) se va construi o nouă matrice (a regretelor) din matricea A a


păţilor. Fie cea mai mare plată pe care o obţine
decidentul dacă starea naturii este Sj şi

11
Matricea R = (rij )ij construită astfel se numeşte matricea regretelor.
Ea reprezintă “regretul” pentru fiecare situatie favorabilă pierdută.
Fiecare element al său arată suma pe care decidentul o pierde dacă nu alege cea mai
bună decizie când apare o anumită stare a naturii.
Criteriul costului minim (sau regretul minim) este:
Se alege acea alternativă care minimizează regretul mediu, adică minimizează
pierderile medii.
Regretul mediu al alternativei i, notat MRi, se definește astfel:
MRi=
Aplicând criteriul b), decidentul va alege strategia care-i minimizează regretul mediu:
MRi*= .

Valoarea medie a informaţiei perfecte MIP


Uneori este util pentru decident să determine beneficiul potential al cunoașterii cu
certitudine a stării naturii care urmează să apară.
MIP este o măsură a diferenţei între profitul mediu ce s-ar obţine în condiţii de
certitudine şi profitul mediu maxim în condiţii de risc.
n
Profitul mediu de certitudine este MC =   j Pj , unde  j este elementul maxim pe
j =1

coloana j, iar Pj este probabilitatea de apariţie a stării Sj.


n
Profitul mediu de risc este MP = max  aij Pj . Rezultă că
i
j =1

MIP = MC – MP= este regretul mediu minim.

Exemplu:
Se dă jocul contra naturii cu patru alternative pentru decident și următoarea tabelă a
profiturilor:
S1 S2 S3
D1 10 16 13
D2 15 8 12
D3 20 14 8
D4 12 12 12
Probabilităţile 0,2 0,5 0,3
stărilor naturii

Sa se determine Valoarea medie a informației perfecte MIP.


Pentru calculul MIP, construim tabelul:
S1 S2 S3 Valoarea medie a profitului MPi
D1 10 16 13 MP1=10.0,2+16.0,5+13.0,3=13,9*
D2 15 8 12 MP2=15.0,2+ 8.0,5+ 12.0,3=10,6
D3 20 14 8 MP3=20.0,2+14.0,5+ 8.0,3=13,4
D4 12 12 12 MP4=12.0,2+12.0,5+12.0,3= 12
Probabilităţile 0,2 0,5 0,3
stărilor naturii
20 16 13

12
Aplicând definițiile, obținem:
n
MC =   j Pj = 20.0,2+16.0,5+13.0,3= 15,9-13,9=2.
j =1

Pe de alta parte, daca vom calcula matricea regretelor si pierderea medie obtinem:

S1 S2 S3 Valoarea medie a pierderii


D1 10 0 0 10.0,2=2*
D2 5 8 1 5.0,2+ 8.0,5+ 1.0,3=5,3
D3 0 2 5 2.0,5+ 5.0,3=2,5
D4 8 4 1 8.0,2+ 4.0,5+1.0,3= 3,9
Probabilităţile 0,2 0,5 0,3
stărilor naturii
Regretul mediu minim este tot 2.

Informaţie suplimentară:
 A 
MPk = max aij P j  k = 1, n
i =1, m
  B k 
n
Profitul mediu: MS =  MPk  P(Bk ) .
k =1

Decizii in conditii de incertitudine


In condiții de incertitudine, sau decidentul nu poate determina probabilitățile de apariție a
stărilor naturii, sau nu are incredere in probabilitățile existente, astfel incât probabilitățile
nu sunt incluse in analiză. In acest sens, situația este la polul opus cazului deciziilor in
condiții de certitudine. Vom aborda următoarele criterii care se aplică in aceste condiții.

Criteriul Wald
Acesta este criteriul maximin aplicat la jocurile contra naturii. Astfel:
- dacă jocul are punct șa, se alege strategia (linia) pentru care există relația:
 = max  i = max min aij .
i i
- dacă jocul nu are punct șa, se alege strategia {x10, x20,…….xm0}pentru care
minj{a1j.x10+a2j.x20+….+amj.xm0} este maxim.
Acest criteriu este adeseori ales in situații in care decidentul nu-și poate permite să
greșească (planuri de apărare, asigurări), astfel incât factorul de decizie alege varianta
care dă cel mai bun rezultat în cea mai nefavorabilă situație posibilă.

Criteriul maximax
Acest criteriu este opus celui precedent. Este identificată cea mai bună plată pentru
fiecare alternativă, iar decizia este dată de linia care are cea mai mare valoare. Astfel, se
alege linia i care satisface condiția maxi(maxj(aij)).
Așacum strategia maximin este considerată excesiv de prudentă, dacă nu chiar pesimistă,
strategia maximax poate fi considerată optimistă.

Exemplu.

13
Un manager de magazin trebuie sa decidă cu ce tipuri de haine să aprovizioneze
magazinul pentru sezonul următor. El are de ales între a face o comandă integrală cu
haine de tip , o comandă integrală de tip B și a împărțt comanda între cele două tipuri.
Profiturile obținute din diferitele stări ale naturii (piața) sunt date în tabelul următor în
unități monetare.
Piața acceptă
Stilul A Stilul B Stilul A+B
Alternative Stilul A 90 40 55 Max=90
de Stilul B 30 100 65 Max=100
comanda Stilul A+B 70 80 106 Max=106*
El va face o comandă mixta A+B, în speranța căva câștiga 106 um.

Criteriul lui Savage (al regretului minim)


Este un criteriu care se aplică unui nou joc, definit de matricea regretelor. Cu alte cuvinte,
Dacă A=(aij) este matricea jocului, se va calcula matricea regretelor R=(rij), unde
rij= -aij. Noului joc cu matricea R I se aplică criteriul minimax dacă jocul admite
punct șa , sau se alege strategia mixtă (x10,x20,…..xm0) care minimizează
maxj(r1j.x1+r2j.x2+…….rmj.xm), in cazul in care jocul nu are punct șa.

Exemplu:
Sa presupunem ca matricea jocului contra naturii este urmatoarea:

A=

Matricea regretelor este:

R=

Nu exista punct sa (de echilibru). Cautam o strategie mixta optima. Se elimina mai intai
coloanele 1 si 4 din matricea A si se rezolva jocul matriceal ramas.
Se obtine x10= 2/5, x20=0, x30= 3/5. Decidentul este sigur ca nu poate pierde mai mult de
8/5 daca adopta aceasta strategie.

Criteriul Bayes-Laplace

Acest criteriu presupune ca se cunosc probabilitatile starilor naturii, daca nu se cunosc, se


considera ca toate starile naturii sunt echiprobabile. In acest caz, daca sunt n stari ale
naturii, fiecare stare are probabilitatea de aparitie egala cu 1/n, astfel problema se
transforma in decizie in conditii de risc.
Astfel:
- Se calculeaza pentru fiecare linie i, marimea lj= ( )/n
- Se alege maximul acestei expresii
- Decizia optima este Di*.

14
Reluam jocul anterior.
S1 S2 S3 S4 lj
D1 3 -1 1 1 1
D2 1 0 0 2 3/4
D3 6 -2 5 7 4*

Decidentul va alege decizia D3, aplicand criteriul lui Bayes.

1. O firmă care comercializează tehnică de calcul achiziţionează echipamente de calcul


care urmează să fie vândute într-o anumită perioadă de timp.
Conform unei statistici bazată pe date privind vânzările anterioare se estimează
vânzările după repartiţia:
 5 10 15 20 
 
 0,1 0,3 0,4 0,2 
Comanda minimă este de 5 calculatoare, costul unitar fiind 1000 um iar pretul de
vânzare de 1300 um.
Conform contractului, după perioada convenită calculatoarele nevândute vor fi
returnate producătorului contra sumei de 800 um/buc.
Să se stabilească numărul optim de calculatoare care pot fi cumpărate de către firmă
pentru comercializare.
Rezolvare
Problema poate fi scrisă sub forma unui joc matriceal. Se observă că la fiecare
calculator vândut se cîştigă 300 um şi se pierd 200 um pentru fiecare calculator returnat
producătorului.
Matricea jocului este următoarea:

Cererea Probabili- Cantitatea comandată


pieţei tatea a1:5 a2:10 a3:15 a4:20
C1:5 0,1 1500 500 -500 -1500
C2:10 0,3 1500 3000 2000 1000
C3:15 0,4 1500 3000 4500 3500
C4:20 0,2 1500 3000 4500 6000

Dacă în stabilirea deciziei optime a firmei se ţine seama numai de consecinţele


economice, atunci se pot aplica criteriile maximin, maximax, minimax.
a) Prin criteriul maximin se stabileşte cea mai mare valoare minimă din toate actele de
decizie, conducând la o soluţie prevenitoare, pentru că se va avea în vedere tot ce este
mai rău posibil să se întâmple. Algoritmul constă în alegerea minimului fiecărei coloane
şi dintre acestea se alege maximul:

a1 a2 a3 a4
1500 500 -500 -1500
Rezultatul alegerii este a1, conducând la cea mai mică pierdere de suportat.
b) Prin criteriul maximax, total opus criteriului maximin, se alege strategia cu cea mai
mare valoare dintre toate actele de decizie, potrivit principiului „celui mai bun lucru care

15
se poate întâmpla”
Se calculează maximul fiecărei coloane şi dintre aceste elemente se alege maximul:

a1 a2 a3 a4
1500 3000 4500 6000

Rezultatul alegerii este a4, conducând la cel mai mare cîştig posibil (dar cu cel mai
mare risc).
c) Criteriul minimax se bazează pe prudenţă. Se alege maximul fiecărei coloane şi
dintre acestea se alege minimul.

a1 a2 a3 a4
1500 3000 4500 6000

Cea mai prudentă decizie este deci a1.


d) Criteriul lui Savage, reprezintă acelaşi criteriu minimax utilizat pe o matrice a
jocului ale cărei elemente se numesc pierderi condiţionate ale oportunităţii (regrete). În
acest caz elementele matricei reprezintă pentru fiecare strategie diferenţa dintre cîştigul
economic al acelei strategii şi cîştigul economic cel mai bun în cazul în care se verifică
un anumit eveniment, sau, în cazul în care natura este într-o stare dată.
De exemplu, să presupunem că are loc evenimentul c1, atunci strategia cea mai bună
este a1, cîştigul economic fiind de 1500 u.m. Pierderile condiţionate de acest eveniment
se obţin scăzând din cîştigul cel mai bun fiecare cîştig corespunzător fiecărei strategii.
Matricea regretelor va fi:

a1 a2 a3 a4
C1 0 1000 2000 3000
C2 1500 0 1000 2000
C3 3000 1500 0 1000
C4 4500 3000 1500 0
max 4500 3000 2000 3000

Pierderea maximă a oportunităţii (regretul maxim) se găseşte în ultima linie a tabelului


iar soluţia optimă este a3 căreia îi corespunde valoarea minimă a regretelor maxime.
e) Ţinând seama de faptul că se cunosc probabilităţile Pi i = 1,4 se pot determina
pierderile medii folosind datele din matricea iniţială înmulţite cu –1 (pentru a reprezenta
pierderi). Dintre ele se alege conform criteriului lui Bayes-Laplace cea mai mică pierdere
medie şi ea va reprezenta strategia Bayes-Laplace a jocului:
Pe matricea initiala avem:
PM1 =1500·0,1+ 1500·0,3+ 1500·0,4+ 1500·0,2= 1500
PM2 = 500·0,1+ 3000·0,3+ 3000·0,4+ 3000·0,2= 2750
PM3 = -500·0,1+ 2000·0,3+ 4500·0,4+ 4500·0,2= 3250
PM4 = -1500·0,1+ 1000·0,3+ 3500·0,4+ 6000·0,2= 2750
şi PM3 = max (PMi), i = 1,4

16
ceea ce conduce la concluzia că a3 este strategia Bayes-Laplace.
Aplicând criteriul Bayes-Laplace pe matricea regretelor avem:
PM1 = 0·0,1+1500·0,3+ 3000·0,4+ 4500·0,2= 2500
PM2 = 1000·0,1+1500·0,4+ 3000·0,2= 1300
PM3 = 2000·0,1+1000·0,3+ 1500·0,2= 800
PM4 = 3000·0,1+2000·0,3+ 1000·0,4= 1300
Fiind vorba de pierderi medii, se alege PM3= min (PMi), i = 1,4 deci strategia a3
este strategia Bayes-Laplace.

2. O societate extractivă oferă 200.000 dolari unui proprietar de teren pentru dreptul de
a cerceta existanţa hidrocarburilor şi exploatarea lor în cazul unor rezultate favorabile ale
cercetării. Exploatarea va aduce un căştig de 800.000 dolari proprietarului, iar costul
prospecţiunii este de 300.000 dolari, recuperaţi numai dacă se vor descoperi zăcăminte
exploatabile. Dacă se descoperă resurse exploatabile, se estimează pentru cel ce le va
exploata un profit net de 3 mil. dolari.
a) Să se stabilească decizia optimă a proprietarului de teren în acest caz;
b) Să se stabilească decizia optimă a proprietarului de teren dacă se estimează că
probabilitatea de a găsi hidrocarburi este de 0,6.
Rezolvare:
a) Deciziile proprietarului pot fi:
a1 – acceptarea ofertei;
a2 – exploatarea pe cont propriu.
Stările naturii sunt:
1 – nu există zăcământ în subsolul terenului;
2 – există zăcământ.
Aplicând criteriul Bayes-Laplace fara sa tinem seama de probabilitatile starilor naturii,
avem

1 2
a1 200 1000
a2 -300 3000

deci decizia optimă în baza acestui criteriu este a2.

b) Matricea cîştigurilor proprietarului va fi:

 p() a1 a2
1 0,4 200 -300
2 0,6 1000 3000
PMi 680 1680

Soluţia optimă este cea care conduce la un profit mediu maxim.


max( PMi) = max(200  0,4 + 1000  0,6; − 300  0,4 + 3000  0,6)
i

= max(680,1680)

17
Aşadar, cunoscând probabilităţile p(1) şi p(2) decizia optimă este a2 – să exploateze
pe cont propriu prin criteriul a priori.

3. În problema anterioară, proprietarul de teren efectuează sondaje pentru descoperirea


zăcământului cu un cost de 50.000 dolari. Se admite că în 30% din cazuri sondajul nu
indică existenţa zăcământului, cu toate că el există. Când zăcământul nu există testul este
exact în 90% din cazuri.
Folosind aceste date şi estimarea iniţială potrivit căreia probabilitatea existenţei
zăcământului este 0,6 să se determine decizia optimă a proprietarului.
Rezolvare:
Problema se încadrează în categoria jocurilor cu experienţă unică, având spaţiul
rezultatelor Z={z1,z2) cu z1= evenimentul că sondajul indică inexistenţa zăcământului,
iar z2= evenimentul că sondajul indică existenţa zăcământului.
Din enunţ avem:
P(z1/1)= 0,9; P(z1/2)= 0,3
P(z2/1)= 0,1; P(z2/2)= 0,7
Sunt necesare probabilităţile a posteriori calculate cu formula lui Bayes.

Avem:

P( z1 /  1 )  P ( 1 )
P ( 1 / z1 ) = =
P ( z1 /  1 )  P ( 1 ) + P ( z1 /  2 )  P ( 2 )
0,9  0,4 2
= =
0,9  0,4 + 0,3  0,6 3
P( z 2 /  1 )  P( 1 )
P( 1 / z 2 ) = =
P( z 2 /  1 )  P( 1 ) + P( z 2 /  2 )  P( 2 )
0,1  0,4 2
= =
0,1  0,4 + 0,7  0,6 23
Tot din enunţul problemei se deduce că matricea cîştigurilor proprietarului se

modifică, fiecare element diminuându-se cu 50 din cauza cheltuielilor necesitate de

operaţia de sondaj. Avem deci

 p() a1 a2
1 0,4 150 -350
2 0,6 950 2950

Cu probabilităţi a posteriori şi cu cîştigurile din această matrice se pot determina


cîştigurile medii ale proprietarului pentru fiecare rezultat z1,z2 al experienţei, după
formula:

18
MS =  MPA p( / z ), z  Z fixat
0
În cazul evenimetului Z1 cîştigurile medii ale proprietarului sunt:
MS11 = q11  p( 1 / z1 ) + q 21  p( 2 / z1 ) = 150  + 950  = 417
2 1
3 3
MS12 = q12  p( 1 / z1 ) + q 22  p( 2 / z1 ) = −350  + 2950  = 750
2 1
3 3
max (MS1, MS2)= 750 deci decizia optimă este a2 dacă rezultatul experienţei este z1.
În cazul evenimentului z2 cîştigurile medii ale proprietarului sunt:
MS 21 = q11  p( 1 / z 2 ) + q 21  p( 2 / z 2 ) = 150  + 950 
2 21
= 840
23 23

MS 22 = q12  p( 1 / z 2 ) + q 22  p( 2 / z1 ) = −350 


2 21
+ 2950   2663
23 23

max (MS21, MS22) = 2663, adică decizia optimă este a2 dacă rezultatul experienţei este z2.
Rezultă că se alege strategia de exploatare pe cont propriu a2, în oricare caz.

4. O firmă care deţine un lanţ de magazine de confecţii trebuie să comande în


primăvara fiecărui an confecţiile pentru iarna viitoare. Profitul firmei va depinde de
numărul de haine ce vor fi comandate şi de faptul dacă moda va rezista de la data
încheierii contractului şi până la sezonul de iarnă.
Estimarea cîştigurilor (în mii de dolari) efectuate de firmă sunt date în tabelul următor:

a1: nu a2: a3: a4:


comandă comandă comandă comandă
puţin moderat suficient
C1: hainele sunt la -50 -10 60 80
modă
C2: hainele sunt 0 30 45 40
acceptabile
C3: hainele nu mai 80 35 -30 -45
sunt la modă

Să se determine soluţia optimă de aprovizionare.


Rezolvare:
Folosind criteriul Bayes-Laplace se obţine:

1 n   − 50 + 0 + 80 − 10 + 30 + 35 60 + 45 − 30 80 + 40 − 45 
max   q ij  = max  , , , 
j
 n i =1   3 3 3 3 
= max 10; 18, 33; 25; 25 = 25
deci decizia optimă este a3 sau a4.

19
5. Companiile petroliere Shell şi Lukoil intenţionează să construiască (independent
una de cealaltă) o staţie de carburanţi într-o intersecţie intens circulată între trei oraşe
A,B,C, situate la 15 km, 10km respectiv 20 km unul faţă de altul.
Se ştie că 40% dintre solicitanţii din zonă se aprovizionează în prezent din primul
oraş, 35% din al doilea şI 25% din al treilea.
Se ştie deasemenea că prima companie ar controla majoritatea pieţei în situaţii
comparabile. Din cercetările efectuate în zonă de ambele companii s-a ajuns la
următoarele previziuni identice:
- dacă ambele companii s-ar instala într-un oraş (sau la distanţe egale de acesta)
prima ar controla 70% din piaţa petrolieră a acestuia.
- dacă prima companie ar fi mai aproape de un oraş decât a doua, ar controla 85% din
piaţa acestuia iar în caz contrar ar controla doar 40%.
- Oraşul al treilea fiind mai mic nu intră în planurile de afaceri ale primei companii.
a) Considerând enunţul de mai sus un joc în care jucătorii sunt cele două companii să
se construiască matricea jocului şi să se stabilească strategiile optime ale celor doi
jucători.
b) Ce strategii pure se pot înlătura prin aplicarea criteriului dominării?
Rezolvare: a) Strategiile pure ale celor doi jucători sunt următoarele:
- strategia a1 – prima companie poate construi în oraţul A
- strategia a2 – prima companie poate construi în oraţul B
- strategia b1 – a doua companie poate construi în oraţul A
- strategia b2 – a doua companie poate construi în oraţul B
- strategia b3 – a doua companie poate construi în oraţul C
Presupunem că încasările ar fi în aceleaşi procente cu cele din cercetările de marketing
realizate şi că un procent cîştigat sau pierdut de una dintre firme este un procent pierdut
sau cîştigat de cealaltă.
Rezultă că jocul are sumă nulă.
Calculul elementelor matricei jocului se efectuează astfel:
Dacă ambele companii construiesc în acelaşi oraş, atunci prima companie va acapara
70% din piaţa întregii regiuni, deci q11 = q 22 = 0,70 .
Dacă Shell construieşte în oraşul A, iar Lukoil în oraşul B, atunci:
q12 = 0,85  0,40 + 0,40  0,35 + 0,4  0,25 = 0,35 + 0,14 + 0,1 = 0,59 .
Dacă Shell construieşte în oraşul A, iar Lukoil în oraşul B,
atunci: q13 = 0,85  0,4 + 0,85  0,35 + 0,4  0,25 = 0,34 + 0,3 + 0,1 = 0,74 .
După acelaşi raţionament q 23 = 0,74 .
Dacă Shell construieşte în oraşul B iar Lukoil în oraşul A, atunci:
q 21 = 0,4  0,4 + 0,85  0,35 + 0,9  0,25 = 0,71 .
Matricea jocului va fi:

20
Shell b1 b2 b3 1
Lukoil
a1 0,70 0,59 0,74 0,59
a2 0,71 0,70 0,74 0,70
 = 0,70
1 0,71 0,7 0,74
 = 0,70
Valoarea inferioară a jocului este:
 = max  i = max (max qis ) = 0,70 .
i i s

Valoarea superioară este:


 = min  s = min (max qis ) = 0,70 .
i i s

Cum  =  = 0,7 , aceasta va fi valoarea jocului, iar strategiile pure optime sunt:
a 2 - Shell să construiască în oraşul B
b2 - Lukoil să construiască tot în oraşul B

b) Primul jucător poate să înlăture strategia a1 pentru că plăţile corespunzătoare sunt mai
mici sau egale decât plăţile strategiei a 2 (q1i  q 2i i = 1,2,3) .
Al doilea jucător poate să înlăture strategiile b1 şi b3 pentru că q i1  q i 2 şi q i 3  q i 2
i = 1,2 , adică b1  b2 , b3  b2 .
După eliminarea acestor strategii, matricea jocului rămâne formată dintr-un singur
element q 22 = 0,70 , care corespunde strategiilor pure a1 şi b2 ale celor doi jucători.
Acestea sunt strategiile optimale.

21

S-ar putea să vă placă și