Sunteți pe pagina 1din 18

Jocul operaional ca metod de simulare

Noiuni introductive
n toate domeniile de activitate este necesar analiza situaiilor conflictuale, acele
situaii practice n care sunt prezente dou sau mai multe laturi ce urmresc aspecte opuse
i rezultatul final al ntrecerii depinde de msurile pe care i le-au luat pe parcurs
competitorii.
Orice conflict, luat nemijlocit din activitatea practic, este foarte complex i
analiza lui matematic presupune construirea unui model simplificat (prin omiterea
factorilor mai puin importani) i formalizat al conflictului, model care se numete joc
i care se deosebete de conflictele reale prin faptul c are reguli bine definite.
Teoria jocurilor este diferit de teoria jocurilor de noroc, chiar dac terminologia
este uneori analog, n acestea din urm elemental dominant fiind ntmplarea, iar
aciunile partenerilor nu pot fora aceast ntmplare n scopul ctigului.
Jocurile care fac obiectul acestei teorii sunt acelea n care partenerii au libertatea
de a-i alege strategia, adic un plan care conduce la obinerea unui ctig optim. Din
acest motiv, aceste jocuri se numesc jocuri strategice i n acest context jocul apare ca un
proces n care factorii activi sunt oamenii (jucatorii).
John von Neumann i Oskar Morgenstern n 1943: jocul este: orice interaciune
ntre diveri ageni, guvernat de un set de reguli specifice care stabilesc mutrile
posibile ale fiecrui participant i cstigurile pentru fiecare combinaie de mutri.
Teoria jocurilor utilizeaz trei ipoteze fundamentale: juctorii se comport
raional; fiecare stie c ceilali sunt raionali; toi juctorii cunosc regulile jocului.
Pentru a nelege un joc oarecare este necesar mai nti cunoaterea regulilor
acestuia, deoarece astfel se poate afla care aciuni sunt permise (posibile) la un anumit
moment i care nu. Apoi este necesar s se cunoasc cum aleg juctorii una dintre
aciunile posibile.
Problema alegerii aciunilor (strategiilor) de ctre juctori este legat de primele
dou ipoteze amintite anterior. Juctorul raional are o anumit ierarhie a preferinelor,
astfel nct este posibil exprimarea acestora cu ajutorul unor funcii de utilitate.
Se poate observa c ipotezele cu care opereaz teoria jocurilor sunt similare celor
cu care se lucreaz n economie i n alte domenii.
Definiia1. Numim joc cu n juctori o succesiune de decizii i evenimente
aleatoare distribuite probabilistic, simultane sau nu, care respect o anumit structur a
ctigului, impus de anumite reguli (regulile jocului).
Regulile jocului vor indica modul n care se iau deciziile de ctre jucatori i
ordinea acestora.
Un juctor este raional dac va cuta s-i maximizeze satisfacia (ctigul) n
raport cu ceilali jucatori.
Definiia 2. Se numete strategie a unui juctor, o aciune posibil, pe care
juctorul o poate alege n cadrul jocului. Mulimea strategiilor jocului este dat de
mulimea strategiilor tuturor juctorilor.
Vom nota mulimea strategiilor jocului astfel:

S = S1 x S2 x ... x Sn,
unde n este numrul de juctori.
n unele situaii, natura (hazardul) este al (n + 1) -lea juctor.
Definiia 3. Se numete funcie ctig (de utilitate) a jocului, funcia u = (u1, u2,
...un), format din funciile ctig ale fiecrui juctor. Notnd funcia ctig a fiecrui
juctor ui i funciile ctig ale celorlali jucatori u-i, funcia ctig a jocului va fi: u : S
R, u = (ui, u-i). Strategiile se mai noteaz uzual cu ai i bj, reprezentnd acelai lucru.
Definiia 4. Se numete strategie optimal acea strategie care maximizeaz
ctigul juctorului i, indiferent de strategiile alese de ceilali juctori.
Clasificarea jocurilor
Jocurile pot fi clasificate n raport cu diverse criterii:
a) n raport cu modul n care comunic jucatorii ntre ei:
- jocuri cooperative;
- jocuri necooperative.
n jocurile cooperative juctorii comunic liber ntre ei nainte de luarea deciziilor i
pot face promisiuni (care vor fi respectate) nainte de alegerea strategiilor, pe cnd n cele
necooperative acetia nu comunic ntre ei nainte de luarea deciziilor.
b) n raport cu desfurarea n timp a jocurilor:
- jocuri statice;
- jocuri dinamice.
n jocurile statice deciziile juctorilor se iau simultan, dup care jocul ia sfrsit.
n jocurile dinamice deciziile juctorilor sunt secveniale, adic evolueaz n timp.
c) n raport cu natura informaiei:
- jocuri n informaie complet;
- jocuri n informaie incomplet.
n primul caz, toi juctorii cunosc numrul celorlali juctori, strategiile fiecruia,
funciile ctig ale fiecruia, precum i regulile jocului.
n cel de-al doilea caz, cel puin unul dintre juctori nu cunoate una sau mai multe
funcii ctig ale celorlali juctori, restul elementelor (numrul celorlali juctori,
strategiile fiecruia i regulile jocului) fiind cunoscute.
d) n cazul jocurilor dinamice, n raport cu tipul informaiei:
- jocuri n informaie perfect
- jocuri n informaie imperfect
Jocul dinamic n informaie perfect este jocul dinamic n care fiecare dintre juctori
cunoate regulile, numrul juctorilor, strategiile acestora, precum i evoluia n timp a
jocului (istoria jocului). Jocul dinamic n informaie imperfect este jocul dinamic n care
mcar unul dintre juctori nu cunoate istoria jocului, cunoscnd celelalte elemente.
e) n raport cu structura ctigurilor:
- jocuri de sum nul;
- jocuri de sum nenul
Jocul de suma nul este acel joc n care suma ctigurilor este zero .
Jocul de suma nenul este jocul n care suma ctigurilor este diferit de zero.
2

f) n raport cu numrul de jucatori:


- jocuri cu doi juctori;
- jocuri cu mai muli juctori;
- jocuri contra naturii (cu un singur jucator rational).
g) n raport cu cantitatea de informaie pe care o au juctorii despre paii anteriori:
- jocuri finite, cnd numrul de pai este finit
- jocuri infinite, cnd numrul de pai este infinit.
n cele ce urmeaz vom considera jocuri cu doi juctori (parteneri). n locul
acestora pot fi considerate dou echipe n competiie, juctorii fiecreia dintre acestea
fiind perfect corelai n aciuni i strategii. Fiecare dintre ei dispune de un numr finit de
aciuni posibile (mutri) incompatibile, strategii i cunoate consecinele adoptrii lor.
Fiecare juctor alege o strategie fr a ti care sunt strategiile adoptate de juctorul cu
care este n competiie.
Conform cu strategia aleas de fiecare juctor se asociaz o plat pentru fiecare cuplu
de mutri generndu-se matricea plilor sau matricea jocului. De menionat c plile
sunt, dup caz, ctiguri. Funciile corespunztoare se numesc funcii ctig, sau de
utilitate (vezi definiia 3).
Presupunem c numrul de strategii (mutri) al fiecrui juctor este finit.
Juctorul J1 are m strategii notate a1, a2 ,...am iar J2 are n strategii b1, b2 ,...bn. Dac J1
adopt strategia ai i J2 adopt strategia bj, apare o plat egal cu aij (sau ctig) pe care
n mod convenional o ctig juctorul J1 i o pierde juctorul J2. (dac aij 0, n
realitate J1 pierde i J2 ctig). Toate cele m.n pli ale jocului, precum i strategiile
celor doi juctori sunt prezentate n tabela de mai jos, numit tabela plilor:

J1

a1
a2
.
.
.
am

b1
a11
a21
.
.
.
am1

J2
b2
a12
a22
.
.
.
am2

...
...
...

...

bn
a1n
a2n
.
.
.
amn

Matricea plilor este matricea A (aij ) care are m linii i n coloane. Dup cum se
vede din matricea jocului am considerat strategiile juctorului J1 liniile matricei plilor,
iar strategiile juctorului J2 coloanele matricei plilor. Alegerea de ctre J1 a strategiei ai
nseamn alegerea liniei i a matricei A iar alegerea de ctre J2 a strategiei bj nseamn
alegerea coloanei j a matricii A.
n consecin, un joc matricial este caracterizat de tripletul (X, Y, A) unde :
X a1, a2, ...an este muimea strategiilor juctorilor J1 ;

Y b1, b2 ,...bn este mulimea strategiilor juctorului J2 ;


A (aij ), i 1, m j 1, n este matricea plilor.
Vom nota jocul prin (X, Y, A) i vom spune c un joc este rezolvat dac ambii juctori
au ales cte o strategie optim. Perechea de strategii optime se numete soluia jocului.
Exemple de jocuri.
Doi juctori j1 i j2 aleg fiecare cte un numr din mulimea {1,2,3} i convin ca plata
jocului s fie suma celor dou numere, anume:
- Ctig j1 dac suma este un numr par;
- Ctig j2 dac suma este numr impar.
Matricea de pli a acestui joc de tip 3x3, ntocmit cu ctigurile lui j1 este:

1
2
3
1 2 3 4
2 3 4 5
3 4 5 6
Pierderea lui j1, este ctig al lui j2 i am notat-o cu semnul minus pentru a pstra ideea de
ctig i pierdere.
Juctorii j1 i j2 aleg cte un numr din mulimea {1,2,3} i respectiv mulimea {1,2,3,4},
j2 neavnd nici o informaie despre numrul ales de j1.
Dup ce alegerile au fost fcute, j2 pltete lui j1 o sum definit n tabloul urmtor:

1
2
3 4
1 2
1 10 11
2 0 1 1 2
3 3 5 1 1
Prin urmare, dac j1 alege 1, iar j2 alege 3, atunci j2 pltete lui j1 suma de 10 um, iar dac
j1 alege 3, iar j2 alege 2, atunci j1 pltete lui j2 suma de 5 um. Etc.
Principiul dominrii
Pe baza regulilor ce guverneaz jocul, se poate stabili o coresponden ntre fiecare
pereche ordonat de strategii pure ale celor doi juctori i ctigul atribuit la sfritul
jocului unuia dintre ei (egal de obicei cu pierderea celuilalt juctor).
n multe cazuri, matricea jocului cuprinde unele strategii care sunt dezavantajoase pentru
juctori, deci trebuie eliminate. Convenia stabilit este c pentru juctorul j1 sunt
avantajoase strategiile cu pli mari, iar pentru j2, cele cu pli mici. De exemplu n jocul
cu matricea:

b1
b2
b3
b4
b5
a1
3
5
4
2
1
a2
2
3
1
0
1
a3
4
1
0
1
3
a4
5
0
3
2
4
se observ cu convenia anterioar c strategiile b1 i b3 sunt dominate de strategia b4, cu
pli mai mici, iar strategia a3 este dominat de strategia a4 cu plati mai mari. Prin
eliminarea acestor strategii se obine jocul avnd matricea:
b2
b4
b5
a1
5
2
1
a2
3
0
1
a4
0
2
4
Rezult din exemplul de mai sus necesitatea gsirii strategiilor neavantajoase, pentru
reducerea prealabil a matricei iniiale a jocului la o matrice mai simpl. Operaia prin
care se ndeprteaz strategiile dezavantajoase poart numele de cercetarea dominrii.
Dominarea este strict dac toate elementele unei linii sau coloane sunt respectiv mai
mari sau mai mici dect acelea corespunztoare altor linii sau coloane. O strategie ai
corespunztoare liniei i ale crei elemente sunt mai mici dect elementele liniei k
(aij aki pentru orice j ) se spune c este dominat de strategia ak sau c strategia ak
domin strategia ai . Acest lucru se scrie ak ai unde semnul exprim un raport de
preferin. Dac dominaia nu este strict semnul este dublat i de semnul n care caz
unele elemente ale liniei k pot fi egale cu elementele corespunztoare ale liniei i. De
exemplu n jocul avnd matricea:
2 3 4

4 6 4
5 2 1

strategia a1 nu este dominat strict de strategia a2.


Asemntor i n matricea:
5
6
2

5
6
2
1 1
4

unde strategiile a1 i a2 se repet.


Dac air ais pentru orice i se spune c strategia br este dominat de strategia
bs (br bs ) sau, prescurtat coloana r este dominat de coloana s. Deci este indicat ca
juctorul B s renune la strategia br.
Principiul minimax
ntocmirea matricei jocurilor este precedat de stabilirea strategiilor de care dispune

fiecare juctor far a se analiza n prealabil calitatea acestora.


Numai ntr-o matrice n care fiecare element aij al matricei plilor reprezint plata ce i
se cuvine juctorului J1 dac acesta a ales strategia pur ai iar adversarul su J2 a ales
strategia pur bj, urmeaz a se stabili comportarea celor doi juctori.
n comportarea sa un juctor pornete de la premiza c adversarul su este cel puin tot
att de priceput ca i el i face totul pentru a-l mpiedica s-i ating scopul.
n teoria jocurilor nu se mizeaz pe incapacitatea adversarului, ci din contr pe
calitile raionale ale juctorilor care trebuie s dovedeasc ingeniozitate.
Principiul juctorilor este al aversiunii fa de risc; un juctor trebuie s-i aleag
comportarea innd seama de aciunea cea mai defavorabil pe care i-o rezerv
adversarul.
Juctorul J1 dorete s acioneze n aa fel nct cel mai mic ctig asigurat pe
care l poate obine de la juctorul J2 s fie ct mai mare posibil, fr ca juctorul J2
s-l poat mpiedica s-l obin.
Juctorul J2 urmrete s fac pe ct posibil mai mic cea mai mare valoare ce o
va da lui J1 fr ca acest juctor s poat obine mai mult indiferent ce ar face.
Acest principiu nscut din pruden poart numele de principiul minimax i reprezint
ideea care st la baza teoriei jocurilor.
Jocuri cu sum constant
Dac juctorul J1 alege strategia pur ai corespunztoare liniei i, trebuie s se atepte
c juctorul J2 va rspunde cu aceea din strategiile sale pentru care ctigul lui J1 va fi cel
mai mic.
Aceast strategie a lui J2 corespunde numrului aij avnd n linia i a matricei m x n
valoarea cea mai mic. Notm acest numr i min aij , unde j reprezint coloana n
j

care figureaz cel mai mic element al liniei i. Deci dac J1 a ales strategia pur ai , el nu
se ateapta s ctige mai mult dect i (bineneles n ipoteza c J2 alege aciunile sale
cele mai logice). Dar J1 are la dispoziie m strategii pure, aadar el va cuta s aleag pe
aceea dintre ele n care ai este cel mai mare. Dac max i max min aij , atunci
i

aceast valoare reprezint valoarea inferioar a jocului sau ctigul maxim al juctorului
J1, notat cu v.
Analog putem raiona i pentru juctorul J2 care urmrete s reduc pe ct posibil
ctigul maxim pe care l-ar putea realiza juctorul J1 . Astfel alegndu-i strategia pur bj,
el este sigur c J1 nu va putea ctiga mai mult dect max aij . Notm cu j max aij
i

elementul cu cea mai mare valoare situat n coloana j. Juctorul J2 are la dispoziie n
strategii pure, aa c va alege coloana n care elementul j este cel mai mic, adic va
cuta min j min max aij numit valoarea superioar a jocului, notat v .
j

S considerm elementul a al matricii plilor situat la intersecia liniei ce conine pe


cu coloana care l conine pe .

Deoarece elementul a face parte din coloana lui avem evident a i deoarece
face parte din linia lui avem corespunztor a deci a .
Cele dou valori i ale jocului exist ntotdeauna pentru orice matrice de pli. Ele
permit juctorilor s cunoasc sumele pe care le au asigurate i anume juctorul J1 nu
poate s ctige mai puin dect iar juctorul J2 nu poate pierde mai mult dect .
Strategia ce garanteaz juctorului J1 ctigul egal cu valoarea inferioar a
jocului se numete strategie maximin, iar cea corespunztoare lui J2 ce i asigur o
pierdere egal cu valoarea superioar a jocului se numete strategie minimax.
Exist jocuri pentru care adic cele dou valori, inferioar i superioar ale
jocului sunt egale, avem deci:
max min aij min max aij
(1)
i

Valoarea comun se numete valoarea jocului notat cu v, elementul matricii n care se


realizeaz aceast egalitate se numete punct a iar jocurile pentru care are loc (1) se
numesc jocuri cu punct a . Punctului a i corespunde o pereche de strategii minimax.
Aceste strategii se numesc optime iar perechea lor determin valoarea jocului care este
egal cu elementul corespunztor punctului a, aij din matrice.
Rezolvarea jocurilor prin metoda grafic.
Vom ilustra pe un exemplu aceast metod.
Fie jocul matricial avnd matricea:
J2
b1
b2
J1
a1
1
2

a2
a3

3
1

2
1

b3

b4

1
0
2

1
2
4

unde a1, a2 , a3 sunt strategiile pure ale juctorului maximizant J1 i b1, b2 , b3, b4 sunt
strategiile pure ale juctorului minimizant J2. Se observ c strategia a1 este dominat de
a2 pentru c:
a2 j a1 j () j (3 1, 2 2, 0 1, 2 1)
i deci J1 renun la strategia dominant a1 fr ca valoarea jocului i strategiile optime s
se modifice. Matricea jocului devine:
2
0 2
3

1 1 2 4
Pentru juctorul minimizant J2 strategia b1 este dominat de b2 pentru c
bi 2 bi 1 ()i (2 3, 1 1)
i
strategia
b4
este
dominat
de
b3

bi 3 bi 4 (0 2,

2 4) deci juctorul J2 renun la strategiile dominate b1 i b4 fr s


modifice soluia optim a jocului. Matricea jocului a devenit:
0
2

A
1 2
Valorile inferioar i superioar ale jocului sunt:
b1
b2
i
a1
2
0
0
a2
1
2
1
0
j
2
2
2
Avem v 0 si v 2 . Jocul nu are punct a deoarece v v . n acest caz
v v v i strategiile optime sunt strategii mixte X x1, x2 [i Y y1, y2 unde x1 i
x2 reprezint frecvenele relative de folosire a strategiilor pure a1 respectiv a2 iar y1 ,y2
frecvenele relative de folosire a strategiilor pure b1 respectiv b2 .
Modelul matematic al jocului este:
x1 x2 1
y1 y2 1
x , x 0
y , y 0
1
1
2
2
I 2x x v
II 2 y
v
2
1
1

2x2 v

y1 2 y2 v
Pentru sistemul I, x2 1 x1

2x1 (1 x1) v 0
(1)
3x v 1
1
2(1 x1) v 0
(2)
2x1 v 2
Rezolvm grafic sistemul avnd n vedere c J1 este juctor maximizant,
x1 0 si 0 v 2 . Poligonul soluiilor posibile este triunghiul ABC. Soluia optim
corespunde valorii maxime a lui v, deci este dat de punctul B.
v
2

1
B

A
0

C
1/3

(2)

x1

(1)
-1

3x1 v 1

2x1 v 2

3
2
4
x1 , x2 , v
5
5
5

Pentru sistemul II avem: y2 1 y1,

2 y1 v 0
(1)
2 y v 0
1

3y1 v 2 (2)
y1 2(1 y1) v 0
n rezolvare se ine seama de faptul c y1 0 si 0 v 2 i J2 este juctor
minimizant. Poligonul soluiilor posibile este triunghiul ABC.
v
2

0
(1)

A
C

2/3
(2)

y
1

Soluia optim corespunde valorii minime a lui v, deci punctul:

2 y1 v 0
2
4
3
y1 , v , y2

3
5
5
3y1 v 2
Strategiile optime ale jocului iniial cu matricea asociat vor fi:

3 2
2 3
X * 0, , si Y * 0, , ,0
5 5
5 5
unde am inut cont de faptul c strategiile dominante a1, b1, b4 sunt folosite de strategiile
4
5

optime cu frecvene egale cu zero. Valoarea optim a jocului este v * .


Jocul poate fi rezolvat prin metoda programarii liniare astfel:
Se imparte fiecare inecuatie a sistemului II la V, se noteaza fiecare raport rezultat y1/V si
y2/v cu Y1, respective Y2, se observa din asta ca rezulta functia obiectiv [max]g=Y1+Y2
si gata problema pusa in ecuatie.
Jocuri cu suma variabil
Majoritatea jocurilor ce apar n afaceri nu au o sum constant. Jocurile cu sum
variabil sunt mai complexe dect cele cu suma fix, i au o soluie mai complicat.
Un exemplu este aa-numitul Lets Make a Deal (S facem o nelegere). Juctorul 1,
o vedeta de cinema, i juctorul 2, un regizor, ncearc s se pun de acord cu privire la
un film. Ei estimeaz c filmul va aduce un profit de 30 milioane $. Profitul ar urma s se
mpart n mod egal. Regizorul i vedeta de cinema trebuie s fie amndoi de acord cu
afacerea. Dac unul din ei o respinge, jocul se sfreste i filmul nu se va mai realiza.
Jocul are dou echilibre. Unul dintre ele (da;da) nseamn c afacerea de 30
milioane $ este ncheiat i fiecare parte obine 15 milioane $. Al doilea echilibru (nu;nu)

nseamn c afacerea nu s-a incheiat, i ambele pri obin 0 $. Dac vedeta de cinema
tie ca studioul va respinge filmul, nu pierde nimic dac i ea l respinge. Cele dou
echilibre sunt foarte diferite din punct de vedere al ctigurilor, fapt ce demonstreaz c
jocul este unul cu suma variabil. Acest lucru ne oblig s facem diferena ntre echilibru
i soluie. Un echilibru este reprezentat de orice pereche de strategii spre care se indic
prin sagei din ambele direcii (valoarea jocului). n acest caz, ambii juctori au utilitate
maxim i nici unul nu are motiv s schimbe strategia. Dac jocul este unul cu suma
variabil, nu toate echilibrele au acelai ctig.
Un rezultat trebuie s fie un punct de echilibru pentru a putea fi considerat o
posibil soluie. Dac un rezultat nu este un punct de echilibru, atunci unul din juctori va
ctiga printr-o schimbare de strategie. ns faptul c un rezultat este un punct de
echilibru nu nseamn neaprat c acel rezultat este soluia.
Prezentm o condiie suficient pentru a alege dintre echilibrul de valoare
superioar i cel de valoare inferioar din jocul Lets Make a Deal. Observm c n
ceea ce privete vedeta de cinema opiunea da i va aduce cel puin acelai ctig ca n
cazul opiunii nu, pentru orice opiune a regizorului. De exemplu, dac regizorul spune
da, atunci vedeta de cinema primete 15 milioane $ dac rspunde da, i 0 $ dac
rspunde nu. Rspunsul da poate aduce un ctig mai mare dect rspunsul nu. Dac
regizorul spune nu, atunci vedeta de cinema ctig 0$ pentru opiunea da i 0$ pentru
opiunea nu. n acest caz problema devine o dilem. Nici unul dintre juctori nu are vreun
motiv s spun nu, pentru c opiunea da, domin opiunea nu. Acest lucru ne face s
devenim nencreztori n alegerea echilibrului (nu, nu) ca soluie. Aceast nencredere se
nate ca urmare a urmtoarelor condiii suficiente:
Aplicnd condiia suficient a strategiilor (opiunilor) nedominate n cazul jocului
Lets Make a Deal), observm c (nu,nu) nu poate fi o soluie, din moment ce opiunea
da domin n cazul ambilor juctori. La fel ca i condiiile suficiente n calcule, condiiile
suficiente n teoria jocurilor arat c un anume rezultat nu poate fi o soluie, chiar dac
este un echilibru. Ele sunt menite s demonstreze c anumite echilibre nu sunt posibile
soluii. Jocul are i un alt echilibru, (da,da) i acest echilibru nu este infirmat de condiia
suficient a strategiilor nedominate. De aceea soluia jocului este ca regizorul i vedeta de
cinema s spun da afacerii. Astfel am rezolvat un prim joc cu suma variabil.

10

Jocuri contra naturii, decizii n condiii de risc


Dac unul dintre juctorii este imprevizibil i pasiv, jocul se numete contra naturii.
Matricea jocului (a plilor) este urmtoarea:
A
D1
D2
.
.
Dm
Probabilitile
strilor naturii

S1
a11
a21
.
.
am1
P1

S2
a12
a22
am2
P2

Sn
a1n
a2n

amn
Pn

- aij este profitul n starea Sj cnd decizia este Di, i 1, m, j 1, n


- Pj este probabilitatea estimat pentru apariia strii Sj
n

i 1, n, Pj 1
j 1

Deciziile pot fi :

a) S maximizeze profitul mediu (exprimat n bani)

b) s minimizeze costul (regretul ) mediu

c) s maximizeze profitul mediu (exprimat n utilittil


n

a) MPi aij Pj este ctigul mediu al decidentului


j 1

Decidentul va alege strategia Di care-i maximizeaz profitul mediu:


n

MPi* max MPi max aij x j


i 1, m

i 1, m

j 1

b) Se va construi o nou matrice (a regretelor) din matricea A a plilor. Fie


Pi max aij cea mai mare plat pe care o obine
i 1, m

decidentul dac starea naturii este Sj i rij j aij

i 1, m,

j 1, n

Matricea R rij ij construit astfel se numete matricea regretelor.

Se alege acea alternativ care minimizeaz regretul mediu, adic minimizeaz


pierderile medii.
n

rij* Pj min rij Pj .


j 1

i 1, m

j 1

Valoarea medie a informaiei perfecte este o msur a diferenei ntre profitul mediu
ce s-ar obine n condiii de certitudine i profitul mediu maxim n condiii de risc.
n

Profitul mediu de certitudine este MC j Pj , unde j este elementul maxim pe


j 1

coloana j, iar Pj este probabilitatea de apariie a strii Sj.

11

Profitul mediu de risc este MP max aij Pj


i

j 1

MIP MC MP este regretul mediu minim.


Informaie suplimentar:

MPk max aij P j


k 1, n
B
i 1, m
k

Profitul mediu: MS MPk PBk .


k 1

n continuare sunt prezentate cteva exemple de determinare a strategiei optime cu


ajutorul teoriei jocurilor.
1. Companiile petroliere Shell i Lukoil intenioneaz s construiasc (independent
una de cealalt) o staie de carburani ntr-o intersecie intens circulat ntre trei orae
A,B,C, situate la 15 km, 10km respectiv 20 km unul fa de altul.
Se tie c 40% dintre solicitanii din zon se aprovizioneaz n prezent din primul
ora, 35% din al doilea I 25% din al treilea.
Se tie deasemenea c prima companie ar controla majoritatea pieei n situaii
comparabile. Din cercetrile efectuate n zon de ambele companii s-a ajuns la
urmtoarele previziuni identice:
- dac ambele companii s-ar instala ntr-un ora (sau la distane egale de acesta)
prima ar controla 70% din piaa petrolier a acestuia.
- dac prima companie ar fi mai aproape de un ora dect a doua, ar controla 85% din
piaa acestuia iar n caz contrar ar controla doar 40%.
- Oraul al treilea fiind mai mic nu intr n planurile de afaceri ale primei companii.
a) Considernd enunul de mai sus un joc n care juctorii sunt cele dou companii s
se construiasc matricea jocului i s se stabileasc strategiile optime ale celor doi
juctori.
b) Ce strategii pure se pot nltura prin aplicarea criteriului dominrii?
Rezolvare: a) Strategiile pure ale celor doi juctori sunt urmtoarele:
- strategia a1 prima companie poate construi n oraul A
- strategia a2 prima companie poate construi n oraul B
- strategia b1 a doua companie poate construi n oraul A
- strategia b2 a doua companie poate construi n oraul B
- strategia b3 a doua companie poate construi n oraul C
Presupunem c ncasrile ar fi n aceleai procente cu cele din cercetrile de marketing
realizate i c un procent ctigat sau pierdut de una dintre firme este un procent pierdut
sau ctigat de cealalt.
Rezult c jocul are sum nul.
Calculul elementelor matricei jocului se efectueaz astfel:
Dac ambele companii construiesc n acelai ora, atunci prima companie va acapara
70% din piaa ntregii regiuni, deci q11 q22 0,70 .
Dac Shell construiete n oraul A, iar Lukoil n oraul B, atunci:

12

q12 0,85 0,40 0,40 0,35 0,4 0,25 0,35 0,14 0,1 0,59 .
Dac Shell construiete n oraul A, iar Lukoil n
atunci: q13 0,85 0,4 0,85 0,35 0,4 0,25 0,34 0,3 0,1 0,74 .
Dup acelai raionament q 23 0,74 .
Dac Shell construiete n oraul B iar Lukoil n oraul
q21 0,4 0,4 0,85 0,35 0,9 0,25 0,71 .
Matricea jocului va fi:

Shell
Lukoil
a1

b1 b2

b3

a2

0,70 0,59 0,74


0,71 0,70 0,74

0,71 0,7 0,74

oraul

A,

B,

atunci:

1
0,59
0,70
0,70
0,70

Valoarea inferioar a jocului este:


max i max (max qis ) 0,70 .
i

Valoarea superioar este:


min s min (max qis ) 0,70 .
i

Cum 0,7 , aceasta va fi valoarea jocului, iar strategiile pure optime sunt:
a2 - Shell s construiasc n oraul B
b2 - Lukoil s construiasc tot n oraul B
b) Primul juctor poate s nlture strategia a1 pentru c plile corespunztoare sunt mai
mici sau egale dect plile strategiei a 2 (q1i q 2i i 1,2,3) .
Al doilea juctor poate s nlture strategiile b1 i b3 pentru c qi1 qi 2 i qi 3 qi 2
i 1,2 , adic b1 b2 , b3 b2 .
Dup eliminarea acestor strategii, matricea jocului rmne format dintr-un singur
element q22 0,70 , care corespunde strategiilor pure a1 i b2 ale celor doi juctori.
Acestea sunt strategiile optimale.
2. O firm care comercializeaz tehnic de calcul achiziioneaz echipamente de calcul
care urmeaz s fie vndute ntr-o anumit perioad de timp.
Conform unei statistici bazat pe date privind vnzrile anterioare se estimeaz
vnzrile dup repartiia:
5 10 15 20

0
,
1
0
,
3
0
,
4
0
,
2

Comanda minim este de 5 calculatoare, costul unitar fiind 1000 um iar costul de
vnzare de 1300 um.
13

Conform contractului, dup perioada convenit calculatoarele nevndute vor fi


returnate productorului contra sumei de 800 um/buc.
S se stabileasc numrul optim de calculatoare care pot fi cumprate de ctre firm
pentru comercializare.
Rezolvare
Problema poate fi scris sub forma unui joc matriceal. Se observ c la fiecare
calculator vndut se ctig 300 um i se pierd 200 um pentru fiecare calculator returnat
productorului.
Matricea jocului este urmtoarea:

Cererea
pieei

Probabilitatea

C1:5
C2:10
C3:15
C4:20

0,1
0,3
0,4
0,2

a1:5
1500
1500
1500
1500

Cantitatea comandat
a2:10
a3:15
500
-500
3000
2000
3000
4500
3000
4500

a4:20
-1500
1000
3500
6000

Dac n stabilirea deciziei optime a firmei se ine seama numai de consecinele


economice, atunci se pot aplica criteriile maximin, maximax, minimax.
a) Prin criteriul maximin se stabilete cea mai mare valoare minim din toate actele de
decizie, conducnd la o soluie prevenitoare, pentru c se va avea n vedere tot ce este
mai ru posibil s se ntmple. Algoritmul const n alegerea minimului fiecrei coloane
I dintre acestea se alege maximul:
a1
a2
a3
a4
1500
500
-500
-1500
Rezultatul alegerii este a1, conducnd la cea mai mic pierdere de suportat.
b) Prin criteriul maximax, total opus criteriului maximin, se alege strategia cu cea mai
mare valoare dintre toate actele de decizie, potrivit principiului celui mai bun lucru care
se poate ntmpla
Se calculeaz maximul fiecrei coloane I dintre aceste elemente se alege maximul:
a1
1500

a2
3000

a3
4500

a4
6000

Rezultatul alegerii este a4, conducnd la cel mai mare ctig posibil (dar cu cel mai
mare risc).
c) Criteriul minimax se bazeaz pe pruden. Se alege maximul fiecrei coloane i
dintre acestea se alege minimul.
a1
1500

a2
3000

a3
4500

a4
6000

Cea mai prudent decizie este deci a1.

14

d) Criteriul lui Savage, reprezint acelai criteriu minimax utilizat pe o matrice a


jocului ale crei elemente se numesc pierderi condiionate ale oportunitii (regrete). n
acest caz elementele matricei reprezint pentru fiecare strategie diferena dintre ctigul
economic al acelei strategii i ctigul economic cel mai bun n cazul n care se verific
un anumit eveniment, sau, n cazul n care natura este ntr-o stare dat.
De exemplu, s presupunem c are loc evenimentul c1, atunci strategia cea mai bun
este a1, ctigul economic fiind de 1500 u.m. Pierderile condiionate de acest eveniment
se obin scznd din ctigul cel mai bun fiecare ctig corespunztor fiecrei strategii.
Matricea regretelor va fi:

C1
C2
C3
C4
max

a1
0
1500
3000
4500
4500

a2
1000
0
1500
3000
3000

a3
2000
1000
0
1500
2000

a4
3000
2000
1000
0
3000

Pierderea maxim a oportunitii (regretul maxin) se gsete n ultima linie a tabelului iar
soluia optim este a3 creia i corespunde valoarea minim a regretelor maxime.
e) innd seama de faptul c se cunosc probabilitile Pi i 1,4 se pot determina
prevederile medii folosind datele din matricea iniial nmulite cu 1 (pentru a reprezenta
pierderi). Dintre ele se alege conform criteriului lui Bayes cea mai mic pierdere medie i
ea va reprezenta strategia Bayes a jocului:
Avem:
PM1 =15000,1+ 15000,3+ 15000,4+ 15000,2= 1500
PM2 = 5000,1+ 30000,3+ 30000,4+ 30000,2= 2750
PM3 = -5000,1+ 20000,3+ 45000,4+ 45000,2= 3250
PM4 = -15000,1+ 10000,3+ 35000,4+ 60000,2= 2750
i PM3 = max (PMi), i 1,4
ceea ce conduce la concluzia c a3 este strategia Bayes.
Aplicnd criteriul Bayes pe matricea regretelor avem:
PM1 = 00,1+15000,3+ 30000,4+ 45000,2= 2500
PM2 = 10000,1+15000,4+ 30000,2= 1300
PM3 = 200000,1+10000,3+ 15000,4= 800
PM4 = 30000,1+20000,3+ 10000,4= 1300
Fiind vorba de pierderi medii, se alege PM3= min (PMi), i 1,4 deci strategia a3
este strategia Bayes.
3. O societate extractiv ofer 200.000 dolari unui proprietar de teren pentru dreptul de
a cerceta existana hidrocarburilor i exploatarea lor n cazul unor rezultate favorabile ale
cercetrii. Exploatarea va aduce un ctig de 800.000 dolari proprietarului, iar costul
prospeciunii este de 300.000 dolari, recuperai numai dac se vor descoperi zcminte
exploatabile. Dac se descoper resurse exploatabile, proprietarul estimeaz pentru cel ce

15

le va exploata un profit net de 3 mil. dolari.


a) S se stabileasc decizia optim a proprietarului de teren n acest caz;
b) S se stabileasc decizia optim a proprietarului de teren dac se estimeaz c
probabilitatea de a gsi hidrocarburi este de 0,6.
Rezolvare:
a) Deciziile proprietarului pot fi:
a1 acceptarea ofertei;
a2 exploatarea pe cont propriu.
Strile naturii sunt:
1 nu exist zcmnt n subsolul terenului;
2 exist zcmnt.
Aplicnd criteriul Bayes-Laplace avem
1
2
200 1000
-300 3000
n
1

200 1000 300 3000


max qij max
,
850,
i
i
n
2
2

deci decizia optim n baza acestui criteriu este a2.


a1
a2

b) Matricea ctigurilor proprietarului va fi:

1
2
PMi

p()
0,4
0,6

a1
200
1000
680

a2
-300
3000
1680

Soluia optim este cea care conduce la un profit mediu maxim.


max ( PMi ) max( 200 0,4 1000 0,6; 300 0,4 3000 0,6)
i

max( 680,1680)
Aadar, cunoscnd probabilitile p(1) i p(2) decizia optim este a2 s exploateze
pe cont propriu prin criteriul a priori.

4. n problema anterioar, proprietarul de teren efectueaz sondaje pentru descoperirea


zcmntului cu un cost de 50.000 dolari. Se admite c n 30% din cazuri sondajul nu
indic existena zcmntului, cu toate c el exist. Cnd zcmntul nu exist testul este
exact n 90% din cazuri.
Folosind aceste date i estimarea iniial potrivit creia probabilitatea existenei
zcmntului este 0,6 s se determine decizia optim a proprietarului.
Rezolvare:
Problema se ncadreaz n categoria jocurilor cu experien unic, avnd spaiul
rezultatelor Z={z1,z2) cu z1= evenimentul c sondajul indic inexistena zcmntului,
iar z2= evenimentul c sondajul indic existena zcmntului.
Din enun avem:

16

P(z1/1)= 0,9; P(z1/2)= 0,3


P(z2/1)= 0,1; P(z2/2)= 0,7
Sunt necesare probabilitile a posteriori calculate cu formula lui Bayes.
Avem:
P 1 / z1

P z1 / 1 P 1

P z1 / 1 P 1 P z1 / 2 P 2

0,9 0,4
2

0,9 0,4 0,3 0,6 3


P z 2 / 1 P 1
P 1 / z 2

P z 2 / 1 P 1 P z 2 / 2 P 2

0,1 0,4
2

0,1 0,4 0,7 0,6 23


Tot din enunul problemei se deduce c matricea ctigurilor proprietarului se

modific, fiecare element diminundu-se cu 50 din cauza cheltuielilor necesitate de


operaia de sondaj. Avem deci

1
2

p()
0,4
0,6

a1
150
950

a2
-350
2950

Cu probabiliti a posteriori i cu ctigurile din aceast matrice se pot determina


ctigurile medii ale proprietarului pentru fiecare rezultat z1,z2 al experienei, dup
formula:
MS MPA p / z , z Z fixat
0

n cazul evenimetului Z1 ctigurile medii ale proprietarului sunt:


2
1
MS11 q11 p 1 / z1 q 21 p 2 / z1 150 950 417
3
3
2
1
MS12 q12 p 1 / z1 q 22 p 2 / z1 350 2950 750
3
3
max (MS1, MS2)= 750 deci decizia optim este a2 dac rezultatul experienei este z1.
n cazul evenimentului z2 ctigurile medii ale proprietarului sunt:
2
21
MS 21 q11 p 1 / z 2 q 21 p 2 / z 2 150 950
840
23
23

17

MS 22 q12 p 1 / z 2 q 22 p 2 / z1 350

2
21
2950 2663
23
23

max (MS21, MS22) = 2663, adic decizia optim este a2 dac rezultatul experienei este z2.
Rezult c se alege strategia de exploatare pe cont propriu a2, n oricare caz.
5. O firm care deine un lan de magazine de confecii trebuie s comande n
primvara fiecrui an confeciile pentru iarna viitoare. Profitul firmei va depinde de
numrul de haine ce vor fi comandate i de faptul dac moda va rezista de la data
ncheierii contractului i pn la sezonul de iarn.
Estimarea ctigurilor (n mii de dolari) efectuate de firm sunt date n tabelul urmtor:

C1: hainele sunt la


mod
C2: hainele sunt
acceptabile
C3: hainele nu mai
sunt la mod

a1: nu
comand

a2:
comand
puin

a3:
comand
moderat

a4:
comand
suficient

-50

-10

60

80

30

45

40

80

35

-30

-45

S se determine soluia optim de aprovizionare.


Rezolvare:
Folosind criteriul Bayes-Laplace se obine:
1 n
50 0 80 10 30 35 60 45 30 80 40 45
max q ij max
,
,
,

j
3
3
3
3

n i 1
max 10; 18, 33; 25; 25 25
deci decizia optim este a3 sau a4.

18