Documente Academic
Documente Profesional
Documente Cultură
Noiuni introductive
n toate domeniile de activitate este necesar analiza situaiilor conflictuale, acele
situaii practice n care sunt prezente dou sau mai multe laturi ce urmresc aspecte opuse
i rezultatul final al ntrecerii depinde de msurile pe care i le-au luat pe parcurs
competitorii.
Orice conflict, luat nemijlocit din activitatea practic, este foarte complex i
analiza lui matematic presupune construirea unui model simplificat (prin omiterea
factorilor mai puin importani) i formalizat al conflictului, model care se numete joc
i care se deosebete de conflictele reale prin faptul c are reguli bine definite.
Teoria jocurilor este diferit de teoria jocurilor de noroc, chiar dac terminologia
este uneori analog, n acestea din urm elemental dominant fiind ntmplarea, iar
aciunile partenerilor nu pot fora aceast ntmplare n scopul ctigului.
Jocurile care fac obiectul acestei teorii sunt acelea n care partenerii au libertatea
de a-i alege strategia, adic un plan care conduce la obinerea unui ctig optim. Din
acest motiv, aceste jocuri se numesc jocuri strategice i n acest context jocul apare ca un
proces n care factorii activi sunt oamenii (jucatorii).
John von Neumann i Oskar Morgenstern n 1943: jocul este: orice interaciune
ntre diveri ageni, guvernat de un set de reguli specifice care stabilesc mutrile
posibile ale fiecrui participant i cstigurile pentru fiecare combinaie de mutri.
Teoria jocurilor utilizeaz trei ipoteze fundamentale: juctorii se comport
raional; fiecare stie c ceilali sunt raionali; toi juctorii cunosc regulile jocului.
Pentru a nelege un joc oarecare este necesar mai nti cunoaterea regulilor
acestuia, deoarece astfel se poate afla care aciuni sunt permise (posibile) la un anumit
moment i care nu. Apoi este necesar s se cunoasc cum aleg juctorii una dintre
aciunile posibile.
Problema alegerii aciunilor (strategiilor) de ctre juctori este legat de primele
dou ipoteze amintite anterior. Juctorul raional are o anumit ierarhie a preferinelor,
astfel nct este posibil exprimarea acestora cu ajutorul unor funcii de utilitate.
Se poate observa c ipotezele cu care opereaz teoria jocurilor sunt similare celor
cu care se lucreaz n economie i n alte domenii.
Definiia1. Numim joc cu n juctori o succesiune de decizii i evenimente
aleatoare distribuite probabilistic, simultane sau nu, care respect o anumit structur a
ctigului, impus de anumite reguli (regulile jocului).
Regulile jocului vor indica modul n care se iau deciziile de ctre jucatori i
ordinea acestora.
Un juctor este raional dac va cuta s-i maximizeze satisfacia (ctigul) n
raport cu ceilali jucatori.
Definiia 2. Se numete strategie a unui juctor, o aciune posibil, pe care
juctorul o poate alege n cadrul jocului. Mulimea strategiilor jocului este dat de
mulimea strategiilor tuturor juctorilor.
Vom nota mulimea strategiilor jocului astfel:
S = S1 x S2 x ... x Sn,
unde n este numrul de juctori.
n unele situaii, natura (hazardul) este al (n + 1) -lea juctor.
Definiia 3. Se numete funcie ctig (de utilitate) a jocului, funcia u = (u1, u2,
...un), format din funciile ctig ale fiecrui juctor. Notnd funcia ctig a fiecrui
juctor ui i funciile ctig ale celorlali jucatori u-i, funcia ctig a jocului va fi: u : S
R, u = (ui, u-i). Strategiile se mai noteaz uzual cu ai i bj, reprezentnd acelai lucru.
Definiia 4. Se numete strategie optimal acea strategie care maximizeaz
ctigul juctorului i, indiferent de strategiile alese de ceilali juctori.
Clasificarea jocurilor
Jocurile pot fi clasificate n raport cu diverse criterii:
a) n raport cu modul n care comunic jucatorii ntre ei:
- jocuri cooperative;
- jocuri necooperative.
n jocurile cooperative juctorii comunic liber ntre ei nainte de luarea deciziilor i
pot face promisiuni (care vor fi respectate) nainte de alegerea strategiilor, pe cnd n cele
necooperative acetia nu comunic ntre ei nainte de luarea deciziilor.
b) n raport cu desfurarea n timp a jocurilor:
- jocuri statice;
- jocuri dinamice.
n jocurile statice deciziile juctorilor se iau simultan, dup care jocul ia sfrsit.
n jocurile dinamice deciziile juctorilor sunt secveniale, adic evolueaz n timp.
c) n raport cu natura informaiei:
- jocuri n informaie complet;
- jocuri n informaie incomplet.
n primul caz, toi juctorii cunosc numrul celorlali juctori, strategiile fiecruia,
funciile ctig ale fiecruia, precum i regulile jocului.
n cel de-al doilea caz, cel puin unul dintre juctori nu cunoate una sau mai multe
funcii ctig ale celorlali juctori, restul elementelor (numrul celorlali juctori,
strategiile fiecruia i regulile jocului) fiind cunoscute.
d) n cazul jocurilor dinamice, n raport cu tipul informaiei:
- jocuri n informaie perfect
- jocuri n informaie imperfect
Jocul dinamic n informaie perfect este jocul dinamic n care fiecare dintre juctori
cunoate regulile, numrul juctorilor, strategiile acestora, precum i evoluia n timp a
jocului (istoria jocului). Jocul dinamic n informaie imperfect este jocul dinamic n care
mcar unul dintre juctori nu cunoate istoria jocului, cunoscnd celelalte elemente.
e) n raport cu structura ctigurilor:
- jocuri de sum nul;
- jocuri de sum nenul
Jocul de suma nul este acel joc n care suma ctigurilor este zero .
Jocul de suma nenul este jocul n care suma ctigurilor este diferit de zero.
2
J1
a1
a2
.
.
.
am
b1
a11
a21
.
.
.
am1
J2
b2
a12
a22
.
.
.
am2
...
...
...
...
bn
a1n
a2n
.
.
.
amn
Matricea plilor este matricea A (aij ) care are m linii i n coloane. Dup cum se
vede din matricea jocului am considerat strategiile juctorului J1 liniile matricei plilor,
iar strategiile juctorului J2 coloanele matricei plilor. Alegerea de ctre J1 a strategiei ai
nseamn alegerea liniei i a matricei A iar alegerea de ctre J2 a strategiei bj nseamn
alegerea coloanei j a matricii A.
n consecin, un joc matricial este caracterizat de tripletul (X, Y, A) unde :
X a1, a2, ...an este muimea strategiilor juctorilor J1 ;
1
2
3
1 2 3 4
2 3 4 5
3 4 5 6
Pierderea lui j1, este ctig al lui j2 i am notat-o cu semnul minus pentru a pstra ideea de
ctig i pierdere.
Juctorii j1 i j2 aleg cte un numr din mulimea {1,2,3} i respectiv mulimea {1,2,3,4},
j2 neavnd nici o informaie despre numrul ales de j1.
Dup ce alegerile au fost fcute, j2 pltete lui j1 o sum definit n tabloul urmtor:
1
2
3 4
1 2
1 10 11
2 0 1 1 2
3 3 5 1 1
Prin urmare, dac j1 alege 1, iar j2 alege 3, atunci j2 pltete lui j1 suma de 10 um, iar dac
j1 alege 3, iar j2 alege 2, atunci j1 pltete lui j2 suma de 5 um. Etc.
Principiul dominrii
Pe baza regulilor ce guverneaz jocul, se poate stabili o coresponden ntre fiecare
pereche ordonat de strategii pure ale celor doi juctori i ctigul atribuit la sfritul
jocului unuia dintre ei (egal de obicei cu pierderea celuilalt juctor).
n multe cazuri, matricea jocului cuprinde unele strategii care sunt dezavantajoase pentru
juctori, deci trebuie eliminate. Convenia stabilit este c pentru juctorul j1 sunt
avantajoase strategiile cu pli mari, iar pentru j2, cele cu pli mici. De exemplu n jocul
cu matricea:
b1
b2
b3
b4
b5
a1
3
5
4
2
1
a2
2
3
1
0
1
a3
4
1
0
1
3
a4
5
0
3
2
4
se observ cu convenia anterioar c strategiile b1 i b3 sunt dominate de strategia b4, cu
pli mai mici, iar strategia a3 este dominat de strategia a4 cu plati mai mari. Prin
eliminarea acestor strategii se obine jocul avnd matricea:
b2
b4
b5
a1
5
2
1
a2
3
0
1
a4
0
2
4
Rezult din exemplul de mai sus necesitatea gsirii strategiilor neavantajoase, pentru
reducerea prealabil a matricei iniiale a jocului la o matrice mai simpl. Operaia prin
care se ndeprteaz strategiile dezavantajoase poart numele de cercetarea dominrii.
Dominarea este strict dac toate elementele unei linii sau coloane sunt respectiv mai
mari sau mai mici dect acelea corespunztoare altor linii sau coloane. O strategie ai
corespunztoare liniei i ale crei elemente sunt mai mici dect elementele liniei k
(aij aki pentru orice j ) se spune c este dominat de strategia ak sau c strategia ak
domin strategia ai . Acest lucru se scrie ak ai unde semnul exprim un raport de
preferin. Dac dominaia nu este strict semnul este dublat i de semnul n care caz
unele elemente ale liniei k pot fi egale cu elementele corespunztoare ale liniei i. De
exemplu n jocul avnd matricea:
2 3 4
4 6 4
5 2 1
5
6
2
1 1
4
care figureaz cel mai mic element al liniei i. Deci dac J1 a ales strategia pur ai , el nu
se ateapta s ctige mai mult dect i (bineneles n ipoteza c J2 alege aciunile sale
cele mai logice). Dar J1 are la dispoziie m strategii pure, aadar el va cuta s aleag pe
aceea dintre ele n care ai este cel mai mare. Dac max i max min aij , atunci
i
aceast valoare reprezint valoarea inferioar a jocului sau ctigul maxim al juctorului
J1, notat cu v.
Analog putem raiona i pentru juctorul J2 care urmrete s reduc pe ct posibil
ctigul maxim pe care l-ar putea realiza juctorul J1 . Astfel alegndu-i strategia pur bj,
el este sigur c J1 nu va putea ctiga mai mult dect max aij . Notm cu j max aij
i
elementul cu cea mai mare valoare situat n coloana j. Juctorul J2 are la dispoziie n
strategii pure, aa c va alege coloana n care elementul j este cel mai mic, adic va
cuta min j min max aij numit valoarea superioar a jocului, notat v .
j
Deoarece elementul a face parte din coloana lui avem evident a i deoarece
face parte din linia lui avem corespunztor a deci a .
Cele dou valori i ale jocului exist ntotdeauna pentru orice matrice de pli. Ele
permit juctorilor s cunoasc sumele pe care le au asigurate i anume juctorul J1 nu
poate s ctige mai puin dect iar juctorul J2 nu poate pierde mai mult dect .
Strategia ce garanteaz juctorului J1 ctigul egal cu valoarea inferioar a
jocului se numete strategie maximin, iar cea corespunztoare lui J2 ce i asigur o
pierdere egal cu valoarea superioar a jocului se numete strategie minimax.
Exist jocuri pentru care adic cele dou valori, inferioar i superioar ale
jocului sunt egale, avem deci:
max min aij min max aij
(1)
i
a2
a3
3
1
2
1
b3
b4
1
0
2
1
2
4
unde a1, a2 , a3 sunt strategiile pure ale juctorului maximizant J1 i b1, b2 , b3, b4 sunt
strategiile pure ale juctorului minimizant J2. Se observ c strategia a1 este dominat de
a2 pentru c:
a2 j a1 j () j (3 1, 2 2, 0 1, 2 1)
i deci J1 renun la strategia dominant a1 fr ca valoarea jocului i strategiile optime s
se modifice. Matricea jocului devine:
2
0 2
3
1 1 2 4
Pentru juctorul minimizant J2 strategia b1 este dominat de b2 pentru c
bi 2 bi 1 ()i (2 3, 1 1)
i
strategia
b4
este
dominat
de
b3
bi 3 bi 4 (0 2,
A
1 2
Valorile inferioar i superioar ale jocului sunt:
b1
b2
i
a1
2
0
0
a2
1
2
1
0
j
2
2
2
Avem v 0 si v 2 . Jocul nu are punct a deoarece v v . n acest caz
v v v i strategiile optime sunt strategii mixte X x1, x2 [i Y y1, y2 unde x1 i
x2 reprezint frecvenele relative de folosire a strategiilor pure a1 respectiv a2 iar y1 ,y2
frecvenele relative de folosire a strategiilor pure b1 respectiv b2 .
Modelul matematic al jocului este:
x1 x2 1
y1 y2 1
x , x 0
y , y 0
1
1
2
2
I 2x x v
II 2 y
v
2
1
1
2x2 v
y1 2 y2 v
Pentru sistemul I, x2 1 x1
2x1 (1 x1) v 0
(1)
3x v 1
1
2(1 x1) v 0
(2)
2x1 v 2
Rezolvm grafic sistemul avnd n vedere c J1 este juctor maximizant,
x1 0 si 0 v 2 . Poligonul soluiilor posibile este triunghiul ABC. Soluia optim
corespunde valorii maxime a lui v, deci este dat de punctul B.
v
2
1
B
A
0
C
1/3
(2)
x1
(1)
-1
3x1 v 1
2x1 v 2
3
2
4
x1 , x2 , v
5
5
5
2 y1 v 0
(1)
2 y v 0
1
3y1 v 2 (2)
y1 2(1 y1) v 0
n rezolvare se ine seama de faptul c y1 0 si 0 v 2 i J2 este juctor
minimizant. Poligonul soluiilor posibile este triunghiul ABC.
v
2
0
(1)
A
C
2/3
(2)
y
1
2 y1 v 0
2
4
3
y1 , v , y2
3
5
5
3y1 v 2
Strategiile optime ale jocului iniial cu matricea asociat vor fi:
3 2
2 3
X * 0, , si Y * 0, , ,0
5 5
5 5
unde am inut cont de faptul c strategiile dominante a1, b1, b4 sunt folosite de strategiile
4
5
nseamn c afacerea nu s-a incheiat, i ambele pri obin 0 $. Dac vedeta de cinema
tie ca studioul va respinge filmul, nu pierde nimic dac i ea l respinge. Cele dou
echilibre sunt foarte diferite din punct de vedere al ctigurilor, fapt ce demonstreaz c
jocul este unul cu suma variabil. Acest lucru ne oblig s facem diferena ntre echilibru
i soluie. Un echilibru este reprezentat de orice pereche de strategii spre care se indic
prin sagei din ambele direcii (valoarea jocului). n acest caz, ambii juctori au utilitate
maxim i nici unul nu are motiv s schimbe strategia. Dac jocul este unul cu suma
variabil, nu toate echilibrele au acelai ctig.
Un rezultat trebuie s fie un punct de echilibru pentru a putea fi considerat o
posibil soluie. Dac un rezultat nu este un punct de echilibru, atunci unul din juctori va
ctiga printr-o schimbare de strategie. ns faptul c un rezultat este un punct de
echilibru nu nseamn neaprat c acel rezultat este soluia.
Prezentm o condiie suficient pentru a alege dintre echilibrul de valoare
superioar i cel de valoare inferioar din jocul Lets Make a Deal. Observm c n
ceea ce privete vedeta de cinema opiunea da i va aduce cel puin acelai ctig ca n
cazul opiunii nu, pentru orice opiune a regizorului. De exemplu, dac regizorul spune
da, atunci vedeta de cinema primete 15 milioane $ dac rspunde da, i 0 $ dac
rspunde nu. Rspunsul da poate aduce un ctig mai mare dect rspunsul nu. Dac
regizorul spune nu, atunci vedeta de cinema ctig 0$ pentru opiunea da i 0$ pentru
opiunea nu. n acest caz problema devine o dilem. Nici unul dintre juctori nu are vreun
motiv s spun nu, pentru c opiunea da, domin opiunea nu. Acest lucru ne face s
devenim nencreztori n alegerea echilibrului (nu, nu) ca soluie. Aceast nencredere se
nate ca urmare a urmtoarelor condiii suficiente:
Aplicnd condiia suficient a strategiilor (opiunilor) nedominate n cazul jocului
Lets Make a Deal), observm c (nu,nu) nu poate fi o soluie, din moment ce opiunea
da domin n cazul ambilor juctori. La fel ca i condiiile suficiente n calcule, condiiile
suficiente n teoria jocurilor arat c un anume rezultat nu poate fi o soluie, chiar dac
este un echilibru. Ele sunt menite s demonstreze c anumite echilibre nu sunt posibile
soluii. Jocul are i un alt echilibru, (da,da) i acest echilibru nu este infirmat de condiia
suficient a strategiilor nedominate. De aceea soluia jocului este ca regizorul i vedeta de
cinema s spun da afacerii. Astfel am rezolvat un prim joc cu suma variabil.
10
S1
a11
a21
.
.
am1
P1
S2
a12
a22
am2
P2
Sn
a1n
a2n
amn
Pn
i 1, n, Pj 1
j 1
Deciziile pot fi :
i 1, m
j 1
i 1, m,
j 1, n
i 1, m
j 1
Valoarea medie a informaiei perfecte este o msur a diferenei ntre profitul mediu
ce s-ar obine n condiii de certitudine i profitul mediu maxim n condiii de risc.
n
11
j 1
12
q12 0,85 0,40 0,40 0,35 0,4 0,25 0,35 0,14 0,1 0,59 .
Dac Shell construiete n oraul A, iar Lukoil n
atunci: q13 0,85 0,4 0,85 0,35 0,4 0,25 0,34 0,3 0,1 0,74 .
Dup acelai raionament q 23 0,74 .
Dac Shell construiete n oraul B iar Lukoil n oraul
q21 0,4 0,4 0,85 0,35 0,9 0,25 0,71 .
Matricea jocului va fi:
Shell
Lukoil
a1
b1 b2
b3
a2
oraul
A,
B,
atunci:
1
0,59
0,70
0,70
0,70
Cum 0,7 , aceasta va fi valoarea jocului, iar strategiile pure optime sunt:
a2 - Shell s construiasc n oraul B
b2 - Lukoil s construiasc tot n oraul B
b) Primul juctor poate s nlture strategia a1 pentru c plile corespunztoare sunt mai
mici sau egale dect plile strategiei a 2 (q1i q 2i i 1,2,3) .
Al doilea juctor poate s nlture strategiile b1 i b3 pentru c qi1 qi 2 i qi 3 qi 2
i 1,2 , adic b1 b2 , b3 b2 .
Dup eliminarea acestor strategii, matricea jocului rmne format dintr-un singur
element q22 0,70 , care corespunde strategiilor pure a1 i b2 ale celor doi juctori.
Acestea sunt strategiile optimale.
2. O firm care comercializeaz tehnic de calcul achiziioneaz echipamente de calcul
care urmeaz s fie vndute ntr-o anumit perioad de timp.
Conform unei statistici bazat pe date privind vnzrile anterioare se estimeaz
vnzrile dup repartiia:
5 10 15 20
0
,
1
0
,
3
0
,
4
0
,
2
Comanda minim este de 5 calculatoare, costul unitar fiind 1000 um iar costul de
vnzare de 1300 um.
13
Cererea
pieei
Probabilitatea
C1:5
C2:10
C3:15
C4:20
0,1
0,3
0,4
0,2
a1:5
1500
1500
1500
1500
Cantitatea comandat
a2:10
a3:15
500
-500
3000
2000
3000
4500
3000
4500
a4:20
-1500
1000
3500
6000
a2
3000
a3
4500
a4
6000
Rezultatul alegerii este a4, conducnd la cel mai mare ctig posibil (dar cu cel mai
mare risc).
c) Criteriul minimax se bazeaz pe pruden. Se alege maximul fiecrei coloane i
dintre acestea se alege minimul.
a1
1500
a2
3000
a3
4500
a4
6000
14
C1
C2
C3
C4
max
a1
0
1500
3000
4500
4500
a2
1000
0
1500
3000
3000
a3
2000
1000
0
1500
2000
a4
3000
2000
1000
0
3000
Pierderea maxim a oportunitii (regretul maxin) se gsete n ultima linie a tabelului iar
soluia optim este a3 creia i corespunde valoarea minim a regretelor maxime.
e) innd seama de faptul c se cunosc probabilitile Pi i 1,4 se pot determina
prevederile medii folosind datele din matricea iniial nmulite cu 1 (pentru a reprezenta
pierderi). Dintre ele se alege conform criteriului lui Bayes cea mai mic pierdere medie i
ea va reprezenta strategia Bayes a jocului:
Avem:
PM1 =15000,1+ 15000,3+ 15000,4+ 15000,2= 1500
PM2 = 5000,1+ 30000,3+ 30000,4+ 30000,2= 2750
PM3 = -5000,1+ 20000,3+ 45000,4+ 45000,2= 3250
PM4 = -15000,1+ 10000,3+ 35000,4+ 60000,2= 2750
i PM3 = max (PMi), i 1,4
ceea ce conduce la concluzia c a3 este strategia Bayes.
Aplicnd criteriul Bayes pe matricea regretelor avem:
PM1 = 00,1+15000,3+ 30000,4+ 45000,2= 2500
PM2 = 10000,1+15000,4+ 30000,2= 1300
PM3 = 200000,1+10000,3+ 15000,4= 800
PM4 = 30000,1+20000,3+ 10000,4= 1300
Fiind vorba de pierderi medii, se alege PM3= min (PMi), i 1,4 deci strategia a3
este strategia Bayes.
3. O societate extractiv ofer 200.000 dolari unui proprietar de teren pentru dreptul de
a cerceta existana hidrocarburilor i exploatarea lor n cazul unor rezultate favorabile ale
cercetrii. Exploatarea va aduce un ctig de 800.000 dolari proprietarului, iar costul
prospeciunii este de 300.000 dolari, recuperai numai dac se vor descoperi zcminte
exploatabile. Dac se descoper resurse exploatabile, proprietarul estimeaz pentru cel ce
15
1
2
PMi
p()
0,4
0,6
a1
200
1000
680
a2
-300
3000
1680
max( 680,1680)
Aadar, cunoscnd probabilitile p(1) i p(2) decizia optim este a2 s exploateze
pe cont propriu prin criteriul a priori.
16
P z1 / 1 P 1
P z1 / 1 P 1 P z1 / 2 P 2
0,9 0,4
2
P z 2 / 1 P 1 P z 2 / 2 P 2
0,1 0,4
2
1
2
p()
0,4
0,6
a1
150
950
a2
-350
2950
17
MS 22 q12 p 1 / z 2 q 22 p 2 / z1 350
2
21
2950 2663
23
23
max (MS21, MS22) = 2663, adic decizia optim este a2 dac rezultatul experienei este z2.
Rezult c se alege strategia de exploatare pe cont propriu a2, n oricare caz.
5. O firm care deine un lan de magazine de confecii trebuie s comande n
primvara fiecrui an confeciile pentru iarna viitoare. Profitul firmei va depinde de
numrul de haine ce vor fi comandate i de faptul dac moda va rezista de la data
ncheierii contractului i pn la sezonul de iarn.
Estimarea ctigurilor (n mii de dolari) efectuate de firm sunt date n tabelul urmtor:
a1: nu
comand
a2:
comand
puin
a3:
comand
moderat
a4:
comand
suficient
-50
-10
60
80
30
45
40
80
35
-30
-45
j
3
3
3
3
n i 1
max 10; 18, 33; 25; 25 25
deci decizia optim este a3 sau a4.
18