Sunteți pe pagina 1din 12

Teoria jocurilor

Jocuri contra naturii



1. Noiuni generale

Teoria jocurilor este una din teoriile de mare actualitate practic. Apariia acesteia
se datoreaza lui J. Von Neumann i O. Morgestern care au pus bazele teoriei jocurilor n
lucrarea Theory of Games and Economic Behaviour.
Ea apare ori de cte ori ntre doua sau mai multe persoane exist conflicte de
interese. Astfel, daca mai muli agenti economici urmresc un acelai scop este evident c
fiecare dorete maximizarea profitului din aciunile ntreprinse de el.
Definiie. Se numete joc un ansamblu (J,R,A,U) unde J reprezinta o mulime de
jucatori, R o mulime de reguli, A o multime de aciuni i U o mulime de utiliti sau
ctiguri astfel nct fiecare jucator din J acionnd n limitele impuse de regulile R alege
ntr-un numr de etape succesive, in mod independent de ceilali o actiune din A
urmrind maximizarea sau minimizarea unui element din U.
Este evident ca alegerea unei aciuni trebuie s fie fcut n mod raional deoarece
n caz contrar jocul ar avea un caracter haotic (imaginai-va jocul de fotbal, cu reguli de
altfel precise, n care fiecare jucator ar pasa efectiv la infamplare).
Fie g:JA, g(j)=A
j
CA funcia care asociaz juctorului j mulimea de aciuni A
J
.
Vom mai numi o astfel de aciune i strategie pur a juctorului j. n situaia repetrii
unui joc, dac jucatorul alege cu o anumit frecven una sau alta dintre strategii vom
numi o astfel de situatie strategi mixt. Strategia aleas de un juctor n scopul
maximizrii unui ctig sau minimizarii unei pierderi se numete strategie optim.
De asemenea o strategie pur poate fi liber dac utilizarea ei poate fi fcut n
orice moment al desfurrii jocului (de exemplu jocurile de ah, fotbal, tenis etc.) sau
aleatoare daca ea este aleas la ntmplare (de exemplu jocurile de table, zaruri etc.}.
Dup cantitatea de informaie aflat la dispoziia juctorilor, jocurile se pot
clasifica n jocuri cu informaie complet atunci cnd fiecare jucator cunoate
totalitatea strategiilor pure ale celorlali jucatori i jocuri cu informaie incomplet
atunci cand exist un jucator care nu cunoate n totalitate mulimea strategiilor pure ale
cel puin unuia dintre ceilali juctori.
Teoria jocurilor este teoria matematic care se ocup cu determinarea metodelor
de alegere a deciziilor n cazuri de competiie sau situaii conflictuale. O situaie
conflictual este cea n care acioneaz doi sau mai muli factori (persoane fizice, firme,
partide politice) avnd scopuri contrarii. Astfel de situaii sunt: concurena economic,
vnzrile la licitaie, alegerile parlamentare etc.. Teoria jocurilor se ocup i de cazurile
n care o activitate intr n conflict cu caracterul ntmpltor al unor evenimente naturale
(epidemii, secet). Pentru construirea unui model formal, simplificat al situaiei cercetate
se vor selecta caracteristicile principale, cele secundare neglijndu-se. Terminologia
folosit este cea de la jocurile de societate sau de noroc.
Prin joc sau joc strategic se nelege situaia n care acioneaz o mulime de
elemente raionale (numite juctori sau parteneri) care n mod succesiv i independent,
ntr-o ordine i condiii fixate ntr-un ansamblu de reguli, iau cte o decizie (efectueaz o
mutare) dintr-o mulime dat de alternative. Regulile jocului fixeaz i situaiile n care se
termin jocul, precum i ctigul sau recompensa pentru fiecare juctor. Un joc realizat se
mai numete partid.
Aciunile ntreprinse de juctori n cadrul unei partide se numesc mutri. Acestea
pot fi: libere cnd alegerea alternativei este univoc sau Modele matematice n
economie aleatoare, cnd alegerea alternativei este supus ntmplrii i e determinat de
un mecanism aleator (zar).
Dup cantitatea de informaie de care dispune fiecare juctor exist jocuri cu
informaie complet (ahul) i jocuri cu informaie parial (bridgeul), necunoaterea
inteniilor adversarului constituind elementul esenial al situaiilor conflictuale.
Ansamblul de reguli ce definesc n mod unic micrile libere n funcie de situaia
ivit n timpul jocului se numete strategie. Dac unul dintre adversari are la dispoziie m
alternative, iar partida se ncheie printr-o alegere, se spune c juctorul are la dispoziie m
strategii pure. Cnd partidele se repet, juctorii pot alege strategii pure cu anumite
frecvene sau probabiliti i atunci se spune c utilizeaz o strategie mixt. Dac
numrul strategiilor pure este finit, spunem c avem un joc finit, n caz contrar avem un
joc infinit. Fiecare juctor urmrete aplicarea unei strategii care s i aduc un ctig
maxim, deci i caut o strategie optim.
Ctigul pi realizat de juctorul Pi are semnificaia unei sume bneti sau a unui
numr de puncte, bunuri etc.. Dac pi > 0, juctorul Pi realizeaz un ctig n sensul uzual
al cuvntului, iar dac pi < 0 nregistreaz o pierdere.
Din punct de vedere al ctigului distingem:
- jocuri cu sum nul cnd la sfritul unei partide suma pierdut de o parte din
juctori este ctigat de ceilali i
- jocuri cu sum nenul cnd juctorii pot s-i mreasc concomitent
ctigurile, prin alegerea unor strategii adecvate.

2. Jocuri contra naturii

Sunt situaii n care riscurile cu care se iau hotrri nu pot fi cunoscute, deoarece
juctorul P
2
nu acioneaz raional. Un astfel de juctor poate fi considerat natura, de
unde i denumirea de jocuri contra naturii. De analiza unor astfel de situaii se ocup
teoria deciziilor.
Criterii de alegere a deciziei juctorului P
1
(numit i statistician) n jocurile contra
naturii (numite i jocuri n caz de incertitudine).
Atitudinea fa de joc, diferit de la o persoan la alta, face ca n teoria deciziilor
s nu existe criterii universal valabile. Aplicarea criteriilor poate conduce la rezultate
diferite. Alegerea strategiei ar putea fi dat de rezultatul aplicrii mai multor criterii.
Vom presupune c statisticianul juctorul P
1
, dispune de m strategii pure A
1
, ...,
Am, iar natura are n stri B
1
, ..., B
n
. Fie matricea A = (aij), i = 1,m, j = 1,n , unde aij este
ctigul lui P
1
cnd alege strategia Ai, iar natura se afl n starea Bj.
2.1. Criteriul lui Hurwicz (criteriul optimismului)

Optimismul juctorului P
1
se definete ca un numr | | 1 , 0 e o .
Se determin numerele reale:
{ } { } . , 1 , max min m i a siM a m
ij
j
i ij
j
i
= = =
Fiecrei strategii A
i
i asociem expresia:
. , 1 , ) 1 ( m i m M
i i
= + o o
Strategia optim va fi cea care corespunde la:
] ) 1 ( [ max
i i
i
m M o o +
n folosirea acestui criteriu trebuie s se defineasc n prealabil optimismul
juctorului, adic numrul ] 1 , 0 [ e o

Exemplu
Se consider jocul contra naturii a crui matrice a ctigurilor lui P
1
n orice
strategie a sa A
i
, i = 4 , 1 i n orice stare B
j
, j = 4 , 1 a naturii este:
B
1
B
2
B
3
B
4

A
1
2 4 3 3
A
2
3 2 3 2
A
3
1 5 2 1
A
4
3 3 2 3

S se determine n funcie de strategia optim a lui P1.
Pentru
3
2
= o care este strategia optim?

Rezolvare

Atam matricei date coloanele elementelor: m
i
, M
i
i M
i
+ (1 - )m
i
, unde m
i
este respectiv cel mai mic, iar M
i
este cel mai mare numr de pe linia respectiv. Obinem
astfel:
B
1
B
2
B
3
B
4
m
i
M
i
M
i
+(1-)m
i
A
1
2 4 3 3 2 4 2+2
A
2
3 2 3 2 2 3 +2
A
3
1 5 2 1 1 5 4+2
A
4
3 3 2 3 2 3 +2

Ca s determinm ] ) 1 ( [ max
i i
i
m M o o + , tiind c [0,1], observm c + 2
2 + 2, ( ) [0,1]. Merit studiate cazurile:
a) 4 + 1 < + 2, de unde < ;
3
1

b) + 2 4 + 1 < 2 + 2, de unde ;
3
1
< ;
2
1

c) 2 + 2 4 + 1, de unde .
2
1

Deci pentru [0, )
3
1
, 2 + 2 este cea mai mare valoare i cum ea corespunde
strategiei A
1
, aceasta este strategia optim.
Pentru [ )
2
1
,
3
1
, tot 2 + 2 este valoarea maxim deci A
1
e strategie optim.
Pentru ] 1 ,
2
1
[ , 4 + 1 e valoarea maxim i A
3
este strategia optim.
n particular =
3
2
] 1 ,
2
1
[ , deci A
3
este strategia optim.
2.2. Criteriul Bayes Laplace

n cazul acestui criteriu se va presupune c strile naturii sunt egal probabile. i
cum numrul lor este n, probabilitatea ca natura s se afle n starea B
j
este
n
1
,
( ) j = n , 1 .
Dac juctorul P
1
va alege strategia A
i
, ctigul su va fi

=
n
j
ij
a
n
1
,
1
care este
valoarea medie a variabilei aleatoare discrete cu repartiia:

|
|
|
|
|
.
|

\
|
n n n
a a a
in i i
1 1 1
2 1


P
1
va alege strategia pentru care ctigul su mediu este maxim: .
1
max
1
1
)
`

=
s s
n
j
ij
m i
a
n

Observaia 1:
Dac se cunosc totui probabilitile diferitelor stri ale naturii respectiv y
1
, ..., y
n
,
deci strategia y = (y
1
, ..., y
n
) cu y
j
0, j = n , 1 i

=
=
n
j
i
y
1
, 1 ctigul mediu al
statisticianului P
1
cnd folosete strategia A
i
va fi:

=
=
n
j
j ij
y a y i
1
, ) , (
iar ctigul mediu va fi maxim pentru strategia corespunztoare valorii:
). , ( max
1
y i
m i

s s

Observaia 2:
Criteriul lui Laplace introduce toate neajunsurile valorii medii. Dac estimrile au
fost fcute grosolan apar erori n apreciere, ce vor duce la decizii greite. Criteriul devine
uneori inacceptabil cnd elementele jocului sunt foarte dispersate.

Exemplu
Pentru jocul din exemplul precedent s se determine strategia optim a lui P1 n
cazurile:
a) cnd strile naturii sunt egal probabile;
b) cnd probabilitile ca natura s se afle n strile ei sunt respectiv: .
9
2
,
9
4
,
9
2
,
9
1


Rezolvare
a) Atam matricei jocului coloana :
1
4
1

= j
ij
a
n

B1 B2 B3 B4

=
4
1
1
j
ij
a
n

A1 2 4 3 3 12 *
4
1

A2 3 2 3 2 10 *
4
1

A3 1 5 2 1 9 *
4
1

A4 3 3 2 3 11 *
4
1

Deci 12 *
4
1
4
1
max
4
1
4 1
este aij
j
i
)
`

=
s s
ce corespunde strategiei A
1
deci aceasta este
strategia optim, dup criteriul Laplace.

b) Calculm pentru fiecare strategie A
i
valoarea expresiei date de
(i, y), i = 4 , 1 . Obinem:
. 23 *
9
1
3 *
9
2
2 *
9
4
3 *
9
2
3 *
9
1
) , 4 (
; 21 *
9
1
1 *
9
2
2 *
9
4
5 *
9
2
1 *
9
1
) , 3 (
; 23 *
9
1
2 *
9
2
3 *
9
4
2 *
9
2
3 *
9
1
) , 2 (
; 28 *
9
1
3 *
9
2
3 *
9
4
4 *
9
2
2 *
9
1
) , 1 (
= + + + =
= + + + =
= + + + =
= + + + =
y
y
y
y



Cea mai mare valoare este 28 *
9
1
i corespunde lui (1, y), deci A
1
este strategia
optim.

2.3. Criteriul lui Savage (criteriul regretelor)

Savage compar rezultatul deciziei n cazul necunoaterii strii naturii cu cel care
s-ar obine dac s-ar cunoate aceast stare. Diferena dintre ctigul realizat cnd se ia
decizia fr a cunoate strile naturii i cel realizat dac se cunosc acestea reprezint
regretul sau ce s-ar fi ctigat dac P
1
ar fi cunoscut strile naturii.
Pornind de la matricea A = (a
ij
), i = m , 1 , j = n , 1 , se formeaz o nou matrice R =
(r
ij
), numit matricea regretelor, unde elementul:
, , 1 , , 1 , max
1
n j m i a a r
ij kj
m k
ij
= = =
s s

adic r
ij
este dat de diferena dintre cel mai mare element de pe coloana j i
elementul a
ij
.
Se obine astfel un nou joc caracterizat de matricea R care va fi tratat dup
criteriul minimax. P
1
va alege strategia pe linia creia se obine:
}, max { min
1 1
ij
n j m i
r
s s s s
adic linia pe care cel mai mare regret este minim.

Exemplu
Pentru acelai joc din ultimele dou exemple, aplicnd criteriul regretelor, s se
determine strategia ce va fi aleas de P
1
.

Rezolvare
Se determin mai nti matricea regretelor ale crei elemente de pe o coloan se
obin scznd din cel mai mare element al coloanei fiecare element al acesteia. Se obine:
B1 B2 B3 B4
ij
j
r max
A1 1 1 0 0 1
A2 0 3 0 1 3
A3 2 0 1 2 2
A4 0 2 1 0 2
Atunci , 1 } 2 , 2 , 3 , 1 min{ } max { min = =
ij
j i
r ce corespunde strategiei A
1
, deci P
1
alege
aceast strategie.
Criteriul lui Wald

Dac jocul are punct a, statisticianul P
1
alege strategia A
i
determinat de
condiia:
). min ( max
ij
j i
a
Dac jocul nu are punct a, se determin strategia mixt
x = (x
1
, ..., x
m
) pentru care:
}, { min
1

=
m
i
i ij
j
x a este maxima.
Exemplu
Aplicarea criteriului lui Wald jocului cercetat i cu celelalte criterii ne duce la
concluzia c jocul nu are punct a. Se determin strategia mixt a statisticianului i se
gsete vectorul:
x = (1/3, 1/3, 0, 1/3),
de unde rezult c P1 poate alege oricare dintre strategiile sale A
1
, A
2
sau A
4
.
Observaie: Criteriile aplicate nu au dus mereu la aceeai decizie dar n
majoritatea cazurilor s-a obinut c cea mai bun strategie este A
1
; statisticianul pe
aceasta o va alege.
3. Aplicaie

Patronul unui magazin achiziioneaz un numr de frigidere de un anumit tip pe o
perioad de 6 luni ( var - toamn), pentru a le vinde. Din observaiile statistice, bazate pe
cererea din ultimii doi ani, el estimeaz c va vinde un numr de frigidere cuprins ntre:
15 i 25 cu probabilitatea de 0,1; ntre 25 i 35 cu probabilitatea de 0,4; ntre 35 i 45 cu
0,3 i ntre 45 i 55 cu 0,2.
Costul unitar de achiziie este de 300 euro iar preul unitar de vnzare este 400
euro (incluznd cheltuielile de transport i garania de funcionare pe un an). Toate
frigiderele nevndute pn n toamn se restituie furnizorului pentru 250 euro/bucata.
S se stabileasc numrul optim de frigidere pe care s le achiziioneze patronul
pentru a obine un ctig ct mai mare.

Rezolvare
Determinm matricea A = (a
ij
), i, j = 4 , 1 , unde aij este ctigul obinut de patron
cnd aplic strategia A
i
, i = 1,4 i cererea este n starea S
j
, j = 4 , 1 . Obinem astfel:

Cererea pietei
Cantitatea
achizitionata
S
1
:20 S
2
:30 S
3
:40 S
4
:50
A
1
:20
A
2
:30
A
3
:40
A
4
:50
2000
1500
1000
500
2000
3000
2500
2000
2000
3000
4000
3500
2000
3000
4000
5000

unde de exemplu elementul de pe linia A
3
i coloana S
2
se calculeaz astfel: din
cele 40 frigidere achiziionate se vnd 30.
Diferena dintre preul unitar de vnzare i cel de achiziionare este de 100 euro
pentru un frigider, ce reprezint ctigul patronului. Pentru cele 30 frigidere vndute va
ctiga 3000 euro. Dar alte 10 frigidere nevndute vor fi restituite furnizorului cu o
pierdere unitar de 50 euro dat de diferena dintre costul de achiziie 300 i cel de
restituire 250. Deci pierderea va fi de 500 euro i atunci beneficiul total va fi de:
3000 500 = 2500 euro.
Deoarece n stabilirea deciziei conteaz consecinele economice se pot aplica n
rezolvarea problemei criteriile: maximin, minimax, Savage, Bayes-Laplace:
a) Prin criteriul maximin se alege minimul fiecrei linii i dintre acestea
se gsete maximul:
A
1
A
2
A
3
A
4

2000 1500 1000 500

care este 2000 i recomand strategia A
1
.
b) Criteriul minimax, bazat pe pruden, indic alegerea elementelor
maxime pe fiecare linie i apoi determinarea celui mai mic dintre
acestea.
A
1
A
2
A
3
A
4

2000 3000 4000 5000

Acest element este 2000 i arat c cea mai prudent decizie este A
1
.
c) Criteriul lui Savage este de fapt criteriul minimax aplicat pe matricea
regretelor, ce va avea forma:
|
|
|
|
|
.
|

\
|
=
0 500 1000 1500
1000 0 500 1000
2000 1000 0 500
3000 2000 500 0
R
pentru care vom cuta maximul pe fiecare linie i apoi cel mai mic dintre acestea.
Gsim:
A
1
A
2
A
3
A
4

3000 2000 1000 1500

cel mai mic element este 1000 i recomand strategia A
3
.
d) Criteriul Bayes-Laplace presupune calculul ctigului mediu pentru
fiecare strategie folosind probabilitile date n enunul problemei i
formulele anterioare. Astfel:
. 2900 5000 * 2 , 0 3500 * 3 , 0 2000 * 4 , 0 500 * 1 , 0 ) , 4 (
; 3100 4000 * 2 , 0 4000 * 3 , 0 2500 * 4 , 0 1000 * 1 , 0 ) , 3 (
; 2850 3000 * 2 , 0 3000 * 3 , 0 3000 * 4 , 0 1500 * 1 , 0 ) , 2 (
; 2000 2000 * 2 , 0 2000 * 3 , 0 2000 * 4 , 0 2000 * 1 , 0 ) , 1 (
= + + + =
= + + + =
= + + + =
= + + + =
y
y
y
y


Cel mai mare ctig se obine cnd se aplic strategia A3.

S-ar putea să vă placă și