Sunteți pe pagina 1din 47

Universitatea din Bucureti

Facultatea de Matematic Informatic

Aplicaii ale teoriei jocurilor

Profestor coordonator:

Masterand:

Prof. Univ. Dr. Vasile Preda

Bogdan Negril

Bucureti
2013

Cuprins

Introducere....................................................................................................................3
1. Conceptul de joc.......................................................................................................5
1.1 Jocuri n forma extins.......................................................................................5
1.2 Strategii. Forma normal....................................................................................8
1.3 Puncte de echilibru............................................................................................10
2. Jocuri de dou persoane cu sum nul...................................................................14
2.1 Jocuri cu sum nul...........................................................................................14
2.2 Forma normal...................................................................................................15
2.3 Strategii mixte....................................................................................................16
2.4 Teorema Minimax..............................................................................................19
3. Jocuri contra naturii..................................................................................................23
3.1 Criteriul lui Hurwicz............................................................................................23
3.2 Criteriul Bayes Laplace...................................................................................25
3.3 Criteriul lui Savage.............................................................................................26
3.4 Criteriul lui Wald.................................................................................................27
4. Aplicaii.....................................................................................................................31
4.1 Problema ameninrilor credibile........................................................................31
4.2 Problema pirailor...............................................................................................33
4.3 Un experiment n rezolvarea jocurilor prin eliminarea
strategiilor dominate..........................................................................................36
4.4 Aplicaii din teoria jocurilor n jocul de Poker......................................................38
Bibliografie....................................................................................................................45

Introducere
2

n majoritatea situaiilor cu care ne confruntm zi de zi suntem pui n situaia de a adopta


o decizie dintr-o mulime de decizii posibile, n vederea atingerii unui anumit scop. Perfect
natural i caracteristic activitii noastre raionale, avem tendina de a analiza i
compara posibilitile, n scopul alegerii unei decizii care s permit realizarea obiectivului
propus ntr-o ct mai mare msur. Dei folosim n mod frecvent termenul de decizie
optim, n cele mai multe cazuri optimalitatea este un concept extrem de complex,
care nu poate fi definit dect n limitele unui model matematic. Teoria modelelor
matematice de adoptare a deciziilor optime ntr-un anumit sens constituie azi o
important ramur a matematicii, numit cercetare operaional.
Teoria jocurilor

este capitolul cercetrii operaionale consacrat adaptrii deciziilor n

situaii de competiie (situaii conflictuale), adic situaii n care acioneaz mai muli
factori raionali - fiecare urmrind un anumit scop independeni n alegerea deciziilor
proprii, dar dependeni prin rezultate, care depind de ansamblul tuturor deciziilor. Aceast
situaie este formalizat n conceptul matematic de joc. Trebuie s specificm ns c
teoria jocurilor reprezint un model abstract de luare a deciziilor, astfel c nu trebuie
confundat cu o explicaie de luare a unei decizii n realitatea social.
Originea acestui frumos domeniu matematic ncepe la 1710, prin studiile lui Leibniez
asupra jocurilor de strategie, care anticipeaz nevoia unor teorii asupra acestui domeniu.
Trei ani mai trziu James Waldergrave formuleaz principiul minmax ca soluie a unui joc
de cri ce are ca participani doar dou persoane. Cum persoanele epocii nu au gsit
utilitatea acestui princpiu, el a fost neutilizat pn la nceputul secolului XX. Abia la 1865
Isaac Todhunter nelege importana acestui principiu, pe care l include n lucrarea sa, A
History of the mathematical theory of probability. n 1921 Emile Borel a ncercat s
demonstreze teorema lui Waldergrave, dar fr HllegeH. La 1926 matematicianul ungur
John von Neumann reuete s demonstreze teorma minmax. n 1938 economistul
Morgenstern I se altur lui Neumann n ncercarea de a defini o teorie a jocurilor. Cel
care a desvrit ns acest domeniu este celebrul John Nash, HllegeHe al premiului
Nobel pentru economie n 1994 i subiectul unuia dintre cele mai appreciate filme de la
Hollywood, A beautiful mind.
n acest moment, teoria jocurilor ne permite s descriem i s analizm fenomene
economice i sociale ca nite jocuri strategice, precum i s stabilim echilibrele unui joc,
3

adic strile n care nici un juctor nu dorete s-i modifice comportamentul, indiferent
de comportamentul celorlali juctori.
Exist numeroase concepte de echilibru ntr-un joc. n cadrul lucrrii de fa vom insista
asupra echilibrelor ce se bazeaz pe situaii credibile. Economitii utilizeaz termenul de
de echilibre ale subjocurilor perfecte pentru a descrie astfel de echilibre. Un joc este
caracterizat pe cantitatea i calitatea informaiei de care dispun juctorii. Astfel, distingem
jocuri cu informaie complet sau incomplet, precum i jocuri cu informaie perfect sau
imperfect. O alt categorisire a jocurilor ine cont de numrul participanilor, n funcie de
care avem jocuri de 2 persoane i jocuri de n persoane.
Cele mai bune exemple de jocuri n funcie de cantitatea informaiei sunt: jocul de ah (la
care informaia este complet i fiecare mutare este decis de cea a oponentului n
afara primei mutri), jocul de bridge (n care informaia este parial, la fel ca la jocul de
poker) i ruleta, la care informaia este nul, fiecare nou spin fiind total aleator (nu
considerm situaiile ipotetice n care o persoan ar juca suficient de multe jocuri astfel
nct s intervin echilibrul dat de statistica jocului).
Alegerea acestei lucrri a a avut la baz numeroasele aplicaii ale teoriei jocurilor de la
aplicaii n jocurile de societate, la aplicaii decizionale i de studiu asupra
comportamentului uman, la modelri economice este o teorie foarte utilizat n prezent
n modelarea riscului operaional, n modelarea situaiilor militare, sau mai prezent n
motivarea angajailor, n tehnici de nvare, medicin i multe altele.
Structura acestei lucrri urmrete n primul capitol cteva noiuni introductive, mai mult o
recapitulare a noiunilor din timpul cliclului licen master. n cel de-al doilea capitol vom
prezenta noiuni din jocurile contra naturii, folosite n luarea deciziilor n funcie de
evenimentele aleatoare ce pot interveni. Ultimul capitol este dedicat exclusiv aplicaiilor,
prezentnd unele probleme foarte frumoase i interesante, cum sunt problema
ameninrilor credibile, puzzleul pirailor (idee folosit n foarte multe filme dar i n tehnici
de negociere real) i se ncheie cu un studiu relativ amplu asupra jocului de poker
folosind informaii din teoria jocurilor.

Capitolul I: Conceptul de joc

Ideea de baz a jocului tratat n aceast lucrare i are originea n jocurile de societate.
Pornind dintr-o anumit situaie iniial, urmeaz o serie de pai (micri), la fiecare pas
juctorii alegnd o micare dintr-o mulime dat de micri posibile. Unele din aceste
micri pot fi aleatoare, de exemplu aruncarea unui zar sau extragerea unei cri dintr-un
pachet de cri.
Un aspect interesant al jocului de ah este acela c juctorul nu poate stabili care din
mutrile adversarului au fost fcute pe baza alegerii unei strategii i care din ntmplare.
Numrul uria de strategii posibile ngreuneaz aceast separare a mutrilor
ntmpltoare de cele ce fac parte din cadrul unei strategii.
n final, la ncheierea jocului, juctorii primesc o recompens ce depinde de modul de
desfurare a jocului. Exist aadar o funcie ce asociaz ctiguri fiecrei situaii finale
a unui joc.
1.1 Jocuri n form extins
Conceptul general de joc conine trei elemente:
-

succesiunea de micri asupra crora decid persoane sau ntmplarea;

starea de informare a juctorilor;

o funcie de ctig.

Pentru nceput, vom defini noiunea de arbore de joc, ca o mulime finite de noduri
(vrfuri) care sunt unite prin muchii (arce), astfel ca s rezulte un graf conex fr circuite
(drumuri nchise). Pentru oricare vrfuri A i B exist deci exact un ir de muchii i noduri
care unesc A cu B.
Definiia 1.1 Fie un arbore topologic cu un nod specificat A. Spunem c nodul C este
un succesor al nodului B dac irul de muchii care unete A cu B trece prin C. C este un
succesor direct al lui B dac C este un succesor al lui B i exist o muchie care unete B
cu C. X se numete nod final dac nu are nici un succesor.
Definiia 1.2 Prin joc de n persoane n form extins se nelege:
a) un arbore topologic cu un nod specificat A, nodul iniial al lui ;
b) o funcie de ctig care asociaz fiecrui nod final al lui un n-vector;
c) o pariie a nodurilor lui care nu sunt noduri finale n n 1 mulimi S 0 , S1 ,..., S n ,
numite mulimi ale juctorilor;
5

d) pentru fiecare nod din S 0 o distribuie de probabilitate pe mulimea succesorilor


direci ai acestui nod;
j
e) o partiie a mulimilor S i , i 1, n n submulimile S i (mulimi de informaie), astfel

nct dou noduri din aceeai submulime de informaie au acelai numr de


succsesori direci1 i nici un nod al unei mulimi de informaie nu este succesor al
unui nod al acestei mulimi;
j
j
f) pentru fiecare mulime de informaie S i exist o mulime I i 2.

Semnificaia acestor elemente eseniale ale unui joc este urmtoarea:


a) existena unui nod esenial;
b) existena unei funcii de ctig;
c) totalitatea micrilor se mparte n micri aleatoare ( S 0 ) i cele efectuate de cei n
juctori ( S1 ,..., S n ) ;
d) pentru fiecare micare aleatoare se definete o schem aleatoare;
e) micrile unui juctor se mpart n mulimi de informaie.
Sintetizat, putem afirma c juctorul cunoate n care mulime de informaie se gsete la
un moment dat, dar nu cunoate poziia exact n aceast mulime.
Exemplul 1.1 n problema aruncrii monedei primul juctor poate Hllege stema (S)
sau banul (B). Juctorul II, fr a cunoate alegerea primului juctor, alege de
asemenea stema sau banul. Dac alegerile coincid, atunci juctorul II ctig un dolar de
la I. n caz contrar, I ctig un dolar de la II. n arborele jocului, reprezentat n figura 1.1,
vectorul ataat nodurilor finale reprezint funcia de ctig, iar numerele de lng
celelalte noduri indic juctorul cruia i aparine mutarea. Domeniul mrginit de linia
punctat conine nodurile din aceeai mulime de informaie.

1 Altfel spus, din fiecare nod al lui pornesc acelai numr de arce. Conform axiomei f), fiecare din
aceste arce corespunde uneia dintre aciunile pe care juctorul le poate nreprinde n situaia .
2 reprezint mulimea tuturor mutrilor (aciunilor) posibile ale juctorului n situaia .
6

Fig. 1.1
Exemplul 1.2 Doi juctori primesc fiecare cte o culoare complet a unui pachet de cri
de joc (13 cri numerotate de la 1 la 13). Crile unei a treia culori se amestec i apoi
sunt descoperite una cte una. De fiecare dat cnd o carte a fost descoperit, fiecare
juctor joac una dintre crile sale, la alegerea sa, fr a cunoate cartea jucat de
cellalt. Juctorul care a jucat cea mai mare carte ctig un numr de puncte egal cu
numrul crii descoperite (n cazul n care crile jucate sunt egale nu ctig nici unul).
Jocul se continu pn la epuizarea celor 13 cri. Ctigul este diferena dintre punctele
acumulate de cei trei juctori.
n cazul a 13 cri, arborele jocului este prea mare pentru a fi reprezentat aici. De aceea
vom considera o reprezentare pentru un joc cu doar 3 cri (1, 2 i 3), redat n figura 1.2.
Singura micare aleatoare const n amestecarea crilor, prin care acestea se aeaz n
una dintre cele ase ordini posibile, fiecare cu probabilitatea 1/6. Toate micrile
ulterioare sunt decise de cei doi juctori. Din arborele jocului sunt reprezentate aici numai
anumite pri, ntre care nodul iniial, cteva ramuri i patru noduri finale. Celelalte ramuri
sunt asemntoare celor reprezentate n desen.
Relativ la informaia juctorilor introducem definiia:
Definia 1.3 Un juctor are informaie complet n dac fiecare dintre mulimile sale de
j
informaie S i constau dintr-un singur element. Jocul se numete cu informaie complet
dac fiecare juctor are informaie complet n .

De exemplu, ahul i jocul de dame sunt jocuri cu informaie complet, n constrast cu


jocul de bridge sau cu cel de poker.
7

Fig.1.2
1.2 Strategii. Forma normal
Intuitiv, o strategie este un plan de joc prin care un juctor stabilete cum va reaciona n
fiecare din situaiile posibile ale jocului. Mai precis:
Definiia 1.4 O strategie a juctorului i este o funcie care ataeaz fiecrei mulimi de
j
j
informaie S i un arc3 ce succede unui nod din S i . Notm cu

mulimea tuturor

strategiilor juctorului i .

3 Mai precis, este vorba de o clas de arce, anume toate arcele care corespund unei anumite aciuni
din prin corespondena din axioma f) a definiiei 1.2. Putem spune c o strategie asociaz fiecrei
mulimi un element din . Prin urmare, o strategie a juctorului este o funcie definit pe mulimea
a tuturor mulimilor de informaie ale juctorului cu proprietatea c pentru orice .
8

n general, se presupune c un juctor planific doar cteva micri viitoare, i de cele


mai multe ori acest lucru se ntmpl doar atunci cnd el trebuie s efectueze o micare.
O asemenea practic este adeseori necesar pentru c, aa cum se ntmpl de
exemplu la jocul de ah sau la cel de poker, numrul micrilor posibile este att de mare
nct nimeni nu poate ine seama de toate posibilitile viitoare. Din punct de vedere pur
teroretic se poate depi aceast dificultate practic i se poate presupune c nainte de
nceputul jocului fiecare juctor decide ce va face el n fiecare situaie particular posibil,
adic fiecare juctor alege, nainte de joc, strategia sa. Dup aceasta rmn deschise
numai micrile aleatoare. Ele pot fi concentrate ntr-o singur micare, al crei rezultat,
mpreun cu strategiile alese, determin perfect punctul final al jocului.
Fiecare juctor este interesat, desigur, de acea strategie care i asigur cel mai mare
ctig (adic juctorul i

urmrete s maximizeze componenta i a vectorului

ctigurilor). Deoarece asupra rezultatelor pailor aleatori se pot face doar afirmaii
probabilistice, se consider ctigul egal cu valoarea medie a funciei de ctig. Un
aspect de discutat ns n problema maximizrii funciei de ctig este i profilul
decidentului. Este cunoscut problema investitorului, n care o persoan dispune de
1.000 de dolari i are dou variante: s nu investeasc i s rmn cu cei 1.000 de
dolari sau s investeasc i cu o probabilitate de 90% s ctige 1.100 dolari iar cu o
probabilitate de 10% s piard 900 de dolari. Dei din punct de vedere matematic cele
dou situaii sunt egale (avnd aceeai medie), o persoan optimist va alege s
investeasc banii n timp ce o persoan pesimist va alege s pstreze banii.
S notm acum cu

i i (i 1, n)

strategiile juctorilor i cu

( 1 , 2 ,..., n ) ( 1 ( 1 , 2 ,..., n ),..., n ( 1 , 2 ,..., n ))


valoarea medie a funciei de ctig. Funcia ( 1 , 2 ,..., n ) poate fi tabelat pentru toate
valorile posibile ale lui 1 ,..., n fie sub forma unor relaii, fie printr-un tabel n dimensional de n - vectori. Acest tabel n - dimensional se numete forma normal a
jocului .
Exemplul 1.3 n jocul aruncrii monedei, fiecare juctor are dou strategii: alegerea
stemei sau banului. Forma normal a acestui joc este redat de matricea urmtoare, n
care liniile reprezint strategiile juctorului I, iar coloanele strategiile juctorului II:

Exemplul 1.4 S considerm acum urmtorul joc. O variabil aleatoare ia valorile 1, 2, 3,


4, fiecare cu o probabilitate de . Juctorul I, fr a cunoate rezultatul experimentului
aleator, alege un numr x , iar juctorul II, fr a cunoate rezultatul experimentului
aleator i alegerea lui I, alege un numr y . Drept funcie de ctig se ia:

( y z x z, x z y z)

adic se urmrete ghicirea ct mai exact a valorii z luate de variabila aleatoare. n


acest joc fiecare juctor dispune de 4 strategii: 1, 2, 3, 4. Dac I alege strategia 1 i II
alege strategia 3, atunci ctigul este (2, -2) cu probabilitatea , (0, 0) cu probabilitatea
sau (-2, 2) cu probabilitatea . Valoarea medie este deci (1,3) (1 / 2,1 / 2) . Calculnd
astfel toate valorile ( 1 , 2 ) , se obine urmtoarea matrice:
1
2
3
4

1
(0, 0)
(,-)
(,-)
(0, 0)

2
(- , )
(0 ,0)
(0, 0)
(- , )

3
(- , )
(0, 0)
(0, 0)
(- , )

4
(0, 0)
(,-)
(,-)
(0, 0)

Definiia 1.5 Un joc se numete finit dac arborele su are un numr finit de noduri.
Majoritatea jocurilor de societate sunt, conform acestei definiii, finite. Este uor de vzut
c ntr-un joc finit exist doar o mulime finit de strategii.
1.3 Puncte de echilibru
*
*
*
*
Definiia 1.6 Un sistem ( 1 , 2 ,.., n ) de n strategii i i se numete punct de


echilibru dac pentru orice i 1, n i orice i i avem:
i ( 1* ,.., i*1 , i , i*1 ,.., n* ) i ( 1* ,.., n* ).

10

Cu alte cuvinte, un sistem de n strategii formeaz un punct de echilibru dac nici un


juctor nu are un motiv rezonabil s i modifice strategia, presupunnd c toi ceilali
juctori i pstreaz strategia corespunztoare. Vom vedea ns n partea de aplicaii a
acestei lucrri c n majoritatea cazurilor, chiar n situaii foarte simple, juctorii nu aleg
situaiile optime. Teoretic, dac un juctor cunoate exact planurile celorlali, el va prefera
strategiile care mpreun cu acelea ale oponenilor formeaz un punct de echilibru, i
jocul va deveni stabil.
Exemplul 1.5 Considerm un joc de dou persoane cu forma normal:

1
2

1
(2, 1)
(0, 0)

2
(0, 0)
(1, 2)

Atunci ( 1 , 1 ) i ( 2 , 2 ) sunt puncte de echilibru.


Din pcate, nu orice joc posed puncte de echilibru.Un exemplu este aruncatul monedei,
joc prezentat anterior. Dac un joc nu posed puncte de echilibru, atunci fiecare juctor
va ncerca s-i pcleasc adversarii, pstrndu-i secrete strategiile. Aceast
consecin ne conduce la ideea c n jocuri cu informaie complet exist ntotdeauna
puncte de echilibru.
Pentru a demonstra aceast afirmaie vom folosi noiunea de descompunere a unui joc.
Un joc se numete decompozabil n nodul X

dac nici o mulime de informaie nu

conine noduri care aparin att mulimii formate din X i toi succesorii lui ct i restului
arborelui jocului. n acest caz putem separa jocul parial X , avnd drept noduri pe X i
toi succesorii lui, de jocul ct / X , avnd drept noduri restul nodurilor i pe X . Pentru
jocul ct X este un nod final; ctigul n acest punct, notat X , const din rezultatul subjocului X .
Aa cum am afirmat anterior, o strategie pentru juctorul i este o funcie al crei domeniu
de definiie este totalitatea mulimilor de informaie ale juctorului i . Dac un joc este
decompozabil n nodul X , atunci fiecare strategie se poate descompune n dou pri,
anume

, restricia lui la X , respectiv

/X

, restricia lui la mulimile de

11

informaie ale lui / X . Invers, o strategie pentru / X i o strategie pentru X pot fi


combinate ntr-o singur strategie pentru jocul .


Teorma 1.1 Fie jocul decompozabil n nodul X . Pentru i i ( i 1, n ) se ataaz
nodului X , considerat ca nod final al lui / X , ctigul

X 1 X , 2 X ,..., n X
Atunci avem:

1 ,..., n / X 1 / X ,..., 2 / X

Demonstraia acestei teoreme se reduce la a arta c pentru orice rezultat posibil al


pailor aleatori, acelai nod final este atins att n jocul iniial, ct i n descompunerea
acestuia. Pe baza acestui rezultat avem urmtoarea teorem:


Teorema 1.2 Fie un joc decompozabil n nodul X i fie i i ( i 1, n ) astfel nct:

b)
a)

1X

, 2 X ,..., n X

1 / X

,..., n / X

este un punct de echilibru pentru

este un punct de echilibru pentru / X

i
avnd ctigul

1 X ,..., n X

n nodul final X .
Atunci 1 ,..., n este un punct de echilibru pentru .

Demonstraie: Fie

i i

pentru X , avem:

( i 1, n ) . ntruct

, 2 X ,..., n X

1 X

i 1 X ,..., i X ,..., n X i 1 X ,..., n X


Pe de alt parte, ctigul n nodul X fiind

este punct de echilibru

i innd cont de b), avem:


,..., .

1 X ,..., n X

i 1 / X ,..., i / X ,..., n / X

1 / X

n / X

Ctigul, pentru o mulime dat de strategii, este o medie ponderat a ctigurilor n


unele din nodurile finale ale arborelui jocului. Dac ctigul juctorului i ntr-un nod final
dat (n cazul de fa X ) descrete, atunci, pentru orice alegere a strategiilor, ctigul su

12

mediu deasemenea descrete sau n cel mai bun caz rmne neschimbat. Aplicnd
teorema 1.1, obinem:

i 1 ,..., i ,..., n i 1 ,.., n ,


deci 1 ,..., n este un punct de echilibru.
Relativ la existena punctelor de echilibru, demonstrm urmtoarea teorem:
Teorema 1.3 Orice joc finit de n persoane cu informaie complet posed un punct de
echilibru.
Demonstraie: Definim lungimea unui ca numrul maxim de noduri parcurse pn la
atingerea unui nod final, adic numrul maxim de pai de la nceputul pn la sfritul
jocului. Un joc finit are evident lungime finit. Demonstraia teoremei se face prin inducie
complet dup lungimea jocului. Dac are lungimea 0 afirmaia este banal. Acum,
ntr-un joc de lungime 1, cel mult un juctor efectueaz o micare i el obine strategia de
echilibru, alegnd cea mai bun alternativ. Dac are lungimea m , jocul poate fi
descompus (avnd informaie complet) n jocuri pariale de lungime mai mic dect m .
n baza ipotezei induciei, fiecare dintre aceste jocuri are un punct de echilibru. Aplicnd
acum teorema 1.2, obinem concluzia dorit.

13

Capitolul II: Jocuri de dou persoane cu sum nul


2.1 Jocuri cu sum nul
Definiia 2.1 Un joc se numete joc cu sum nul dac, pentru orice nod final, funcia
de ctig satisface condiia:
n

p
i 1

(2.1)

n general, un joc cu sum nul reprezint un sistem nchis, n care orice ctig al unui
juctor reprezint n mod necesar o pierdere egal pentru ansamblul celorlali juctori.
Majoritatea jocurilor de societate sunt jocuri cu sum nul. Jocurile de dou persoane cu
sum sunt numite antagoniste.
Datorit relaiei (2.1), a n -a component a vectorului de plat este perfect determinat de
celelalte n 1 componente. De aceea, n cazul unui joc de dou persoane cu sum nul
este suficient s se dea doar prima component a vectorului ctigurilor. A doua
component este n mod necesar egal cu opusul primei. n acest caz numim prima
component, pe scurt, ctig, nelegnd prin aceasta c al doilea juctor pltete
aceast sum primului juctor. Mai departe se va vedea c jocurile de dou persoane cu
sum nul se deosebesc de alte jocuri prin aceea c pentru ambii juctori este lipsit de
sens s coopereze ntr-un mod oarecare, cci orice ctig al unuia nseamn o pierdere
pentru cellalt. Semnificaia acestei observaii se nelege din urmtorul rezultat:
Teorema 2.1 Fie 1 , 2 i 1 , 2 puncte de echilibru ntr-un joc de dou persoane cu
sum nul. Atunci:
a) 1 , 2 i 1 , 2 sunt de asemenea puncte de echilibru;
b) 1 , 2 1 , 2 1 , 2 1 , 2 .

(2.2)

Demonstraie: Pentru c 1 , 2 este punct de echilibru, avem:

1 , 2 1 , 2
14

i analog, din 1 , 2 punct de echilibru, avem:

1 , 2 1 , 2 ,
de unde obinem relaia:

1 , 2 1 , 2 1 , 2 .
n mod analog, obinem relaia:

1 , 2 1 , 2 1 , 2 ,
relaie ce ncheie demonstraia relaiei (2.2). Mai departe, pentru orice 1 avem:

1 , 2 1 , 2 1 , 2
i analog pentru orice 2 :

1 , 2 1 , 2 1 , 2 ,
deci 1 , 2 este un punct de echilibru. Similar, se arat c 1 , 2 este punct de
echilibru.
Afirmaia teoremei nu este valabil pentru un joc arbitrar. n jocul din exemplul 1.5,

( 1 , 1 ) i ( 2 , 2 ) sunt puncte de echilibru, dar ctigurile corespunztoare sunt diferite.


De asemenea, nici 1 , 2 i nici 2 , 1 nu sunt puncte de echilibru.
2.2 Forma normal
Dup cum am vzut, forma normal a unui joc finit de dou persoane cu sum nul se
reduce la o matrice4 A n care numrul liniilor (respectiv coloanelor) este egal cu numrul
strategiilor juctorului I (respectiv II). Dac juctorul I alege a i -a strategie, iar juctorul II
a
a j -a strategie, atunci ctigul mediu este reprezentat de elementul ij din linia i i

coloana j a matricei A .
Dup cum vom vedea, o pereche i, j de strategii este un punct de echilibru dac i
numai dac elementul

aij

corespunztor este simultan cel mai mare n coloana lui i cel

mai mic din linia sa. Un astfel de element se numete punct a (prin analogie cu

4 De unde i denumirea de joc matriceal


15

suprafaa unei ei, curbat n sus pe o direcie i n jos pe direcia perpendicular). Nu


orice matrice posed un punct a.
Exemplul 2.1 a) Jocul matriceal

5 1 3

3 2 4
3 0 1

l are pe 2 punct a (elementul din coloana a doua i linia a doua).


b) Jocul matriceal:
1 1

1 1
nu are punct a.
S presupunem c cei doi juctori joac un joc matriceal. n acest caz, alegerea unei
strategii nseamn pentru juctorul I alegerea unei linii i , iar pentru juctorul II alegerea
a
unei coloane j . Ctigul este atunci ij . ntruct aceasta este suma primit de juctorul I

de la juctorul II, I va ncerca s o maximizeze n timp ce II va ncerca s o minimizeze. n


orice caz, nici unul nu tie ce strategie va alege adversarul su i tocmai acesta este un
element esenial n alegerea propriei strategii.
S analizm, de exemplu, jocul aruncrii monedei. Juctorul I poate raiona astfel: De
obicei se alege stema. De aceea ar trebui s aleg banul. Dar este posibil ca juctorul II s
raioneze similar, presupunnd c eu voi alege banul. Ar fi aadar mai bine ca eu s aleg
totui stema. Dar este posibil ca juctorul II s intuiasc acest raionament, deci....
Evident, cu un astfel de raionament juctorul I nu poate ajunge n acest caz la nici o
decizie satisfctoare. Acest lucru se datoreaz lipsei punctului a.
S presupunem acum c ne aflm n condiiile jocului de la punctul a) din exemplul 2.1.
Juctorul I se va decide probabil pentru prima sau a doua dintre strategiile sale i o va
alege n cele din urm pe a doua, raionnd astfel: Trebuie s aleg prima sau a doua
dintre strategiile mele. Juctorul II, nelegnd aceasta, va alege a doua strategie a sa,
deci pentru mine cel mai bine este s aleg a doua strategie a mea. Chiar dac juctorul
II ghicete strategia juctorului I, este bine pentru primul juctor s i-o pstreze. Exist
deci o deosebire fundamental ntre acest joc i precedentul. n primul joc pstrarea
secret a strategiei alese este extrem de important, dar n al doilea joc aceasta nu joac
nici un rol. Explicaia rezid deisgur n existena unui punct a n al doilea joc.
16

2.3 Strategii mixte


Analiza de pn acum a indicat cum trebuie tratat un joc matriceal care posed un punct
a, dar nu a dat nici o indicaie asupra comportrii optime a juctorilor n jocurile fr
puncte a. Astfel de jocuri sunt ns cele mai des ntlnite.
S presupunem c jucm un joc matriceal fr punct a, de exemplu:
4 2

1 3 .
Desigur, nu putem prevedea desfurarea jocului. S presupunem ns c, strategia
adeversarului rmnndu-ne imprevizibil, acesta ghicete exact decizia noastr. n
aceast situaie, ca juctor I, vom alege cu siguran prima strategie, cu care ctigm
dou uniti, n timp ce cu a doua strategie am ctiga doar o unitate. Acest ctig sigur
de cel puin dou uniti este pentru noi ctigul minim, notat:

v I' max min a ij


i

(2.3)

n rolul juctorului II, n aceleai condiii, ar trebui s alegem a doua strategie, care ne
aduce o pierdere de cel mult trei uniti.Notm aceast pierdere maxim:

v IIi min max aij


j

(2.4)

Ctigul minim i pierderea maxim joac un rol extrem de important n jocurile


matriceale. Ctigul minim al juctorului I este evident cel mult egal cu pierderea maxim
a juctorului II, adic:
v Ii v IIi

(2.5)

Demonstraia acestui rezultat este elementar. Dac n aceast inegalitate avem chiar
egalitate, atunci exist un punct a. n cazul n care inegalitatea este strict, jocul nu are
puncte a. ntr-un astfel de joc nu putem prevedea nimic, dar putem stabili urmtoarele:
i
juctorul I trebuie s nu ctige mai puin dect v I , iar juctorul II s nu piard mai mult
i
de v II .

Dac i transmitem adversarului strategia noastr, ntr-un joc fr punct a putem obine,
i
i
n cel mai bun caz, ctigul minim v I , respectiv pierderea maxim v II , dup cum

reprezentm juctorul I sau II. Putem obine un rezultat mai bun doar evitnd ca
17

adversarul s ne afle strategia. Aceasta este desigur greu de realizat atta timp ct
alegerea noastr se bazeaz pe raionamente logice, cci nimic nu l mpiedic pe
adversar s reproduc acest raionament.
Aadar strategia trebuie aleas n mod neraional. Dar care mai este atunci sensul
acestei analize?
Rspunsul este urmtorul: alegerea trebuie fcut la ntmplare, adic nu pe baza unui
raionament, dar schema aleatoare nsi trebuie conceput n mod raional. Aceast
ide st la baza noiunii de strategie mixt.
Definiia 2.2: O strategie mixt

a unui juctor este o repartiie de probabilitate pe

mulimea strategiilor sale pure.


Dac juctorul posed un numr finit m de strategii pure, atunci o strategie mixt a sa

const dintr-un m -vector x x1 ,.., x n ce verific proprietile :


xi 0, pentru orice i 1, n

(2.6)

i
n

x
i 1

(2.7)

Notm cu X i Y mulimile strategiilor mixte ale juctorilor I, respectiv II.


S presupunem acum c juctorii I i II joac jocul matriceal A i aleg strategiile mixte x
i y . Atunci ctigul mediu este:
m

A x, y xi aij y j
i 1 j 1

(2.8)

sau, scis sub form matriceal:


A x, y xAy t .

(2.9)

Ca i pn acum, juctorul I trebuie s se team c II va descoperi strategia sa x . n


acest caz II va alege cu siguran strategia sa y care minimizeaz A x, y . Folosind
strategia x , juctorul I obine deci cel puin ctigul mediu

v( x) min xAy t
yY

(2.10)

18

t
Deoarece xAy poate fi considerat ca medie ponderat a ctigurilor medii ale juctorului
I, cnd acesta folosete strategia x mpotriva strategiilor pure ale juctorului II, minimul

acestor medii ponderate se atinge pentru o strategie pur, adic:

v ( x) min xA j
j

(unde

A j

(2.11)

reprezint coloana j a matricei A ).

Desigur, juctorul I alege x astfel nct s maximizeze v(x) i astfel ctig cel puin:

v I max min xA j
x X

(2.12)

(Existena acestui maxim e asigurat de faptul c mulimea X este compact iar funcia
v(x) este continu). Un asemenea x se numete strategie maximin a juctorului I.

Analog, folosind strategia y , juctorul II are cel mult pierderea medie:

v( y ) max Ai y t
i

(2.13)

El trebuie s aleag y astfel nct s minimizeze aceast pierdere i astfel are cel mult
pierderea:

v II min max Ai y t
yY

(2.14)

O strategie y pentru care se atinge minimul n (2.14) se numete strategie minimax


pentru juctorul II. Valorile v I i v II se numesc valori ale jocului pentru juctorul I,
respectiv pentru juctorul II.
2.4 Teorema Minimax
Se arat cu uurin c pentru orice funcie F x, y definit pe produsul cartezian X Y
avem :

max min F x, y min max F x, y


xX

yY

yY

xX

(2.15)

presupunnd c minimele i maximele exist. Din aceast inegalitate rezult imediat c:

v I v II .
Aceast inegalitate corespunde celei de la punctul (2.5). De fapt, i n acest caz, este
natural ca cel mai mic ctig al juctorului I s nu depeasc pierderea maxim a lui II.
19

n cazul strategiilor pure am vzut c n (2.5) egalitatea are loc doar n anumite cazuri
particulare. n acest caz avem ns urmtorul rezultat:
Teorema 2.2 (Teorema minimax).

v I v II .
Aceast teorem fundamental a teoriei jocurilor a fost demonstrat n diverse moduri.
Vom prezenta n continuare demonstraia original dat de von Neumann i Morgenstern.
Pentru aceasta, vom da, fr demonstraie, dou leme:
Lema 2.3 (Existena hiperplanelor de separare). Fie B o mulime convex nchis n

spaiul euclidian n -dimensional i x x1 ,.., x n un punct ce nu aparine lui B . Atunci


exist numerele reale p1 ,..., p n , p n 1 astfel nct :
n

p x
i

i 1

p n 1

(2.16)

i
n

p y
i 1

p n 1 ,

yB.

(2.17)

Geometric, lema afirm c exist un hiperplan ce trece prin punctul x astfel ca mulimea
B s fie coninut ntr-unul dintre semispaiile determinate de hiperplan.

Lema 2.4 (Teorema alternativei pentru matrice). Fie

A aij

o matrice m n . Atunci este

adevrat una i numai una dintre urmtoarele dou afirmaii :


1) Punctul 0 (al spaiului m - dimensional) aparine acoperirii convexe a urmtoarelor

m n puncte :
a1 a11 ,..., a m1

a n a1n ,..., a mn
i
e 1=( 1, 0, , 0 )

20

e n=( 0, 0, ,1 ) .
2) Exist numerele reale x1 ,..., x m astfel nct:
m

xi 0,

x
i 1

i 1

ij

xi 0,

j 1, n.

Demonstraia teoremei minimax: Fie A un joc matriceal. Conform lemei 2.4, este
adevrat fie afirmaia 1) a acesteia, fie 2). n cazul 1), vectorul 0 se poate reprezenta ca
o combinaie liniar a celor

m+ n

vectori, adic exist numerele

s 1 , , sm +n

astfel

nct:
n

s j aij+ s n+i=0, i=1,m


j=1

n ,
s j 0, j=1, m+
m+ n

s j=1.
j=1

Dac numerele

s 1 , , sn

vectori unitari

e 1, , ,e m , ceea ce este imposibil (deoarece acetia sunt liniar

ar fi toate nule, atunci 0 ar fi o combinaie liniar a celor

s 1 , , sn

independeni). Deci cel puin unul dintre

este pozitiv, ceea ce implic

s j >0

. Notnd:

j=1

y j=

sj
n

sj

j=1

avem:
n

y i 0, y j =1,
j=1

a ij y j =
j=1

sn+ i
n

0, i.

sj
j=1

Prin urmare,

v ( y ) 0

i v II 0 .

n al doilea caz al lemei 2.4, avem


Prin urmare, inegalitatea

v ( x )>0

v I 0< v II

jocul B=( b ij ) , unde bij =aij + k .

i deci v I >0 .

nu poate avea loc. S nlocuim acum jocul

Pentru orice

cu

avem evident:
21

xB y t=xA y t +k
i deci
v I ( B ) =v I ( A )+ k ,
v II ( B )=v II ( A ) +k .
Deoarece nu putem avea
v I ( B ) 0<v II ( B)
i deci nici
v I ( A ) k < v II ( A ) ,
k

rezult,

fiind arbitrar, c nu putem avea

v I <v II , deci v I v II .

Cum inegalitatea contrar a fost deja demonstrat, rmne doar c:


v I =v II .
Aadar, ctigul minm al juctorului I este egal cu pierderea maxim a lui II, dac se
v =v I =v II

folosesc strategii mixte. Numrul


x

se numete valoarea jocului. O strategie

cu proprietatea:
m

x i aij v , j=1, n

(2.18)

i=1

este optim pentru primul juctor, n sensul c nu exist nici o strategie care s-i aduc
un ctig mediu mare mare ca
dac

v , indiferent de strategia folosit de juctorul II. Invers,

are proprietatea:
n

a ij y j v ,i= 1,n

(2.19)

j=1

atunci

este optim pentru juctorul II n sensul definit mai devreme. Avem evident

atunci:
xA y t =v ,
deoarece folosind relaiile (2.18) i (2.19) avem relaia
Prin urmare, strategiile optime

t
v xA y v .

sunt de asemenea strategii optime una

mpotriva celeilalte, ca i mpotriva oricrei alte strategii a adeversarului. O asemenea


pereche ( x , y )

de strategii optime se numete, din acest motiv, soluie a jocului.

n ncheierea acestui capitol, enunm, fr demonstraie, o variant mai tare a teoremei


minimax:

22

Teorema 2.5 ntr-un joc matriceal


strategie optim

cu

de dimensiune

m n , fie juctorul II are o

y n >0 , fie I are o strategie optim

x , pentru care:

a xi > v

i=1

Capitolul III: Jocuri contra naturii


Pn acum ne-am ocupat de jocuri n care alegerea strategiilor era determinat de
matricea

a ctigurilor primului juctor. Sunt situaii n care riscurile cu care se iau

hotrri nu pot fi cunoscute, deoarece juctorul II nu acioneaz rational. Un astfel de


juctor poate fi considerate natura, de unde i denumirea de jocuri contra naturii. De
analiza unor astfel de situaii se ocup teoria deciziilor.
n cele ce urmeaz vom vedea unele criteria de alegere a deciziei juctorului I (pe care l
vom numi i statistician) n jocurile contra naturii (numite i jocuri n caz de incertitudine).
Menionm c atitudinea fa de joc, diferit de la o persoan la alta, face ca n teoria
23

deciziilor s nu existe criterii universal valabile. Aplicarea criteriilor poate conduce la


rezultate diferite.
Alegerea strategiei ar putea fi data de rezultatul aplicrii mai multor criteria. Vom
m

presupune c statisticianul juctorul I, dispune de


natura de

Fie matricea

stri

A 1 , , A m , iar

B1, , Bn .

A=( aij ) ,

alege strategia

strategii pure

i=1,m; j=1, n , unde

A i , iar natura se afl n starea

aij

este ctigul juctorului I cnd

Bj .

3.1 Criteriul lui Hurwicz (criteriul optimistului)


Optimismul juctorului I se definete ca un numr

[ 0, 1 ] . Se determin numere

reale:
m i=min {a ij }
j

M i=max { a ij } ,
j
Fiecrei strategii

Ai

i=1,m .

i asociem expresia:
M i + ( 1 ) mi , i=1,m .

Strategia optim va fi cea care corespunde la:


[ M i + ( 1) mi ]
.
max
i

n folosirea acestui criteriu este necesar ns s se defineasc n prealabil optimismul


juctorului, adic valoarea

[ 0, 1 ] .

Pentru o mai bun nelegere a acestui criteriu vom prezenta n cele ce urmeaz un scurt
exemplu.
Exemplul 3.1 Se consider jocul contra naturii a crui matrice a ctigurilor juctorului I
n orice strategie a sa
A1
A2
A3
A4

A i ,i= 1, 4
B1
2
3
1
3

i n orice stare
B2
4
2
5
3

B j , j=1, 4

a naturii este:
B3
3
3
2
2

B4
3
2
1
3

24

Considerm

2
3

i ne propunem s determinm strategia optim.


mi , M i

Atam matricei date coloanele elementelor:

M i +(1) m i , fiecare

avnd semnificaia descris anterior. Obinem astfel:


B1
2
3
1
3

A1
A2
A3
A4

B2
4
2
5
3

Ca s determinm

B3
3
3
2
2

B4
3
2
1
3

mi

Mi
4
3
5
3

2
2
1
2

M i +(1) mi
2+2
+ 2
4 +1
+ 2

[ M i + ( 1) mi ]
, cum [ 0, 1 ] , observm c + 2 2+2.
max
i

Aadar, studiem doar cazurile:


<

1
;
3

a)

4 +1<+2, de unde

b)

+ 2 4 +1<2 + 2 , de unde

c)

2+2 4 +1 , de unde

Deci pentru
strategiei

[ )

0,

1
,
3

2+2

1
1
< .
3
2

1
.
2

este cea mai mare valoare i cum ea corespunde

A 1 , aceasta este strategia optim.

Pentru
Pentru

[ )
[ ]

1 1
, ,
3 2

tot 2+2

1
,1 ,
2

4 +1

n cazul nostru, avem

este valoarea maxim, deci

e valoarea maxim i

[ ]

2 1
= ,1
3 2

, deci

A3

A3

A1

e strategie optim.

este strategia optim.

este strategia optim.

3.2 Criteriul Bayes Laplace


n cazul acestui criteriu se presupune c strile naturii sunt egal probabile. Cum numrul
lor este n , probabilitatea ca natura s se afle n starea

Bj

este

1
, j=1, n .
n

25

Dac juctorul I va alege strategia

A i , ctigul su va fi

1
a , care este valoarea
n j=1 ij

medie a variabilei aleatoare discrete cu repartiia:

ai 1 ai 2 a
1 1 1
n
n n

Juctorul I va alege strategia care maximizeaz ctigul su mediu:

1
max aij
1 i m n i=1

Obsevaia I: Dac se cunosc totui probabilitile diferitelor stri ale naturii, respectiv

y 1 , , y n , deci strategia

1
y=( , , y n )

y j 0, j=1, n

cu

y j=1

, ctigul

j=1

mediu al statisticianului I cnd folosete strategia

Ai

va fi, conform teoremei minimax:

( i , y )= aij y j ,
j=1

iar ctigul mediu va fi maxim pentru strategia corespunztoare valorii:


max ( i , y ) .

1 i m

Observaia II: Criteriul lui Laplace introduce toate neajunsurile valorii medii. Dac
estimrile au fost fcute grosolan apar erori mari n apreciere, ce vor duce la decizii
greite. Criteriul devine de multe ori inacceptabil atunci cnd elementele jocului sunt
foarte dispersate.
Exemplul 3.2. Ne propunem ca pentru jocul de la exemplul 3.1 s determinm strategia
optim a juctorului I n cazurile:
a) cnd strile naturii sunt egal probabile;
b) cnd probabilitile ca natura s se afle n strile ei sunt respectiv:

1 2 4 2
, , ,
.
9 9 9 9

Pentru cazul a), atam matricei jocului coloana

1
a :
4 j =1 ij

26

B1

B2

B3

B4

A1

A2

A3

A4

Deci

1
max aij
1 i 4 4 j=1

1
12 , ce corespunde strategiei
4

este

1
a
n j=1 ij
1
12
4
1
10
4
1
9
4
1
11
4

A 1 , deci aceasta este

valoarea optim conform criteriului Laplace.


Pentru b), calculm pentru fiecare strategie

Ai

valoarea expresiei date de

(i , y ) ,

i=1, 4 . Obinem:
1
2
4
2
28
( 1, y )= 2+ 4+ 3+ 3=
9
9
9
9
9
1
2
4
2
23
( 2, y )= 3+ 2+ 3+ 2=
9
9
9
9
9
1
2
4
2
21
( 3, y )= 1+ 5+ 2+ 1=
9
9
9
9
9
1
2
4
2
23
( 4, y ) = 3+ 3+ 2+ 3=
9
9
9
9
9

Cea mai mare valoare este

28
, corespunztoare lui
9

( 1, y ) , deci

A1

este

strategia optim.
3.3 Criteriul lui Savage (criteriul regretelor)
Savage compar rezultatul deciziei n cazul necunoaterii strii naturii cu cel care s-ar
obine dac s-ar cunoate aceast stare. Diferena dintre ctigul realizat cnd se ia
decizia fr a cunoate strile naturii i cel realizat dac se cunosc acestea reprezint
regretul sau ce s-ar fi ctigat dac I ar fi cunoscut strile naturii.

27

Pornind de la matricea
R=( r ij )

A=( aij ) ,

i=1,m ,

, se formeaz o nou matrice


j= 1,n

numit matricea regretelor, cu elementele:


r ij = max a kjaij , i=1,m ,
1 k m

r ij

adic

elementul

j= 1,n
j

este dat de diferena dintre cele mai mare element de pe coloana

aij .

Se obine astfel un nou joc caracterizat de matricea

care va fi tratat dup criteriul

minimax. Juctorul I va alege strategia pe linia creia se obine:

min max r ij

1 i m 1 j n

, adic linia pe care cel mai mare regret este minim.

Exemplul 3.3 Vrem s vedem, pentru acelai joc folosit i n primele dou exemple, ce
strategie ar alege juctorul I aplicnd criteriul regretelor.
Se determin mai nti matricea regretelor ale crei elemente de pe o coloan se obin
scznd din cel mai mare element al coloanei fiecare element al acesteia. Se obine:

A1
A2
A3
A4

min max r ij

Cum

1 i m 1 j n

B1

B2

B3

B4

max r ij

1
0
2
0

1
3
0
2

0
0
1
1

0
1
2
0

1
3
2
2

{ 1,3, 2, 2 }
= min

juctorul I va alege tot strategia

= 1, ne rezult c i utiliznd acest principiu

A1 .

3.4 Criteriul lui Wald


Dac jocul are punct a, statisticianul I alege strategia
max min aij
i

Ai

Dac jocul nu are punct a, se determin strategia mixt

{ }

determinat de condiia:

x=( x 1 , , x m )

pentru care:

min
j

i =1

aij x i

este maxim.

28

Exemplul 3.4 Aplicarea criteriului lui Wald jocului cercetat i cu celelalte criterii ne duce la
concluzia c jocul nu are punct a. Procednd ca n subcapitolul 2.3 prezentat anterior se
determin strategia mixt a statisticianului i se gsete vectorul:

( 13 , 13 ,0, 13 )

x=

de unde rezult c juctorul I poate alege oricare dintre strategiile sale

A1 ,

A2

sau

A4 .
Observaie: Dei criteriile aplicate nu au dus mereu la aceeai decizie, n majoritatea
cazurilor s-a obinut c cea mai bun strategie este

A1 ,

astfel c statisticianul o va

alege pe aceasta.
Aplicaie Ne propunem ca pe baza criteriilor de mai sus s gsim o soluie a urmtoarei
probleme:
Patronul unui magazin achiziioneaz un numr de frigidere de un anumit tip pe o
perioad de 6 luni (primvar var), cu scopul de a le vinde. Din observaiile statistice,
bazate pe cererea din ultimii trei ani, el estimeaz c va vinde un numr de frigidere
cuprins ntre: 15 i 25 cu probabilitatea de 0,1; ntre 25 i 35 cu probabilitatea de 0,4;
ntre 35 i 45 cu 0,3 i ntre 45 i 55 cu 0,2.
Costul unitar de achiziie este de 300 de euro, iar preul unitar de vnzare este de 400
euro (incluznd cheltuielile de transport i asigurarea garaniei de funcionare pentru un
an de zile). Toate frigiderele nevndute pn n toamn se restituie furnizorului pentru
250 de euro bucata.
Ne propunem s determinm numrul optim de frigidere pe care patronul ar trebui s le
achiziioneze.
Mai nti determinm matricea
patron cnd aplic strategia

A=( aij ) ,
A i ,i= 1, 4

i, j=1, 4 , unde

aij

este ctigul obinut de

i cererea este n starea

S j , j= 1, 4 . Obinem

astfel:
Cererea pieei / cantitatea
achiziionat

A 1 : 20
A 2 : 30
A 3 :40
A 4 :50

S 1 :20

S 2 :30

S 3 : 40

S 4 :50

2000
1500
1000
500

2000
3000
2500
2000

2000
3000
4000
3500

2000
3000
4000
5000

29

unde de exemplu elementul de pe lina

A3

i coloana

S2

se calculeaz astfel: din

cele 40 de frigidere achiziionate se vnd 30.


Diferena dintre preul unitar de vnzare i cel de achiziionare este de 100 de euro
pentru un frigider, ce reprezint ctigul patronului. Pentru cele 30 de frigidere vndute va
ctiga 3000 de euro. Dar alte 10 frigidere nevndute vor fi restituite furnizorului cu o
pierdere unitar de 50 de euro dat de diferena dintre costul de achiziie, 300 de euro, i
cel de restituire, 250 de euro. Deci pierderea va fi de 500 de euro, astfel c beneficiul
final va fi: 3000 500 = 2500 euro.
Deoarece n stabilirea deciziei conteaz consecinele economice se pot aplica n
rezolvarea problemei criteriile: maximin, minimax, Savage i Bayes Laplace.
a) Prin criteriul maximin se alege minimul fiecrei linii i dintre acestea se gsete
maximul:
A1
A2
A3
A4
2000
1500
1000
500
A
care este 2000, astfel c se va recomanda strategia
1 .
b) Criteriul minimax, bazat pe pruden, indic alegerea elementelor maxime pe
fiecare linie i apoi determinarea celui mai mic dintre acestea.
A1
A2
A3
A4
2000
3000
4000
5000
A
Acest element este 2000 i arat c
1 reprezint i cea mai prudent decizie.
c) Criteriul lui Savage este de fapt criteriul minimax aplicat pe matricea regretelor, ce
va avea forma:

0
500
R=
1000
1500
pentru care vom cuta maximul pe

500 2000
0
1000
500
0
1000 500
fiecare linie

3000
2000
.
1000
0
i apoi pe cel mai mic dintre ele.

Gsim:
A1
A2
A3
A4
3000
2000
1000
1500
A
Deci n acest caz va alege strategia
3 , care d o pierdere de doar 1000.
d) Criteriul Bayes Laplace presupune calculul ctigului mediu pentru fiecare
strategie folosind probabilitile date n enunul problemei i formulele pe care leam vzut anterior. Astfel, avem:
( 1, y )=0,12000+0,42000+ 0,32000+0,22000=2000
( 2, y )=0,11500+0,43000+0,33000+0,23000=2850
( 3, y )=0,11000+0,42500+0,34000+0,24000=3100
30

( 4, y ) =0,1500+ 0,42000+0,33500+0,25000=2900
Cel mai mar ctig se obine cnd se aplic strategia A 3 .
Aadar, prin dou metode am gsit strategia
dou metode am gsit strategia

A1

A3

ca fiind cea mai indicat, iar prin alte

drept optim.

Este de remarcat c nici una din aceste metode nu indic i strategia

A2

care din

punct de vedere stric economic are sens prin prisma a dou aspecte: ofer cea mai bun
probabilitate de realizare i un foarte bun cost de oportunitate.

31

Capitolul IV: Aplicaii


n cadrul acestui capitol ne propunem s vedem soluiile unora dintre cele mai interesante
probleme ce se pot rezolva cu teoria jocurilor. Am ales problema ameninrilor credibile
datorit rolului foarte important n tehnicile de negociere, chiar dac majoritatea
persoanelor nu contientizeaz aspectul mathematic al situaiei, problema pirailor, de
asemenea foarte folosit n tehnici de negociere, dar i n stabilirea preului pe pia i
chiar o surs de inspiraie n filme. Ulterior am exemplificat felul n care oamenii percep n
viaa de zi cu zi aceste probleme de teoria jocurilor n situaii reale cu care se pot
confrunta. Ultimul subcapitol este dedicate jocului de poker, din punctul meu de vedere
unul dintre cele mai complexe jocuri n care se aplic tehnici matematici complexe.
4.1 Problema ameninrilor credibile
Problema a fost dezbtut de economistul german Reibhard Selten, profesor la
Universitatea din Bonn, laureat al premiului Nobel pentru economie n 1994. Acesta a
dorit s demonstreze diferenele dintre forma extins i cea normal a unui joc ca
instrumente de analiz strategic, dup ce mult vreme au fost considerate echivalente.
Exemplul pe care l vom prezenta se numete copilul rsfat i are urmtorul scenariu:
ntr-o smbt dup-amiaz un copil capricios (juctorul I) dorete s mearg la cinema,
dar prinii si (juctorul II) au decis ca toat familia s fac o vizit mtuii Sofia.
Juctorul I deschide jocul. El poate accepta s mearg la mtua Sofia sau s refuze.
Dac decide s mearg la mtu, jocul se termin i fiecare juctor are un ctig de 1.
Dac totui copilul refuz s mearg, atunci prinii sunt n faa alegerii urmtoare: l pot
pedepsi, privndu-l de ieire sau s cedeze i toat familia va merge la cinema.
n cazul n care aleg s l pedepseasc, fiecare are un ctig de -1 (copilul este suprat
deoarece este pedepsit, dar nici prinii nu vor fi mai fericii, urmnd s stea acas toat
ziua i s asculte plnsetele copilului). Dac vor ceda i vor merge la cinema, atunci
copilul va avea un ctig de 2 iar prinii de 0.
De aceea, prinii nu vor pune n aplicare executarea ameninrii lor, n ciuda refuzului
copilului de a merge la mtua Sofia. Ei vor prefera s revin asupra deciziei i s
mearg la cinema.
32

Tabelul urmtor prezint forma normal a acestui joc:

Juctorul I
(copilul rsfat)

Vizit la mtua
Refuz

Juctorul II (prinii)
Pedeaps
Cedare
(1, 1)
(1, 1)
(-1, -1)
(2, 0)

n forma normal, jocul are 2 echilibre: primul este acceptul copilului de a merge la mtu
i pedeapsa din partea prinilor, iar al doilea corespunde refuzului copilului de a merge la
mtu i cedarea din partea prinilor. Totui, juctorul II are o ncitaie slab n a adera
la primul din aceste echilibre, cci din moment ce juctorul I alege s mearg la mtu,
juctorul II este indiferent ntre cele 2 strategii ale sale (pedeapsa sau nu). n plus, n
aceast situaie pedeapsa nu este justificat.
n ciuda acestui lucru, fiecare din aceste echilibre de la forma normal satisfac definiia
unui echilibru Nash: nici unul din juctoru nu va face mai bine deviind de la strategia sa
de echilibru.
S analizm acum problema utiliznd forma extins. Avem urmtorul arbore:

Echilibrul stnga stnga se bazeaz pe o ameninare noncredibil din partea juctorului


II de a se deplasa la stnga dac juctorul I se deplaseaz la dreapta.

33

Cunoscnd ameninarea juctorului II cel mai bun rspuns al juctorului I este s accepte
i dac juctorul I alege s mearg la mtu, alegerea juctorului II nu are nici o
importan pentru c el nu va avea nevoie s joace.
Acest echilibru pune ns probleme, deoarece ameninarea juctorului II nu este credibil.
S presupunem c prinii vor ine discursul de mai sus, dar n ciuda ameninrii copilul
refuz s mearg la mtu. n acest caz, prinii se gsesc n nodul 2 al arborelui, unde
se confrunt cu alegerea urmtoare: fie i pun n aplicare ameninarea i au un ctig de
-1, fie cedeaz i au un ctig de 0. Dac prinii sunt rezonabili, ei prefer o satisfacie
nul uneia de -1. Doar rancuna i-ar putea conduce s-i pun n aplicare ameninarea.
Devine evident c a echilibrul dat de (a merge la mtu, a pedepsi) nu este un echilibru
satisfctor, cci el nu se sprijin pe o ameninare credibil. Pui n faa faptului mplinit
(refuzul copilului de a merge la mtu) prinii prefer s mearg la cinema mai curnd
dect s-l pedepseasc. Acesta constituie de fapt echilibrul jocului.
Un exemplu concret al acestei probleme l constituie negocierea pentru achiziionarea
Tumblr de ctre Yahoo. Dei oferta de 800 de milioane de dolari a fost considerat prea
mic de ctre cei de la Tumblr, care au cerut o sum aproape dubl pentru a vinde,
Yahoo a ales s menin aceeai ofert. Alegerea a fost dat de ameninarea
noncredibil din partea platformei de blogging, deoarece nivelul veniturilor acestora este
mult sub nivelul cheltuielilor, astfel c fr s vnd ar fi fost nevoie s nchid platforma.
Desigur c proprietarii afacerii au preferat o sum de aproape 1 miliard de dolari n
detrimentul falimentului. Oferta celor de la Yahoo nu ar fi putut fi ns nici prea sczut,
deoarece n aceast situaie alte companii ar fi fost interesate i s-ar fi ajuns la o licitaie.
4.2 Problema pirailor
Forma simplificat a problemei se prezint n felul urmtor: trei pirai, A, B i C, gsesc
100 de bani de aur, pe care i vor mpri conform unui vechi cod al pirailor. Conform
acestui cod, piraii urmeaz reguli clare de structur: piratul A este mai puternic dect
piratul B, iar acesta din urm este mai puternic dect piratul B.
n mprirea banilor, modul de vot este urmtorul:
1. Cel mai puternic pirat propune o mprire a banilor: de exemplu 50 mie, 30 lui B
i 20 lui C;
34

2. Toi piraii, inclusiv cel care a propus mprirea banilor, vor vota dac accept sau
nu mprirea propus;
3. Dac este majoritar votul pentru, are loc mprirea banilor;
4. Altfel, piratul care a propus mprirea este aruncat peste bord i lsat s se nece;
5. Urmtorul cel mai puternic pirat propune o nou mprire a banilor i procesul se
reia pn cnd se stabilete o mprire acceptat.
n mod evident, fiecare pirat este interesat n primul rnd de a scpa cu via i mai apoi
de ct aur primete. Astfel c la o prim vedere va fi dispus s ofere foarte mult aur
celorlali, fiind dispus s nu pstreze chiar nimic pentru el. Totui, cum va decurge jocul?
Soluia se obine relaionnd n sens invers. Piratul C este interesat s accepte orice
sum primit de la piratul A. n caz contrar, dac i B va vota mpotriv, piratul A va fi
aruncat peste bord iar votul se va da ntre B i C. Acum, piratul B poate propune ca el s
pstreze toi cei 100 de galbeni, iar C s nu primeasc nimic. La vot, evident c B i va
vota propria-i prounere, i cum este mai puternic dect piratul C, indiferent de votul
acestuia, propunerea sa va fi acceptat. Astfel, pentru C este avantajos s accepte orice
ofert din partea lui A n urma cruia el primete ceva.
Din punctul de vedere al piratului B, el este interesat s refuze orice propunere a piratului
A, cu excepia cazului cnd i sunt oferii toi cei 100 de galbeni (soluie nerealist). Altfel,
el va vota mpotriv deoarece dac piratul A va fi aruncat peste bord el va decide
mprirea banilor i automat va opri toi galbenii. De aceea indiferent de suma propus
de piratul A, el va vota mpotriv.
Pentru piratul A, care are evident votul propriu, este suficient s mai atrag un singur pirat
de partea sa. Conform celor descries mai sus, i este practic imposibil s fie pe aceeai
lungime de und cu piratul B, dar l poate convinge pe C. De aceea, soluia optim pentru
piratul A este o mprire de genul (99, 0, 1).
Cum se extinde aceast situaie?
S considerm cazul a 4 pirai, A, B, C i D care impart banii conform acelorai reguli.
Piratul A are nevoie de un singr vot, iar cel mai simplu este s l obin pe cel al lui C.
Dac A ar fi aruncat peste bord, am ajunge la situaia descris anterior, iar B ar pstra 99
de galbeni i D un singur galben. Evident, C va prefera s primeasc ceva, n timp ce B
va refuza orice ofert sub 99 de galbeni. D ateapt o ofert de minim 1 galben, pe care
i-ar obine n cazul n care A este aruncat. Aadar, A ar putea mpri astfel galbenii: (99,

35

0, 0 ,1) sau (99, 0, 1, 0). Totui, el va prefera votul unui pirat mai puternic, anume al lui C,
astfel c va alege a doua variant. Aceasta constituie rezolvarea problemei de fa.
Problema se poate generaliza pentru orice numr de pirai i orice numr de monede.
Exist ns o mare diferen ntre situaiile teoretice i situaiile practice. O abordare a
acestei problem, experimentat practic, este problema ultimatumului: 2 juctori primesc
100 de dolari. Juctorul I este cel care mparte banii. Dac juctorul II accept, mprirea
are loc. Dac nu, nici unul nu primete nimic. Teoretic, juctorul II este mulumit cu orice
sum primete, deoarece n caz contrar nu va primi nimic. De aceea, o mprire de (99,
1) ar trebui s satisfac ambii juctori. Din punct de vedere al echilibrului Nash, i o
mprire de (100, 0) ar trebui s reprezinte un punct de echilibru, deoarece fie c refuz
fie c accept juctorul II nu primete nimic, astfel c i este indiferent. Nu vom considera
ns o astfel de soluie pentru problema ultimatumului.
Practic, s-a constatat ns c soluiile sub 20 de dolari au fost respinse de majoritatea
persoanelor care au avut rolul celui de-al doilea juctor 5. Deranjai de lcomia primului
juctor ei prefer s nu primeasc nimic dect ca acesta s rmn cu o mare parte a
sumei. Procente mari de acceptare s-au obinut abia pentru mpriri de 50 - 50.
Problema iniial provine din Talmud (textul central al iudaismului islamic) din perioada
Babylonian, i a fost nesoluionat pentru mai bine de 1800 de ani. ntr-unul din pasaje,
Talmudul trateaz situaia unei persoane care moare lsnd n urm o datorie de 600 de
galbeni, 100 ctre Creditorul I, 200 ctre Creditorul II i 300 ctre Creditorul III. Averea sa
nu acoper ns aceast datorie, astfel c se pune problema cum vor fi mprii banii.
Soluia dat n Talmud nu vizeaz proporiile ntre nivelul datoriilor i averea defunctului,
ci prevede urmtoarele:

Dac averea este de 100, fiecare creditor primete o cot egal, de 33,(3);
Dac averea este de 200, primul creditor primete 50 de galbeni iar ceilali doi cte

75;
Dac averea este de 300, primul primete 50 de galbeni, al doilea 100 iar cel de-al
treilea 150 (n acest caz se respect proporiile).

Algoritmul prin care se mpart banii a fost descoperit de matematicienii Robert Aumann i
Michael Maschler, n 19806.
5 Studiu publicat de Joseph Henrich n 2004 n The Ultimate Game, Fairness, and Cooperation
among Big Game Hunters.
6 Aumann, R. J. and Maschler M., Game theoretic analysis of a bankruptcy problem from the
Talmud, Journal of Economic Theory 36 (1985), 195 213.
36

4.3 Un experiment n rezolvarea jocurilor prin eliminarea strategiilor dominate


n subcapitolul 4.1 am vzut c exist o diferen ntre soluiile considerate optime
generate de descrierea n form extins i de cea n form normal. Ne propunem n cele
ce urmeaz s prezentm un experiment ce demonstreaz c forma extins este i mai
util n ceea ce privete luarea deciziilor, fiind mai intuitiv. Desigur, are dezavantajul
dificultii de expunere atunci cnd numrul juctorilor este mare sau cnd avem mai
multe strategii posibile.
Este evident c un juctor raional nu va utiliza niciodat o strategie dominat. Cu toate
acestea, cnd participm la un joc, nu tim ntodeauna dac adversarul nostru este
suficient de raional sau inteligent pentru a sesiza c anumite strategii ale sale sunt
dominate. Dac apar astfel de ndoieli, nu este sigur c echilibrul rezultat din eliminarea
strategiilor dominate s fie acela pe care l observm n realitate.
Pentru a studia aceast problem, Schotter, Weigelt i Wilson au cerut unui numr de 40
de studeni s participe la jocul descris n tabelul urmtor:

Juctorul I

Strategia a
Strategia b

Strategia A
(4, 4)
(0, 1)

Juctorul II
Strategia B
(4, 4)
(6, 3)

Experimentul a artat c studenii aflai n rolul juctorului I alegeau strategia a n 57% din
cazuri, pe cnd cei n rolul juctorului II i alegeau strategia dominat n 20% din cazuri.
Altfel spus, muli studeni n rolul juctorului I i bnuiau clar adversarii de a nu fi suficient
de inteligeni sau raionali pentru a nelege c ei nu ar trebui s utilizeze niciodat
strategia A. Altfel spus, pentru a evita riscul unui ctig nul (celula din stnga jos a
tabelului), ei preferau s joace n siguran i alegeau strategia a care le garana un ctig
de 4.
Cei trei autori au descoperit n timpul experimentului c lund un alt grup de studeni i
punndu-i n faa aceluiai joc, dar n forma sa extins, rezultatele au fost cu totul diferite.
Jocul a fost reprezentat n forma urmtoare:

37

S notm c situaia strategic din reprezentarea extensiv din graficul de mai sus este
exact aceeai cu cea prezentat sub form normal sau matriceal primilor studeni.
Cu toate acestea, numai 9% din noii studeni interpretnd rolul juctorului I au optat
pentru siguran (strategia a). Ceilali 91% s-au comportat ca i cnd gndeau c
juctorul II nelesese c una din strategiile lor era dominat.
Aceast diferen de apreciere ntre cele 2 grupe de juctori I n ceea ce privete
capacitile juctorilor II de a recunoate strategia dominat este fr ndoial datorat
faptului c strategia A a juctorului II era mai vizibil dominat de strategia B n forma
extins a jocului.
Aa cum am indicat i n problema ameninrilor credibile, suntem n msur s gndim
c modul de reprezentare a unui joc (forma normal sau extins) modific rezultatul.
Acest rezultat experimental este problematic pentru teoria jocurilor pentru c situaia
strategic era identic n cele 2 experimente (n ambele cazuri juctorii dispuneau de
aceeai informaie, dar aveau fr ndoial mai multe dificulti n a trata aceast
informaie n forma normal dect n forma extins. Acelai lucru se ntmpl i n cazul
problemei ameninrilor credibile). Aceasta permite poate s se explice diferenele de
comportament observate.
Cnd acelai joc este prezentat unui grup n forma normal i unui alt grup n forma sa
extins, rezultatele sunt diferite. Modul de reprezentare a unui joc afecteaz aparent
modul n care fiecare grup concepe situaia strategic i conduce juctorii s se comporte
diferit.
38

4.4 Aplicaii din teoria jocurilor n jocul de Poker


Vom ncepe acest subcapitol cu cu un joc simplu de cri, numit Pokerul de o carte.
Jocul este jucat de dou persoane care folosesc un set cu doar trei cri: un as, un trei i
un doi. Pentru a se ncepe joculm, unul din juctori va fi ales dealer, iar cellalt se va
numi deschiztor. Dup ce dealerul este selectat, fiecare juctor pune cte 100 de dolari,
formndu-se un pot de 200 de dolari. Apoi, dealerul mparte cte o carte fiecrui juctor.
Dup ce fiecare juctor i vede cartea, deschiztorul are prima micare. Poate s dea
check sau s mreasc miza cu ali 100 de dolari. Dac alege s mreasc miza,
dealerul poate rspunde sau se poate arunca. Dac dealerul arunc, deschiztorul ia
ntregul pot; altfel, ambii juctori i arat crile i ctig cel care are cartea mai mare.
Asul e considerat cea mai mic carte, urmat de doi i apoi de trei.
Dac deschiztorul ncepe jocul cu un check, atunci dealerul poate de asemenea s dea
check sau s mreasc pariul cu 100 de dolari. Dac dealerul alege check-ul, se arat
crile. n caz contrar, deschiztorul fie se arunc fie rspunde pariului.
Acum, avnd aceste reguli, s considerm urmtoarea situaie: dealerul a primit doiul, iar
deschiztorul alege s parieze. Evident, doiul dealerului poate nvinge doar un bluff din
partea deschiztorului (dac acesta are n mn asul). Ne propunem s determinm care
este frecvena teoretic cu care dealerul ar trebui s rspund acestui pariu.
n cartea Teoria Pokerului, David Sklansky folosete elemente de teoria jocurilor pentru
a determina situaiile n care trebuie rspuns la un bluff. Printre altele, noteaz: n
general, cnd mna ta nvinge doar un bluff, i vei folosi experiena i judecata pentru a
determina ansele ca oponentul s blufeze. Totui, n faa unui adversar a crui logic
este la fel de bun ca a ta sau chiar mai bun, sau n faa unuia ce este capabil s
foloseasc teoria jocurilor, la rndul tu va trebui s foloseti aceast teorie mcar pentru
a-i minimiza profitul.
El prezint urmtorul exemplu: Dac oponentul tu mrete miza cu ali 20 de dolari
pentru a ctiga 100 (valoarea potului deja existent), va merge la bluff n 5 situaii din 6.
Aadar, faci cotele de 5 la 1 mpotriva aruncrii tale. Altfel spus, vei rspunde pariului de
5 ori i vei arunca crile o dat
Pe baza acestei observaii, s ne ntoarcem la exemplul de la care am plecat. Dealerul
are un doi i poate ctiga doar n faa unui bluff. Deschiztorul a adugat 100 de dolari
la un pot de 200, deci sunt anse de 2 la 1 s blufeze. Am putea gndi atunci c dealerul
39

trebuie s rspund de dou ori i s se arunce o dat. Altfel spus, frecvena cu care
dealerul ar trebui s rspund avnd doiarul este de

2
. Dup cum vom vedea ns,
3

aceast frecven este greit.


Frecvena teoretic optim a jocului cu care dealerul ar trebui s rspund pariului este
de

1
.
3

O alt situaie interesant este urmtoarea: dealerul are asul iar deschiztorul
alege s nu creasc miza. Ar trebui dealerul s blufeze? Dac deschiztorul
are treiarul, atunci va pierde automat, dar dac totui primul juctor are doiul,
este posibil ca blufful s funcioneze. Facem presupunerea c totui
deschiztorul are n mn un doi, deoarece n caz contrar el ar fi mrit miza
nc de la nceput. Care este frecvena optima teoretic cu care dealerul ar
trebui s blufeze?
Conform aceleiai cri citate mai sus, frecvena bluffului ar trebui s fie

1
.
3

Dar analiza acestui exemplu pleac de la supoziia c deschiztorul va paria


mereu atunci cnd deine treiul. Dar dac el folosete o tehnic neltoare i
uneori alege s nu mreasc miza, dei are cea mai bun carte? Sau dac nu
pariaz niciodat atunci cnd are treiul? Cu att mai mult cu ct poate d
check i atunci cnd are doiul, ce concluzie ar mai putea trage dealerul?
Aadar dealerul tine n mn asul i deschiztorul a dat check. n jumtate din
cazuri, statistic, el va avea treiul i blufatul va fi fatal. n cealalat jumtate va
avea doiul, iar n

1
3

din aceste situaii dealerul ar trebui s blufeze. Aadar,

frecvena optim cu care ar trebui s blufeze este

1
.
6

Dar din nou, aa cum vodea, aceast presupunere este greit. Frecvena
teoretic optim cu care primul juctor ar trebui s blufeze este

1
,
3

indiferent de frecvena cu care primul juctor alege s dea check avnd treiul
n mn. De fapt, dac dealerul ar alege s blufeze doar ntr-o esime de
40

cazuri, deschiztorul ar putea folosi aceast strategie n favoarea sa, alegnd


s nu mreasc miza de fiecare dat cnd are un trei n mn.
Cum vrem ca n continuare s folosim teoria jocurilor pentru determinarea
frecvenelor optime, este important s definim strategiile posibile ale
dealerului i cele ale deschiztorului. Cum vrem ca analiza s fie ct mai
scurt, vom elimina strategiile aberante, ca de exemplu s plteti creterea
pariului cu un as n mn. Strategiile neacceptate sunt:
S1: Aruncatul crii atunci cnd aceasta este treiul. Presupunem c nici un
juctor nu se va arunca avnd treiul n mn.
S2: Rspunsul la pariu avnd asul.
S3: Check la check-ul primului juctor cu treiul n mn. Vom presupune c de
fiecare cnd dealerul are treiul n mn iar deschiztorul a dat check, dealerul
va mri miza. Evident, prin aceast tehnic el poate fie s rmn cu aceiai
bani (dac primul juctor se arunc), fie s i dubleze pariul (dac primul are
doiul n mn i gndete c primul blufeaz).
S4: Creterea mizei avnd doiul n mn. Atunci cnd deschiztorul are doiul
n mn, el nu are nici un motiv s creasc miza. Dac adversarul su are
asul, se va arunca (conform S2), deci deschiztorul nu va ctiga nimic n plus.
n schimb, dac dealerul are treiul el va rspunde pariului i deschiztorul va
pierde cu 100 de dolari mai mult. Situaia se aplic i n cazul n care dealerul
are doiul iar deschiztorul a dat check. Creterea pariului avnd doiul n mn
este o situaie din care nu se poate ctiga.
Cum am limitat strategiile juctorilor, dealerul trebuie acum doar s decid ct
de frecvent s blufeze atunci cnd are asul n mn i deschiztorul d check
i ct de frecvent s rspund pariului avnd doiul n mn atunci cnd
deschiztorul crete miza. Vom nota aceste probabiliti cu

q1 , respectiv

q2 .
n ceea ce privete deschiztorul, el are de luat trei decizii: ct de des s
blufeze crescnd miza atunci cnd are asul n mn ( p1 ), ct de des s
rspund pariului atunci cnd are doiul n mn iar dealerul a crescut miza

( p2 ) , i ct de des alege s mreasc miza avnd treiul n mn ( p3 ) .


41

Vrem s folosim aceste valori pentru a calcula valoarea ateptat de


deschiztor. Pentru aceasta vom privi potul initial de 200 de dolari ca
neaparinnd nici unui juctor. Astfel, dac de exemplu primul juctor d
check, al doilea crete miza iar primul se arunc, vedem cei 200 de dolari ca
un ctig pentru dealer i un ctig de 0 dolari pentru primul juctor.
Considernd toate situaiile posibile, deschiztorul are trei valori nenule ale
valorii ateptate: astfel, el poate pierde 100 de dolari, ctiga 200 de dolari
sau ctiga 300 de dolari. Vom calcula probabilitile pentru fiecare din aceste
cazuri. Mai nti s descriem pe larg cazurile posibile:
Cazul 1: deschiztorul are asul iar dealerul are doiul. Deschiztorul poate blufa i s i se
rspund, caz n care pierde 100 de dolari cu probabilitatea

p1 q 2 , sau s ctige 200

de dolari dac blufeaz i dealerul se arunc, pentru care avem o probabilitate de


p1 ( 1q2 ) .
Cazul 2: deschiztorul are asul, iar dealerul are trei. Dac deschiztorul ncearc s
blufeze, atunci automat el pierde 100 de dolari. Probabilitatea este

p1 .

Cazul 3: deschiztorul are doiul, iar dealerul are asul. Conform celor de mai sus,
deschiztorul nu mrete miza.
Cazul 4: Deschiztorul are doiul, iar dealerul are treiul, caz n care deschiztorul nu poate
ctiga, ci doar pierde 100 dolari cu o probabilitate

p2

dac rspunde pariului

dealerului.
Cazul 5: Deschiztorul are treiul, iar dealerul are asul.
Cazul 6: Deschiztorul are treiul, iar dealerul are doiul.
n final,

Va pierde 100 de dolari cu probabilitatea:


1
Q1= ( p1 q 2+ p1 + p2 )
6
Va ctiga 200 de dolari cu probabilitatea:
1
Q2= ( p1 p 1 q 2+ 32 q 1+ p3 q 1p 3 q2 )
6
Va ctiga 300 de dolari cu probabilitatea:
1
Q 3 = ( p 2 q 1 + q1 p3 q 1 + p3 q 2 )
6

(4.1)

(4.2)

(4.3)

Aadar, valoarea sa ateptat este:


Q1 +2 Q2 +3 Q3 .
42

Dac vrem s reducem i cei 100 de dolari investii iniial, atunci din fiecare valoare vom
scdea 1 (considerm c 100 de dolari este valoarea unitate), astfel c valoarea final
ateptat va fi:
Q1 +2 Q2 +3 Q31 .

(4.4)

Scopul deschiztorului este evident acela de a maximiza aceast valoare.


n continuare, vrem s vedem cum alegerea lui

afecteaz valoarea

ateptat.
Din relaiile (4.1), (4.2), (4.3) i (4.4), obinem relaia:
1
1
1
( p1 q2 p1 p2 ) + 6 ( 2 p1 2 p1 q2 +64 q1 +2 p3 q12 p3 q2 ) + 6 ( 3 p2 q1 +3 q 13 p 3 q1 )1
6
care prin efectuarea calculelor se reduce la forma
1
(3 p 1 q 2+ p 1 p2q 1 p3 q1 + p3 q2 +3 p2 q1 ) .
6
Pentru a ne putea folosi ct mai mult de aceast formul, o vom rescrie:
1
p ( 13 q 2) + p 2 ( 3 q 11 ) + p3 ( q 2q1 ) q1 ]
6[ 1

(4.5)

sau din perspectiva dealerului:


1
q ( 3 p2 p 31 ) +q 2 ( p3 3 p1 ) + ( p 1 p2 ) ] .
6[ 1
Observm c n (4.5) avem o situaie special pentru
valoarea ateptat a deschiztorului este
alege valorile

p1 , p2 , p3 .

1
q1 =q2 = .
3

(4.6)
n aceast situaie

1
, independent de modul n care acesta i
18

Aadar, dac deschiztorul i alege aceste valori, atunci

pentru el devin indiferente alegerile deschiztorului, avnd ctigul estimat de

1
18

orice situaie. De aceea vom numi aceast situaie drept strategia indiferent a
dealerului.
Dac dealerul alege s devieze de la aceast strategie, face o greal ntruct i permite
deschiztorului s obin o valoare ateptat mai bun, poate chiar pozitiv. S
considerm de exemplu urmtorul exemplu, n care dealerul nu blufeaz suficient de des
cu asul, nu rspunde cu doiul destul de des i blufeaz cu asul mai des dect rspunde
cu doiul. Altfel spus, alege o strategie cu

1
q 2< q1 < .
3

Dac deschiztorul identific


43

aceast situaie, pentru a-i maximize valoarea ateptat el nu va rspunde niciodat cu


doiul (din moment ce dealerul nu blufeaz destul de des), va blufa mereu cu asul
(deoarece dealerul nu rspunde cu doiul suficient de des) i nu va paria niciodat cu
treiul (din moment ce dealerul va blufa de mai multe ori dect va rspunde). Strategia sa
se exprim aadar prin

p1=1, p 2=0

p3=0 .

Din relaia (4.6) vedem c n acest caz valoarea ateptat a deschiztorului este
1
[q13 q2 +1 ] .
6
Cum

q 2< q1 <

1
3

1
, putnd chiar
18

, aceast valoare va fi mereu mai mare strict dect

foarte bine s fie pozitiv. De exemplu, pentru

q 2=

1
6

q1 =

1
4

valoarea ateptat e

1
.
24
Pentru alt exemplu, s considerm exemplul n care deschiztorul este un fel de juctor
pasiv, n sensul c nu va paria niciodat cu un trei. Dealerul sesizeaz acest lucru i din
motivele indicate n deschiderea acestui subcapitol alege s blufeze doar n

1
6

din

cazuri. Acest lucru se va dovedi ns greit, cci deschiztorul poate contraataca


nefcnd efectiv nimic. El nu va mri niciodat i va rspunde doar atunci cnd are treiul
p1= p2= p3 =0.

n mn. Strategia sa va fi definit de


obine o valoare ateptat de

Din relaia (4.5) constatm c va

1
, ceea ce este mai bine dect
36

1
.
18

Pentru ultimul exemplu, s presupunem c dealerul a citit Teoria Pokerului i a decis s


blufeze cu asul n o treime din cazuri. Aadar, alege

1
q1 = .
3

Mai tie c dac are doiul

nu poate ctiga dect n faa unui as, astfel c atunci cnd deschiztorul mai adaug
100 de dolari la un pot de 200, dealerul va face ansele de 2 la 1 mpotriva aruncatului,
deci va plti de dou ori i se va arunca o dat. Astfel, se decide asupra lui

q 2=

2
.
3

Din relaia (4.5) vedem acum c valoare ateptat de deschiztor este:

1
1
1
p1 + p 3 .
6
3
3
44

Deschiztorul i poate maximize acum valoare ateptat prin alegerea lui


blufeze niciodat),

p3=1

p1=0

(s nu

(s mreasc miza de fiecare dat cnd are treiul) i s

aleag orice strategie atunci cnd are doiul. Vedem c n acest caz valoarea ateptat
este 0. n alte cuvinte, rspunznd n dou treimi din cazuri cu doiul, dealerul i-a pierdut
1
, pe care l are n mod natural deoarece este ultimul
18

avantajul valorii ateptate de

care acioneaz. Dac cei doi vor schimba rolurile, iar primul va deveni dealer, el poate
acum s termine, pe termen lung, n ctig.
Adar, singura strategie corect a dealerului este s aleag mereu

q1 =q2 =

1
.
3

Vrem acum s analizm situaia i din punctul de vedere al deschiztorului. Din relaia
(4.6) nelegem c un set de

p - valori ce satisfac:
3 p 2 p31=0
p33 p1=0

vor reprezenta o strategie indiferent pentru deschiztor ce i va aduce mereu o valoare


ateptat de

1
( p p ) , indiferent de felul n care dealerul joac. Aadar, deschiztorul
6 1 2

poate alege arbitrar valoarea lui

p3 iar apoi s determine:

1
p 1 = p3
3
.
1
1
p2 = p 3 +
3
3

Prin aceast modalitate, i va asigura o valoare ateptat de:

))

1 1
1
1
1
p 3 p 3 + =
6 3
3
3
18

indiferent de strategia dealerului. Adar, toate aceste strategii reprezint pentru el


strategii optime.

45

Bibliografie
[1]. Berge, C. Topological Games with perfect information;
[2]. Kuhn, H. W. Extensive games and the problem of information;
[3]. Luce , R. D., Raiffa, H. Games and decisions, John Wiley and Sons, New York,
1957;
[4]. Von Neumann, J, Morgenstern, O. Theory of games and economic behavior,
Princenton University Press, 1944;
[5]. McKinsey, J.C., Introduction to the theory of games McGraw Hill Book Co, New
York, 1952;
[6]. Weyl, H. Elementary proof of a Minimax Theorem due to von Neumann;
[7]. Shapley, L. S., Snow, R. N. Basic solutions of discrete games;
[8]. Robinson, J. An iterative method of solving a game, 1951;
[9]. Motzkin, T. S., Raiffa, H., Thompson G. L., The double descriptionmethod;
46

[10]. Sklansky, D., The theory of poker, Two plus two publishing, 1989;
[11]. Swanson, J. Game theory and poker, 2005;
[12]. Yildiz, M. Game theory lecture notes, MIT Course, 2005;
[13]. Shoham Y., Jackson, O. Game theory, Standford, 2013;
[14]. Aumann, R. J., Game theory in the Talmud, 2012;
[15]. Kaminsky M., Hydraulic Rationing, Mathematical Social Sciences, 200;
[16]. Ian, S. A puzzle for pirates, Scientific American, 1999;
[17]. Nash, J. The bargaining problem, Econometrica 18, 1950;
[18]. Zeuthen, F., Problems of monopoly and economic warfare, Routledge and Sons,
Londra, 1930;
[19]. Arrow, K. J. Social choice and individual values, Cowlen Commission Monograph
12, John Wiley and Sons, New York, 1951;
[20]. Nash, J., Shapley, L. S., A simple three-person poker game;
[21]. Preda, V. Teoria jocurilor. Note de curs, Universitatea Bucureti, 2011.

47