Documente Academic
Documente Profesional
Documente Cultură
Elemente de
teoria jocurilor
ANUL II Semestrul IV
1
Cluj-Napoca 2013
Cuprins
TEME DE CONTROL 61
TEME DE CONTROL 84
TEME DE CONTROL 94
2
UNIVERSITATEA „BABE Ş-BOLYAI” CLUJ-NAPOCA
SEMESTRUL: IV
I. Informaţii generale
Telefon: 0264-418653
Fax: 0264-412570
E-mail: anton.muresan@econ.ubbcluj.ro
Anul II Semestrul IV
3
Locul de desfăşurare a cursului: Clădirea Campus, săli etajul II
Descrierea cursului :
4
Materiale bibliografice obligatorii:
1. Blaga P. Muresan A.S., Lupas Al., Matematici aplicate in economie, vol. 2, ed.
Promedia Plus, Cluj-Napoca, 1999
2. Gibbons, R., Game theory for applied economists Princeton Univ. Press,
Prenceton, New Jersey
3. Muresan, A.S., Non cooperative games, Ed. Mega, Cluj-Napoca, 2012
4. Muresan A.S.Blaga P., Matematici aplicate in economie, vol. 2, ed. Transilvania
Press, Cluj-Napoca, 1996
5. Muresan A.S., Cercetari operationale, vol. 1 si 2, lito. UBB, Cluj-Napoca, 1997
Studentii cu dizabilitati:
6
I. Suportul de curs propriu-zis
Modulul 1
Obiective:
c. notiunea de solutie
Rezultate aşteptate:
Obiective:
CONŢINUTUL UNITĂŢII
Există situaţii în care modelele matematice la care se ajunge se prezintă sub forma
unor jocuri matriciale. Asa sunt, de exemplu, acelea in care 2 sau mai
1 (capul) 1 -1
2 (pajura) -1 1
De asemenea, ele pot fi scrise in matricele de castig pentru cei doi jucatori:
H1 1 -1 H2 -1 1
= , =
1
-1 1 -1
Spunem ca fiecare jucator are doua strategii (actiuni, mutari, decizii). In matricea
H1 prima linie reprezinta prima strategie a jucatorului 1, a doua linie reprezinta a
8
doua strategie a jucatorului 1. Daca jucatorul 1 alege strategia 1, inseamna ca
moneda sa arata capul deasupra. Strategia 2 inseamna pajura deasupra. Similar,
prima si a doua second coloana a matricei H1 corespunde respectiv la prima si a
doua strategie a jucatorului 2. In H 2 avem aceleasi situatii, dar pentru jucatorul 2.
Observatia 1.1. Acest ansamblu de “concurs” (competitie) este un joc de doua
persoane cu suma nula (zero). Simplu spunand, un joc este o multime de reguli
in care se precizeaza intregul process de competitie (sau concurs), incluzand
jucatorii, strategiile, si castigurile (rezultatele) dupa fiecare jucare a jocului. Toate
acestea sunt descrise complet.
Observatia 1.2. Datele (elementele) din tabelul de mai sus formeaza o matrice
de castig (payoff matrix a jucatorului 1, adica H1 ). Matricea H 2 este matricea de
castig a jucatorului 2, si avem
t
H1 H 2 O2 ,
9
Jucătorul 2
1 2 3
Jucătorul 1 1 0 -1 1
2 1 0 -1
3 -1 1 0
Avem H1 = H2 si H1 + H 2t = O3 .
Exemplul 1.3. Consideram jocul de doua personae cu suma nula pentru care
matricea de castig este data in urmatorul tabel:
Jucătorul 2
q 0 1 2
p
Jucătorul 1 0 0 1 4
1 -1 2 7
2 -4 1 8
3 -9 -2 7
-9 -2 7
In fiecare din exemplele de mai sus exista doi jucatori, anume jucatorul 1 si
jucatorul 2, si o matrice de castig, H1 (exista de asemenea si matricea H 2 asa ca
H1 + H 2t = 0 ). Fiecare jucator are mai multe strategii. Strategiile jucatorului 1 sunt
Jocuri matriciale
In cele ce urmeaza presupunem ca jucatorul 1 are m strategii si jucatorul 2 are
a a ... a
11 12 1n
a a ... a
A
=
(aij )= 21 22 2n
11
Definitia 1.1. Numim joc matricial jocul care este complet determinat de matricea
A de mai sus.
Sa rezolvam jocul, adica sa gasim solutia (ce castig maxim are jucatorul 1 si ce
startegii sunt alese de ambii jucatori pentru a obtine aceasta) examinam elementele
matricei A .
In acest joc, jucatorul 1 vrea sa obtina un castig aij cat mai mare posibil, in timp ce
jucatorul 2 va face alegerea sa cea mai buna si conduca la o valoare aij cat mai mica
posibil. Interesele celor doi jucatori sunt complet opuse (in conflict).
Daca jucatorul 1 alege strategia i el poate fi sigur ca va obtine cel putin castigul
min a ij .
1j n
max min a ij .
1i m 1 j n
Cu alte cuvinte, daca jucatorul 1 face cea mai buna alegere a sa, ceea ce obtine el
nu poate fi mai mic decat valoarea de mai sus.
Similar, daca jucatorul 2 alege strategia sa j , el va pierde cel mult
max a ij .
1 i m
Dar, jucatorul 2 vrea sa-si minimizeze pierdearea sa, iar pentru asta va incerca sa
sa-si aleaga strategia sa j asa ca sa obtina minimul valorii de mai sus. Anume,
jucatorul 2 poate alege j asa incat pierderea sa sa fie nu mai mare decat
min max a ij .
1j n 1 i m
Asa, daca jucatorul 2 face cea mai buna alegere a sa, castigul pe care il obtine
jucatorul 1 nu poate fi mai mare decat valoarea de mai sus.
Am vazut ca jucatorul 1 poate alege strategia i care sa-I asigure un castig care sa
fie cel putin
12
v 1 max min a ij ,
1i m 1 j n
v 2 min max a ij .
1j n 1 i m
a
ij £ max aij , i = 1, m
1£ j £n
Deci inegalitatea
min a ij max a ij
1 j n 1 i m
are loc, pentru fiecare i = , si fiecare j = .
1, m 1, n
adica,
min a ij v2.
1 j n
Observatia 1.6. Valoarea v este valoarea comuna a acelora date in (3) si (5).
Valoarea jocului din Exemplul 1.3 este v = 0 .
14
Daca egalitatea (7) are loc, atunci exista un i* si un j* astfel incat
min a * j = max min aij =
v,
i 1£i£m 1£ j £n
1£ j £n
si
max a * min max aij = v.
1£ j £n 1£i £m
=
1£i£m ij
Deci
min a * j = max * .
a
i ij
1£ j £n 1£i£m
a
1£ j £n i j i j
1£i £m
ij
Astfel
max a = a
*
= v = min a *
*
* .
1£i £m ij i j 1£ j £n i j
(solutia jocului) este valoarea jocului. Cand jucatorul 1 isi mentine strategia sa
optimala i* , el se poate astepta sa-si creasca castigul sau daca jucatorul 2 se
departeaza de la startegia sa optimala j* . Similar, daca jucatorul 2 isi mentine
strategia sa optimala j* , castigul jucatorului 1 poate descreste daca el se
departeaza de la strategia sa optimala i* . Astfel, daca jocul are un punct sa
(i* , j* ) atunci egalitatea (7) are loc si a = v .
i*j*
Observatia 1.8. Un joc matriceal poate avea mai mult decat un punct sa in
startegii pure. Totusi, castigurile la diferitele puncte sa sunt egale,. Valoarea lor
comuna fiind valoarea jocului.
15
Exemplul 1.4. Consideram jocul matrieal cu matricea de castig
4 3 6 2
A= 1 2 0 0
6 7
5 5
Cum v1 = v2 = 5 avem punct sa in satrategii pure. Este usor de verificat ca (3,1) si (3,
4) sunt ambele puncte sa in strategii pure pentru ca
a31 a34 v 5.
Observatia 1.9. Daca jocul matricial are un punct sa in startegii pure (i* , j* ) ,
atunci el este foarte usor de gasit. Realmente, prin Definitia 1.3 a unui astfel de
punct sa in startegii pure (8), valoarea este un element din matricea de castig
ai * j *
A = (aij ) care este in acelasi timp minimul din linia sa si maximul din coloana sa.
In Exemplul 1.3, (1,1) este un punct sa in strategii pure al jocului deoarecei a11 = 0
este cel mai mic element din prima linie si in acelasi timp este cele mai mare
element din prima coloana.
In Exemplul 1.4 a31 = a34 = 5 sunt doua elemente cu cea mai mica valoare in linia a
treia si in acelasi timp cele mai mari din prima si a patra coloana, respective.
Un joc matricial poate avea mai multe puncte sa in strategii pure. In acest caz
putem demonstra urmatorul rezultat:
16
Lema 1.2. Fie (i* , j* ) si (i** , j** ) puncte sa in strategii pure ale unui joc
matricial. Atunci (i* , j** ) si (i** , j* ) sunt de asemnea puncte sa in strategii pure si
valorile la toate aceste puncte sa sunt egale, adica
ai * j* = ai ** j ** = ai * j ** = ai ** j * .
i,j i,j
Demonstratie. Dovedim ca este un punct sa in startegii pure. Faptul ca
este un punct sa in startegii pure se face intr-un mod similar.
Deoarece (i* , j* ) este un punct sa in strategii pure avem
aij* £ ai* j * £ ai* j
pentru toti i=1, si toti j=1,n . Deoarece (i** , j** ) este un punct sa in strategii
m
pure avem
aij ** £ ai** j** £ ai** j
care dovedesc (9). Prin (9) si prin inegalitatile de mai sus avem
aij * £ ai* j** £ ai* j
pentru toti i=1,m si toti j=1,n . Deci (i* , j** ) este un punct sa in strategii pure.
Din aceasta lema rezulta ca un joc matricial cu puncte sa in strategii pure are
urmatoarele proprietati:
- interschimarea sau proprietatea rectangulara a punctelor sa in strategii pure,
- egalitatea valorilor la toate punctele sa in startegii pure.
Exemplul 1.5. Jocul cu matricea de castig
3 0 -5
A=-7-1 4
1
2 1
Exemplul 1.6. Perechea (3, 3) este un punct sa in strategii pure pentru jocul ca
matricea de castig
17
0 -1 -1
A=1 0 -1
1 0
1
Avem v = 0 .
Exemplul 1.7. Perechea (2, 3) este un punct sa in strategii pure pentru jocul cu
matricea de castig
2 -3 -1 4
A= 1 2 0 1
-2 3 -1 -2
are patru puncte sa in strategii pure deoarece avem (vezi Lema 1.2)
a12 = a13 = a22 = a23 = 1 = v.
si v2 min(14, 9, 8) = 8.
=
18
Unitatea 2
Obiective:
CONTINUTUL UNITǍTII
asteptat
min XA j u.
1j n
∑aij xi ³ u, j = 1.n
i =1
cu
m
∑ xi =1 xi ³ 0, i = 1, m.
i=1
19
∑aij xi, ³ 1, j = 1, n
1
∑ xi, =
u
xi, ³ 0, i = 1, m
min f x1 x2 xm
a ij x i 1, j
i 1
xi 0, i
∑aij y j £ w, i = 1.m
j=1
unde
m
∑yj =1 y j ³ 0, j = 1, n,
j=1
Notam y j / w = y ,j , j = 1, n .
20
max g y 1 y2 yn
a ij yj 1, i
j 1
yj 0, j .
Astfel problema gasirii solutiei unui joc matricial este este echivalenta cu
problema rezolvarii unei perechi de probleme de programare liniara duale.
Observatia 1.28. Datorita teoremei dualitatii, bine cunoscuta in programarea
liniara, este suficient sa se rezolve una singura dintre acele probleme de mai sus.
vom obtine
5 3 4
A= 4 5 3
1
5 9
5 y , + 3 y ,+ 4 y
,
£ 1
1 2 3
4 y , + 5 y ,+ 3 y , £ 1
1 2 3
, ,
5y, +y +9y £ 1
1 2 3
, ,
y, ,y ,y ³ 0
1 2 3
21
Unitatea 3
Joc necooperativ
Obiective:
CONŢINUTUL UNITĂŢII
22
n) şi pentru i fixat si = 1, mi ( si variază de la 1 la mi ). Luând câte o strategie a
fiecărui jucător se obţine o situaţie (strategie) a jocului s = (s1 ,..., sn ), element
al produsului cartezian S = S1 x...xS n = P Si .
iÎI
în care I şi Si sunt mulţimi (secţiuni) de numere naturale, iar H i = H i (s) sunt funcţii
reale definite pe mulţimea S , s Î S , S = P Si .
iÎI
H (2,1) -1 1
1
H1 (2,2)
s ... sn H ... Hn
1 1
s1 s2 H1 H2
1 1 1 -1
1 2 -1 1
2 1 -1 1
2 2 1 -1
24
câ ştig negativ) permanent. Situaţie similară s-ar produce dacă jucătorul 1 ar aplica
permanent strategia a doua.
s = (s1 , s2 ),
Din cele stabilite rezultă că în orice situaţie unul dintre jucători are o altă
situaţie preferată s', faţă de cea existentă s în acel moment, la care se poate ajunge
modificând numai strategia juc ătorului cu altă preferinţă:
1 2
(1,1) (1,2)
(1,2) (2,2)
(2,1) (1,1)
(2,2) (2,1)
totalitatea jocurilor jucate, pentru fiecare jucător, sau, ceea ce este acelaşi lucru, de
a asigura valoarea medie cea mai mare posibilă a câ ştigului pentru fiecare jucător.
P1=P2´P3 =
= p p ,p p ,p p ,p p ,p p ,p p ,p p ,p p ,p p ,p p ,p p ,p p
[ 21 31 21 32 21 33 21 34 22 31 22 32 22 33 22 34 23 31 23 32 23 33 23 34 ]
P2 =P1´P3=
= p p ,p p ,p p ,p p ,p p ,p p ,p p ,p p
[ 11 31 11 32 11 33 11 34 12 31 12 32 12 33 12 34 ]
P3=P1´P2=
= p p ,p p ,p p ,p p ,p p ,p p .
[ 11 21 11 22 11 23 12 21 12 22 12 23 ]
Cu notaţiile introduse dăm următoarea definiţie:
F F
1 2
P p p P p p
2 21 22 1 11 12
P1 P2
p11 1 -1 p -1 1
21
p -1 1 p22 1 -1
12
26
p11 + p12 = 1, p21 + p22 = 1,
F1 = ( p21 - p22 ) p11 + (- p21 + p22 )p12 ,
F2 = (- p11 + p12 ) p21 + ( p11 - p12 )p22 .
[ ] (
P10 = p110 , p120 pentru care F10 = F1 P10 , P2 > F1 = F1 (P1 , P2 ), unde )
F10 = (p21 - p22 )p110 + (- p21 + p22 )p120 şi nu există nici un vector de probabilitate
P20 = F2
[ ]
= p210 , p220 pentru care F20 (P1, P20 )> F2 = F2 (P1 , P2 ), unde
F20 = (- p11 + p12 )p210 + (p11 - p12 )p220 .
Pi H i PiT = Pi FTi ,
adică
Pi (H i PiT - F T
i )= 0,
unde
P ³ 0, i = 1, n şi H PT -F T £0.
i i i
i
27
Dacă componenta j a vectorului H i PiT - F Ti ar fi pozitivă, atunci prin
înmulţirea la stânga cu vectorul Pi* cu toate componentele egale cu 0, exceptând
componenta j egală cu 1, ar rezulta Fi* = Pi* H i PiT > Fi , contrar definiţiei 1 conform
căreia F este valoarea maximă a expresiei P* H PT pentru P fixat.
i i i i i
si
unde si0 este o strategie oarecare. Aici cu H i (si )PiT , respectiv H i (si0 )PiT am
notat elementul cu indice de linie si , respectiv si0 al matricei H i PiT .
Introducând o matrice linie Ti cu variabile independente nenegative tis , si = 1, mi i
[
Ti = ti1 ,..., timi , ]
pentru fiecae jucător i, se poate scrie o ecuaţie matriceală echivalentă cu inecuaţia
H i PT - F T
i £0; FTi - H i PT = TiT .
i i
unde i= .
1, n
Observaţia 1. Valorile reale necunoscute Fi se consideră scrise ca
,
diferenţă a două valori nenegative F şi F ,,, F =F ,
- F ,, pentru a avea toate
i i ii i
necunoscutele nenegative.
unde
P1 = [p11 , p12 ], P2 = [p21 , p22 ],
P1 = P2, P2 = P1,
J1 = J2 = [1,1]
T1 = [t 11 , t12 ], T2 = [t 21 , t22 ],
H1 = 1 -1 H 2 -1 1
, =
-1 1 1 -1
[ ] [
F1 = F1' - F1', F1' - F1' , F2 = F2' - F2', F2' - F2' , ]
unde
29
- p11 + p12 - F2' + F2' + t21 = 0,
p11 - p12 - F2' + F2' + t22 = 0
Rezolvând acest sistem prin metoda elimin ării se obţine soluţia găsită cu ocazia
rezolvării problemei din exemplul 1, punctul 2. prin procedeul particular.
p t + p t = 0 Û p11t11 = 0, p t = 0,
11 11 12 12 12 12
p t + p t = 0 Û p21t21 = 0, p22t22 = 0,
21 21 22 22
Un astfel de joc permite o rezolvare mai simplă. Problema formulată prin teorema
P =P
1 2
P1 J1T = 1, (2)
FT2 - H2P1T = T2T
30
P1T1T = 0 , P2T2T = 0.
p =0
1s1
p
21
' '
+ t12 = 0
- p21 + p22 - F1 + F1
p +p
=
11 12
1,
(2')
1
S1 = -1 -11100.
-1 1 -11010
0 0 0 0 0 0 0
1 1 0 0 0 0 1
S 2 = -1 1 -11100
1 -1 -11010
0 0 0 0 0 0 0
2 2
pentru t11 = t12 = t21 = t22 = 0 şi F1' = F1 '= F2'=F2 '
= 0 şi prin urmare F1 = F2 = 0 .
32
Având în vedere c ă orice egalitate este echivalentă cu două inegalităţi,
sistemele (1), (2) şi (3) din punctul 4. pot fi scrise în următoarea formă:
H1P2T - F1T £ 0
- J2P2T £ -1 (4)
J PT £1,
2 2
unde F1 conţine ca elemente una şi aceiaşi valoare F1 , iar F2 conţine una şi aceiaşi
valoare - F2 ,
Aceste valori pot fi considerate şi ca alori minimax (minumul unor valori maxime)
obţinute prin minimizarea funcţiei F1 , (maximul este infinit), respectiv maximin
(maximul unor valori minime) obţinute prin maximizarea funcţiei - F2 = F1
(minimul este infinit).
Adăugând sistemului (4) func ţia F1 = F1' - F1 ' iar sistemului (5)
funcţia - F2 = -F2' + F2 ' rezultă două probleme de programare liniară, una duala
celeilalte. Desigur se poate folosi notaţia simplificată F = F1 = -F2 şi considerăm că
se determină F = MIN prin sistemul (4) şi F = MAX prin sistemul (5). Astfel, cel
puţin o soluţie prticulară a jocului antagonist se poate obţine rezolvând numai unul
dintre sistemele (4) şi (5). Jocul antagonist poate avea însă, ca joc bimatriceal, şi
alte soluţii, rezultând din rezolvarea sistemului (1), (2) şi (3) din punctul 4.
punând - F2 = F1 = F Având în vedere simetria celor dou ă sisteme (4) şi (5) şi
notând F = F1 = -F2 , rezultă următoarea teoremă cu privire la jocurile antagoniste
(teorema von Neumann-Morgenstern).
33
min max F (P1 , P2 ) = max min F (P1 , P2 ).
P P P P
2 1 1 2
1 1 0 0 0 0 1
-1 -1
1 1 1 0 0
-1
-1 1 1 0 1 0
0 0 1 -1 0 0 0
Aplicatii economice
Obiective:
CONŢINUTUL UNITĂŢII
Aplicatii in economie
In cele ce urmeaza dam ceva aplicatii ale jocurilor in economic. Vom evalua
functia de castig pentru fiecare jucator, care va fi dependenta de strategiile
jucatorilor. Aici multimile strategiilor vor fi intervale ale axei reale.
1. Modelul Cournot al duopolului
Ci (qi ) = cqi . Adica, nu exista costuri fixe si costul marginal este constant c , unde
vom considera ca c < a . Presupunem ca firmele isi aleg cantitatile lor simultan.
Mai inati vom translata problema intr-un joc “conti nuu”. Pentru aceasta vom
specifica: jucatorii din acest joc (cele doua firme), strategiile posibile pentru
fiecare jucator (diferitele cantitati ce le pot produce), castigurile pe care le vor
primi fiecare jucator pentru fiecare combinatie de strategii ce pot fi alese de
jucatori (castigul firmei este profitul sau). Vom presupune ca outputul este
35
continuuu divizibil si outputuri negayive nu pot fi. Astfel, spatiul strategiilor
fiecarei firme este Si = [0, ¥) , numerele reale nenegative, in care caz o tipica
strategie si este o cantitate aleasa, qi ³ 0 . Deoarece P(Q) = 0 pentru Q ³ a , nici
o firma nu va produce o cantitate qi > a . Castigul firmei i , o functie de
strategiile alese de ea si de cealalta firma, profitul sau, poate fi scris ca
pi (qi , q j ) = qi [a - (qi + q j ) - c].
Cum stim, un punct de echilibru (echilibrul Nash) este perechea (q1* , q2* )
unde qi* ,
pentru fiecare firma i , rezolva problema de optimizare
max p (q , q* )j = max q [ - (q + q* ) -ij c].
0£qi <¥ i 0£q <¥ i
i
a i
1 2
Fiecare firma va dori, desigur, sa fie un monopol in aceasta piata, in care caz ea va
vrea sa aleaga cantitatea qi care sa maximizeze pi (qi , 0) = qi (a - qi - c) , si in
consecinta ea va produce cantitatea monopolista qm =(a-c)/2 , si va obtine
profitul monopolistic π(qm ,0) = (a-c)2 /4.
Dandu-se ca exista doua firme, profitul agregat pentru duopol va fi maximizat prin
luarea cantitatii agregate q1 + q2 egala cu cantitatea monopolista qm , care va apare
daca qi =qm /2 pentru fiecare i , de exemplu. Problema cu acest aranjament este ca
fiecare firma are tendinta de a devia: deoareca cantitatea monopolista este mica,
pretul asociat P(qm ) este inalt, si la acest pret fiecrae firma va dori sa-si mareasca a
ei cantitate, in speta datorita faptului ca o asa crestere a productiei conduce la un
pret care curata piata mai mic. Sa vedem aceasta , folosim (48) sa aratam ca qm /2
nu exista un cel mai bun raspuns al firmei 2 la alegerea qm /2 a firmei 1. In
36
echilibrul Cournot, din contra, cantitatea agregata este mare, asa ca pretul asociat
este scazut, asa ca tentatia de a creste outputul este redusa.
Observatia 1.37.
O alta rezolvare, inafara de cea algebrica, pentru echilibrul Nash in jocul Cournot
se poate lua un procedeu grafic folosind cel mai bun raspuns pentru o firma:
1
R2 (q1 ) = (a - q1 - c) -- cel mai bun raspuns al firmei 2, si
2
1
R1 (q2 ) = (a - q2 - c) -- cel mai bun raspuns al firmei 1.
2
Acest model al lui Bertrand este bazat pe faptul ca firmele acum isi aleg preturile,
altfel decat la modelul lui Cournot. Modelul lui Bertrand este un joc diferit decat
modelul jocului lui Cournot deoarece spatial strategiilor este diferit si functiile de
castig sunt diferite. Astfel obtinem un alt punct de echilibru, dar conceptual de
echilibru folosit este tot de echilibru Nash definit in sectiunile precedente.
Consideram cazul produselor diferentiate. Daca firmele 1 si 2 aleg preturile p1 and
p2 , respectiv, cantitatea ce consumatorii o cer de la firma i este
qi ( pi , p j ) = a - pi + bp j ,
unde b > 0 reflecta extinderea la care produsul firmei i este un substitut pentru
produsul firmei j. Aceasta o nerealista functie de cerere pentru ca cererea pentru
produl firmei i este positiva chiar cand firma i isi alege un pret arbitrar de inalt, cu
conditia ca firma j de asemenea isi alege un pret destul de inalt. Presupunem ca sunt
costuri de productie constante, ca sunt costurile marginale constante, la c , unde c <
a , si ca firmele actioneaza simultan (isi aleg preturile lor). Translatam problema
economica intr-un joc necooperativ. Exista din nou doi jucatori. In acest moment
totusi, strategiile posibile la fiecare firma sunt preturile diferite care se pot schimba,
altfel decat diferitele cantitati ce se pot produce. Vom presupune ca preturile
negative nu sunt admisibile, dar ca orice pret nenegativ poate fi ales – nu exista nici
o restrictie la preturi determinate de monede. Astfel la fiecare firma spatiul
strategiilor poate fi din nou reprezentat ca Si = [0, ¥) , si o strategie tipica si esste
acum un pret, pi ³ 0 .
37
Vom presupune din nou ca functia de castig pentru fircare firma este
tocmai profitul. Profitul firmei i cand este ales pretul pi si rivala sa
alege pretul pj este
i p i , p jq i p i , p j p i ca p i bp j p i c.
0£ pi <¥ 0£ pi <¥
Deci, daca perechea de preturi ( p* , p* ) este sa fie un echilibru Nash, pretul ales de
1 2
3 4 10
6 5 6
-9 -6 -3 -6
t
-5 -4 H1+H
H2= -3 - 5 deoarece 2 =0.
-8 -10
-1 -6
Jucătorul 1 are 4 strategii deoarece matricea A are 4 linii. Jucătorul 2 are 3 strategii deoarece
matricea A are 3 coloane.
38
2. Doi jucători scriu, independent , unul din numerele 1, 2 sau 3. Dacă ei au scris acelaşi număr atunci
jucătorul 1 plăteşte jucătorului 2 un număr de unităţi monetare egal cu numărul scris de primul
jucător. În caz contrar, jucătorul 2 plăteşte jucătorului 1 numărul de unităţi monetare egal
cu numărul pe care jucătorul 1 l-a scris. Care este matricea de câ ştig a acestui joc?
Soluţie. Este uşor de constatat că matricea de câ ştig a jucătorului 1 este:
-1 1 1
A 2 -2 2
=
33-3
Cum v1 = v2 = 5 rezultă că primul joc are punct şa în strategii pure. Este usor de verificat că (2,2) şi
4 3
X × A ×Y t = ∑ ∑aij xi y j = 9x1 y1 + 3x1 y2 + x1 y3 + 6x2 + 5x2 y2 +
y1
i= j =1
1
39
Pentru al doilea joc, fie X = (x1 , x2 , x3 ) şi Y = (y1 , y2 , y3 ) strategiile mixte ale jucătorului
1, respectiv 2. Atunci câ ştigul aşteptat al jucătorului 1 este:
3 3
X × A ×Y t = ∑aij xi y j = -x1 y1 + x1 y2 + x1 y3 + 2x2 y1 - 2x2 y2 +
∑
i j =1
=1
5. Folosind eliminarea iterată a strategiilor strict dominate rezolvaţi jocul cu matricea de câ ştig:
0 -1 -1
A=1 0 -1
1 0
1
Soluţie. În matricea A, elementele primei linii sunt mai mici decât elementele corespunz ătoare
din linia a 3-a. În consecinţă, jucătorul 1 niciodată nu va folosi prima sa strategie. Prima linie va
fi eliminată. Obţinem astfel matricea de câ ştig redusă:
1 0 -1
A'= 1
1 0
Acum, în această matrice A' fiecare element al primei coloane este mai mare decât elementele
corespunzătoare ale coloanei a 3-a. În consecinţă jucătorul 2 nu va folosi niciodată prima sa
strategie, deci prima coloană poate fi eliminată. Aşa obţinem matricea redusă:
0 -1
A ''=
1 0
Similar obţinem succesiv:
Astfel strategiile optimale (pure) sunt X * = (0,0,1), Y * = (0,0,1) şi valoarea jocului este v = 0.
a+d-b-c a+ d - b - a+d-b-c
c
a) Obţinem:
p* = 3 -1 = 1 , q* = 3-0 =3 , v = 2×3-0×1 = 3 ,
2 +3-0-1 2 2 +3-0-1 4 2+3-0-1 2
40
1 1 Y*= 3 1 v=3
Deci X
* = , , , , .
2 2 4 4 2
b) Avem:
c) Obţinem:
p *= 1- (-1) = 1, q *
= 1, v = 1×1 - (-1)× (-1) = 0,
x2 a - b y2 c-a
Williams).
a) Obţinem x1 + x2= 1, x1 = 1 - 3 = 1, deci x1 = x2 , x1 = x2 = 1 , respectiv
x2 2-0
2
2
y1 + y2 = 1, y1 = 3 - 0 = 3, deci 3 y2 = y1 , y1 = 3 , y =1 .
y2 1-24 4
Astfel X
* 1 1 Y*= 3 1
= , , , şi atunci
2 2 4 4
2 0 3 3
t 1 1 4 = 1, 1
2 =3
v*
*
=X × A×Y
*
= , ×
2 2 1 3 13 2 22
4 2
b) Avem x1 + x2 = 1, x1 = 2 - 0 = 2, deci x1 = 2x2 , x1 = 2 , x2 = 1 , respectiv
x
2
1-23 3
+ y2 = y = 0-2 =2 =1 *
X =Y * 2 1
y1 1, , y1 , y2 . Astfel = , , şi
1
y2 2 -1 3 3 3 3
2 2
t
2 1 1 2 4 4 4
v * *
=X × A×Y *
= , 3 = , 3 =
3 2 0 13 13
3
3
3 3
4
1
c) Avem x1 + x2 = 1, x1 = -1-1 = 1 deci x1 = x2 , x1 = x2 =1 , respectiv
x2 1- (-1) 2
y 1- (-1) 1 1 1
y1 + y2 = 1, = = 1, y1 = y2 , y1 = y2 = . Astfel X *
=Y *
= , , şi
1
y2 -1 -1 2 2 2
*111-1 1
0. 2
1
v= ,2 2 -1 1 × 2 =
8. Rezolvaţi problema 6 cu metoda grafică descrisă pentru jocurile matriceale de tip 2 ´ n respectiv m ´ 2 .
Soluţie. Fie X = (x,1 - x), y = (y,1 - y) respectiv, strategiile mixte pentru jucătorii 1 şi 2. Trasăm
liniile drepte ac, bd şi ab, cd respectiv în cele două figuri (sistemele de coordonate) în planele xOv
respectiv yOv. Apoi determinăm coordonatele punctelor de intersecţie ale acestor linii drepte.
2 0
a) Matricea de câ ştig este A = , astfel avem liniile drepte care unesc punctele de coordonate
1 3
(1,2), (0,1) respectiv (1,0), (0,3). Ecuaţiile acestor drepte sunt:
x -1 = v - 2 respectiv x -1 = v - 0
0-1 1-2 0-1 3-0
Sau
v = x + 1 respectiv v = -3x + 3
2 2 2 2
3
a jucătorului 1 iar v = este valoarea jocului.Pentru strategia optimală a jucătorului 2 considerăm
2
liniile drepte ce unesc punctele de coordonate (1,2), (0,1) respectiv (1,1), (0,3). Ecuaţiile
acestor drepte sunt:
y -1 = v - 2 respectiv y -1 = v -1
0-1 0-2 0-1 3-1
Sau
v = 2 y respectiv v = -2 y + 3
3 3 3 1
Punctul de intersecţie are coordonatele y = ,v= . Astfel Y * = , este strategia optimală a
4 2 4 4
3
jucătorului 2, iar v = este valoarea jocului.
2
42
b) Procedând ca şi în cazul punctului a) găsim valorile x = 2 , y = 2 , v = 4 aşa încât strategiile
3 3 3
2 1 4
optimale sunt X* =Y *
= , şi valoarea jocului este v= .
3 3 3
1 1 1 1
c) Găsim valorile x = , y= , v = 0, deci X *
=Y *
= , sunt strategiile optimale, iar
2 2 2 2
valoarea jocului este v = 0 .
9. Folosind metoda grafică, rezolvaţi jocurile matriceale cu matricele de câ ştig:
2 9 6 3 5 6
b) A = 9 4
a) A = ,
8
3 7 5
1 8
Soluţie.
a) Fie X = (x,1 - x) o strategie mixtă a jucătorului 1. Liniile drepte ae; df; cg; dh; care unesc
punctele: (1,2), (0,8); (1,9), (0,3); (1,6), (0,7); (1,3), (0,5) au ecuaţiile:
;
x -1 = v - 2 x -1 = v - 9 x -1 = v - 6 x -1 = v - 3 0-1 8-2
; ; .
0-1 3-9 0-1 7-6 0-1 5-3
x -1 = v - 9 respectiv x -1 = v - 3 ,
0-1 3-9 0-1 5-3
sau v = -2x + 5 respectiv v = 6x + 3.
1 9
Coordonatele punctului de intersecţie (maximul minimelor) sunt x = ,v= .
4 2
Astfel X
* 1 3 v=9
= , este strategia optimală a jucătorului 1, iar valoarea jocului este .
4 4 2
y1 + y2 + y3 + y4 = 1 şi X * × A ×Y t = v = 9 .
2
Ajungem la sistemul de ecuaţii liniare
y1 + y 2 + y 3 + y 4 = 1
26 y1 + 18 y 2 + 27 y3 + 18 y4 = 18
yj ³0 j = 1,4
care are soluţia y1 = 0, y3 = 0, y2 = q, y = 1 - q, q Î [0,1].
4
1 1 3
Se consideră că q = , deci strategia optimală a jucătorului 2 este Y *
= 0, ,0, .
4 4 4
43
b) Fie Y = (y,1 - y) o strategie mixtă pentru jucătorul 2. Liniile drepte ab, cd, ef care unesc
punctele (1,5), (0,6); (1,9), (0,4); (1,1), (0,8) au ecuaţiile
y -1 = v - 5 y -1 = v - 9 y -1 = v -1
, , .
Punctul de intersecţie (minimul maximelor este acelaşi pentru oricare două drepte) se obţine
din sistemul de ecuaţii (format cu ultimele două, pentru minimul maximelor)
v = 5 y + 4, v = -7 y + 8.
1 17 1 2
Astfel avem y = , v= şi atunci Y *
= , este strategia optimală pentru jucătorul al doilea
3
3 3 3
iar valoarea jocului este v = 17 .
3
Strategia mixtă a jucătorului 1 are forma X = (x , x , x ) şi se determină aşa încât x + x + x = 1
1 2 3 1 2 3
*t 17
şi X × A ×Y =v= .
3
Ajungem la sistemul de ecuaţii liniare
x1 + x2 + x3 = 1
17x1 +17 x2 +17 x3 = 17
xi ³ 0 i = 1,3
7 5
Se constată că strategia optimală a jucătorului 1 este X *
= 0, , .
12 12
6 0 3
A=8 -2 3.
6
4 5
Soluţie. Folosim metoda descrisă pentru jocurile matriceale de forma 3x3.
X × A·1 = 6x1 + 8x2 + 4x3 , X × A·2 = -2x2 + 6x3 , X × A·3 = 3x1 + 3x2 + 5x3 .
Ecuaţia liniei X × A·1 = X × A·2 este 6x1 + 10x2 - 2x3 = 0.
Ecuaţia liniei X × A·2 = X × A·3 este - 2x1 + 6x3 = 3x1 + 3x2 + 5x3 , sau 3x1 + 5x2 - x3 = 0, adică
2x1 + 6x3 = 5.
44
Ecuaţia liniei X × A·3 = X × A·1 este
3x1 + 3x2 + 5x3 = 6x1 + 8x2 + 4x3 , sau 3x1 + 5x2 - x3 = 0, adică 2x1 + 6x3 = 5
Regiunea R1 , în care min X × A· j = X ×A·1 se determină din inegalităţile X×A·1 £X×A·2
1£ j £3
1 5 1 3 (0,0,1)
Astfel regiunea R1 , este delimitată de punctele 0, , ,0, şi
6 6 4 4
14
15 1 3
Întrucât X × A = , X×A =9, X×A (0,0,1) = 4 constatăm că valoarea maximă
·1
0, ,
3 ·1
,0,
2 ·1
4
66 4
este 14 , max = 14 .
3 3
Regiunea R2 , în care min X × A× j = X ×A×2 se determină din inegalităţile X×A×2 £ X×A12
1£ j £3
1 5 1 3
Astfel regiunea R2 , este delimitată de punctele (1,0,0), (0,1,0), 0, , , ,0, .
6 6 4 4
1
15 3
Întrucât X × A (1,0,0) = 0, X × A (0,1,0) = -2, X × A = 14, X×A = 9, constatăm
×2 ×2 ×2
0, ,
3 ×2
4
,0,
2
66 4
că valoarea maximă este 14 , max = 14 .
3 3
Regiunea R3 , în care min X × A× j = X ×A×3 se determină din inegalităţile X×A×3 £ X×A×1
1£ j £3
14
14 , max = .
33
45
= min 14, 14 ,14 =14 .
3 3 3 3
=1 5
Strategia optimală a jucătorului 1, pentru care se obţine valoarea jucătorului este
X *
0, , .
6 6
Pentru jucătorul 2 fie Y = (y1 , y2 , y3 ) o strategie mixtă. Calculăm
3
A Y t = 6 y + 3y , A Y t = 8 y - 2 y2 + 3
, A =4y +6y 2+ 5 y .
3y Yt
1× 1 2× 1 3× 1 3
care ne dau y1 - y2 £ 0 şi y1 - y2 ³1 .
2
Întrucât aceste inegalit ăţi se contrazic rezultă că regiunea T1 , este mulţimea vidă, T1 = f.
A Y t ³ A Y t , care ne dau y - y ³ 0 şi y - y ³ 1 .
2 1 2
2× 3× 1
3
1 2 1 1 1
Rămâne doar y1 - y2 ³ . Regiunea T2 este delimitată de punctele (1,0,0), , ,0 , ,0 .
3 3 3 3 3
2
Întrucât A Y t (1,0,0 ) =8, A 21
=14 , A 1
= 14 , constatăm că valoarea minimă este
Yt Yt
2× 2×
, ,0 32× ,0, 3
3 3 3
14
14 , min = .
33
Regiunea T , în care max A Y t = A Y t , se determină din inegalităţile A Y t ³ A şi A Y t ³ A ,
Y t Yt
3 1£i£3 i× 3× 3× 1× 3× 2×
care ne dau y1 - y2 £1 şi y1 - y2 £1 .
2 3
Rămâne doar y1 - y2 £ 1 .
3
2 1 1 2
Regiunea T3 este delimitată de punctele , ,0 , (0,1,0), (0,0,1), ,0, .
3 3 3 3
=14 = 6, = 5, A Y t =14
t 21 1
Întrucât A Y , AYt (0,1,0) AY t (0,0,1) 2
, constatăm că
3×
, ,0
3 3× 3× 3×
,0,
3
33 3 3
14 14
valoarea minimă este , v= .
3 3
Acum valoarea jocului v este dată de relaţia
46
v = min max A Y t = max min A Y t , min A Y t , max A Y t = max 14 , 14 =14.
X ÎS 3 3 3
i× i× i× i×
YÎS3 IT1 X ÎS3 IT2 X ÎS3 IT3
3 1£i£3
2 1 1 2
Strategiile optimale ale jucătorului 2 sunt Y1* = , ,0 , Y2* = ,0, . Astfel soluţia (strategia
3 3 3 3
14
ucătorul 2 este Y * = lY1* + (1 - l )Y2* cu l Î [0,1], iar valoarea jocului v = .3
0 2 1 0 1
5 1 0 1 1
1 0 0
1 0
asupra căreia aplicăm ARS. Obţinem succesiv
1 1
0
0 2 1 0 1 1 2 0 2
1 1 1 1 1 1
1 0 ®1 0 -
5 5 5 10 5 10
0
4 -1 -1 -2 -1 - 3
5 0 5 5 0 0 5 5 5
2 6
47
În plus y3' = y4' = 0, deci y3 = y4 = 0.
De asemenea x1' = 2 aşa încât x1 = w × x1' = 2 , x2' = 1 , dec x2 =1
i
5 3 5 3
X =2 * 1
1 5
În concluzie strategiile optimale ale celor doi jucători sunt , ,
Y* = , , iar valoarea
3 3 6 6
5
jocului este w = v = .
3
a) În cazul al doilea problema de programare liniară este:
[max]g = y1' + y2' + y3' + y4'
6 y1' + 3 y3' + 5 y4' £ 1
8 y1' + 2 y2' + 3y3' + 9 y4' £ 1
4 y1' + 6 y2' + 5 y3' + 4 y4' £ 1
y 'j ³ 0 , j = 1,4
6 0 3 5 1 0 0 1
8 -2 3 9 0 1 0 1
4 6 5 4 0 0 1 1
.
1 1 1 1 0 0 0 0
3 3 -7 1 - 3 1 - 23 1 - 9 -3 1
0
2 4 4 4 0 4 0 0 0 14 14 14 7
1
- 1 3 9
0
1
0
1
1 0
1 31
0
3 1 1
4 8 8 8 8 ® 2 14 28 28 7
7 -1 0 - 1 1 1 - 1 0 - 1 1 1
07 2 2 2 2 2 1 0 1 14 14 7 14
5 5 -1 0 - 1 -1 - 1 0 - 1 - 5 - 3
0 0 0 0 0
4 8 8 8 8 28 28 28 14
Astfel avem g max = 3 = 1 , deci w = 14 respectiv
1 w 3
4
y1, = 1 , y2, = 1 , y3, = 0, y4, = 0, y5, = 1 , y 6, = 0, y7, = 0, aşa încât:
7 14 7
y1 = w × y1, = 2 , y2 = 1 , y3 = 0, y4 = 0, y5 = 2 , y6 = 0, y7 = 0. În concluzie o strategie optimală
3 3 3
2 1 14
a jucătorului 2 este Y *
= , ,0,0 , iar valoarea jocului este w =v= . De asemenea avem
3 3 3
48
x1, = 0, x2, = 1 , x3, = 5 , x4, = 0, x5, = 0, x6, = 0, x7, = 1 , aşa încât
2 28 28
8
x1 = w × x1, = 0, x2 = 1 , x3 = 5 , x4 = 0, x5 = 0, x6 = 0, x7 = 1 . Strategia optimală a jucătorului 1
6 6 6
1 5
este X
*
= 0, , . Observăm că există şi o altă soluţie pentru că în ultima linie a matricei precedente
6 6
este un element egal cu 0 într-o coloană neredusă. Obţinem
-2 -9 -3 1
3
0 0 0 14 1 14 14 7
-1 0 16 5 3 1
1 -
7 0 28 28 14
0
-1 -1 2 1
2 1 7 0 7 7 7
-1 -1 - 5 - 3
0 0 0 0
2 28 2
8 8
1
4
Astfel y1, = 1 , y2, = 0, y3, =1 , y4, = 0, y5, =1 , y6, = 0, y7, = 0, deci
1 7 7
4
y1 = 1 , y2 = 0, y3 = 2 , y4= 0, y5 = 2 , y 6 = 0, y7 = 0.
3 3 3
*
1 2
O altă soluţie (strategie optimală) pentru jucătorul 2 este Y2 = ,0, ,0 .
3 3
În concluzie, strategia optimală generală a jucătorului 2 este
Trei firme utilizează, cu scop tehnologic, apa dintr-un acelaşi rezervor. Fiecare firmă are la dispoziţie
două strategii: îşi construieşte staţie de purificare (strategia 1) sau foloseşte apa nepurificată (strategia
2). Se ştie că dacă cel mult o firma foloseşte apa nepurificată atunci apa din rezervor este bună şi nu
apar cheltuieli. Dacă, însă, cel puţin două firme folosesc apa nepurificată atunci fiecare firmă pierde 3
unităţi monetare. Construirea staţiei de purificare costă o unitate monetară. Scrieţi matricele de câ ştig
pentru acest joc.
Soluţie. Având în vedere anun ţul constatăm că este un joc de 3 ,,persoane” la care fiecare ,,juc ător”
are 2 strategii. Deci n = 3, m1 = m2 = m3 = 2. Numărul situaţiilor jocului este m1 × m2 × m3 = 8 , iar
câ ştigurile jucătorilor sunt reprezentate în următorul tabel (reprezentare generală):
49
Situaţii Câ ştiguri
1 1 1 -1 -1 -1
1
1 2 -1 -1 0
1
2 1 -1 0 -1
1
2 2 -4 -3 -3
2
1 1 0 -1 -1
2
1 2 -3 -4 -3
2
2 1 -3 -3 -4
2
2 2 -3 -3 -3
Valorile ,,câ ştigurilor au fost calculate având în vedere enun ţul. Spre exemplu, în situaţia (1,2,2),
firmele 2 şi 3 folosesc apa nepurificată deci (cum sunt două) fiecare firmă pierde 3 unităţi monetare.
Firma 1, însă, îşi construieşte staţie de purificare, deci mai cheltuieşte o unitate monetară, deci, ,,câ
ştigul” ei este - 4.
Două fabrici produc acelaşi tip de produs A, respectiv B, în două sortimente A1 şi A2 respectiv
B1 şi B2 . Produsele sunt interschimbabile. În urma unui test, făcut în avans, s-a constatat că preferinţele
cumpărătorilor, exprimate în procente, sunt reprezentate în următorul tabel
B
A B1 B2
A1 40 90
A2
70 20
Precizăm că precedentele date se referă la prima fabrică (primul produs), în timp ce precedentele
pentru a doua fabrică (al doilea produs) sunt completare faţă de procentul de 100%. Scrieti matricele de
câ ştig pentru acest joc.
Soluţie. Sunt 2 jucători (fabricile) şi fiecare are câte 2 strategii (posibilit ăţi, sortimente). Din enunţ se
constată că sunt precizate în tabelul cu cu punctele chiar ,,câ ştigurile” primului ,,jucotor”. Astfel într-o
reprezentare generală (tabelară) matricile de câ ştig pentru cei doi jucători pot fi scrise în tabelul:
50
Situaţii Câ ştiguri
s1 s2 H1(s) H2(s)
1 1 40 60
1 2 90 10
2 1 70 30
2 2 20 80
În acest caz (pentru că sunt doar doi jucători) se poate utiliza şi reprezentarea bi-matriceală (obişnuită)
pentru matricele de câ ştig. Astfel avem:
H1 40 90 H2 60 30
= , =
70 20 10 80
14. Rezolvarea jocului bimatriceal
Situaţii Câ ştiguri
s1 s2 H1(s) H2(s)
1 1 400 600
1 2 900 100
2 1 700 300
2 2 600 900
Se consideră că modificările ,,esenţiale” sunt doar la situa ţia (2,2) (în rest sunt datele de la problema
precedentă la care procentele (100%) au fost înlocuite cu unităţile vândute (1000)), care au fost
calculate conform relaţiilor
51
200 + 1 ×800 = 600, 800 + 1 × 200 = 900.
2 2
În scrierea bi-matriceală avem matricile de câ ştig:
b) Întrucât
+H 1000 1000
H1 2t =
1000 1500
deci nu este o matrice cu toate elementele egale (sumă constantă) jocul din această problemă este un
joc bi-matriceal (nu este antagonist). Pentru a-l rezolva trebuie să găsim toate soluţiile admisibile de
bază pentru două sisteme de ecuaţii liniare, iar apoi se vor păstra doar perechile de soluţii care verifică
şi al treilea sistem de ecuaţii.
52
I p = 1, p = 0, F1' = 700, F1 '=0, t11 = 300, t = 0,
21 22 12
600 p
11
+ 300 p12 - F2' + F2 ' + t21 =0
' '
+ t22 =0
100 p11 + 900 p12 - F2 + F2
Pentru care avem succesiv
1 1 - 1 - 1
1 1 0 0 0 0 1 2 0 600 600 0 1
600
-1 ® 1 - 1 1 1 ®
0
600 300 1 1 0 1 2 600 600 600 0 0
100 900 -1 1 0 1 0 1700 - 5 5 -1
0
2 6 6 6 1 0
-1 - 8 - 3 5100
0
0 300 1 -1 -1 0 600 0 1 11 11 11
® ® 1 - 1 6 ®
1
1 0 0 0 01 1000 1100 1100 11
0
1100 0 0 -1 1 500 1 1 5
0 1 0 0 -
1100 11
1100
800 0 1 -1 0 -1 900
® 1100 0 0 0 1 -1 600 .
1 1 0 0 0 0 1
deci produsul dintre un ,,p”, şi un ,,t” cu aceea şi indici trebuie sa fie 0 (zero).
Testând toate cele 9 combina ţii posibile (fiecare cu fiecare) constatăm că doar soluţiile (combinaţiile)
(2, II) satisfac acest ultim sistem. Întradevăr
p ×t = 6 × 0 = 0, p12 × t12 = 5 × 0 = 0, p × t21 = 1 × 0 = 0, p 22 × t = 1 ×0=0.
11 11
21 22
11 11 2 2
53
Nici o alta combinaţie (din cele 8 rămase) nu se poate accepta pentru ca măcar o ecuaţie din
ultimul sistem nu este verificată. Spre exemplu combinaţia (3, I) nu convine pentru că deşi
În concluzie unica soluţie (care verifică toate cele trei sisteme) este:
p11 = 6 , p12 = 5 , p21 = 1 , p22 = 1 , F1, = 650, F1,, = 0, F2, = 5100 , F2,, = 0,
11 11 2 2 11
t = t12 = t21 = t22 = 0.
11
6 5
P = ,
Astfel strategia optimală a jucatorului 1 este 1 , cu caştigul
11 11
1 1
=
F1 = F1, - F1,, = 650, iar strategia optimală a jucătorului 2 este P
2 , cu caştigul
2 2
5100
F2 = F2, - F2,, = .
11
15. Rezolvarea jocului antagonist
a) Rezolvaţi jocul.
H1 40 90 H2 60 30
= , =
70 20 10 80
şi cum
H1 + H 100 100
2t = jocul este antagonist cu suma constantă 100.
100 100
54
p +p
21 22 =1
40 p
21
+ 90 p22 - F1' '
+ F1 + t11 =0
70 p21 + 20 p22 - F1' + F1 ' + t12 =0
' ' ® min .
F = - F1
F1
Utilizăm pentru rezolvare ARS şi atunci putem scrie succesiv:
5 1 - 1 -1
0 1
7 70 70 0 70 0501-10-170
550 3 3 4
0 - - 0 0
-1
® 7 7 7 1 7 ® 100 0 0 1 30 ®
2 -1 1 1 1100001
1 7 70 0 70 0
5 1
70
0000000
0 -1 0 - 1 1
770 7 70
0
0501-10-170 0501-10-170
® -1 30 -1
0 100 0 0 1 ® 0 100 0 0 1 30 ®
1100001 1 1 0000 1
001-1000 0-500001-70
-1 -1 -1 -1 - 1 -1
0 0 1 2 2 65 0 0 1 2 2 65
1 -1 3 1 -1 3
0100 0100
® 100 100 10 ® 100 100 10 ®
-1 1 7 -1 1 7
1 1
0 0 0 100 100 10 0 0 0 100 100 10
0 0 0 -1 0 0 0
0000 0 0 1
-1 -1 - 1
0 0 1 2 2 65
1 -1 3
0 1 0 0
® 100 10
1 .
0
0
-1 1 7
1
0 0 0 100 10
1
0
0
0 0 0 0 1 1 - 65
2 2
10 10
Problema duală (pentru primul jucător) are soluţia (citibilă tot din ultima matrice)
p
=1 =1 =
1 1
11 , p12 . Deci P1 , este strategia optimală a primului jucător, care va obţine câ ştigul
2 2 2 2
= 65, iar strategia optimală a jucătorului 2 este P2 =
7 3
maxim F1 , care va obţine câ ştigul
10 10
maxim F2 = 65.
B B B
1 2
A
∑ A
= A1 14 13,5 27,5
A2 3
24,5 27,5
38,5 16,5 55
A A1 A2
B
∑ B
= B1 21 10,5 31,5
B2 12
1,5 13,5
22,5 22,5 45
Elementele din matricele de structură constituie termenii rezultaţi ca urmare a exprimării funcţiilor
de câ ştig. Astfel în prima matrice au fost trecuţi termenii lui
1
7 340 90 2
F1=P1 × H1 × P1t = P1 × H1 × P2t = 20 1
10 1070
2
după cum urmează:
10 2 10 2
56
24,5 = 7 ×70× 1 = ( p11 × h21 × p22 ), 3 = 3 ×20× 1 = ( p12 × h22 × p22 ). Apoi, pe ultima coloană, sunt
10 2 10 2
trecute sumele elementelor de pe liniile corespunzătoare, iar pe ultima linie sunt trecute sumele de pe
coloanele corespunzătoare. Tabelul (de 55) reprezintă câ ştigul final (maxim) al jucătorului 1. Într-un
mod cu totul analog se obţin elementele matricei de structură pentru al doilea jucător pornind de la
7
1 160 30
F2 = P2 × H 2 × P2t = P2 × H 2 × P1t = 10
2 21080 3
10
De altfel situaţia sintetică, exprimată în procente, asupra structurii tipurilor de produse, este următoarea:
Asta în condiţia că producţia ambelor fabrici este 100%. Datorită antagonicităţii pieţei, a doua
fabrică realizează o vânzare mai mic ă decât prima, care este de 45%.
16. Considerăm problema 15 în ipoteza că a doua fabrică, la momentul când î şi alege strategia
sa, cunoaţte strategia aplicată de prima fabrică. Se cere:
b) Rezolvaţi jocul.
Soluţie. a) Faţă de problema anterioară (15) acum al doilea jucător are o informaţie suplimentară: ştie ce
strategie a ales primul jucător. În consecinţă se va modifica matricea de câ ştig a jucătorului 1, deoarece
jucătorul 2 poate aplica alte două strategii obţinute prin combinarea strategiilor sale B1 şi B2 , după cum
urmează:
57
B B1 B1 B2 B2
A B1 B2 B1 B2
B1 40 40 90 90
B2 20 70 20
70
Acum P2 va fi de forma P2 = [p21 , p22 , p23 , p24 ], iar P1 = [p11 , p12 ,].
a) Pentru rezolvare, observăm mai întâi c ă strategia a treia este dominantă aşa încât poate fi
eliminată, deci p23 = 0 şi atunci problema de programari liniară ce trebuie rezolvată este
p +p +p =1
21 22 24
40 p
+ 40 p22 + 90 p24 - F1' + F1 ' + t11 =0
21
F = - F1
F1
Avem succesiv
1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1
-1 90 -1 ®
40 40 90 1 1 0 0 ®4040 1 1 0 0
70 20 20
-1 1 0 1 0 70 20
20 -1 1 0 1 0
0 0 0 1 -1 0 0 0 1 1 1 0 0 0 0 1
5 5 1 - 1 -1
0
7 7 70 70 0 7 1
050501 -1 0 -1 70
0
0 200 550 -3 3 1 -4 0
7 7 7 7 7 ®
0
50 100 0 0 1 -1 30 ®
2 2 - 1 1 1 1 1 10 0 0 01
1 7 7 7 70 0 70 0
0 0 0 00 0 0 00
0 5 5 1 -1 0 1 1
7 7 70 70 70
050501 -10-170 0 50 50 1-10-1 70
050 -1 0 -1 ®
® 100 0 0 1 30 ® 50 100 0 0 1 30
1 1
10 0001 1 1 1 0000 1
0 0 0 1 -1000 0-50-500001-70
58
0
-1 -1 1
25 0 1 2 2 55
1 1 - 1 3
0 1 0 0
® 100 10 ®
2 100
1 1 7 - 1
1
0 0 0 100 2 10 100
0 - 25 0 0 0 1 1 - 55
2 2
00-501-1-1 1 40
1 - 1 3
0 1 2 0 0 5
® 50 50 .
1 0 -1 0 0 - 1 1 2
50 50 -5
005000 1 0 40
Soluţia optimă este p = 2 , p = 3 , p = 0, F1 =' '
F =0, t = 0, t12 = 0, deci
22 24 1 11
21 40,
5 5
2 3
P2' = , ,0 este o strategie optimală a jucătorului 2. Se constată că mai există şi o altă soluţie,
5 5
conform matricei
-50 0 0 1 -1 0020
1 1 1 0 0 0 0 1
,
50 0 -500 0 -11 20
0 0500010-40
2 3
P2 = l1 P2' + l2 P2 ' = l1 , ,0,0 + l2 [0,1,0,0], cu l1l2 Î [0,1] l1 + = 1 iar valoarea maximă a lui
5 5 l2
59
B B1 B1
A B1 B2
∑= A A 16λ2 40λ1+24λ2 40
1
16λ2 40λ1+24λ2 40
A A1
B
∑= B BB 24λ2 24λ2
1 1
B1 B2 60λ1+36λ2 60λ1+36λ2
60 60
Constatăm o descreştere cu 15% pentru prima fabrică, ceea ce dă o creştere cu 15% pentru fabrica a doua.
Aceasta se datorează informaţiei suplimentare pe care a avut-o fabrica a doua. Mai putem spune că prima
fabrică va face 40% din sortimentul A1 iar a doua fabrică va face numai sortimentul B1, în total de 60% (cu
împărţirea: 24λ2% datorită ,,strategiei” B 1: B1 şi (60λ1+36λ2) % datorită ,,strategiei” B 1: B2, cu
l1l2 Î [0,1], l1 + l 2 = 1 ).
60
TEME DE CONTROL
3 6 9 6
H1=A=
10 6 1 8
4 5
3 5
Care este matricea de câ ştig a jucătorului 2? Câte strategii are juc ătorul 1, respectiv jucătorul 2?
2. (Jocul Morra). Doi jucători arată simultan unul sau două degete de la mâna stâng ă şi în acelaşi timp
spun numărul de degete pe care ei cred că îl va arăta oponentul.Dacă un din jucător nimereşte numărul
de degete arătat de oponent, el primeşte aşa de multe unităţi monetare cât este num ărul de degete pe
care le-au arătat împreună. Dacă ambii jucători nimeresc sau niciunul nu nimereşte atunci niciunul nu
primeşte nimic. Care este matricea de câ ştig a acestui joc?
1 -1 -2 0
3
A= 0 2 4
4
5 1 5
2 3 -1 3
6. Găsiţi strategiile optimale şi valoarea jocului (cu relaţiile de calcul) pentru jocurile cu
următoarele matrice de câ ştig:
2 3 6 -1 2 4
; ; .
a) A = b) A = c) A =
5 2 4 5 3 1
7. Rezolvaţi problema 6 cu metoda Williams.
61
2 4
2 1 4 3 1
,
a) A = 5 1 b) A =
3
1 6
5 0
1 -1-2
A
= -1 1 1
2-10
12. O firmă produce trei tipuri de produse P1 , P2 , P3 , folosind trei tipuri de materiale M 1 , M 2 , M 3 .
Cheltuielile cu materialele încorporate în câte o u nitate de produs sunt date în tabelul:
P
M P1 P2 P3
M1 4 4 6
M2
3 5 3
M3
5 2 4
13. Două ramuri economice au de făcut investiţii în 4 obiective. Strategia cu codul i constă în a finanţa
obiectivul i, i = 1,4. Ca urmare a tuturor analizelor făcute s-a constatat că, pentru prima
ramură, câ ştigurile sunt date de matricea:
0 1 -1 2
A -1 0 3 2
=
0
1 2 -1
2 0 0 0
Se presupune că fiecare ramură îşi materializează câ ştigul în înţelegere cu cealaltă, adică ceea ce câ
ştigă una pierde cealaltă şi invers.
H1 1 7 H2 1 8
=
, =
3 4 7 8
Rezolvaţi jocul.
15. Pentru dezvoltarea economică şi socială a unui oraş apare problema construirii sau nu a două
obiective economice. Există două strategii corespunzătoare Ministerului tutelar şi pentru autorităţile
locale ale oraşului: 1 – a construi primul obiectiv, 2 – a constru i al doilea obiectiv. Autorităţile oraşului
au 2 strategii: 1 – agreeaz ă (acceptă) propunerea Ministerului, 2 – nu agreeaz ă (acceptă) propunerea.
H1 -10 2 H2 5 -2
= 1 , =
-1 -1 1
Rezolvaţi acest joc necooperativ.
16.1. Care sunt procentele p1 , p2 , p3 pe care să le facem, în avans, pentru oferta cu materialele în aşa
fel încât stocul s ă fie sigur asigurat şi să se realizeze o valoare maximă a producţiei?
16.2. Găsiţi un plan de producţie corespunzător unui tabel de producţie de 4 milioane unităţi moetare.
Răspunsuri.
1.
-3 -10 -4
-6
H2= -6 -5
-9 -1 -3
-6 -8 -5
2.
63
0 2 -3 0 L11
H1 =A=
-2 0 0 3 L12
3 0 0 - 4 L21
0 L22
-3 4
0
L înseamnă : 1 deg et, 1 spune;
11
L
12 înseamnă : 1deg et, 2 spune;
unde
L înseamnă : 2 deg ete, 1 spune;
21
3. v1 = max min aij = 3, v2 = min max aij = 6, deci nu există punct şa în strategii pure,
pentru
primul joc; v1 = -2, v2 = 2; deci nu există punct şa în strategii pure, pentru al doilea joc.
3 4
4. a x y = 3x y + 6x y
∑ ∑ ij i j 1 1 1 2 + ... + 5x3 y4 ;
i =1 j =1
4 4
- 3 x4 y2 + 4 x4 y3 .
2 1 1 5 5
5. X *
= 0, , ,0 , Y * = 0, , ,0 , v = .
3 3 6 6 3
6–8.
1 3 3 1
a) X *
= , , Y* = , , v = 1.
4 4 4 4
3 1 1 7 17
b) X *
= , , Y* = , , v= .
4 4 8 8 4
3 1 1 1 5
c) X *
= , , Y* = , , v= .
4 4 2 2 2
9.
1 1 3 1 5
a) X *
= , , Y* = ,0, ,v = .
2 2 4 4 2
1 2 1 2 1
b) X *
= 0, ,0, , Y* = , , v= .
3 3 3 3 3
64
3 2 2 3 1
10. X *
= 0, , , Y *
= , ,0 , v= .
5 5 5 5 5
4 4 6
12. H1=35 3
2
5 4
0 1 -1 2
-1
= 0 3 2
13. H
1
0 1 2 -1
2 0 0 0
= (1,0), 3 2 = (1,0), F1 = 17
A doua soluţii: P1 P2' = , , P2' l1 + 3l2 , F2 = 8, unde
5 5 5
l1 , l2 ³ 0, l1 + l2 = 1, P2 = l1 P2' + l2 P2'.
3 3
16. 16.1. 1: 0:0
Bibliografie modul
1. Blaga P. Muresan A.S., Lupas Al., Matematici aplicate in economie, vol. 2, ed.
Promedia Plus, Cluj-Napoca, 1999
2. Gibbons, R., Game theory for applied economists Princeton Univ. Press, Prenceton,
New Jersey
3. Muresan, A.S., Non cooperative games, Ed. Mega, Cluj-Napoca, 2012
4. Muresan A.S.Blaga P., Matematici aplicate in economie, vol. 2, ed. Transilvania Press,
Cluj-Napoca, 1996
5.Muresan A.S., Cercetari operationale, vol. 1 si 2, lito. UBB, Cluj-Napoca, 1997
65
Modulul 2
JOC POZITIONAL
Obiective:
Rezultate aşteptate:
Unitatea 1
Obiective:
CONŢINUTUL UNITĂŢII
66
succesiune finită de acţiuni, declanşate în urma unor decizii luate în diferite
momente de către cei n jucători care participă la joc. Momentele de decizie se
succed în mod discret, fiind net separate unele de altele. În fiecre moment de
decizie se ştiu
67
trece în x1 , adică de a începe jocul. Pentru a deosebi clasele cu vâr furi iniţiale
echivalente din punct de vedere informaţional, asociem celor h clase
informaţionale diferite, tot atâtea simboluri diferite ct , t = 1, h . Aceste simboluri pot
fi, de exemplu, primele h numere naturale pozitive. Menţionăm că echivalenţa
informaţională a vârfurilor ini ţiale implică echivalenţa informaţională a arcelor
incidente spre exterior. Jucătorii raţionali se vor nota cu primele n numere naturale
pozitive, iar natura cu numărul natural 0. Jocul poziţional asociat arborescenţei A
este o funcţie de arborescenţă (arc) F(A), definită prin 6+n caracteristici asociate
fiecărui arc: g codul (numărul) arcului, x j codul vârfului ini ţial al arcului, xk codul
vârfului final al arcului, i codul (num ărul) jucătorului care ia decizia în vârful
iniţial al arcului, ct codul (numărul) clasei de vârfuri echivalente din punct de
vedere informaţional de care aparţine vârful ini ţial al arcului, p(g ) probabilitatea
alegerii variantei reprezentate de arcul respectiv, H1 (g ),..., H n (g ) sunt componentele
vectorului de câ ştig, în cazul când arcul este un arc suspendat. Sch ematic, în formă
tabelară se poate scrie:
g xj xk i ct p(g ) H1 (g ) … H n (g )
1. Arborescenţa A.
2. Funcţia de câ ştig H i (g ) definită pentru fiecare arc suspendat g şi
pentru fiecare jucător i, i Î I , I = {1,..., n}. Dacă jocul se termină în arcul suspendat g jucătorul i primeşte suma
H i (g ).
68
3. Aplicaţia T a vârfurilor ini ţiale x j , x j Î X , X = {x1 ,..., xm }, pe mulţimea
jucătorilor (inclusiv natura 0) I 0 , I 0 = I È {0}. Deci Tx j = i , atunci jucătorul i este cel
care ia decizia în vârful x j .
4. Probabilităţile asociate arcelor incidente spre exterior vârful ui x j .
Dacă în vârful x j decide natura 0 se asociază arcelor g k = (x j , xk ) probabilităţile
p(g k ) care însumate, în raport cu k , pentru toate arcele cu vârful ini ţial x j , dau
valoarea 1. Dacă în vârful x j decide un jucător raţional i, i ¹ 0 , în ipoteza unei
strategii pure locale de alegere a variantei (x j , xk ), arcului respectiv i se
asociază probabilitatea egală cu 1. Totodată restului arcelor cu acelaşi vârf ini
ţial x j li se asociază probabilitatea egală cu 0.
5. O descompunere a mulţimii vârfurilor ini ţiale într-o mulţime de clase
ct , t = 1, h , de vârfuri, echivalente din punct de vedere infor maţional, caracterizată
prin următoarele:
a. Vârfurilor x j şi x j aparţinătoare aceleiaşi clase ct , li se asociază acelaşi
'
jucător i: Tx j = Tx j = i.
' '
Sunt doi jucători. Primul jucător alege unul dintre numerele 1 şi 2. Jucătorul 2,
cunoscând alegerea juc ătorului 1, alege unul dintre numerele 1 şi 2. Jucătorul 1,
cunoscând alegerea juc ătorului 2, dar necunoscând prima sa alegere, alege unul
dintre numerele 1 şi 2. Ce câ ştigă unul dintre jucători pierde celălalt jucător.
Funcţia de câ ştig este dată prin următoarele valori:
69
Tabelul 1
x y z H1 H2
1 1 1 -2 2
1 1 2 -1 1
1 2 1 3 -3
1 2 2 -4 4
2 1 1 5 -5
2 1 2 2 -2
2 2 1 2 -2
2 2 2 6 -6
Aici x este numărul ales de primul jucător la prima decizie, y este numărul ales de
cel de al doilea jucător şi z este numărul ales de primul jucător la a doua decizie.
Notăm poziţia jocului, când începe primul juc ător, cu x1 . Vârfului x0 îi asociem
clasa informaţională c1 = şi arcului (x0 , x1 îi asociem probabilitatea p(1) = 1. Arcul
1 )
(x0 , x1 nu este arc suspendat, deci nu i se asociază câ ştig.
)
70
Jucătorul 1, în vârful x1 , are două alternative, cărora le asociem arcul al
doilea (x1 , x2 ) şi arcul al treilea (x1 , x3 ). Clasa informaţională trebuie să difere de
c1 : punem c2 = 2 pentru vârful x1 . Probabilitatea asociată poate fi 1, pentru arcul
H 1 (g ) H 2 (g )
H 2 (g )
(x1 , x2 ) şi 0, pentru arcul (x1 , x3 ) sau, 0 pentru arcul (x1 , x2 ), şi 1, pentru arcul (x1 ,
x3 ), în funcţie de strategia pură locală aleasă, după cum jucătorul 1 alege varianta
(x1 , x2 ), respectiv alege varianta (x1 , x3 ). Arcele nefiind suspendate, coloanele H1
şi H 2 nu se completează.
Construirea tabelului se continuă în acelaşi mod pentru jucătorul 2.
Deoarece jucătorul 2 cunoaşte alegerea jucătorului 1, pentru el poziţiile x2 şi x3 vor
fi diferite din punct de vedere informaţional, şi de aceea se fixează pentru vârful x2
clasa informaţională c3 , iar pentru vârful x3 , clasa informaţională c4 . Menţionăm că
strategiile pure locale considerate în vârfurile x2 şi x3 , aparţinând unor clase
informaţionale diferite, sunt independente între ele şi se pot schimba în toate
modurile posibile: (1,0) pentru x2 , (1,0) pentru x3 ; (1,0) pentru x2 , (0,1) pentru x3 ;
(0,1) pentru x2 , (1,0) pentru x3 ; (0,1) pentru x2 , (0,1) pentru x3 , formând strategii
pure combinate.
Urmează din nou primul jucător. Deoarece nu-şi cunoaşte prima sa alegere,
în vârfurile x4 şi x6 , respectiv x5 şi x7 posedă aceeaşi informaţie: în primul caz ştie că
jucătorul 2 a ales numărul 1, în al doilea caz ştie că jucătorul 2 a ales numărul 2.
Prin urmare, pentru cele două perechi de vârfuri avem dou ă noi clase
informaţionale: c5 = 5 şi c6 = 6 . Strategiile pure locale, în poziţiile x4 şi x6 ,
respectiv x5 şi x7 , nu sunt independente deoarece ele aparţin aceleiaşi clase
informaţionale. Astfel în vârfurile x4 şi x6 , aparţinătoare clasei informaţionale c5 ,
fie se aleg simultan variantele (x4 , x8 ), (x6 , x12 ), fie se aleg simultan variantele
(x4 , x9 ), (x6 , x13 ). La fel se pune problema alegerii variantelor în vârfurile x5 şi x7
.
Toate arcele fiind suspendate, în coloanele şi sunt trecute câ ştigurile
corespunzătoare celor doi jucători. Jocul fiind cu sumă nulă, suma câ ştigurilor
corespunzătoare este egală cu 0 (şi de aceea se putea renunţa la precizarea
individuală a valorilor din coloana ).
71
Tabelul 2
g xj xk i ct p(g ) H1 (g ) H 2 (g ) Numărul
ales
1 x0 x1 0 1 1
2 x1 x2 1 2 1 0 1
3 x1 x3 1 2 0 1 2
4 x2 x4 2 3 1 0 1
5 x x 2 3 0 1 2
2 5
6 x3 x6 2 4 1 0 1
7 x3 x7 2 4 0 1 2
8 x4 x8 1 5 1 0 -2 2 1
9 x4 x9 1 5 0 1 -1 1 2
10 x5 x 1 6 1 0 3 -3 1
10
11 x x 1 6 0 1 -4 4 2
5 11
12 x6 x 1 5 1 0 5 -5 1
12
13 x6 x 1 5 0 1 2 -2 2
13
14 x7 x 1 6 1 0 2 -2 1
14
15 x7 x 1 6 0 1 6 -6 2
15
72
În completarea raţionamentelor de mai înainte, ne putem referi încă la
strategiile pure complexe care apar. Făcând produsul cartezian al mul ţimilor M
aparţinătoare unor clase informaţionale distincte, având ca elemente mul ţimi de
arce ce se aleg simultan ca variante, şi care, toate aparţin jucătorului 1, se obţine
mulţimea strategiilor pure complexe ale jucătorului 1:
{2,3}x {{8,12}, {9,13}}x {{10,14},{11,15}}=
{{2,{8,12},{10,14}},{2,{8,12},{11,15}},{2,{9,13},{10,14}},} {2,
{9,13},{11,15}},{3,{8,12},{10,14}},{3,{8,12},{11,15}}, {3,{9,13},
{10,14}},{3,{9,13},{11,15}}},
formată din 8 strategii pure complexe. La fel, formând pro dusul cartezian
corespunzător în cazul jucătorului 2, se obţine mulţimea strategiilor pure complexe
ale acestuia:
{4,5}x {6,7}= {{4,6},{4,7},{5,6},{5,7}},
formată din 4 strategii pure complexe.
Unitatea 2
Obiective:
CONŢINUTUL UNITĂŢII
{2,{8,12},{10,14}} 1
{2,{8,12},{11,15}} 2
{2,{9,13},{10,14}} 3
{2,{9,13},{11,15}} 4
1
{3,{8,12},{10,14}} 5
{3,{8,12},{11,15}} 6
{3,{9,13},{10,14}} 7
{3,{9,13},{11,15}} 8
{4,6} 1
2
{4,7} 2
{5,6} 3
{5,7} 4
unde G(x) este mulţimea tuturor arcelor incidente spre exterior vârful ui final x al
arcului g. Vectorul (funcţia) de câ ştig căutat va fi cel care se va găsi pe arcul
rădăcină al arborescenţei.
75
Tabelul 4
g xj xk i ct p( g ) H1 (g ) H 2 (g )
1 x0 x1 0 1 1 -2 2
2 x1 x2 1 2 0 -2 2
3 x1 x3 1 2 1 5 -5
4 x2 x4 2 3 1 -2 2
5 x2 x5 2 3 0 -4 4
6 x3 x6 2 4 1 5 -5
7 x3 x7 2 4 0 6 -6
8 x4 x8 1 5 1 -2 2
9 x4 x9 1 5 0 -1 1
10 x5 x 1 6 0 3 -3
10
11 x5 x 1 6 1 -4 4
11
12 x x 1 5 1 5 -5
6 12
13 x6 x 1 5 0 2 -2
13
14 x7 x 1 6 0 2 -2
14
15 x7 x 1 6 1 6 -6
15
76
H (7) = p(14)H (14)+ p(15)H (15) = 0[2,-2]+1[6,-6] = [6,-6],
(2) = p(4)H (4)+ p(5)H (5) = 1[- 2,2]+ 0[- 4,4] = [- 2,2],
Această ultimă valoare H (1) = [5,-5]. , este valoarea funcţiei de câ ştig asociată
perechii de strategii pure (6,1) a jocului matriceal, respectiv a perechii de
strategii pure complexe ({3,{8,12},{11,15}},{4,6})a jocului poziţional iniţial dat.
Astfel o dată cu trecerea de la jocul poziţional la jocul matriceal asociat se poate
scrie H(6,1), în loc de H(1) şi sunt restabilite notaţiile din punctul 1.
Calculând în mod similar restul valorilor func ţiei de câ ştig se obţine, pentru
jucătorul 1, matricea bidimensională din tabelul 5. Pentru jucătorul 2 se poate
scrie un tabel similar schimbând semnul elementelor matricei din tabelul 5.
Tabelul 5
i 1 2 3 4
j
1 -2 -2 3 3
2 -2 -2 -4 -4
3 -1 -1 3 3
4 -1 -1 -4 -4
5 5 2 5 2
6 5 6 5 6
7 2 2 2 2
8 2 6 2 6
77
2. Graficul problemei pentru perechea de strategii (6,1) poate fi reprezentat
într-o figură.
Arcelor cărora le corespund probabilităţile egale cu 1 vor fi marcate cu linii
duble. Lâng ă fiecare arc se va trece simbolul g al arcului şi valoarea funcţiei
H (g ). Calculul valorilor H (g ), trecute în coloanele H1 (g ) şi H 2 (g ) ale tabelului
4 pot fi urmărite pe figură.
Unitatea 3
Obiective:
CONŢINUTUL UNITĂŢII
78
Teorema 1. Pentru a obţine strategii mixte asociate variantelor, în cazul
unui jucător fixat, se procedează după cum urmează:
Tabelul 6
1 2 3 4 5 6 7
i
j
1 1 1 1 1 0 0 1 =
2 -2 -2 3 3 -1 1 0 £
3 -2 -2 -4 -4 -1 1 0 £
4 -1 -1 3 3 -1 1 0 £
5 -1 -1 -4 -4 -1 1 0 £
6 5 2 5 2 -1 1 0 £
7 5 6 5 6 -1 1 0 £
8 2 2 2 2 -1 1 0 £
9 2 6 2 6 -1 1 0 £
10 0 0 0 0 1 -1 0 MIN
Astfel jucătorul 2 va putea aplica strategia pură complexă {4,6} respectiv {5,6} cu
probabilitatea m1 respectiv m2 . Notând cu p probabilitatea pe arce şi în cazul
jucătorului 2, avem pe de o parte p1 (4) = m1 , p1 (6) = m1 , iar pe de altă parte
p2 (5) = m2 , p2 (6) = m2 , deci p(4) = p1 (4) = m1 , p(5) = p2 (5) = m2 ,
P = ∑li P i , li ³ 0, i = 1, s; ∑ li = 1,
i =1 i=1
(a)
* *
aÎa aÎa
unde
T
li ∑Pi J T Pi J (a)
( a) *
' aÎa '
următoarea teoremă:
Se consideră jocul poziţional cu următoarea desfăşurare. Primul pas este făcut de natură: sunt două
variante, prima se realizează cu probabilitatea 2 , a doua cu probabilitatea 1 . Al doilea pas este făcut de
3 3
jucătorul 1, care, necunoscând ce a realizat natura, al ege unul dintre numerele 1,2. Pasul al treilea este
făcut de jucătorul 2, care, necunoscând ce s-a realizat la pasul aleatoriu, dar cunoscând num ărul ales
de jucătorul 1 la al doilea pas, alege unul dintre numerele 1,2. Câ ştigul jucătorului 1, de la al doilea
jucător, este dat prin tabelul:
81
s 1 2 3 4 5 6 7 8
h(s) -1 5 2 -3 4 1 -2 6
unde s este codul situaţiei în ordonare lexicografică, iar h(s) este câ ştigul corespunzător.
informaţionale, ct , t = 1,5
1 x0 x1 0 1 1
2 x1 x2
0 2 2/3
3 x2 x3
1 3
4 x3 x4
2 4 -1 1
5 x3 x5
2 4 5 -5
6 x2 x6
1 3
7 x x
6 7 2 5 2 -2
8 x6 x8 2 5 -3 3
9 x1 x9
0 2 1/3
10 x9 x
10 1 3
11 x x 2 4 4 -4
10 11
12 x x 2 4 1 -1
10 12
13 x9 x 1 3
13
14 x x 2 5 -2 2
13 14
15 x x 2 5 6 -6
13 15
3. Reducerea jocului. Corespondenţa între jocul poziţional şi jocul matriceal este stabilită în
tabelul următor.
Urmând calculele se poate scrie urm ătoarea matrice a jocului (referitoare la jucătorul 1):
82
1 2 3 4
2 2 11 11
H=1
3 3 3 3
2 2
2 0 0
3 3
1 {3, 10} 1
{6, 13} 2
2 {{4,11}, {7,14}} 1
{{4,11}, {8,15}} 2
{{5,12}, {7,14}} 3
{{5,12}, {8,15}} 4
4. Rezolvarea jocului. Coloana a treia este dominantă şi se poate elimina. Matricei rămase i
se asociază matricea simplex
i\j 1 2 3 4 5 6
1 1 1 1 0 0 1 =
2 2 11 -1 1 0 ≤
2
3 3 3
3 0 0 -1 1 0 ≤
2
3
4 0 0 1 -1 0 MIN
0
P = [1,0], Q = l1Q2 + l2 Q2 ,
Q1 = [1,0,0,0], Q2 = [0,1,0,0],
l1 ³ 0, l2 ³ 0, l1 + l2 = 1
83
TEME DE CONTROL
1. Jucătorul 1 alege un număr a din mulţimea {x,y}. Jucătorul 2 , fiind informat asupra numărului a,
alege numărul b din aceeaşi mulţime {x,y}. Jucătorul 1, uitând num ărul a, şi nefiind informat asupra
numărului b, alege un număr c din mulţimea {x,y}. Câ ştigul jucătorului 1 este dat prin funcţia M:
6
1. Să se reprezinte grafic arborescenţa jocului.
2. Să se scrie tabelul jocului.
3. Să se reducă jocul la un joc matriceal.
Bibliografie modul
84
Modulul 3
Obiective:
Rezultate aşteptate:
Unitatea 1
Obiective:
CONŢINUTUL UNITĂŢII
Vom considera acum jocuri de informaţie incompletǎ (jocuri Bayes), adicǎ jocuri
în care cel puţin un jucǎtor nu este sigur (nu cunoaşte) de funcţia de câ ştig a altui
85
jucǎtor. Un exemplu specific de joc static de informaţie incompletǎ este cel al
vânz ǎrii prin licitaţii. Fiecare ofertant cunoaşte evaluarea sa pentru un anumit bun
ce urmeazǎ a fi vândut dar nu ştie evluǎrile celorlalţi ofertanţi.
Definim forma normalǎ de eprezentare a unui joc Bayes static şi a unui echilibru Bayes
– Nash într-un astfel de joc. Întrucât aceste definiţii sunt abstracte şi destul de
complexe vom introduce ideile principale pentru exemplul simplu, anume competiţia
Cournot în informaţie asimetricǎ. Considerǎm un modul Cournot cu inverse funcţiei
cerere datǎ prin P(Q) = a - Q, unde Q = q1 + q2 este cantitatea agregatǎ de pe piaţǎ.
Funcţia cost a firmei 1 este C1 (q1 ) = cq1 . Funcţia cost a firmei 2
este C2 (q2 ) care are distribuţia probabilisticǎ C2 c L q2 c H q 2 ,
(q2 ):
1-q q
unde cL < cH . Mai mult, informaţia este asimetricǎ deoarece firma 2 cunoaşte
funcţia sa de cost şi funcţia de cost a firmei 1, dar firma 1 cunoaşte funcţia sa de
cost şi cunoşte numai cǎ pentru firma 2 costul marginal c are distribuţia
probabilisticǎ
c : cL c
H .
1 -q q
Aceastǎ situaţie poate fi atunci când firma 2 vrea s ǎ intre cu ceva sortiment nou pe
piaţǎ sau poate tocmai a inventat o nouǎ tehnologie. Toate acestea sunt în comun
cunoscute de cǎtre cele douǎ firme. Firma 1 ştie cǎ firma 2 are o informaţie în plus
(superioarǎ), firma 2 ştie cǎ firma 1 cunoaşte acest lucru şi aşa mai departe.
Natural, firma 2 poate vrea sǎ aleagǎ cantitǎţi diferite (de obicei mai mici) în cazul
când costul s ǎu marginal este mai înalt decât atunci când costul este mai scǎzut.
Firma 1, din punctual sǎu de vedere, va anticipa cǎ firma 2 poate împǎrţi (alege)
cantitatea sa la costul sǎu în acest mod.
Fie q2* (c) notatǎ cantitatea pe care firm 2 o alege ca funcţie de costul sǎu, adicǎ
86
daca c = cL .
q * (c ) ,
q2* (c) = 2 L
Fie q* notatǎ singura cantitate pe care o allege firma 1. Când c ostul firmei 2 este
1
[
max (a - q1* - q2 )- cL q2 . ]
q2
Analog, când costul firmei 2 este înalt, q2* (cH ) va rezolva problema
[
max (a - q1* - q2 )- cH q2 .
q
]
2
max{(1 - q ) [(a - q1 - q2* (cL ))- c]q1 +q [(a - q1 - q2* (cH ))- c]q1 },
q1
Condiţiile necesare de extrem pentru aceste trei probleme de optimizare sunt (dupǎ
anularea derivatelor de ordinul întâi)
q1 * 1
=
[(1 - q )(a - q2 (cL )- c)+ q (a - q2 (cH )- c)].
* *
2
Rezolvând acest sistem de trei ecua ţii obţinem
3 6
q2 (cH ) = 1 (a - 2cH
*
+ c)- 1 -q (cH - cL ),
3 6
87
1
q* = [a - 2c + (1 - q )c + qc ].
Observaţie.
1 L H
Sǎ comparǎm cantitǎţile q2* (cL ), q2* (cH ) şi q1* cu cele de la echilibrul Cournot în
cazul informaţiei complete, când costurile marginale sunt c1 şi c2 . Presupunând c ǎ
valorile c1 şi c2 sunt aşa încât cantit ǎţile de echilibru ale ambelor firme sunt
pozitive, vom avea, în acst caz al informaţiei complete, cǎ firma i va produce
cantitatea:
1
q i+ = (a - 2ci + c j ).
3
În cazul informaţiei incomplete cantitatea q2* (cH ) este mai mare decât 1 (a - 2cH + c),
3
Aceastǎ situaţie apare deoarece firma 2 nu numai cǎ îşi împarte cantitatea sa dupǎ
costurile sale dar la fel rǎspunde la faptul cǎ firma 1 nu poate sǎ o facǎ. Dacǎ
pentru firma 2 costul este înalt, de exemplu, ea produce mai puţin, dar la fel
produce mai mult deoarece ea cunoaşte cǎ firma 1 va produce o cantitate ce
maximizeazǎ profitul ei aşteptat şi astfel este mai micǎ decât cantitatea ce o va
produce dacǎ ea ştie cǎ va fi costul firmei 2 înalt.
Reamintim cǎ ansamblul G =< I ,{Si }{,H i }, i Î I > este un joc necooperativ, unde
Si este spaţiul strategiilor jucǎtorului i şi H i (s) este câ ştigul jucǎtorului i în
situaţia
s = (s1 , s2 ,..., sn ) a jocului.
88
(cu mutǎri succesive) de informaţie completǎ (finit sau infinit repetat) o strategie
H i (a1 , a2 ,..., an )
H i (a1 , a2 ,..., an ; ti )
Primul pas este sǎ prezentǎm ideea cǎ fiecare jucǎtor cunoaşte funcţia sa de câ ştig
dar poate fi nesigur asupra funcţiilor de câ ştig ale celorlalţi jucǎtori. Fie funcţiile
posibile de câ ştig ale jucǎtorului i reprezentate prin unde ti este
numit tipul jucǎtorului i şi care aparţine la o mulţime posibilǎ de tipuri (sau spaţiul
tipurilor) Ti . Fiecǎrui tip ti îi corespunde o funcţie de câ ştig diferitǎ pe care
jucǎtorul i o poate avea.
Dând aceast ǎ definiţie a tipului unui jucǎtor a spune cǎ jucǎtorul i cunoaşte funcţia
sa de câ ştig este echivalent cu a spune cǎ jucǎtorul i cunoaşte tipul sǎu. În
consecinţǎ a spune cǎ jucǎtorul i poate fi nesigur asupra funcţiilor de câ ştig ale
celorlalţi jucǎtori este echivalent cu a spune cǎ jucǎtorul i poate fi nesigur asupra
tipurilor celorllţi jucǎtori notate prin t-i = (t1 ,...,ti-1 , ti+1 ,..., tn ).
Notǎm T-i mulţimea tuturor valorilor posibile ale lui t-i , şi folosim distribuţia
89
Observaţie. În multe aplicţii tipurile jucǎtorilor sunt independente, caz în care pi
(t-i / ti ) nu depinde de ti , aşa cǎ vom putea scrie încrederea jucǎtorului i ca
pi (t-i ).
Observaţie. Folosim notaţia G =< I ,{Ai }, {Ti },{pi },{H i } i Î I > pentru un joc
static Bayesian cu n jucǎtori.
atare determinǎ funcţia de câ ştig jucǎtorului i, H i (a1 , a2 ,..., an ; ti )şi acest tip este
Firma 2 are douǎ funcţii cost posibile şi astfel douǎ posibile profituri sau funcţii de
câ ştig:
şi
Astfel, spaţiul tipurilor firmei 1 este T1 = {c}, iar al firmei 2 (spaţiul tipurilor) este
T2 = {cL , cH }.
Observatie. Formularea (desfǎşurarea) unui joc Bayesian static este dupǎ cum
urmeazǎ:
(1) natura alege vectorul tip t = (t1, t2 ,K, tn ) , unde ti este luat din mulţimea de
tipuri posible Ti ;
(2) natura releveazǎ ti la jucǎtorul i dar nu la orice alt jucǎtor;
(3) jucǎtorii aleg simultan acţiuni, jucǎtorul i alege ai din mulţimea posibilǎ
(admisibilǎ) Ai ;
Deoarece natura reveleazǎ tipul jucǎtorului i, dar la nici un alt jucǎtor j în pasul (2),
jucǎtorul j nu cunoaşte istoria completǎ a jocului când ac ţiunile sunt alese în pasul
(3).
Observatie. Sunt jocuri în care jucǎtorul i are o informaţie privatǎ nu numai a asupra
funcţiei sale de câ ştig dar la fel asupra funţiilor de câ ştig ale altor jucǎtori. Vom
evidenţia aceastǎ posibilitateprin precizarea cǎ la jucǎtorul i câ ştigul sǎ depindǎ nu
numai de acţiunile (a1 , a2 ,..., an ) ci şi de tipurile (t1 , t2 ,...,tn ). Scriem deci
acest câ ştig ca
Observatie. Al doilea punct tehnic implicǎ încrederile pi (t-i / ti ). Vom presupune
cǎ este o cunoştinţǎ comunǎ cǎ în pasul (s) de la formularea unui joc Bayesian
static, natura alege un vector tip t = (t1 , t2 ,...,tn )conform cu distribuţia de
91
probabilitate p(t ). Când natura releveaz ǎ ti la jucǎtorul i, el poate calcula
încrederea pi (t-i / ti ) folosind regula lui Bayes
p (t |t) p(t-i , ti ) .
-i
p(t-i , ti ) =
=
i i
p(ti ) ∑ p(t-i , ti )
t ÎT
-i -i
Unitatea 2
Obiective:
CONŢINUTUL UNITĂŢII
Întâi definim spa ţiile de strategii ale jucǎtorilor într-un jucǎtor Bayesian.
Cunoaştem cǎ o strategie a unui jucǎtor este un plan complet de acţiune, specificând
o ac ţiune posibilǎ (admisibilǎ) în fiecare moment în care poate fi pus sǎ acţioneze.
Dând o desf ǎşurare a unui joc Bayesian static, în care natura începe jocul prin
alegerea tipurilor jucǎtorilor, o strategie (purǎ) pentru jucǎtorul i trebuie sǎ specifice
o acţiune posibilǎ (admisibilǎ) pentru fiecare tip posibil al jucǎtorului i.
Definiţie. Într-un joc Bayesian static T, o strategie pentru jucǎtorul i este o funcţie
si (ti )
Astfel, dacă conceptul nostru de echilibru este să cerem ca strategia firmei 1 să fie
un cel mai bun răspuns la strategia firmei 2, atunci strategia firmei 2 trebuie să fie
o pereche de cantităţi, câte una pentru fiecare tip de cost posibil, alt fel firma 1 nu
poate calcula dacă strategia sa este întradevăr un cel mai bun răspuns al firmei 2.
Dând defini ţia unei strategii într-un joc Bayesian, ne întoarcem la definiţia unui
punct de echilibru Nash Bayesian. Ideea centrală este ca să fie simplu şi familiar:
fiecare strategie a jucătorului trebuie să fie cu cel mai bun răspuns la strategiile
celorlalţi jucători. Adică, un echilibru Bayesian Nash este simplu un echilibru
Nash într-un joc Bayesian.
Definitia 2.3. Într-un joc static Bayesian G strategiile s* = (s1*, s2*,K, sn* )
constituie (in strategii pure) un echilibru Bayesian Nash daca pentru fiecare
jucator i si pentru fiecare i tipul ti ÎTi , si (ti ) rezolva problema
max ∑ Hi (s1* (t1 ),K, si*-1 (ti -1 ), ai , si*+1 (ti +1 ),K, sn* (tn ); t) pi (t-i | ti ).
ai ÎAi t ÎT
-i -i
Observatia 2.9. Într-un echilibru Bayesian Nash nici un jucator nu vrea sa schimbe
startegia sa, chiar daca schimbarea implica numai o actiune de la un tip.
TEME DE CONTROL
Firma 2 are douǎ funcţii cost posibile şi astfel douǎ posibile profituri sau funcţii de
câ ştig:
şi
Astfel, spaţiul tipurilor firmei 1 este T1 = {c}, iar al firmei 2 (spaţiul tipurilor) este
T2 = {cL , cH }.
94
o funcţie de câ ştig diferitǎ, jucǎtorul poate sǎ reprezinte posibilitatea cǎ jucǎtorul
poate sǎ aibǎ mulţimi de acţiuni posibile diferite dupǎ cum urmeazǎ.
Cuprins
TEME DE CONTROL 61
TEME DE CONTROL 84
TEME DE CONTROL 94
95